国际

阿里巴巴释出Qwen 2.5-Max 性能号称优于DeepSeek-V3

阿里巴巴商标。-照片:路透社

中国人工智能模型大厮杀!DeepSeek模型颠覆全球人工智能界后,阿里巴巴周三(29日)大年初一释出旗下的“通义千问Qwen 2.5-Max”超大规模模型呛声,号称优于备受赞誉的DeepSeek-V3。

阿里云罕见地在大年初一公假释出Qwen 2.5-Max,凸显DeepSeek的横空降世不只对外国挑战者带来压力,也引发中国国产人工智能模型竞争。

阿里云形容,Qwen 2.5-Max几乎在各方面都优于GPT-4o, DeepSeek-V3和Llama-3.1-405B,亦即美国科技企业OpenAI和科技巨擘Meta最先进的开源模型。

阿里云声称该模型可通过API方式进行访问,也可以登录Qwen Chat体验,例如直接与模型对话,或者使用artifacts及搜索等功能。

阿里云指出,通义千问Qwen 2.5-Max使用超过20兆token的预训练数据,以及精心设计的后训练方案进行训练。

DeepSeek人工智能助理翻转人工智能界,主要原因在于开发成本较低,让投资者质疑美国主要人工智能公司的烧钱做法,亦导致美日科技股惨跌。

Loading...
即时