国际

阿里巴巴释出Qwen 2.5-Max 性能号称优于DeepSeek-V3

中国人工智能模型大厮杀！DeepSeek模型颠覆全球人工智能界后，阿里巴巴周三（29日）大年初一释出旗下的“通义千问Qwen 2.5-Max”超大规模模型呛声，号称优于备受赞誉的DeepSeek-V3。

阿里云罕见地在大年初一公假释出Qwen 2.5-Max，凸显DeepSeek的横空降世不只对外国挑战者带来压力，也引发中国国产人工智能模型竞争。

阿里云形容，Qwen 2.5-Max几乎在各方面都优于GPT-4o, DeepSeek-V3和Llama-3.1-405B，亦即美国科技企业OpenAI和科技巨擘Meta最先进的开源模型。

阿里云声称该模型可通过API方式进行访问，也可以登录Qwen Chat体验，例如直接与模型对话，或者使用artifacts及搜索等功能。

阿里云指出，通义千问Qwen 2.5-Max使用超过20兆token的预训练数据，以及精心设计的后训练方案进行训练。

DeepSeek人工智能助理翻转人工智能界，主要原因在于开发成本较低，让投资者质疑美国主要人工智能公司的烧钱做法，亦导致美日科技股惨跌。