发布: 11:37am 30/01/2025

阿里巴巴发布升级版AI模型挑战ChatGPT与Deepseek

（北京29日法新电）中国阿里云在大年初一发布通义千问旗舰版模型Qwen2.5-Max，并称在指令模型版本性能测试中，几乎全面超越深度求索DeepSeek-V3等其他模型。

阿里云周三凌晨在微信公众号宣布，Qwen2.5-Max全新升级发布，并说新模型展现出极强劲的综合性能，在多项公开主流模型评测基准上录得高分，全面超越了目前全球领先的开源混合专家（MoE）模型以及最大的开源稠密模型。

此前，中国初创公司深度求索（DeepSeek）最近发布的模型震惊了矽谷，并挑战了有关美国在蓬勃发展的AI领域占据主导地位的假设。

连续出现的中国模型可能会加剧美国的担忧，美国公司已经在AI开发上投入了数十亿美元，而中国的初创公司正以低得多的成本与之匹敌。

在一篇博客文章中，Qwen团队表示，他们的新模型在多个测试中表现优于DeepSeek V3，包括代码生成和一般功能，同时在与OpenAI的GPT-4和Anthropic的Claude-3.5-Sonnet等行业领导者的竞争中表现出竞争力。

该模型接受了超过20万亿代币的数据训练，值得注意的是，它没有与DeepSeek的R3模型进行比较。R3是一种专注于推理的AI，在1月20日通过聊天机器人推出时引起了轰动。

Qwen2.5-Max现在可以通过阿里云服务向开发者开放，并可以通过该公司的对话式AI平台Qwenchat访问。该系统提供了与OpenAI API格式的兼容性，潜在地简化了已经使用类似AI服务的组织的采用。

在指令模型方面，Qwen2.5-Max在多个基准测试中比肩美国的Claude-3.5-Sonnet模型，并几乎全面超越了另外三个美国模型GPT-4o、DeepSeek-V3及Llama-3.1-405B。

在基座模型方面，阿里云则说，通义团队将Qwen2.5-Max与目前领先的开源MoE模型 DeepSeek V3、最大的开源稠密模型Llama-3.1-405B，以及同样位列开源稠密模型前列的Qwen2.5-72B进行了对比。在所有11项基准测试中，Qwen2.5-Max全部超越了对比模型。

路透社报道，选择大年初一发布Qwen 2.5-Max是较为特殊的时间点，也显示了深度求索过去三周迅速崛起，给中国境内外竞争对手带来压力。

深度求索1月20日发布推理模型DeepSeek-R1后，字节跳动旗下豆包更新版大模型1.5-pro上周三正式发布。

据IT之家报道，1.5-pro模型增强了综合能力，在知识、代码、推理、中文等多个测评基准上，综合得分优于GPT-4o、Claude 3.5 Sonnet 等模型。

打开全文

百格视频

更多视频

发布: 4:32pm 18/02/2025

马斯克

AI

聊天机械人

DeepSeek

Grok 3

马斯克

AI

聊天机械人

DeepSeek

Grok 3

马斯克加入新一轮AI大战发布Grok 3聊天机械人

（旧金山18日综合电）中国AI大模型DeepSeek横空出世引发新一轮AI大战，最新出招迎战的是美国总统特朗普身边的“大红人”亿万富豪马斯克，他旗下人工智能（AI）新创公司初创xAI发布新一代聊天机械人Grok 3。

马斯克和其xAI团队人员在周一晚网上直播发布Grok 3，并现场示范，有逾200万人观看直播。xAI指出，Grok 3在数学、科学和编码等多个基准测试中，优于创造ChapGPT聊天机器人的竞争对手OpenAI的GPT-4o、Anthropic的Claude-3.5、DeepSeek V3和Google旗下Gemini 2.0 Pro，并把它形容为“地表最聪明AI”。

马斯克的团队指出，Grok 3除了帮助工程师、研究人员和科学家编写程式码，也能帮助用家回答日常遇到的问题。