![阿里巴巴发布升级版AI模型 挑战ChatGPT与Deepseek](https://www.sinchew.com.my/wp-content/uploads/2025/01/e998bfe9878ce5b7b4e5b7b4e58f91e5b883e58d87e7baa7e78988aie6a8a1e59e8b-e68c91e68898chatgpte4b88edeepseek.jpg)
(北京29日法新电)中国阿里云在大年初一发布通义千问旗舰版模型Qwen2.5-Max,并称在指令模型版本性能测试中,几乎全面超越深度求索DeepSeek-V3等其他模型。
阿里云周三凌晨在微信公众号宣布,Qwen2.5-Max全新升级发布,并说新模型展现出极强劲的综合性能,在多项公开主流模型评测基准上录得高分,全面超越了目前全球领先的开源混合专家(MoE)模型以及最大的开源稠密模型。
ADVERTISEMENT
此前,中国初创公司深度求索(DeepSeek)最近发布的模型震惊了矽谷,并挑战了有关美国在蓬勃发展的AI领域占据主导地位的假设。
连续出现的中国模型可能会加剧美国的担忧,美国公司已经在AI开发上投入了数十亿美元,而中国的初创公司正以低得多的成本与之匹敌。
在一篇博客文章中,Qwen团队表示,他们的新模型在多个测试中表现优于DeepSeek V3,包括代码生成和一般功能,同时在与OpenAI的GPT-4和Anthropic的Claude-3.5-Sonnet等行业领导者的竞争中表现出竞争力。
该模型接受了超过20万亿代币的数据训练,值得注意的是,它没有与DeepSeek的R3模型进行比较。R3是一种专注于推理的AI,在1月20日通过聊天机器人推出时引起了轰动。
Qwen2.5-Max现在可以通过阿里云服务向开发者开放,并可以通过该公司的对话式AI平台Qwenchat访问。该系统提供了与OpenAI API格式的兼容性,潜在地简化了已经使用类似AI服务的组织的采用。
在指令模型方面,Qwen2.5-Max在多个基准测试中比肩美国的Claude-3.5-Sonnet模型,并几乎全面超越了另外三个美国模型GPT-4o、DeepSeek-V3及Llama-3.1-405B。
在基座模型方面,阿里云则说,通义团队将Qwen2.5-Max与目前领先的开源MoE模型 DeepSeek V3、最大的开源稠密模型Llama-3.1-405B,以及同样位列开源稠密模型前列的Qwen2.5-72B进行了对比。在所有11项基准测试中,Qwen2.5-Max全部超越了对比模型。
路透社报道,选择大年初一发布Qwen 2.5-Max是较为特殊的时间点,也显示了深度求索过去三周迅速崛起,给中国境内外竞争对手带来压力。
深度求索1月20日发布推理模型DeepSeek-R1后,字节跳动旗下豆包更新版大模型1.5-pro上周三正式发布。
据IT之家报道,1.5-pro模型增强了综合能力,在知识、代码、推理、中文等多个测评基准上,综合得分优于GPT-4o、Claude 3.5 Sonnet 等模型。
![close](/public/images/galleryclose.png)
![zoom](/public/images/galleryzoom2.png)
![image](/public/images/foursquare.png)
ADVERTISEMENT
热门新闻
![happy](/public/images/emoji-happy-1.png)
![shock](/public/images/emoji-shock-1.png)
![cry](/public/images/emoji-cry-1.png)
![angry](/public/images/emoji-angry-1.png)
![speechless](/public/images/emoji-speechless-1.png)
百格视频
![马斯克加入新一轮AI大战 发布“地表最聪明”Grok 3聊天机械人](https://www.sinchew.com.my/wp-content/uploads/2025/02/e9a9ace696afe5858be58aa0e585a5e696b0e4b880e8bdaeaie5a4a7e68898-e58f91e5b883e2809ce59cb0e8a1a8e69c80e881aae6988ee2809dgrok-3e8818ae5a4a9.jpg)
(旧金山18日综合电)中国AI大模型DeepSeek横空出世引发新一轮AI大战,最新出招迎战的是美国总统特朗普身边的“大红人”亿万富豪马斯克,他旗下人工智能(AI)新创公司初创xAI发布新一代聊天机械人Grok 3。
马斯克和其xAI团队人员在周一晚网上直播发布Grok 3,并现场示范,有逾200万人观看直播。xAI指出,Grok 3在数学、科学和编码等多个基准测试中,优于创造ChapGPT聊天机器人的竞争对手OpenAI的GPT-4o、Anthropic的Claude-3.5、DeepSeek V3和Google旗下Gemini 2.0 Pro,并把它形容为“地表最聪明AI”。
马斯克的团队指出,Grok 3除了帮助工程师、研究人员和科学家编写程式码,也能帮助用家回答日常遇到的问题。
马斯克:Grok 3“聪明得吓人”
马斯克早前形容Grok 3“聪明得吓人”,称Grok 3的运算能力是前一代的10倍,其表现已超越“我们所知的任何已发布产品”,又谓xAI是利用合成数据进行训练,可透过反复检查数据以反思所犯的错误,从而实现逻辑一致性。
AI聊天机器人常见的错误,俗称“幻觉”,这种错误会导致AI将假讯息或误导性内容当成事实来处理。
根据法新社报道,马斯克希望Grok 3将在ChatGPT及中国的DeepSeek等对手竞争激烈的AI市场中占有一席之地。
他在Grok 3发表会上说:“Grok目标是要理解宇宙。”
他说:“我们被对宇宙本质的好奇心驱使,这也是为何我们推动最大限度寻求真理的人工智能,即使这种真理有时与政治正确相悖。”
林汉伟:可带旺美股及相关硬体厂
摩尔投顾分析师林汉伟表示,Grok 3主要带旺族群除美股外,也将可能带旺AI伺服器等相关台厂,如台积电、广达、纬创,或是机壳散热等硬体厂,不过最终对AI概念股是否是真正的利多,关键将是Grok 3的“训练成本”。
林汉伟指出,就目前的消息来判断,Grok 3并不会像DeepSeek一样带动边缘AI应用,因此主要应集中于AI伺服器概念股。
对于,Grok 3作为ChatGPT的竞品,推出后会否让AI的需求激增,林汉伟指出,其实关键在于后续公布的训练成本,Grok 3号称最聪明的AI,但如果训练成本跟DeepSeek一样很低,那对市场恐怕就会是负面影响。
Grok 3将率先向社媒交X平台的Premium+ 订阅者使用,xAI备推出一个名为“SuperGrok”的新订阅服务,除了可以使用Grok 3外,包括额外的推理查询、DeepSearch等功能,可生成更多图片。订阅可选择月费或年费,月费为30美元;年费为300美元。
马斯克续指,该AI将新增语音模式,让用户能够使用口头命令自然地进行互动,料未来一周推出,数周内Grok 3和DeepSearch会加入企业API功能。另外,团队等到未来几个月 Grok 3稳定之后,数月内开源Grok 2。
![close](/public/images/galleryclose.png)
![zoom](/public/images/galleryzoom2.png)
![image](/public/images/foursquare.png)
![happy](/public/images/emoji-happy-1.png)
![shock](/public/images/emoji-shock-1.png)
![cry](/public/images/emoji-cry-1.png)
![angry](/public/images/emoji-angry-1.png)
![speechless](/public/images/emoji-speechless-1.png)
ADVERTISEMENT