
(北京24日彭博电)知情人士披露,蚂蚁集团使用了中国制造的半导体来开发训练人工智能(AI)模型的技术,从而能把成本降低20%。
知情人士说,蚂蚁集团用国内晶片训练了采用所谓混合专家(MoE)机器学习方式的模型,这些晶片的来源包括其关联公司阿里巴巴集团以及华为。
ADVERTISEMENT
他们说,训练结果与H800之类的辉达晶片差不多。
其中一人说,虽然蚂蚁集团仍在使用辉达进行AI开发,但现在主要依赖AMD和中国晶片之类的替代品来训练最新模型。
因事未公开,知情人士不愿具名。
自深度求索(DeepSeek)展示出模型训练成本可以远低于OpenAI和Alphabet旗下谷歌投入的数十亿美元以来,中国和美国公司之间的AI竞赛加快,而蚂蚁集团的这些模型标志著它也加入了“战圈”。此事还突显出,中国公司正试图利用本土产品来替代最先进的辉达半导体。H800虽然不是最先进的,但也是相对强大的处理器,目前被美国禁止进入中国。
蚂蚁集团本月发布了一篇研究论文,声称其模型有时在特定基准指标上胜过了Meta,《彭博社》尚未独立核实这一点。但若其所言非虚,那么这将标志著推理或支持AI服务的成本降低,也就意味著中国AI行业又前进了一步。
随著各公司重金投入AI研发,MoE模型已成为一种流行选择,因被谷歌和DeepSeek等公司使用而获得认可。这种技术将任务分为更小的数据集,类似于拥有一个专家团队、每人专注于工作的一部分,从而提高流程效率。
蚂蚁集团在电邮声明中不予置评。



ADVERTISEMENT
热门新闻





百格视频

(纽约26日彭博电)深度求索(DeepSeek)不仅证明打造人工智能(AI)不一定需要投入数十亿美元,而且还激活了沈寂已久的中国科技业。现在可能是OpenAI、辉达等西方巨头要付出代价的时候了。
自从1月DeepSeek以一款据称只花费几百万美元打造的强大模型抢了OpenAI风头后,中国主要科技企业潮水般地向市场推出了一系列低成本AI服务,对OpenAI、谷歌等公司的高价产品形成冲击。仅仅过去两周,中国企业就宣布了不少于10项重大的产品升级或新AI工具,这还没算上那些知名度相对不太高的公司。
百度公司推出文心大模型X1,直接与DeepSeek的R1展开竞争。阿里巴巴随后也发布了自家的AI智能体以及推理模型升级版。上周腾讯公布AI发展蓝图,并升级了据称对标R1的推理模型。蚂蚁集团分享了有关如何让中国晶片削减五分之一成本的研究成果;一鸣惊人的DeepSeek同样没闲著,该公司升级了对V3模型。甚至连以全球最大外卖平台闻名的美团,也宣布将在AI领域投入数十亿美元。
这一系列升级与优化远不只是中国企业赶上DeepSeek热潮那么简单。这些几乎全部开源的AI模型代表著中国开发者试图成为全球AI标准与基准的制定者,并争夺更大的国际市场占有率。尽管这些AI产品是否能达到或超越西方最先进系统仍有待观察,但它们的出现的确令美国主要科技公司的商业模式面临更大压力。
OpenAI就是其中之一,这家公司目前正试图在不同策略之间寻找平衡点。作为ChatGPT的创造者,OpenAI表示,在DeepSeek通过开源策略取得成功之后,该公司正在考虑开放部分自家技术。与此同时,OpenAI仍在权衡是否对旗下最先进的AI工具收取更高使用费。Vectara创始人兼首席执行员阿瓦达拉(Amr Awadallah)表示,如果DeepSeek的低成本模式被业内同行复制,可能会压缩辉达的利润空间,其估值出现“调整”几乎不可避免。
过去几年里,中国企业凭借强大的制造能力和低价策略已经在电动汽车、太阳能电池板等多个行业挤压了全球竞争对手。现在,这一模式可能正在人工智能领域重演。
阿瓦达拉表示,这将是一个“严重的问题”,“我们即将看到一个趋势,那就是整个生态系统中的公司都将面临利润大幅压缩。受影响的不仅仅是AI模型的开发者,还有那些推动行业成长的大型AI赋能者。”
DeepSeek在1月份宣布开源的低成本高性能模型后,这些模型在全球范围内被复制和使用,包括在美国和印度,尽管这些国家的企业和政府官员开始限制员工使用DeepSeek。中国开发者正在重塑市场,投资者对于美国大型科技公司(如OpenAI和微软)的大量基础设施投资是否有必要提出质疑。
科技咨询公司 Monevate的创始人兼管理合伙人威尔顿(James Wilton)表示:“如果你认为中国大语言模型开发者的意图是扰乱市场并抢占占有率,那么他们确实成功了。他们现在或许愿意承担这些成本,但这种‘免费’状态不可能永远持续。”
与此同时,承载AI开发工作的中国云端服务提供商也在大幅削减价格,这场竞争有可能扩展到中国之外,波及全球市场。
美国Interconnected Capital创始人兼科技投资人Kevin Xu表示:“这其实就是中国生态系统内价格战向其他市场蔓延的一种自然演变。”
阿里巴巴董事会主席蔡崇信周二在香港的一场会议上警告称,数据中心建设可能正在形成泡沫,他认为建设速度或超过了对AI服务的初期需求。蔡崇信说,他仍然对美国在AI投资方面抛出的那些数字感到震惊,对于人们谈论的数千亿美元,他认为不是完全有必要。
一些人预计,接下来几个月,开源模型的种类将扩展到其他相关领域,例如计算机视觉、机器人技术和图像生成等。
科技投资人、Andreessen Horowitz前合伙人斯里尼瓦桑(Balaji Srinivasan)表示,随著中国在硬体方面的优势不断显现,AI模型越便宜就越容易获取,对AI驱动的设备的需求也会越高。
他在X上的一篇帖子中写道:“中国正在对AI采取其一贯的策略:学习、模仿、优化,然后以低价和巨大的规模让所有对手破产。”








ADVERTISEMENT