
(纽约1日综合电)中国新创公司DeepSeek的模型成本引发质疑,并且造成股市震荡。研究机构SemiAnalysis在报告中指出,光是硬体绘图处理器(GPU)上的支出远超过5亿美元(22.31亿令吉)。
SemiAnalysis指出,中国对冲基金幻方量化(High-Flyer)在2023年5月成立推动AI技术研究。之前,幻方量化于2021年,也就是任何出口管制生效前投资购买1万颗辉达A100 GPU,光在投资上已超过5亿美元。
ADVERTISEMENT
报告说,辉达根据法规要求生产了多款H100的变化版,比如H800、H20,仅有H20可销售予中国。辉达过去9个月来已生产超过100万颗专供中国市场的H20 GPU。分析显示,DeepSeek的伺服器总资本支出(CapEx)约16亿美元(71.38亿令吉)。
DeepSeek从中国本土招募人才,目前约有150名员工,仍在急速扩张。DeepSeek的价格和效能在本周因出现模型训练成本低于600万美元(2676万令吉)的说法引起讨论。报告强调,训练成本仅是总成本的一小部分,不代表完整支出。
DeepSeek论文中提到的600万美元成本是指预训练运行(pre-training run)时的GPU成本,是模型总成本的一部分,未算入重要支出包括研发、硬体总拥有成本的关键因素。
报道也提到,DeepSeek能获得大量算力资源与出口管制存在时间滞后(lag)有关。
美国智库兰德公司(RAND)研究人员海姆分析,硬体的出口管制存在时间滞后,目前尚未完全发挥影响力。真正的考虑将出现在数据中心需要升级或扩展时,这对美国企业较为容易,可是对出口管制的中国企业而言将是挑战。



ADVERTISEMENT
热门新闻





百格视频
(吉隆坡5日讯)新加坡对辉达(Nvidia)人工智能晶片可能通过马来西亚非法流向中国而展开调查一案,可能进一步殃及本地房地产发展商—奕森集团(EXSIM)。
2狮城1中国人被控欺诈
在新加坡当局的调查下,至今已有两名新加坡人和一名中国公民于 2月27日被指控欺诈。
据悉,被指控的3人之一、新加坡人魏兆伦(音译)是新加坡多家公司董事,包括Achieva Tech Allianz、Altrics Global Services、Aperia Cloud Services及其子公司A-Speed Infotech和Aurica。
行内人士告诉新加坡《海峡时报》,Aperia Cloud Services是奕森集团位于吉隆坡武吉加里尔功耗为15兆瓦(MW)的数据中心的主要客户。
依照官网资讯,那是该集团至今唯一一项数据中心发展项目。
一名知情金融高管透露,Aperia Cloud Services是辉达在东盟的首个云合作伙伴,已承诺租用奕森集团功耗10兆瓦以上的数据中心功率。
在正式动工建造前敲定租用协议,对发展商取得所需建设资金,是至关重要,因这可确保数据中心未来的营收,从而确保业主有能力偿还债务。
“奕森集团可能需要终止与Aperia的交易。若终止的活,奕森集团或需要找其他客户来承租,或许他们可要求未来阶段的客户,承租更大份额的功耗。”
去年颁Binastra 2建筑工程
资料显示,奕森集团在2024年9月和11月时,向Binastra颁发上述数据中心项目的2项相关建筑工程合约,总值8亿3085万令吉。
在本月3日,本地AI伺服器代工商——NationGate控股就因上述事件而跌停板;次日,该公司澄清与所有嫌疑人皆无商业关系,带动股价反弹。








ADVERTISEMENT