
(北京30日讯)DeepSeek去年12月26日推出DeepSeek-V3这款大型语言模型,性能已可与OpenAI和Google等美企旗下优秀的聊天机器人媲美,单这点已让外界惊艳。然而DeepSeek在一份说明技术构建的研究论文里称他们训练AI所用晶片数量远少于其他美企后,犹如引发地震。
全球一些顶尖企业用超级电脑训练聊天机器人时动辄得用上至少1.6万片晶片,然而DeepSeek工程师们说他们仅使用约2000片辉达(Nvidia)晶片。
ADVERTISEMENT
此外,自从2022年底OpenAI掀起旋风以来,“不动辄重砸数十亿美元没法训练出强大AI系统”始终是主流观点,也予人唯有像微软、Google、Meta等科技巨擘才玩得起先进AI、辉达这类AI晶片厂将一片光明的印象。
然而DeepSeek称他们仅花费约560万美元和相对原始的运算能力训练自家系统,这比Meta建构旗下最新AI所花资金便宜约10倍,引来AI产业反思是否真有必要砸天文数字的资金、AI产业是否将泡沫化等。
DeepSeek是如何办到使用较少晶片
美国的顶尖AI工程师们表示,DeepSeek的研究论文提出一些让人印象深刻的巧思来降低晶片使用量,简言之就是种让晶片分析数据时更有效率。
先进AI系统需归纳文字、图片、影音等大量数据来学习技能,DeepSeek则把这些数据分析工作分配给多个不同模型,每个模型负责特定领域,如此一来维持高效数据处理的同时还缩短运算时间。这种方法之前不是没有人用过,只是没法像DeepSeek用更少的运算能力做到。
精通建构高效AI系统的卡内基美隆大学(CMU)电脑科学教授戴特摩斯说:“现在看显然除OpenAI这类公司外,其他人也能玩。DeepSeek使用的方法人人都能依样画葫芦。”
DeepSeek技术真能媲美OpenAI、Google吗?
根据一些标准基准测试,DeepSeek-V3一如市场现有的同类产品,即能有效地答覆询问、解决逻辑问题并自行做编程。
就在DeepSeek公布自身技术前,OpenAI才揭橥一款名为OpenAI o3的新系统,效能似乎比DeepSeek-V3更强,只是还没对外推出。OpenAI o3的设计是能对数学、科学和电脑程式等问题“推理”;一些专家认为,DeepSeek还不具备这种未来AI趋势的推理能力。
然DeepSeek旋即在1月20日发布自家推理模型DeepSeek-R1,终于引发投资圈和其他人因意识到DeepSeek带来的影响性而于这周末陷入恐慌。
何谓开源AI
与许多公司一样,DeepSeek也把自身最新的AI系统“开源”(open sourced),即把支撑AI的运算代码公开给其他企业和研究人员,让所有人都能使用这些技术来建构、推广自己的产品。DeepSeek与其他中国企业能如此迅速拿出具竞争力的AI产品,部分也是受惠于他人开源。
开源于AI世界兴起是在2023年,Meta免费分享名为Llama的系统。当时许多人认为只有像Meta这种拥有靠专门晶片支撑大数据库的公司继续分享,开源生态才能蓬勃。但DeepSeek证明,就算没有美国科技巨擘,开源生态照样能有声有色。
DeepSeek鼓舞其他国家
华尔街日报指出,并非所有人都认为DeepSeek将颠覆AI产业。分析师瑞斯冈表示,尽管DeepSeek可能找出降低AI训练成本的方法,但随AI需求持续飙升,科技公司仍需更多的算力,不愁晶片卖不出,“DeepSeek会是AI产业生态的末日吗,我们不觉得”。
不过DeepSeek的成功,可能重塑AI发展的全球竞争格局,让美国以外的国家感到振奋。
像法国政府就表示,DeepSeek证明只要业者灵活具备巧妙技术,纵使资金少或无法获得顶级晶片,照样能在AI世界逐鹿中原。法国的官员就认为,不仅中国有机会,欧洲和世界其他地区也有机会追上矽谷。



ADVERTISEMENT
热门新闻





百格视频





ADVERTISEMENT