星洲网
星洲网
星洲网 登入
Newsletter|星洲网 Newsletter 联络我们|星洲网 联络我们 登广告|星洲网 登广告 关于我们|星洲网 关于我们 活动|星洲网 活动

ADVERTISEMENT

ADVERTISEMENT

财经

|

即时财经

|
发布: 9:40am 29/01/2025 44085点阅

AI

DeepSeek

AI

DeepSeek

横空出世颠覆AI界 DeepSeek是何方神圣?

(北京29日讯)中国人工智能初创公司深度求索()不仅轰动美国硅谷,更在星期一(27日)让华尔街股市掀起大海啸,引发科技股大暴跌,而晶片巨头英伟达(Nvidia)股价当天溃败,猛跌17%至118.58美元,市值一夜蒸发近6000亿美元。

ADVERTISEMENT

市场投资者对人工智能泡沫破灭的担忧,导致纳斯达克综合指数在这一天下挫3.07%。整个股市对DeepSeek的反应,引发投资者对过度炒作的人工智能投资周期的怀疑,也不禁开始质疑人工智能巨额投资的效率。

DeepSeek最让市场大跌眼镜的是,它能够在无需花费同等费用的情况下,构建一个类似Open的ChatGPT。DeepSeek公开它大概需要花费560万美元,来构建它的人工智能模型。

而人工智能开发商Anthropic首席执行官阿莫代(Dario Amodei)去年提到的构建模型成本则是在1亿美元至10亿美元之间。美国的各个大型科技公司每年花费数百亿美元的资本支出,大部分也是专门用在人工智能基础设施上。

成本的差距令人震惊。

谁是梁文锋?

到底DeepSeek是怎样的一家公司?它的创始人梁文锋又是谁?

梁文锋原本是中国量化对冲基金的创始人。约两年前,他决定投身人工智能领域。当时他拿着英伟达(Nvidia)晶片,组建了一支年轻、雄心勃勃的人才团队。

两年后的今天,DeepSeek爆红了。

DeepSeek是在1月20日发布了一个开源人工智能模型,而且免费供人使用。这个模型迅速成为硅谷的热门话题。

DeepSeek-R1在多项数学和推理基准测试中,都击败了OpenAI o1等业界领先的人工智能模型。不论在能力、成本、开放性等各个指标,DeepSeek都在挑战着西方人工智能巨头。

若把这次DeepSeek的成功形容为人工智能的黑天鹅事件,其实一点也不为过。

在中美科技冷战期间,美国对出口的严厉管制,严重地限制了中国科技公司利用“西方的科技”在人工智能领域竞争的能力。这些中国科技公司无法通过购买更多高科技晶片,来培训无限扩大的人工智能模型。基于此,许多中国人工智能相关企业都只能专注在下游应用,而不是建立自己的人工智能模型。

其实DeepSeek在中国人工智能行业,是个非常另类的人工智能初创公司。它最初是中国表现最好的量化对冲基金之一,也就是High-Flyer的深度学习研究分支,名为Fire-Flyer。

这个对冲基金成立于2015年,并迅速在中国声名鹊起,成为首支募集资金超过1000亿元人民币的量化对冲基金。不过自2021年以来,这个数字已降至80亿美元左右。

多年来,High-Flyer一直在储备图形处理器(Graphics Processing Unit,简称GPU)并构建Fire-Flyer超级电脑来分析财务数据。然后,在2023年,也拥有电脑科学硕士学位的创办人梁文锋决定将基金的资源投入一家名为DeepSeek的新公司,开发自己的人工智能模型。

他大胆的愿景奏效了。

梁文锋去年曾向中国媒体说过,他转换跑道的决定是出于对科学的好奇心,而不是渴望盈利。

他说,即使你要我找,我也找不到创建DeepSeek的商业理由。因为从商业的角度,这不值得做,基础科学研究的投资回报率很低。当OpenAI的早期投资者给它钱时,他们肯定也没有考虑自己会获得多少回报。相反的,他们是真的很想做这件事。

就是这股“想做”的冲劲,今天的DeepSeek不仅能脱颖而出,而且还是中国唯一一家不依赖百度、阿里巴巴或字节跳动等科技巨头融资的领先人工智能公司之一。其独立性,不言而喻。

美国政府是在2022年10月开始对高科技晶片实施出口管制,严格限制中国人工智能公司获得像英伟达H100等尖端晶片。梁文锋向媒体承认,这确实给DeepSeek带来了问题。

因此,DeepSeek必须想出更有效的方法,来训练它的人工智能模型。

他们使用一系列工程技巧优化了模型架构,如:晶片之间的通信方案、减少字段以节省内存,以及创新地使用模型混合方法等。其中许多方法都不是什么新做法,但是把这些工程技巧结合在一起,它产生的尖端模型竟是了不起的。

一直为美国总统特朗普提供建议的硅谷风险投资家安德森(Marc Andreessen)于上星期五(24日)在社交平台X发布贴文说:“Deepseek-R1是我见过最惊人、最令人印象深刻的突破之一。”

DeepSeek最后最重要的一步,就是它愿意免费与公众分享这些创新,因此它迅速在全球人工智能研究界赢得了相当大的好感。

对美国晶片出口管制带来挫折

当然DeepSeek的突然冒起,也会给美国目前专门对准人工智能资源的出口管制带来挫折。因为现在中国人工智能的发展已经不受限于高端晶片的多寡了。

DeepSeek已经颠覆了这方面的认知。

认知被颠覆,造成不安与惊慌是正常的。很明显的是,整个华尔街也接受不了DeepSeek的突然成功。

DeepSeek的成功对原本被追捧的晶片巨头英伟达(Nvidia)、超微(Advanced Micro Devices)、博通公司(Broadcom Inc)、Marvell Technology Inc等到底意味着什么?

这些公司的市值应该是反映它们未来几年由人工智能驱动的业绩。但是现在按这种理解还合理吗?这些科技巨头对人工智能的高额资本支出还是正确的吗?

肯定的是,DeepSeek的出现,将促使美国超大规模科技企业更迫切地要利用它们的关键优势,也就是它们拥有的高端科技晶片,来扩大他们与DeepSeek的距离。

也许从这点来看,这些美国科技巨头今后可能会更需要像英伟达和博通公司的晶片。

从更大的角度来看,这场中美科技冷战现在已经不是一面倒。

美国总统特朗普是否会加速之前宣布的Stargate数据中心发展计划?是否能更快地拉到各个大巨头至少投资5000亿美元在Stargate?

DeepSeek的出现,也许会连原本对Stargate有意见的全球首富马斯克(Elon Musk)也改变初衷。(联合早报)

打开全文

ADVERTISEMENT

热门新闻

百格视频

发布: 5:48pm 13/02/2025 885点阅
4月1日起 百度“文心一言”宣布全面免费
百度创始人、董事长兼首席执行官李彦宏。(图:百度)

(北京13日综合电)中国网路巨擎百度周四宣布,旗下大型语言模型“文心一言”将于4月1日起全面免费,所有PC端和APP端使用者都可以体验到文心系列最新模型。被外界视为百度在DeepSeek追赶下为挽回使用者所做出的决定。

百度公告表示,随著文心大模型的迭代升级和成本不断下降,文心一言将于4月1日0时起,全面免费;此外,文心一言当天上线深度搜索功能,该功能也将于4月1日起免费开放使用。

公告指出,深度搜索功能,具备更强大的思考规划和使用外部工具能力,可为用户提供专家级内容回复,并处理多场景任务,实现多模态输入与输出。

文心一言在2023年3月上线,能够与人互动、回答问题及协作创作,并在2023年8月开放给全球使用者使用。百度当年声称,其最新版本的文心一言模型“文心一言3.5”,在综合能力得分上超过了ChatGPT,并在多个中文功能方面表现优于GPT-4。更有中国媒体称,文心一言是中国版的ChatGPT。

文心一言目前有分为免费的基础版和收费的专业版,专业版的月费为59.9元‌(约36.6令吉)。百度首席技术官王海峰去年底表示,文心一言的使用者已达4.3亿,相比之下,今年爆红的DeepSeek,其每日的活跃用户量为3000万。

作为最早一批发布的中国大型语言模型,文心一言公布全面免费一事并未引起中国网友的正面回应,大部分的人认为文心一言并不好用,即使全面免费也不会选择再次使用,加上目前相关服务竞争激烈,认为有其他更好的选择。

ADVERTISEMENT

ADVERTISEMENT