Wed, 26 Feb 2025 12:19:34 GMT
Omer Taha Cetin | Anadolu | Getty Images 中国人工智能公司深度求索(DeepSeek)在1月份凭借其最新模型DeepSeek-R1的发布迅速走红,一度取代OpenAI的ChatGPT成为苹果App Store上下载量最高的免费应用。在这背后,人工智能推动者——那些构建基础设施和应用以支持人工智能的公司——感受到了市场动荡的压力。
尽管英伟达股价在单个交易日内下跌超过15%,原因是市场意识到人工智能模型的开发可以在比预期更低的利润和更低质量的资源下完成,但这些人工智能推动者仍在开发专门用于人工智能的半导体芯片,构建计算能力,并开发基础模型可以使用的平台。
企业人工智能平台Kolena的联合创始人兼首席执行官Mohamed Elgendy表示:“一方面,深度求索的方法表明,你可以优化模型构建过程,从而需要更少的计算能力。这对英伟达有负面影响。然而,显而易见的是,现在你会发现很多人都在构建基础模型。基础模型不再仅仅属于那些拥有数亿美元来构建基础设施的顶级公司。”
英伟达股价在2025年迄今已下跌近9%,尽管在此之前其股价在过去两年中上涨了近500%。这家芯片巨头将在周三收盘后公布财报,预计深度求索以及人工智能“超级扩展者”——如谷歌、甲骨文、亚马逊和微软等公司——未来支出的潜在影响将受到华尔街分析师和投资者的关注。这些公司购买了英伟达高达一半的人工智能芯片。
Elgendy的推理基于这样一种信念,即深度求索的模型发布标志着行业的转变,他认为行业现在将朝着更加民主化的方向发展,其结果已经开始显现,研究人员表示,市场上出现了低至50美元的额外大语言模型(LLM)。他说:“深度求索之前的日子与深度求索之后的日子是不同的。”
基础世界模型公司Integral AI的首席执行官Jad Tarifi在其2024年出版的《超级智能的崛起》一书中写道:“虽然许多研究人员专注于在人工智能模型中追求更高的计算和数据效率,但对强大基础设施的需求仍然至关重要。”Tarifi继续写道:“即使模型简化,预期的现实世界部署也将确保对强大计算资源的需求不断增长。”
企业人工智能代理公司Vectara的首席执行官Amr Awadallah则有略微不同的看法。他说:“我认为这是人工智能模型构建者和为其提供支持的大型人工智能推动者利润率显著压缩的开始。整个行业的收入将继续增长,并且增长很多,但这些大公司能够提取的利润将大幅下降,因此从这一角度来看,这将带来一些压力。”
最近有报道称,微软正在缩减其人工智能数据中心的建设规模,这吓坏了投资者,但微软对此表示异议,称其承诺了800亿美元的支出,但补充说它可能会“在某些领域战略性地调整或调整我们的基础设施”。
Awadallah将这一转变比作闪存驱动器的历史,闪存驱动器的设计需要大量工作,但现在已成为一种利润比以前低的常见商品。深度求索能够在低端硬件上训练其模型,而无需使用美国大公司使用的高端硬件,从而有效地使市场商品化。
深度求索本身运行在英特尔的Xeon和Gaudi处理器上,据英特尔发言人表示,这些处理器“帮助客户以更低的成本获得强大的性能”。英特尔的Gaudi也被用于Denvr Dataworks,该公司提供既注重性能又注重数据隐私的人工智能解决方案。“新的人工智能模型带来了令人兴奋的 机遇与挑战并存。它们能推动创新、提升效率并开启新的可能性,但扩展人工智能也伴随着成本、能源消耗及负责任部署等挑战,”英特尔发言人向CNBC表示。英特尔方面称,其产品和服务已将这些障碍纳入考量。
尽管预计会随时间改进,但DeepSeek的准确性问题众所周知。Vectara测试显示,DeepSeek-R1模型的幻觉发生率为14.3%,相比之下,OpenAI的GPT-4约为2%(甚至高于DeepSeek自身不具备推理能力的上一代模型Deepseek-V3)。Kolena的Elgendy指出,测试中发现DeepSeek在多数对抗性或越狱类攻击中表现不佳,这些问题曾是GPT-3早期面临的,但已得到主要供应商的解决。尽管如此,Elgendy视DeepSeek或其代表意义为未经雕琢的钻石,认可其在训练大模型方面展现出的更高效新方法,并认为其有效。
Awadallah对DeepSeek仅花费600万美元训练模型的说法表示怀疑,认为实际成本远超此数,可能仅最终模型生成阶段耗资600万,而前期多次尝试的成本预计至少5000万美元以上。即便如此,这仍远低于谷歌Gemini的1.49亿美元,且未计入员工薪资,后者会使成本翻倍。Elgendy预测,更多基于相对有限预算和计算能力构建的基础模型将涌现,改变以往认为基础模型需大量资源投入的假设,这将极大增加开发者和用户数量。
他特别期待在医疗、研究、制药、会计、金融等特定领域运营的模型增多,认为基础设施将回归早期AI机器学习时代,专业AI公司将构建专用基础模型,均需基础设施支持,其中测试与验证将成为最重要环节,因其他组件已高度商品化。关于测试,Elgendy认为,随着更多此类提供商出现,竞争将加剧,如DeepSeek一经发布,便引发广泛测试,其测试范围与未测试领域立见分晓。他强调,竞争将起到约束作用,因为”市场现在就是警察”。
NVIDIA CEO黄仁勋在预先录制的采访中表示,市场对R1的反应暗示AI已完成,无需更多计算,而事实恰恰相反。鉴于DeepSeek及其同类模型的巨大潜力,Awadallah预见,像NVIDIA这样为模型提供基础设施的AI赋能者之间的竞争将更为激烈,唯有能承受利润冲击并自我维持的企业才能屹立不倒,持续繁荣。
原文链接:https://www.cnbc.com/2025/02/26/how-the-first-nvidia-earnings-day-after-deepseek-will-be-different.html