新报告估计,深度求索的硬件支出可能高达5亿美元。

Fri, 31 Jan 2025 20:18:30 GMT

Faisal Bashir | Lightrocket | Getty Images

本周,中国的深度求索(DeepSeek)成为科技界最热门的话题,行业内外及华尔街的关注焦点集中在一个数字上:600万美元。在深度求索关于其最新人工智能模型的论文中,公司表示,基于英伟达图形处理单元的租赁价格,其总训练成本达到557.6万美元。深度求索明确说明,这一数字仅涵盖模型的“正式训练”,不包括“前期研究及架构、算法或数据上的消融实验”相关成本。

本周初,深度求索的AI助手在美国苹果应用商店的免费应用下载榜上超越OpenAI的ChatGPT,荣登榜首。全球科技股遭遇抛售,芯片制造商英伟达和博通在周一市值合计蒸发8000亿美元。

半导体研究与咨询公司SemiAnalysis的一份新报告为深度求索的开销提供了更多背景信息。该公司估计,深度求索的硬件支出“在公司历史上远超5亿美元”,并指出研发成本和总拥有成本相当可观。SemiAnalysis写道,为模型生成“合成数据”以供训练需要“大量的计算资源”。

报告称,Anthropic的Claude 3.5 Sonnet模型训练成本“高达数千万美元”,但指出Anthropic从亚马逊和谷歌筹集了数十亿美元,这表明运行模型和公司所需的资金规模之大。“这是因为他们必须进行实验,设计新架构,收集和清理数据,支付员工工资等,”SemiAnalysis表示。

深度求索的论文中并未包含其计算成本的估算。公司未立即回应置评请求。

“明确地说,深度求索在达到这一成本水平和能力方面是独一无二的,”SemiAnalysis写道。该公司补充说,深度求索的R1“是一个非常优秀的模型”,并且“如此迅速地接近推理前沿,客观上是令人印象深刻的。”

本周,专家和分析师们盛赞深度求索模型的质量,并指出考虑到美国在三年内三次限制对华芯片出口,这一成就尤为引人注目。这引发了人们对美国在其主要对手面前落后的担忧,尤其是在一个预计十年内收入将超过1万亿美元的市场中。

观看视频:03:11 科技巨头争相采用深度求索R1 TechCheck

伯恩斯坦分析师在周一的一份报告中写道:“根据我们周末看到的许多(有时是歇斯底里的)热议,其影响范围从‘这真的很有趣’到‘这是我们所知的AI基础设施综合体的丧钟’不等。”

深度求索由量化对冲基金High-Flyer的联合创始人梁文峰于2023年创立。据报道,这家AI初创公司于2023年4月从High-Flyer的AI研究部门独立出来,专注于大型语言模型和实现人工通用智能(AGI)——一个在广泛任务上等于或超越人类智能的AI分支,OpenAI等公司也在追求这一目标。

根据杰富瑞分析师的说法,深度求索目前仍由High-Flyer全资拥有并资助。

本月早些时候,深度求索发布R1,其推理模型与OpenAI的o1相抗衡,引发了广泛关注。R1是开源的,意味着任何AI开发者都可以使用它。

与其他中国聊天机器人一样,深度求索在某些话题上存在限制:例如,当被问及中国领导人习近平的一些政策时,深度求索会引导用户远离类似的问题。

OpenAI首席执行官萨姆·阿尔特曼公开赞扬了该模型,但公司也表示,有证据表明深度求索不当获取了OpenAI的数据来构建其产品。

周四在华盛顿特区由OpenAI主办的活动上,阿尔特曼表示深度求索“显然是一个伟大的模型”。“这是一个值得铭记的时刻,”他补充道。 他提到,这同样反映了“对推理技术的兴趣程度,以及对开源技术的关注热度”。观看视频:英伟达CEO黄仁勋与特朗普总统就人工智能政策会面,立即观看。视频时长1分06秒,内容涉及英伟达CEO黄仁勋与特朗普总统将就AI政策、对华限制措施及DeepSeek等议题展开讨论,在《街头访谈》节目中播出。

原文链接:https://www.cnbc.com/2025/01/31/deepseeks-hardware-spend-could-be-as-high-as-500-million-report.html