中国新型AI模型DeepSeek如何挑战美国主导地位

Fri, 24 Jan 2025 13:00:01 GMT

在这篇文章中,METAGOOGL关注你喜爱的股票创建免费账户一家鲜为人知的中国人工智能实验室引发了硅谷的恐慌,因其发布的AI模型在性能上超越了美国顶尖模型,而构建成本更低,且使用了性能较弱的芯片。这家名为深度求索(DeepSeek)的实验室在去年12月底推出了一款免费开源的大型语言模型,据称仅耗时两个月,耗资不到600万美元,并采用了英伟达降级版的H800芯片。这一新进展引发了关于美国在全球人工智能领域领先地位是否缩水的警报,并对科技巨头在构建AI模型和数据中心的巨额投入提出了质疑。在一系列第三方基准测试中,深度求索的模型在从复杂问题解决到数学和编码的准确性上均优于Meta的Llama 3.1、OpenAI的GPT-4o以及Anthropic的Claude Sonnet 3.5。周一,深度求索发布了r1推理模型,同样在许多第三方测试中超越了OpenAI最新的o1模型。

微软CEO萨提亚·纳德拉在瑞士达沃斯世界经济论坛上表示:“看到深度求索的新模型,他们在开源模型上做得非常有效,特别是在推理计算和超级计算效率方面,令人印象深刻。我们应该非常、非常认真地对待中国的发展。”深度求索还不得不应对美国政府对中国实施的严格半导体限制,这些限制切断了中国获取最强大芯片(如英伟达H100)的途径。最新进展表明,深度求索要么找到了绕过规则的方法,要么出口管制并未达到华盛顿预期的扼制效果。

基准资本普通合伙人切坦·普塔贡塔表示:“他们可以采用一个称为蒸馏的过程,利用一个非常大的模型来帮助小模型在特定任务上变得聪明。这实际上非常具有成本效益。”关于这家实验室及其创始人梁文峰的信息知之甚少。据媒体报道,深度求索源自一家名为高飞量化的中国对冲基金,管理着约80亿美元的资产。

但深度求索并非唯一取得突破的中国公司。领先的人工智能研究员李开复表示,他的初创公司01.ai仅用300万美元就完成了训练。TikTok母公司字节跳动周三发布了其模型的更新,声称在关键基准测试中超越了OpenAI的o1模型。Perplexity CEO阿拉温德·斯里尼瓦斯说:“需求是发明之母。因为他们必须找到变通办法,最终反而构建出了更高效的东西。”

观看此视频了解更多信息。

原文链接:https://www.cnbc.com/2025/01/24/how-chinas-new-ai-model-deepseek-is-threatening-us-dominance.html