Mon, 16 Dec 2024 23:00:25 GMT
中国正专注于人工智能领域的大型语言模型(LLMs)。Blackdovfx | Istock | 盖蒂图片社中国试图主导人工智能领域的努力似乎正在见效,业内专家和技术分析师告诉CNBC,中国的人工智能模型已经非常受欢迎,并且在性能上与美国的模型并驾齐驱,甚至有所超越。人工智能已成为美国和中国之间的最新战场,双方都将其视为战略技术。华盛顿继续限制中国获取用于增强人工智能能力的尖端芯片,担心该技术可能威胁美国国家安全。这促使中国采取自己的策略来提升其人工智能模型的吸引力和性能,包括依赖开源技术和开发自己的超快软件和芯片。
中国正在开发受欢迎的LLMs
与该领域的一些美国领先企业类似,中国的人工智能公司正在开发所谓的大型语言模型,或称LLMs,这些模型经过大量数据训练,支撑着聊天机器人等应用。然而,与OpenAI的模型(如广受欢迎的ChatGPT)不同,许多中国公司正在开发开源或开放权重的LLMs,开发者可以免费下载并在其基础上构建,无需严格的许可要求。
在LLMs的存储库Hugging Face上,中国的LLMs是最受欢迎的下载对象,该公司机器学习工程师王铁臻表示。阿里巴巴旗下的一组人工智能模型Qwen在Hugging Face上最受欢迎,他说:“Qwen因其出色的竞争基准表现而迅速流行起来。”他补充说,Qwen拥有“非常有利的许可模式”,这意味着公司可以使用它,而无需进行“广泛的合法审查”。
Qwen有多种尺寸(在LLMs领域称为参数)。大型参数模型更强大,但计算成本更高,而较小的模型运行成本更低。“无论你选择哪种尺寸,Qwen都可能是目前性能最好的模型之一,”王补充道。
初创公司DeepSeek最近也因其名为DeepSeek-R1的模型引起轰动。DeepSeek上个月表示,其R1模型与OpenAI的o1竞争,后者是为推理或解决更复杂的任务而设计的模型。
这些公司声称,它们的模型可以在各种功能上与Meta的Llama等其他开源产品以及OpenAI的封闭LLMs竞争。
“在过去的一年里,我们看到了中国在人工智能领域的开源贡献的崛起,这些贡献具有非常强大的性能、低成本和高吞吐量,”Lux Capital的合伙人Grace Isford通过电子邮件告诉CNBC。
中国推动开源走向全球
开源技术有多种用途,包括推动创新,因为更多开发者可以访问它,以及围绕产品建立社区。
不仅中国公司推出了开源LLMs。Facebook母公司Meta以及欧洲初创公司Mistral也拥有开源版本的人工智能模型。
但在技术行业陷入华盛顿和北京之间的地缘政治斗争之际,开源LLMs为中国公司提供了另一个优势:使它们的模型能够在全球范围内使用。
“中国公司希望看到它们的模型在中国以外使用,因此这无疑是公司成为人工智能领域全球参与者的途径,”全球咨询公司DGA Group的合伙人Paul Triolo通过电子邮件告诉CNBC。
虽然目前的重点是人工智能模型,但也有关于将构建在其上的应用程序的讨论——以及谁将主导未来的全球互联网格局。
“如果你假设这些前沿基础人工智能模型是入场券,那么关键在于这些模型之上将构建什么,”Isford说。 “大语言模型(LLM)被视为前沿科学和工程技术的加速器,”Lux Capital的Isford表示。如今的人工智能模型被比作操作系统,如微软的Windows、谷歌的安卓和苹果的iOS,它们有潜力主导市场,就像这些公司在移动设备和PC领域所做的那样。如果这一比喻成立,那么构建一个主导的LLM的重要性就更高了。”他们(中国公司)将LLM视为未来科技生态系统的核心,”伦敦国王学院中国与东亚商业高级讲师孙鑫通过电子邮件告诉CNBC。”他们未来的商业模式将依赖于开发者加入他们的生态系统,基于LLM开发新应用,并吸引用户和数据,从而通过各种方式,包括但不限于引导用户使用他们的云服务,来产生后续利润,”孙鑫补充道。芯片限制对中国AI未来投下阴影。AI模型需要大量数据进行训练,这要求巨大的计算能力。目前,英伟达是这些被称为图形处理单元(GPU)的芯片的主要设计者。大多数领先的AI公司都在使用英伟达的高性能芯片训练其系统——但在中国并非如此。过去一年左右,美国加强了对华出口先进半导体和芯片制造设备的限制。这意味着英伟达的尖端芯片无法出口到中国,公司不得不生产符合制裁规定的半导体进行出口。尽管如此,中国企业仍成功推出了先进的AI模型。”目前,中国主要科技平台拥有足够的计算能力来继续改进模型。这是因为它们储备了大量英伟达GPU,同时也利用了华为等公司的国产GPU,”DGA集团的Triolo表示。事实上,中国公司一直在加大努力,寻找英伟达的可行替代品。华为一直是中国追求这一目标的领军企业之一,而百度和阿里巴巴等公司也在投资半导体设计。”然而,在先进硬件计算方面的差距将随着时间的推移而加大,特别是明年英伟达推出基于Blackwell的系统时,这些系统对中国是受限出口的,”Triolo说。Lux Capital的Isford指出,中国一直在”系统性地投资并发展其整个国内AI基础设施栈,不依赖英伟达,而是使用百度等公司的高性能AI芯片。””无论英伟达芯片是否在中国被禁,都不会阻止中国投资并构建自己的基础设施来构建和训练AI模型,”她补充道。
原文链接:https://www.cnbc.com/2024/12/17/chinese-ai-models-are-popular-globally-and-are-beating-us-rivals-in-some-areas.html