2025/02/02
资料图(REUTERS)
桃井裕理:中国生成AI(人工智能)初创企业DeepSeek(全称:杭州深度求索人工智能基础技术研究)发布了一款被认为超越美国OpenAI的“Chat GPT”的新模型。主张以压倒性的低成本实现的该模型的出现使得AI行业的游戏规则突然改变。激烈的中美AI战争甚至可能改变未来世界的格局。
“中国企业成为AI时代的主角”,“硅谷陷入恐慌”,在全球股市迎来“DeepSeek冲击”的新一周刚开始,中国社交媒体上(SNS)上已经到处都是欢庆这一壮举的标签。
DeepSeek由80后的企业家梁文锋于2023年在杭州市创办。继去年年底发布的第七款模型“V3”引发关注后,该公司在特朗普就任美国总统当天的1月20日发布了创新模型“R1”。
令全球惊讶的是,该公司展示了与“ChatGPT-o1”的性能对比表。两者在主要性能上旗鼓相当,但在文字等数据输出的成本上,DeepSeek的成本仅为4%。
该模型的开发背后存在中国AI一线的“2无”与“2有”。
“为什么中国AI企业比美国落后?”,去年,在与中国生成AI企业高层的交谈中,笔者得到的答复是:“因为我们没有那样的资金实力。”
AI模型开发过程中,成本高昂的主要原因在于“训练”阶段,即不断让模型学习标准答案。有能力筹集巨额资金的美国大型科技企业不管多少资金都可以投入,而资金有限的中国初创企业只能收窄训练的方向。
“R1”通过另一种方式弥补了这一差距。它赋予AI类似人类的推理与分析能力,能够在面对未知问题时通过思考得出答案,以此实现了“自我进化”。这一创新大大降低了训练过程的成本。
另一个“无”是受限于对中国的高性能半导体出口管制。中国国产半导体仍处于试用阶段,因此中国企业在高效模型的开发上展开激烈竞争。“R1”在半导体内存使用量上大幅减少,具有简化的设计。这两个“限制”反而催生了创新。
而中国AI的“2有”则是“丰富的人才”和“自由”。
清华大学、北京大学等中国名牌大学纷纷扩展生成AI部门。据美国智库称,世界顶尖的AI研究人员中,近一半在中国接受过教育。
DeepSeek约140人的开发团队正是这一优势的象征。梁文锋来自浙江大学,在AI研究领域颇有声誉。他重视“潜力而非经验”,因此公司的员工主要是20多岁的年轻人,也有许多博士生。所有员工都是没有海外经历的本土人才,团队中也有不少“天才少女”和数学奥林匹克获奖者等知名人物。
另一方面,尽管中国的AI行业在政治上受到政府管理,但整体来看,目前的开发环境相比于欧美,较为自由。特别是在欧洲高度重视的知识产权保护、伦理问题以及军事用途限制等方面,中国尚未实施严格的限制。
随着DeepSeek的崛起,原本由巨额资金左右的“强者游戏”突然被那些没有资源的“玩家”打破,低成本、低价格的竞争成为新游戏规则。美国的科技企业可能无法收回投资。
意识到危机的美国AI行业正迅速接近特朗普政府。
特朗普总统在1月20日宣布撤销拜登政府在2023年发布的AI监管令。此举回应了OpenAI的萨姆·奥尔特曼等人的要求,放弃了限制开发的伦理与安全规定,旨在应对来自中国的威胁。
未来,美国可能会加速对中国AI的出口管制与使用限制。然而,低价的中国AI可能会在某些国家普及,这为成为未来社会基础设施的“信息基础设施的脱钩”埋下了伏笔。作为全球AI两大开发国的美国和中国,在规则制定上不再合作,而是一路走向“无仁义的开发竞争”,这可能会导致AI构建的新世界成为一个无法无天的荒野。
技术发展的最终目的,是构建更美好的世界,还是进入“反乌托邦”呢?2025年1月20日,“特朗普2.0”与“R1”同时登场。为了不让这一天成为世界的分水岭,民主社会即使面临困境,也绝不能放弃“良知”。
日本经济新闻(中文版:日经中文网)中国总局长 桃井裕理
Original article: http://cn.nikkei.com/columnviewpoint/column/57913-2025-02-02-05-00-32.html?print=1