Tue, 26 Nov 2024 11:00:01 GMT
法国电信巨头Orange周二宣布,将与微软支持的OpenAI和Facebook母公司Meta合作,开发定制的人工智能模型,旨在更好地理解和处理非洲地区的本土语言。Orange表示,正在与OpenAI和Meta共同研发基于各自Whisper和Llama开源AI模型的定制AI系统——这些公开可用的系统能够根据特定需求进行调整——以理解西非地区的大多数对话系统无法识别的语言。
目前,许多大型AI公司用于训练其算法的数据主要源自美国,这意味着当涉及欧洲、中东和非洲等不同地区时,其模型可能会丢失重要的文化与语言背景信息。Orange的首席AI官Steve Jarrett指出,这意味着这些模型在理解和处理使用较少代表性语言编写的文本和语音通信时可能会遇到困难。
Jarrett在接受CNBC采访时表示:“通过开放模型,我们可以进行所谓的微调,即向模型引入最初训练时未包含的额外信息。我们正在增加对西非地区语言的识别能力,这些语言目前任何AI都无法理解。”
Orange计划于2025年初首先推出包含两种西非地区语言——沃洛夫语和富拉语的AI模型。沃洛夫语主要在塞内加尔、冈比亚和毛里塔尼亚南部使用,而富拉语则主要在塞内加尔流行。Orange表示,这些开源AI模型将通过免费许可提供给外部非商业用途,如公共卫生和教育。该公司还计划将其定制AI模型扩展至最终覆盖所有18个西非国家。
Jarrett向CNBC解释道:“我们在西非国家运营,这些地区的许多本土语言在我们的客服中心被使用,但当前的AI模型无法理解这些人的输入或表达。”像OpenAI的GPT、Meta的Llama和Anthropic的Claude这样的大型语言模型并不完全适合非洲的需求,因为它们并未专门针对该地区的数据进行训练。
这一举措触及了一个全球范围内逐渐受到关注的概念——“主权AI”。该术语指的是,各国和地区应寻求对构建AI系统的核心技术基础设施拥有更大控制权,通过本地化数据存储和处理,以确保其代表特定的语言、文化和历史。Orange还计划在欧洲数据中心本地化数据处理和OpenAI模型的托管。Orange表示,这将使其能够提前访问OpenAI的最新和最先进的AI模型,并帮助其构建新的应用,如用于客户服务的AI语音系统。
Jarrett表示,Orange承诺“负责任地”使用AI,并“并非总是使用庞大的大型语言模型(LLM)来解决每个问题”,考虑到该技术巨大的能源需求带来的环境问题。除了利用AI系统改进客户服务外,Orange还在使用这项技术来提升其核心业务——移动网络的性能。Jarrett告诉CNBC:“在网络方面,我们不仅利用AI优化网络规划,还优化网络的实际运营。” 数据中存在一些信息,有助于我们在客户察觉之前识别并预测故障。每周五,您将收到一封邮件,汇总全球顶尖科技新闻,敬请订阅。
原文链接:https://www.cnbc.com/2024/11/26/orange-partners-with-openai-meta-on-custom-african-language-ai-models.html