英国启动对在版权内容上训练人工智能模型的审查

Tue, 17 Dec 2024 10:40:18 GMT

12月9日,OpenAI在美国及其他国家公开了其人工智能视频生成模型Sora。英国正在制定措施,以规范科技公司使用受版权保护的内容来训练其人工智能模型。英国政府于周二启动了一项咨询,旨在为创意产业和AI开发者提供更清晰的指导,涉及知识产权的获取及AI公司如何将其用于训练目的。一些艺术家和出版商对OpenAI和谷歌等公司未经许可自由抓取其内容用于训练大型语言模型表示不满。大型语言模型是当今生成式AI系统的基础技术,包括OpenAI的ChatGPT、谷歌的Gemini和Anthropic的Claude。去年,《纽约时报》起诉微软和OpenAI,指控其侵犯版权并滥用知识产权来训练大型语言模型。对此,OpenAI反驳称,使用公开网络数据训练AI模型应视为“合理使用”,并提供了权利人“退出”机制。此外,图片分发平台Getty Images在英国起诉生成式AI公司Stability AI,指控其未经同意抓取数百万张图片用于训练Stable Diffusion AI模型。Stability AI对此提出异议,称其模型的训练和开发是在英国境外进行的。

咨询将考虑的提案包括:首先,在商业用途背景下,为AI训练制定版权法例外,同时允许权利人保留其权利以控制内容使用。其次,提出措施帮助创作者许可并获得AI模型制作者使用其内容的报酬,并为AI开发者明确可用于训练的材料。政府表示,创意产业和技术公司需共同努力,确保权利保留和透明度的标准和要求有效、可及并广泛采用。政府还在考虑要求AI模型制作者更透明地披露其训练数据集及其获取方式,以便权利人了解其内容何时及如何被用于训练AI。这可能引发争议,因为科技公司在涉及其宝贵算法的数据或训练方式时,通常不愿公开这些商业敏感信息。此前,在时任首相苏纳克领导下,政府曾试图达成一项自愿的AI版权行为准则。

在最近接受CNBC采访时,应用开发软件公司Appian的首席执行官表示,他认为英国有望成为这一问题的“全球领导者”。他指出,英国通过2018年的《数据保护法》展示了其与知识产权权利的紧密关联,并且不像美国那样受到国内AI领导者的强烈游说影响,因此可能不会像美国政客那样容易屈服于科技巨头的压力。 lkins表示:“这是一股强大的力量,阻止任何人制定合理的立法或保护那些知识产权被这些主要人工智能玩家整体掠夺的个人的权利。”随着科技公司向更“多模态”的人工智能形式迈进——即能够理解和生成图像、视频以及文本内容的人工智能系统,AI企业可能存在的版权侵权问题正变得日益突出。上周,OpenAI在美国及“国际上大多数国家”公开了其AI视频生成模型Sora。该工具允许用户输入所需场景,并生成高清视频片段。

原文链接:https://www.cnbc.com/2024/12/17/uk-consults-on-rules-for-using-copyrighted-content-to-train-ai-models.html