OpenAI发布Sora,其备受瞩目的AI视频生成工具

Mon, 09 Dec 2024 18:08:48 GMT

OpenAI周一宣布,其备受瞩目的AI视频生成工具Sora将于当天晚些时候发布。这款AI视频生成模型与OpenAI的图像生成AI工具DALL-E类似:用户输入所需场景的文字描述,Sora将返回一段高清视频片段。Sora还能根据静态图像生成视频片段,并能扩展现有视频或填补缺失帧。微软支持的人工智能初创公司OpenAI,因去年ChatGPT的病毒式传播而声名鹊起,今年二月推出了Sora。

根据OpenAI的YouTube直播,Sora将于今日面向美国用户及“多数国际国家”用户首次亮相,且用户无需额外付费,该工具将包含在现有的付费ChatGPT账户中。此前,Sora主要面向一小群安全测试员,即“红队成员”开放,他们负责测试模型在错误信息和偏见等领域的漏洞。

Reddit用户曾在十月向OpenAI高管询问Sora的发布日期,质疑是否因推理所需的计算量/时间或安全问题而推迟。对此,OpenAI产品主管Kevin Weil回应称:“需要完善模型,确保安全/冒充等问题无误,并需扩展计算能力!”

OpenAI在十月份完成了最新一轮融资,估值达到1570亿美元,其中包括从众多投资公司和科技巨头筹集的66亿美元。此外,公司还获得了40亿美元的循环信贷额度,总流动性超过100亿美元。这都体现了OpenAI的严肃增长计划,作为微软支持的人工智能初创公司,它正与亚马逊支持的Anthropic、Elon Musk的xAI、Google、Meta、微软和亚马逊争夺生成式AI市场的最大份额,预计该市场十年内收入将突破万亿美元。

本月早些时候,OpenAI聘请了首位首席营销官,表明计划加大营销投入以扩大用户基础。十月,OpenAI在ChatGPT中推出了搜索功能,使其能更好地与Google、微软的Bing和Perplexity等搜索引擎竞争,并可能吸引更多原本访问这些网站进行网络搜索的用户。

借助Sora,ChatGPT的制造商希望与Meta和Google等公司的视频生成AI工具竞争,后者于一月宣布了Lumiere。其他初创公司如Stability AI也提供了类似的AI工具,如Stable Video Diffusion。亚马逊还推出了Create with Alexa,专注于生成基于提示的儿童短动画内容。

随着聊天机器人和图像生成器进入消费者和企业领域,视频可能成为生成式AI的下一个前沿。尽管创意机会将激发一些AI爱好者的兴趣,但新技术在全球重大政治选举期间带来了严重的错误信息担忧。根据机器学习公司Clarity的数据,AI生成的深度伪造数量同比增长了900%。

OpenAI已将多模态——结合文本、图像和视频生成——作为其提供更广泛AI模型套件的重要目标。Sora的发布消息传出之前,抗议者因担忧ChatGPT制造商对待艺术家的方式,决定泄露看似Sora的副本。OpenAI早期访问计划中的一些成员,约300名艺术家,在十一月底发表了一封公开信,批评OpenAI不够开放,且在营销之外对艺术支持不足。 承诺成为早期测试者、红队成员和创意合作伙伴,然而,我们认为我们正被诱导进行’艺术洗白’,以向世界宣称Sora是艺术家的实用工具。”信中还提到,数百名艺术家通过漏洞测试和Sora反馈为OpenAI提供了无偿劳动,而”尽管数百人免费贡献,少数人将通过竞赛被选中,他们的Sora创作影片将被放映——提供的补偿微不足道,与OpenAI获得的巨大公关和营销价值相比显得苍白无力。”

“我们并不反对将AI技术作为艺术工具的使用(如果反对,我们可能就不会被邀请参与此项目),”公开信中写道,”我们不认同的是这个艺术家项目的推出方式以及工具在可能的公开发布前的成型方式。我们向世界分享这些,希望OpenAI能更加开放,更友好地对待艺术家,并在公关噱头之外支持艺术。”

11月底,OpenAI的一位发言人就抗议者的行动向CNBC发表声明。”我们alpha阶段的数百名艺术家塑造了Sora的发展,帮助优先考虑新功能和安全措施,”OpenAI发言人当时表示,”参与是自愿的,没有义务提供反馈或使用工具。我们很高兴为这些艺术家提供免费访问,并将通过资助、活动和其他项目继续支持他们。”

此事件仍在发展中,请持续关注更新。

原文链接:https://www.cnbc.com/2024/12/09/openai-releases-sora-its-buzzy-ai-video-generation-tool.html