Thu, 14 Nov 2024 00:11:13 GMT
图中展示的是Vidu网站上的一段由人工智能生成的视频片段。该工具能够根据文本或图像提示创建视频。Evelyn Cheng | CNBC北京——总部位于北京的神树科技周三表示,其人工智能驱动的文本转视频工具Vidu现在能够通过组合图像生成视频。Vidu已经允许全球用户根据书面提示创建8秒的短视频。而OpenAI——ChatGPT的制造商——在二月份透露,其AI模型Sora可以从文本生成一分钟的视频,但尚未公开发布。
神树科技称,Vidu的新AI功能可以将三张图片——比如一件衬衫、一个人和一辆摩托车——组合成一段视频,展示穿着衬衫的人驾驶摩托车穿越场景。其他平台声称可以使用AI将文本或图像转换为视频,但输出质量参差不齐。神树科技声称其突破在于能够将三张独特的图像以视觉一致性整合到AI生成的视频中。
神树科技首席技术官范宝在普通话中表示:“我们很早就确定了(视觉一致性)为问题,并希望很好地解决它。”Vidu于四月推出,其将两张头像照片转换为逼真的人拥抱视频的能力在TikTok上走红。
神树科技联合创始人兼CEO唐嘉宇在普通话中表示,AI视频生成器已经从广告商、动画师和其他企业中盈利。他说,每位客户的月使用率可以从10万元到100万元不等(约合13,871美元到138,711美元)。为了解决版权问题,唐表示公司可能会与艺术家签订协议,允许AI模仿艺术家的绘画风格用于广告。他表示,尚未看到与消费者使用图像相关的重大法律案件。
唐补充说,Vidu不允许公众使用名人或“敏感”个体的图像生成内容。他表示,该AI工具还禁止裸体和暴力图像。至于个人照片,唐表示Vidu会根据通用数据保护条例销毁数据——这是一个全球基准。
根据PitchBook的数据,神树科技成立于去年,支持者包括百度风投、阿里巴巴关联公司蚂蚁集团、中国初创公司智普AI、启明创投和北京市政府。唐表示,Vidu的AI运行于中国和国外租用的云服务器上。
原文链接:https://www.cnbc.com/2024/11/14/chinese-ai-startup-shengshu-launches-image-to-video-tool-rivaling-sora.html