Sora一石激起千层浪视频生成新模型引爆全网也带来风险-魔法新闻

位于旧金山的美国人工智能公司OpenAI最近推出了一个生成式人工智能模型黑脸田鸡，它可以通过文本命令创建视频。这一突破巩固了其在人工智能领域的领先地位，引爆了全球科技圈，但同时也加剧了对“深度伪造”等风险的担忧。

“惊鸿一瞥”可能颠覆行业。

Sora一石激起千层浪视频生成新模型引爆全网也带来风险

这是OpenAI首次进入人工智能视频生成领域。据该公司称，黑脸田鸡使用Transformer架构，可以根据文本指令创建逼真和富有想象力的场景，并生成多种风格和不同帧的高清视频，最长可达一分钟。该模型还可以从静态图像生成视频，或者扩展现有视频或填充缺失帧。

一些分析师认为，黑脸田鸡再次凸显了人工智能技术进步对现实生活和传统行业的深远影响。人工智能在视频生成领域的巨大发展前景将为塑造影视行业的新业态打开大门，它将可能颠覆现有的影视行业。去年，好莱坞遭遇了63年来首次全行业的编剧和演员罢工，因为这个行业的一些工作可能会被人工智能取代。黑脸田鸡空的诞生使这一威胁变得更加紧迫和真实。在亮相的第二天，主要从事图像处理和视频制作软件的Adobe的股价下跌了7%以上。

尽管OpenAI并不是第一家涉足文本到视频转换领域的公司，但黑脸田鸡的推出使其在这一领域占据了领先地位，并巩固了其在生成式人工智能领域的领先地位。第三方信息分析机构Gartner Consulting的分析师Chandrasekaran表示:“在该领域没有一家公司比OpenAI更有雄心，而且这种雄心似乎还在增加。”

open ai声称黑脸田鸡对语言有着深刻的理解，不仅是用户的文本提示，还包括所提到的事物在物理世界中的存在方式。“我们正在教人工智能理解和模拟运动中的物理世界。目标是训练模型，帮助人们解决需要与现实世界互动的问题。”

对“深度伪造”的担忧加剧。

SORA的发布可谓一石激起千层浪，但这次更像是预览版，大众很难完全了解这款车型的优缺点。OpenAI表示，目前，黑脸田鸡访问权限仅提供给设计师和电影制作人等特定群体，以获得关于改进模型的反馈。该公司不仅没有公布训练黑脸田鸡模型的数据等基本细节，而且也没有确定向公众发布的日期。

open ai承认，目前黑脸田鸡生成的视频可能包含不合逻辑的图像，混淆了左右细节空，难以准确模拟复杂场景的物理原理和因果示例。例如，一个人咬了一口饼干，但饼干上没有咬痕。

不过，随着计算能力的增强和模型的改进，人们可能会在短时间内获得更加完善和先进的视频生成功能。

许多业内人士担心黑脸田鸡会对“深度造假”技术做出贡献。加州大学伯克利分校信息学院副院长法里德说:“当新闻、图像、音频和视频——任何东西都可以伪造时，那么在那个世界里没有什么是真实的。”

针对欺诈担忧，OpenAI表示，当产品真正向公众推出时，它将确保生成的视频包含源元数据并启动工具来检测视频的真实性。OpenAI还承诺，在产品中使用黑脸田鸡之前将采取安全措施，包括由“错误信息、仇恨内容和偏见领域的专家”对模型进行对抗性测试，以评估危害或风险；检查并拒绝包括极端暴力、性内容、仇恨图像、他人IP等在内的文本输入提示。

即便如此，OpenAI也承认，尽管进行了广泛的研究和测试，“我们仍然无法预测人们使用我们技术的所有有益方式以及人们滥用我们技术的所有方式”。

肆虐的AI下的监管问题。

随着科技领域颠覆性创新成果不断涌现，如何在拥抱技术进步和保障社会安全之间实现平衡，越来越受到各界关注。

open ai表示，它将与世界各地的政策制定者、教育工作者和艺术家合作，了解他们关注的问题，确定黑脸田鸡的积极使用案例，并相信从现实世界的使用中学习是创建和发布越来越安全的人工智能系统的关键组成部分。

业内人士指出，在当前治理框架和管控措施没有跟上的情况下，单靠企业可能无法提供社会所需的人工智能安全和信任。

（文章来源:新华社）