Sora竟是用这些数据训练的？OpenAI CTO坦白惹众怒

置顶 Sora竟是用这些数据训练的？OpenAI CTO坦白惹众怒

文章字数：897

阅读时间： 3 分钟

智能摘要 DeepSeek

OpenAI的Sora文生视频工具在2月推出，能生成超现实场景，但手部处理仍有困难。Sora短期内不会公开，计划加入音频生成和用户编辑功能。OpenAI正优化其连贯性、易用性和成本。Sora的训练数据包括公开可用和许可数据，如Shutterstock。安全措施和训练数据来源是公众关注焦点。

OpenAI 的 Sora 在今年 2 月横空出世，把文生视频带向了新阶段。它能够根据文字提示生成超现实场景。Sora 的可适用人群受限，但是在各媒体平台上，Sora 的身影无处不在，大家都在期待着使用它。

在前几天的访谈中，三位作者透露出 Sora 的更多细节，包括它处理手部时仍然存在困难，但正在优化。他们也对 Sora 更多的优化方向进行了阐述，要让用户能够对视频画面有更加精准的控制。不过，短期内，Sora 并不会对公众公开。毕竟 Sora 能够生成与现实十分接近的视频，这会引发很多问题。而正因如此，它还需要更多的改进，人们也需要更多时间来适应。

不过不用气馁，这个短期可能不会太久。OpenAI 首席技术官 Mira Murati 接受了华尔街日报科技专栏作家 Joanna Stern 的采访。她在谈到 Sora 何时推出时，透露道 Sora 将于今年推出，大家可能要等几个月，一切都取决于红队的进展情况。

OpenAI 还计划在 Sora 中加入音频生成的功能，让视频生成效果更加逼真。接下来，他们也会继续优化 Sora，包括帧与帧之间连贯性、产品的易用性以及成本。OpenAI 也希望添加用户编辑 Sora 生成视频的功能。毕竟 AI 工具的成果并不是百分百准确。如果用户能够在 Sora 的基础上进行再创作，想必会有更好的视频效果和更准确的内容表达。

当然，技术解读上的深入浅出只是采访的一部分，另一部分始终围绕着安全、担忧这样的大众话题。比如，一段 20 秒的 720p 视频，不需要几个小时的生成时间，只要几分钟，Sora 在安全方面又将采取怎样的举措？

采访中，主持人还刻意将话题引到 Sora 训练数据上，Mira Murati 表示，Sora 接受过公开可用和许可数据的训练。当记者追问是否用到了 YouTube 上的视频时，Mira Murati 表示自己不是很确定。记者又追问是否用到了 Facebook 或者 Instagram 上的视频？Mira Murati 回答道如果它们是公开可用的，可能会成为数据地一部分，但我不确定，我不敢打包票。

此外她还承认 Shutterstock（是一家美国图片库、图片素材、图片音乐和编辑工具供应商）是训练数据的来源之一，也强调了他们的合作关系。

等人表示很赞

1,396

永远飞行模式

📝 广而告之

置顶 Sora竟是用这些数据训练的？OpenAI CTO坦白惹众怒

评论

置顶超级“辅助”来了！谷歌推出通用AI：能听玩家指令，陪打游戏

置顶星舰完成第三飞，我们怎么看？

置顶 AI巅峰大会！英伟达GTC大会：期望之高，B100撑得住场子吗？

置顶下一代AI“超级芯片”呼之欲出

置顶旅行者1号发出有价值信号，拯救最远航天器仍有希望

⏰ 文章聚合

🌁 图集

📖 推荐栏目

🤩 推荐作者

永远飞行模式

suxing

🍟 最新评论

😍 AIGC

永远飞行模式

📺社交媒体

📝 广而告之

置顶 Sora竟是用这些数据训练的？OpenAI CTO坦白惹众怒

评论

置顶 超级“辅助”来了！谷歌推出通用AI：能听玩家指令，陪打游戏

置顶 星舰完成第三飞，我们怎么看？

置顶 AI巅峰大会！英伟达GTC大会：期望之高，B100撑得住场子吗？

置顶 下一代AI“超级芯片”呼之欲出

置顶 旅行者1号发出有价值信号，拯救最远航天器仍有希望

⏰ 文章聚合

🌁 图集

📖 推荐栏目

🤩 推荐作者

永远飞行模式

suxing

🍟 最新评论

😍 AIGC

置顶超级“辅助”来了！谷歌推出通用AI：能听玩家指令，陪打游戏

置顶星舰完成第三飞，我们怎么看？

置顶下一代AI“超级芯片”呼之欲出

置顶旅行者1号发出有价值信号，拯救最远航天器仍有希望