Sora到底懂不懂物理世界? Sora开启更多可能

A面面观 2024-02-20 1345

　　OpenAI的视频生成模型Sora持续引发关注，而围绕Sora到底懂不懂物理世界？这个讨论越发火热，甚至是在讨论Sora 到底是不是物理引擎甚至世界模型？

　　当然Sora 目前看起来似乎还微有瑕疵，但是视频效果已经足以震撼人心，而且OpenAI自己也认为确实还是有很多问题，比如Sora可能会混淆左右，比如Sora难以准确体现随时间推移而发生的事件，但是这些问题似乎都不会是Sora改进的阻碍。

　　业界当然还有多种声音，比如英伟达高级研究科学家Jim Fan 认为Sora 是一个数据驱动的物理引擎，是一个可学习的模拟器，或者可以说是一个世界模型。

　　还有图灵奖得主Yann LeCun则认为仅仅根据 prompt 生成逼真视频并不能代表一个模型理解了物理世界，生成视频的过程与基于世界模型的因果预测完全不同。

　　还有观点认为Sora可以说确实是已经嵌入了物理模型，但问题是这个物理模型是否已经就是准确的？逻辑能力依然不行。

　　不管大牛们怎么看，Sora的能力确实很强大，Sora 生成的视频能够展现出精细的场景，还有生动的角色表情和复杂的镜头动态。文本转视频模型似乎已经非常完美。

　　有网友评论称“首个大型视频生成模型”的名号肯定没跑了，期待国产大模型反超。

　　当然未来Sora落地应用，克服算力需求也是一大问题。

　　这一次Sora 让大家看到了AI的技术已经扩展到了视频领域；Sora的强大令人震惊，业界多认为Sora展示了人工智能在理解真实世界场景并与之互动的能力，这被认为是朝着实现通用人工智能（AGI）的重要一步。未来Sora会将在更多领域得到推广应用。

　　尽管目前Sora尚未对外开放公测，也未提供内部测试的申请途径。还只是在内部测试，但是全球都充满了期待。

打开APP阅读更多精彩内容