Sora到底懂不懂物理世界? Sora开启更多可能

描述

  OpenAI的视频生成模型Sora持续引发关注,而围绕Sora到底懂不懂物理世界?这个讨论越发火热,甚至是在讨论Sora 到底是不是物理引擎甚至世界模型?

  当然Sora 目前看起来似乎还微有瑕疵,但是视频效果已经足以震撼人心,而且OpenAI自己也认为确实还是有很多问题,比如Sora可能会混淆左右,比如Sora难以准确体现随时间推移而发生的事件,但是这些问题似乎都不会是Sora改进的阻碍。

  业界当然还有多种声音,比如英伟达高级研究科学家Jim Fan 认为Sora 是一个数据驱动的物理引擎,是一个可学习的模拟器,或者可以说是一个世界模型。

  还有图灵奖得主Yann LeCun则认为仅仅根据 prompt 生成逼真视频并不能代表一个模型理解了物理世界,生成视频的过程与基于世界模型的因果预测完全不同。

  还有观点认为Sora可以说确实是已经嵌入了物理模型,但问题是这个物理模型是否已经就是准确的?逻辑能力依然不行。

  不管大牛们怎么看,Sora的能力确实很强大,Sora 生成的视频能够展现出精细的场景,还有生动的角色表情和复杂的镜头动态。文本转视频模型似乎已经非常完美。

  有网友评论称“首个大型视频生成模型”的名号肯定没跑了,期待国产大模型反超。

  当然未来Sora落地应用,克服算力需求也是一大问题。

  这一次Sora 让大家看到了AI的技术已经扩展到了视频领域;Sora的强大令人震惊,业界多认为Sora展示了人工智能在理解真实世界场景并与之互动的能力,这被认为是朝着实现通用人工智能(AGI)的重要一步。未来Sora会将在更多领域得到推广应用。

  尽管目前Sora尚未对外开放公测,也未提供内部测试的申请途径。还只是在内部测试,但是全球都充满了期待。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分