继OpenAI和Meta之后,谷歌也在世界模型领域公布了其最新进展。 近日,谷歌发布了一种新的AI模型Genie,据谷歌官网介绍,Genie是一个基于互联网视频训练的基础世界模型,能够从合成图像、照片、草图等多种来源生成多种动作可控的环境。
随着谷歌的加入,世界模型领域的竞争愈发激烈,但目前尚难以确定谁能引领这一领域的发展风向。此前,Sora作为一款世界模型已引发争议。反对者认为其视频生成方式与世界模型的因果预测存在很大不同。从Sora发布的视频来看,虽然保真度较高,但模拟物理规律似乎是其弱点,且目前难以看出其交互能力。
相比之下,谷歌的Genie在交互性方面下了不少功夫。它能够推断出生成环境中的潜在动作,为用户提供一个可玩的、交互式的虚拟环境。然而,在视频真实性和清晰度的层面,Genie尚未展现出与Sora相当的水平。
总的来说,谷歌的Genie和Sora各自具有不同的优势和挑战。世界模型领域正迎来一场激烈的竞争,未来的发展方向将取决于各大公司在技术创新和市场应用上的表现。我们期待看到这一领域能够涌现出更多创新成果,推动人工智能技术的不断发展和进步。
全部0条评论
快来发表一下你的评论吧 !