3 月 25 日,Meta 公司宣布研发 SceneScript 视觉模型。据悉,此模型具备用可编程语言构建场景的能力,能实时推断房间的几何形态,然后将相关信息转化为建筑学方面的近似的数值。
Meta 表示,此模型具备创建室内 3D 模型的高效与轻便,仅需几KB内存便能生成完整清晰的几何图形,同时,这些形状数据具备可解释性,便于用户理解和编辑。
值得注意的是,开发者借鑒了大语言模型中“预测单词”的技术原理,例如 Llama 模型,它能依据前一单词预测句子的下一词,如在输入“The cat sat on the…”的情况下,模型预测潜在的答案可能是 “mat”或“floor”。同样,SceneScript 借鉴这一概念,通过前一输入预测后续内容及应用这些建筑学描述重构复杂室内 3D 环境。
全部0条评论
快来发表一下你的评论吧 !