Meta发布SceneScript视觉模型，高效构建室内3D模型

微云疏影 2024-03-26 1301

描述

　　3 月 25 日，Meta 公司宣布研发 SceneScript 视觉模型。据悉，此模型具备用可编程语言构建场景的能力，能实时推断房间的几何形态，然后将相关信息转化为建筑学方面的近似的数值。

　　Meta 表示，此模型具备创建室内 3D 模型的高效与轻便，仅需几KB内存便能生成完整清晰的几何图形，同时，这些形状数据具备可解释性，便于用户理解和编辑。

　　值得注意的是，开发者借鑒了大语言模型中“预测单词”的技术原理，例如 Llama 模型，它能依据前一单词预测句子的下一词，如在输入“The cat sat on the…”的情况下，模型预测潜在的答案可能是 “mat”或“floor”。同样，SceneScript 借鉴这一概念，通过前一输入预测后续内容及应用这些建筑学描述重构复杂室内 3D 环境。

打开APP阅读更多精彩内容