近日消息,Meta企业对外宣布已成功研发一款名为“SceneScript”的革新性视觉模型技术,该技术核心在于运用高级可编程指令实现对场景的瞬时构造与解析,能够即时推理出室内空间的精确几何结构,并能将此类信息高保真地转化为建筑领域的近似参数表达。
这一突破意味着SceneScript模型能够实时构建起三维立体空间模型,为建筑设计、虚拟现实及增强现实等领域带来更为便捷高效的场景构建方案。
Meta 声称,相关方法能够高效且轻量地建立室内 3D 模型,号称“只需要数 KB 的内存即可生成清晰且完整的几何形状”,并且相关形状数据具有“可解释性”,用户可以轻松阅读和编辑这些数据表示。
开发人员借鉴了大语言模型“预测单词”的方法来开发 SceneScript,以 Llama 模型为例,该模型可以根据前面的单词来预测句子的下一个单词,例如输入句子“The cat sat on the…”,模型会预测下一个单词可能是“mat”或“floor”。
而 SceneScript 运用了相同的概念,即通过前序输入内容推出后文,并使用这些建筑学层面的描述重建出复杂的室内 3D 环境。
文明上网,理性发言,共同做网络文明传播者