11月23日,Meta公司宣布推出WorldGen,这是一种创新的端到端系统,能够仅通过单条文本提示词自动生成可交互、可导航的三维世界。该系统结合了程序化逻辑推理、基于扩散模型的三维生成技术和面向对象的场景分解方法,输出的三维场景在几何结构、视觉表现和渲染效率上均表现出色,适用于游戏开发、模拟仿真和沉浸式社交环境等多种应用场景。
WorldGen在生成三维资产方面取得了显著进展,它整合并创新了现有的二维与三维生成技术。与大多数基于单一指定视角构建三维世界的方法不同,WorldGen能够生成50米×50米尺度的全纹理三维场景,并确保整体风格与几何结构的高度一致性。这与那些在中心视角附近生成高质量几何与纹理,但一旦移动3-5米模型质量便迅速下降的方法形成对比。
尽管WorldGen已在生成多样化、可交互、可导航三维世界的研究方向上迈出关键一步,但目前仍处于研究阶段,尚未向开发者开放。不过,它所生成的内容可以直接兼容Unity、Unreal等主流游戏引擎,无需额外转换或定制渲染管线。Meta计划未来进一步拓展可生成世界的空间规模,并降低生成延迟。
