AI 不再只生成一个 3D 模型,开始生成「整个世界」——Vast 甩出 Project Eden,把世界拆成三层来造

过去两年,AI 生成 3D 这件事基本停在”给你一个物件”——你说一句话,它吐出一把椅子、一个角色、一栋楼的网格。

Vast 这家北京公司想干的是下一格:不生成一个物件,生成一个能一直存在、还能多人同时进去逛的世界。

6 月 1 日,Vast(旗下产品就是大家熟的 Tripo AI)公布了一个叫 Project Eden 的世界模型计划。同一天,它刚收下近 2 亿美元的 A+ 和 A++ 融资,估值过了 10 亿美元——但真正值得说的不是这笔钱,是它要造的东西。

“生成模型”和”生成世界”差在哪

现在主流的 AI 3D 工具,干的是一锤子买卖:输入一句描述,输出一个静态资产。生成完,它和别的物件之间没有关系,下次再要还得重新生成。

世界模型要解决的是另外三件事:

  • 能存档:这个世界生成出来后状态留得住,不是看一眼就消失
  • 能复用:同一个场景可以反复进、反复改
  • 能多人:好几个人同时进去,看到的是同一个世界

听起来像游戏引擎,但区别在于——这一切是 AI 生成出来的,不是美术一砖一瓦搭的。

把”世界是什么”和”世界长什么样”拆开

Project Eden 最有意思的地方在架构。Vast 把它拆成了解耦的三层:

干的活
结构化状态层 维护底层的 3D 世界状态,跟你从哪个角度看无关
状态到观测接口 把世界状态翻译成渲染需要的几何和语义条件
生成式渲染层 实时出画面,保证不同视角看过去是一致的

关键就在第一层和第三层的分家:把”世界本身是什么”和”世界当前长什么样”彻底分开。

为什么这么设计?因为只有状态独立于画面,世界才存得住、才能多人共享——你转个身,世界不会因为你没看着就重新瞎编一套;另一个人从另一个方向进来,看到的是同一个房间,不是各自的幻觉。这恰恰是当下那些”看着炫、一动就穿帮”的视频生成模型最缺的东西。

这家公司什么来头

Vast 成立于 2023 年,团队 100 多人。它的 Tripo 产品全球用户已经到了 2000 万,用户主要在美国、欧洲、日本和韩国。今年 3 月,它刚发过 H3.1 和 P1.0 两个 3D 生成模型——H3.1 主打几何精度,P1.0 几秒钟出可直接用的网格。

这次近 2 亿美元由 Ince Capital 和中国人寿旗下的长三角科创基金领投。钱主要砸向世界模型的研发团队、算法和数据基建。

首席科学家曹炎培(Yanpei Cao)把公司的定位讲得很白:

“We give them the tools to do what they do best.”

意思是——我们给创作者趁手的工具,让他们把自己最擅长的事做好。换句话说,对内部那批做游戏、做内容的人,Vast 的口径是帮手,不是替代。

为什么这事值得盯

世界模型是今年 AI 最热的前沿之一。它不只是给游戏和影视省美术成本,更被押在具身智能身上——机器人要在一个能预测物理、能反复试错的虚拟世界里练手,比在真实工厂里摔坏几十台划算太多。

这条赛道上,谷歌有 Genie,李飞飞的 World Labs 专门在做。现在又挤进来一个中国团队,而且是从”已经有 2000 万人用的 3D 生成产品”往上长,路径不太一样——别人从研究往产品走,它是从产品往研究反推。

Project Eden 目前还没正式开放给开发者,计划是 2026 年内。从”生成素材”到”生成世界”,难度是跳了一档的。

能不能把那张漂亮的架构图变成真能跑、真能多人进去逛的世界,今年底前会有第一批答案。

参考来源:Tripo AI Raises Nearly $200 Million and Launches Project Eden(GamesBeat / TipRanks);Vast Raises Nearly $200M for Tripo AI 3D Models(Implicator.ai);Tripo AI Raises Nearly $200 Million in Series A+ and Series A++ Financing(GlobeNewswire)