打开 Google Maps,随便点一个东京街角的图钉。
选一个画风——「真实」「卡通」「赛博朋克」。
Genie 当场给你生成一个可以走进去的世界。720p 画质,每秒 24 帧,你转身回头,它把背后的世界记住了。
这是 Google DeepMind 上周在 I/O 2026 抛出来的新功能。
这事到底新在哪儿
Genie 不是新东西——它是 DeepMind 做了两年的”世界模型”项目,从文字描述生成可交互的环境。Genie 3 去年就能做了,但有个尴尬的问题:它生成的世界是 AI 凭空想出来的,跟现实地理对不上号。
这次接到 Street View 之后,性质变了——
输入:Google Maps 上一个坐标 + 一种视觉风格
输出:一个真实地理位置的可交互环境,你能在里面走来走去
Street View 这边贡献的数据量是真的大:2800 亿张图像,覆盖 110 个国家,7 大洲都有。
Genie 拿到坐标之后做两件事:
- 从 Street View 库里调出当地的真实图像锚定空间结构
- 用世界模型生成对应风格的可漫游环境,实时渲染
讲人话——它不是渲染一段视频给你看,是搭一个你能用方向键走进去的小型沙盒游戏,地理位置真,画风按你选。
几个关键数字
| 指标 | 数值 |
|---|---|
| 分辨率 | 720p |
| 帧率 | 20-24 fps |
| 锚定图像库 | 2800 亿张 |
| 覆盖国家 | 110 |
| 360° 转身记忆 | 是 |
| 文字指令交互 | 是 |
| 物理引擎 | 暂无 |
| 真实感 | “视频游戏级,不是照片级” |
最关键的是 360° 转身记忆——你转个圈再转回来,背后的环境跟之前一致。这个看起来理所当然的能力,过去的视频生成模型完全做不到(每生成一帧都是新的”想象”,几秒之后场景就漂了)。
怎么用、用在哪儿
第一批用户已经定了:Google AI Ultra 订阅者($200/月那档)。美国先开放,全球 Ultra 用户接下来几周陆续接入。
DeepMind 自己讲的几个落地方向——
自动驾驶训练:Waymo 已经在用 Genie 3 给 robotaxi 训练罕见场景。比如”前方道路突然出现儿童追球”这种现实里收集成本极高的数据,世界模型可以批量造。
机器人训练:物理 AI 公司可以用 Genie 在虚拟里把策略学好再迁移到真机,省下昂贵的实地测试。
消费级”踏勘”:旅游、房产、零售选址——客户不用飞过去,先在 Genie 里走一圈。
第三类是 Google AI Ultra 现在主推的场景。$200/月这个价位的订阅,目标客户就是有”我得能走进去看看”需求的专业用户。
这条赛道现在有谁
世界模型这两年是真的密集——
| 公司 | 项目 | 现状 |
|---|---|---|
| Google DeepMind | Genie 3 + Street View | I/O 2026 开放 |
| 李飞飞 World Labs | 3D 世界生成 | 拿了 10 亿美元融资 |
| LeCun AMI Labs | 世界模型 | 刚成立,挖了 Meta 班底 |
| Runway | Gen-4 World Model | 53 亿估值,主攻视频 |
| Tesla / xAI | Cybercab 世界模拟 | 内部用 |
Google 这次的关键差异在数据——Street View 这 2800 亿张图是别人复制不了的资产。Tesla 自己车队有路面数据,但城市覆盖远没 Street View 这么广;李飞飞和 LeCun 都得从头采数据。
讲人话:DeepMind 是最早做世界模型的,Google 是手里有最大空间图像库的。这两件事终于合上了。
几个不能忽视的问题
DeepMind 自己也讲了限制——
画质还是视频游戏级。不是照片级。真实纹理、动态光照、人物表情这些复杂的视觉细节还在 Genie 4 的 todo list 上。
没有物理引擎。你能走进去,但走到墙上不会反弹,捡起东西不会有重量。这意味着 Waymo 用它训练自动驾驶的时候,能用的场景是有限的——任何需要精确碰撞、惯性、流体的,还得回正经的仿真器(CARLA、Drive Sim 这些)。
Street View 拍摄时间戳。Google 街景在很多城市最近一次更新是 2-3 年前的图。Genie 生成的”上海陆家嘴”里有没有去年新建的楼?大概率没有。这个时间差对于”看个意境”够用,对于精确踏勘不够用。
接下来盯什么
两条线——
第一:Genie 4 什么时候来,物理引擎进不进去。DeepMind 内部据说在做,时间表没公布。
第二:开放给开发者的 API 什么时候开。现在是 Ultra 订阅消费端体验,没开发者接口。一旦 API 开了,World Labs、Runway 这些初创会立刻被甩开——大家硬碰硬,比的就是数据壁垒。
短期看,Google 这一手让世界模型从”研究 demo”正式进入”消费产品”。
中期看,地图公司的护城河可能比想象中宽很多。Google Maps、Street View、Earth 这三套数据是过去 20 年砸出来的,AI 时代一夜之间变成了 LLM 拿不到的稀缺资产。
参考来源:Google's Genie world model can now simulate real streets with Street View(TechCrunch)、Simulate real-world places with Project Genie and Street View(Google Blog)、Genie 3 + Street View: Google Turns 280 Billion Photos Into a Real-World Simulator(Pasquale Pillitteri)、Genie 3 Trains Waymo's Robotaxis on Rare Scenarios(TechTimes)、Google DeepMind connects Street View to Project Genie world model(TNW)