Google 把 2800 亿张街景图喂给 Genie:你在地图上点哪儿,它现场建一个世界让你走进去

打开 Google Maps,随便点一个东京街角的图钉。

选一个画风——「真实」「卡通」「赛博朋克」。

Genie 当场给你生成一个可以走进去的世界。720p 画质,每秒 24 帧,你转身回头,它把背后的世界记住了。

这是 Google DeepMind 上周在 I/O 2026 抛出来的新功能。

这事到底新在哪儿

Genie 不是新东西——它是 DeepMind 做了两年的”世界模型”项目,从文字描述生成可交互的环境。Genie 3 去年就能做了,但有个尴尬的问题:它生成的世界是 AI 凭空想出来的,跟现实地理对不上号。

这次接到 Street View 之后,性质变了——

输入:Google Maps 上一个坐标 + 一种视觉风格

输出:一个真实地理位置的可交互环境,你能在里面走来走去

Street View 这边贡献的数据量是真的大:2800 亿张图像,覆盖 110 个国家,7 大洲都有

Genie 拿到坐标之后做两件事:

  1. 从 Street View 库里调出当地的真实图像锚定空间结构
  2. 用世界模型生成对应风格的可漫游环境,实时渲染

讲人话——它不是渲染一段视频给你看,是搭一个你能用方向键走进去的小型沙盒游戏,地理位置真,画风按你选

几个关键数字

指标 数值
分辨率 720p
帧率 20-24 fps
锚定图像库 2800 亿张
覆盖国家 110
360° 转身记忆
文字指令交互
物理引擎 暂无
真实感 “视频游戏级,不是照片级”

最关键的是 360° 转身记忆——你转个圈再转回来,背后的环境跟之前一致。这个看起来理所当然的能力,过去的视频生成模型完全做不到(每生成一帧都是新的”想象”,几秒之后场景就漂了)。

怎么用、用在哪儿

第一批用户已经定了:Google AI Ultra 订阅者($200/月那档)。美国先开放,全球 Ultra 用户接下来几周陆续接入。

DeepMind 自己讲的几个落地方向——

自动驾驶训练:Waymo 已经在用 Genie 3 给 robotaxi 训练罕见场景。比如”前方道路突然出现儿童追球”这种现实里收集成本极高的数据,世界模型可以批量造。

机器人训练:物理 AI 公司可以用 Genie 在虚拟里把策略学好再迁移到真机,省下昂贵的实地测试。

消费级”踏勘”:旅游、房产、零售选址——客户不用飞过去,先在 Genie 里走一圈。

第三类是 Google AI Ultra 现在主推的场景。$200/月这个价位的订阅,目标客户就是有”我得能走进去看看”需求的专业用户。

这条赛道现在有谁

世界模型这两年是真的密集——

公司 项目 现状
Google DeepMind Genie 3 + Street View I/O 2026 开放
李飞飞 World Labs 3D 世界生成 拿了 10 亿美元融资
LeCun AMI Labs 世界模型 刚成立,挖了 Meta 班底
Runway Gen-4 World Model 53 亿估值,主攻视频
Tesla / xAI Cybercab 世界模拟 内部用

Google 这次的关键差异在数据——Street View 这 2800 亿张图是别人复制不了的资产。Tesla 自己车队有路面数据,但城市覆盖远没 Street View 这么广;李飞飞和 LeCun 都得从头采数据。

讲人话:DeepMind 是最早做世界模型的,Google 是手里有最大空间图像库的。这两件事终于合上了。

几个不能忽视的问题

DeepMind 自己也讲了限制——

画质还是视频游戏级。不是照片级。真实纹理、动态光照、人物表情这些复杂的视觉细节还在 Genie 4 的 todo list 上。

没有物理引擎。你能走进去,但走到墙上不会反弹,捡起东西不会有重量。这意味着 Waymo 用它训练自动驾驶的时候,能用的场景是有限的——任何需要精确碰撞、惯性、流体的,还得回正经的仿真器(CARLA、Drive Sim 这些)。

Street View 拍摄时间戳。Google 街景在很多城市最近一次更新是 2-3 年前的图。Genie 生成的”上海陆家嘴”里有没有去年新建的楼?大概率没有。这个时间差对于”看个意境”够用,对于精确踏勘不够用。

接下来盯什么

两条线——

第一:Genie 4 什么时候来,物理引擎进不进去。DeepMind 内部据说在做,时间表没公布。

第二:开放给开发者的 API 什么时候开。现在是 Ultra 订阅消费端体验,没开发者接口。一旦 API 开了,World Labs、Runway 这些初创会立刻被甩开——大家硬碰硬,比的就是数据壁垒。

短期看,Google 这一手让世界模型从”研究 demo”正式进入”消费产品”。

中期看,地图公司的护城河可能比想象中宽很多。Google Maps、Street View、Earth 这三套数据是过去 20 年砸出来的,AI 时代一夜之间变成了 LLM 拿不到的稀缺资产。

参考来源:Google's Genie world model can now simulate real streets with Street View(TechCrunch)、Simulate real-world places with Project Genie and Street View(Google Blog)、Genie 3 + Street View: Google Turns 280 Billion Photos Into a Real-World Simulator(Pasquale Pillitteri)、Genie 3 Trains Waymo's Robotaxis on Rare Scenarios(TechTimes)、Google DeepMind connects Street View to Project Genie world model(TNW)