NanoBanana:Google的轻量级图像生成模型跑在端侧是什么体验

 · 

Google的NanoBanana是一个面向端侧部署的轻量级图像生成模型,和Stable Diffusion那种动辄几十GB的模型走了完全不同的路。

核心卖点

在手机上跑图像生成。 不需要云端服务器,不需要强大的GPU。模型小到可以在移动设备上直接运行。

这个定位决定了几个技术特征:

  • 模型参数量极度压缩
  • 推理速度优先(生成一张图几秒而不是几分钟)
  • 图像质量有取舍(不追求最高画质,追求”够用”)

为什么叫NanoBanana

Google的内部项目命名一向随意。”Nano”表示小,”Banana”……大概就是随便起的。(Google的传统:项目代号不需要有意义。)

应用场景

端侧图像生成最直接的应用:

  • 聊天中的即时图片生成(不用等服务器响应)
  • 离线场景下的图像处理(没网也能用)
  • 隐私敏感场景(图片不离开设备)

和苹果的端侧AI策略类似——能在本地做的就不上云。对于隐私意识越来越强的用户来说,这个特性本身就是卖点。

和Imagen的关系

Google的旗舰图像生成是Imagen系列,NanoBanana可以看作是Imagen的极度压缩版。用知识蒸馏和量化技术,把大模型的能力”塞进”一个可以在手机芯片上运行的小模型里。

当然画质差距是肉眼可见的。NanoBanana生成的图片和Midjourney、DALL-E 3这些云端模型没法比。但如果你的需求是”在手机上快速生成一张还行的图”,它就够了。

参考来源:Google AI博客