Google的NanoBanana是一个面向端侧部署的轻量级图像生成模型,和Stable Diffusion那种动辄几十GB的模型走了完全不同的路。
核心卖点
在手机上跑图像生成。 不需要云端服务器,不需要强大的GPU。模型小到可以在移动设备上直接运行。
这个定位决定了几个技术特征:
- 模型参数量极度压缩
- 推理速度优先(生成一张图几秒而不是几分钟)
- 图像质量有取舍(不追求最高画质,追求”够用”)
为什么叫NanoBanana
Google的内部项目命名一向随意。”Nano”表示小,”Banana”……大概就是随便起的。(Google的传统:项目代号不需要有意义。)
应用场景
端侧图像生成最直接的应用:
- 聊天中的即时图片生成(不用等服务器响应)
- 离线场景下的图像处理(没网也能用)
- 隐私敏感场景(图片不离开设备)
和苹果的端侧AI策略类似——能在本地做的就不上云。对于隐私意识越来越强的用户来说,这个特性本身就是卖点。
和Imagen的关系
Google的旗舰图像生成是Imagen系列,NanoBanana可以看作是Imagen的极度压缩版。用知识蒸馏和量化技术,把大模型的能力”塞进”一个可以在手机芯片上运行的小模型里。
当然画质差距是肉眼可见的。NanoBanana生成的图片和Midjourney、DALL-E 3这些云端模型没法比。但如果你的需求是”在手机上快速生成一张还行的图”,它就够了。
参考来源:Google AI博客