【AI新秀】面世神秘 AI”纳米香蕉”,蒙上面纱的下一代图像编辑技术

Photo of author

By Global Team

最近全球AI社区中讨论最多的名字之一是“纳米香蕉(Nano-Banana)”。这一未经官方发布且没有开发商信息的不明型号在AI实验平台LMArena上首次亮相,引起了广泛关注。

LMArena是一个平台,用户可以通过输入简单的指令(提示词),让两个模型同时生成图像,并选择其中更好的一个来比较和投票。在投票结束后,才会揭示出哪个模型生成了哪个结果。在这一过程中,“纳米香蕉”这个名字反复出现,随着其压倒性的结果出现,兴趣迅速增加。

“纳米香蕉”之所以特别,主要在于其一致的角色表现能力。现有的图像生成AI通常在多次绘制同一人物时表情或身体比例会发生变化。然而,“纳米香蕉”能够在不改变人物眼睛、表情和服装的情况下实现多种场景,实现出色的游戏或网络漫画角色再现能力。

2025年于加拿大卡纳纳斯基斯举办的G7首脑会议纪念合影中使用了纳米香蕉测试的照片(图片来源=白宫)
2025年于加拿大卡纳纳斯基斯举办的G7首脑会议纪念合影中使用了纳米香蕉测试的照片(图片来源=白宫)

“将背景改为首尔城市”的提示词被用来进行图像编辑,最自然的右侧图像被选出后显示了“纳米香蕉”模型名。(图片=解决方案新闻李承勋记者 25..08.18)

将背景改为首尔城市的提示词被用来进行图像编辑,最自然的右侧图像被选出后显示了‘纳米香蕉’模型名。
将背景改为首尔城市的提示词被用来进行图像编辑,最自然的右侧图像被选出后显示了‘纳米香蕉’模型名。

另一点值得注意的是无蒙版的文本基础编辑功能。通常修改图像需要用户手动指定特定区域,而“纳米香蕉”仅需一句示例“将背景变为城市夜景”,即可改变相关部分。依旧保留人物或主要物体,只自然更换背景或其他要素。

然而,它的弱点也很明显。小字或复杂的文本表现经常会失败,广告牌上的文字或文档中的文本经常会被扭曲或难以阅读。社区里普遍认为,文字部分还需与图形工具结合使用。

记者亲自体验过LMArena的图像编辑模式下的“纳米香蕉”。然而,这并不是每次都能遇到的模型。由于随机分配,需要多次尝试。输入几次后,“纳米香蕉”就出现了。

实际使用结果显示,角色一致性非常令人印象深刻。同一人物在多个场景中,表情和姿势自然保持。背景更换也非常顺畅。细节如衣服或头发未做改变,仅背景变化,成品质量较高。然而,小文本表现依然脆弱,例如菜单上的文字容易变得扭曲或者变成完全不同的样子,因此商业用途似乎仍需加强。

在Reddit和X(前Twitter)上,“纳米香蕉”的体验分享快速传播。评价如“比谷歌的Imagen系列更自然”,并表示“如果商业化,广告、游戏、网络漫画的制作环境将会大大改变”。国内社区也活跃,案例如“用于制作自己的模型”以及“漫画编辑更顺畅”的反馈被广泛分享,成为热门话题。

在社区中,新型模型'nano-banana'的体验分享迅速扩散。(图片=ⓒRohan Paul / X)
在社区中,新型模型’nano-banana’的体验分享迅速扩散。(图片=ⓒRohan Paul / X)

“纳米香蕉”确切是哪个组织的产物尚未得到确认。然而业内专家普遍认为可能是谷歌的项目。首先被指出的是结果的质感和编辑方式。人物刻画的柔和,以及背景和主体的自然结合,与谷歌开发的“Imagen”系列十分相似。

最近在谷歌内部代码中发现的“GEMPIX”新功能名称也被列为佐证。一些参与分析的开发者认为,GEMPIX与图像生成功能相关,可能直接联系到“纳米香蕉”。如果GEMPIX表示“Gemini Pixel”,那么有可能与下一代Pixel设备一起推出的本地设备模型。

时间点也令人怀疑。谷歌定于8月20日(当地时间)举行的“Made by Google”活动上公布新型Pixel 10。谷歌过去也不断展示基于AI的新型照片和视频功能。社区迅速扩散这样的预测,即“纳米香蕉”将在此次活动中正式亮相。然而,目前为止,这仅是猜测,也可能是外部研究机构或初创公司开发的实验性模型。

通过纳米香蕉实验生成在快餐店中食用汉堡场景。(图片=解决方案新闻李承勋记者 25..08.18)
通过纳米香蕉实验生成在快餐店中食用汉堡场景。(图片=解决方案新闻李承勋记者 25..08.18)

此外,有必要制定由监管机构、学界和工业界共同参与的“AI透明性指南”。欧盟(EU)已通过AI法案(AI Act)对模型的风险进行分级,并要求高风险模型公开数据来源的制度。尽管韩国相关讨论仍处于初级阶段,但“尚不知谁创造的AI控制市场”的情况值得警惕,如今“纳米香蕉”现象所展示的正是这一问题。

最终,“纳米香蕉”带来的信息是,单靠性能是不够的。用户需要可以信赖的AI,换句话说,就是“知其来处及制造过程”的AI,才能成为市场标准。技术进步需要伴随伦理和制度装置方可长远扩散。透过“纳米香蕉”引发的讨论,为过度偏重性能竞争的AI产业提供了“透明与责任”的解决方案。

Leave a Comment