
谷歌的视觉AI模型让我开始理解它名字的由来,因为在使用了几天后,我只能用"疯狂"来形容它:它生成的图像真实到令人疯狂。我盯着这些图像看太久后感觉自己都要疯了。如果我要找出一个理由来解释为什么NanoBananaPro的图像看起来比之前的AI生成内容更加真实,那就是:它们看起来就像用手机相机拍摄的照片。
当然,如果仔细观察,还是能找到一些破绽。比如文章开头那张(并非真实的!)城市人行道上情侣的图像。背景中的路灯看起来不太对劲,一些建筑立面——特别是更远处的背景——看起来有些奇怪和方正。但如果我只是在社交媒体上随便浏览这张照片呢?我绝对不会认为它是AI生成的。拍摄对象看起来很真实,但我认为图像看起来不太完美的事实恰恰让它更加可信。
明亮、平坦的曝光,宽广的景深,略显粗糙的细节:这一切都让我想到手机相机。流行iPhone相机应用Halide的联合创始人BenSandofsky对此表示赞同。在上面那张AI生成的渡轮图像中,他注意到了"智能手机照片中常见的激进图像锐化处理。这是一种让图像'突出'的视觉技巧。"手机拍照的另一个标志是什么?噪点。"大多数AI生成的照片感觉过于干净。这些照片中的纹理感觉就像来自微型智能手机传感器。"
那么,谷歌的AI是从哪里获得关于手机照片概念的呢?谷歌照片似乎是一个显而易见的——也是深度问题性的——来源,但Gemini应用的全球传播经理ElijahLawal表示,"对于NanoBanana,我们不使用谷歌照片。"他还告诉我,NanoBananaPro并没有被特别调整为产生手机相机的外观。"其中一个巨大的改进是它可以连接到谷歌搜索,"他说。如果你提示它创建一个关于今天天气的信息图表,它可以去查找温度——以前,你需要在提示中包含更多这些信息。
根据Lawal的说法,这仅限于文本搜索,而非图像搜索。但能够自行获取现实世界信息可能是这里的关键因素。NanoBananaPro特别擅长向图像添加在该背景下有意义的元素——即使你从未特别要求过它们。它可以添加历史元素,如符合时代的衣服和汽车,而无需明确指示。当我要求它为西雅图的假房子创建一个假Zillow房源时,它甚至添加了西北多重房源服务的水印。它在理解任务和添加这些小细节方面变得更好,而无需提示。
我要求Gemini为西西雅图的一套工匠风格的白色油漆和黑色装饰房屋提供Zillow房源。它返回了一个描述该地方的冗长纯文本房源,但通过另一个提示,我使用NanoBananaPro创建了一个配合描述的图像。我没有特别要求,但图像中包含了2023年版权,这很有趣,还有一个水印,就像你在大西雅图地区找到的基本上每张房地产照片上都有的那种。有趣的是,这不是当前的标识——而是以前的版本,与我2018年买房时每张照片上的标识相同。
我询问谷歌NanoBanana如何可能想出这个,DeepMind产品经理NainaRaisinghani建议这是一个幻觉,提供了这样的声明:"NanoBananaPro在角色一致性、图像生成和基于搜索的准确性方面提供了重大升级。虽然这是我们迄今为止最精确的图像模型,但AI幻觉可能会发生。如果图像不太对,我们鼓励您重试,因为后续尝试通常会产生更符合您意图的结果。"问题是,为房地产房源服务添加水印似乎正是模型按预期工作的表现。
无论有没有水印,我想"待售"标志上的小字可能会暴露这是AI生成的,或者门廊上的盆栽植物看起来有点太完美,但说实话?即使我内心深处知道这不是真的,我也很难相信这房子不是真实的。如果我在房地产网站上遇到它,我不会多想,水印确实有助于让它看起来真实。如果AI在模仿那些表明照片真实的信号方面变得如此出色,那么各位:我们完蛋了。
最令我担心的是:AI的破绽越来越难以发现,NanoBanana在模仿让图像看起来真实的小细节方面越来越好。我们给它一些模糊的提示来描绘一个Verge记者报道现场活动;它添加了诸如记者手中带有Verge标志的麦克风和屏幕下方的字幕等细节。没有拼写错误或外星人般的字母。没有六根手指的手。没有任何明显暴露它是AI的东西,但有很多小细节来证明它是真实的。
一年前,甚至几个月前,我有一种感觉,未来会有那么一天,除非另有证明,否则相信我在网上从不熟悉来源看到的任何照片或视频都是不明智的。这次经历让我确信那一天不是在未来;它就是现在。适当调整你的AI雷达,如果它让你有点疯狂,也不要感到惊讶。
Q&A
Q1:NanoBananaPro是什么?它有什么特别之处?
A:NanoBananaPro是谷歌开发的AI图像生成模型。它的特别之处在于能够生成看起来像手机拍摄的照片,具有明亮平坦的曝光、宽广景深和略显粗糙的细节,这些特征让生成的图像更加真实可信。
Q2:为什么NanoBananaPro生成的图像这么逼真?
A:主要原因是它能模仿手机相机拍照的特征,包括激进的图像锐化处理、适当的噪点和不太完美的细节。此外,它还能连接谷歌搜索获取实时信息,并自动添加符合场景的细节元素。
Q3:如何识别NanoBananaPro生成的假图像?
A:识别变得越来越困难,但仍可注意一些细节,如背景中略显奇怪的建筑、过于完美的植物、或不合理的水印等。但总的来说,AI破绽正变得越来越难以发现。