众力资讯网

AI图像为什么很假?真相藏在频谱里

你有没有感觉,AI图像扫一眼就觉得它假,说不上哪里怪,就是缺了点什么。

网友말린 고사리分析AI图像的频谱找到了答案。

图片是有空间频率的,变化平缓的纹理是低频,变化剧烈的纹理是高频。我们可以用傅立叶变换的快速版本FFT,将图片翻译成一张频率分布图。

而他用的方法叫带通滤波,是高通滤波加低通滤波的组合。

简单理解,低通只放行低频,留下大轮廓;高通只放行高频,留下锐利的边缘和细节。两者结合,用50、60、70截止频率,就能看出中频的信息长什么样。

中频带正好是人眼对纹理和层次最敏感的区段,他把AI图过滤到这一层后发现,AI生成的图像细节分布很均匀,没有重点。

而人类手绘的插画主次分明,明暗浓淡一目了然。

背后的原因是,人画画通常先打草稿再勾线,最后在关键地方加细节,信息天然就有了高低起伏。

而扩散模型从一团噪声里慢慢去噪生成,天生倾向于全图平均发力,细节就这样均匀撒满每个角落。