[CV]《IncorporatingPre-trainedDiffusion

爱生活爱珂珂 2025-08-27 06:20:36

[CV]《Incorporating Pre-trained Diffusion Models in Solving the Schrödinger Bridge Problem》Z Tang, T Hang, S Gu, D Chen... [Tsinghua University & Southeast University & University of Science and Technology of China] (2025)

将预训练扩散模型融入Schrödinger桥问题求解,开创训练稳定且高效的生成模型新范式:

• 统一Score-based Generative Models (SGMs)与Schrödinger桥(SB)问题,提出三种重参数化技术:IPMM(均值匹配)、IPTM(终点匹配)、IPFM(流匹配),显著提升SB训练速度与稳定性。

• 设计创新初始化策略,利用预训练SGMs作为强大起点,解决SB训练收敛慢、计算量大的瓶颈,实现SB与SGMs优势互补,训练更高效、生成质量更佳。

• 理论严谨证明重参数化训练目标与传统DSB方法等价,且支持直接替换预训练模型,避免传统SB方法因训练目标不匹配导致的性能下降。

• 通过高维高斯分布拟合、无条件图像生成(CelebA)、无配对图像翻译(AFHQ、Horse2Zebra、Selfie2Anime)及条件图像生成(ImageNet、CUB-200)等多任务广泛验证,均优于现有方法,特别在FID分数和KL散度表现卓越。

• 细致分析噪声调度对生成对齐度和多样性的影响,揭示预训练模型初始化如何引导SB训练快速收敛,避免训练不稳定和低效。

这项研究深刻连接了扩散模型与Schrödinger桥理论,开启生成模型训练的新思路,兼顾理论与实践,推动高分辨率自然图像及复杂条件生成任务的落地。

详见🔗 arxiv.org/abs/2508.18095

生成模型扩散模型Schrödinger桥无监督学习计算机视觉

0 阅读:0
爱生活爱珂珂

爱生活爱珂珂

感谢大家的关注