[CV]《Incorporating Pre-trained Diffusion Models in Solving the Schrödinger Bridge Problem》Z Tang, T Hang, S Gu, D Chen... [Tsinghua University & Southeast University & University of Science and Technology of China] (2025)
将预训练扩散模型融入Schrödinger桥问题求解,开创训练稳定且高效的生成模型新范式:
• 统一Score-based Generative Models (SGMs)与Schrödinger桥(SB)问题,提出三种重参数化技术:IPMM(均值匹配)、IPTM(终点匹配)、IPFM(流匹配),显著提升SB训练速度与稳定性。
• 设计创新初始化策略,利用预训练SGMs作为强大起点,解决SB训练收敛慢、计算量大的瓶颈,实现SB与SGMs优势互补,训练更高效、生成质量更佳。
• 理论严谨证明重参数化训练目标与传统DSB方法等价,且支持直接替换预训练模型,避免传统SB方法因训练目标不匹配导致的性能下降。
• 通过高维高斯分布拟合、无条件图像生成(CelebA)、无配对图像翻译(AFHQ、Horse2Zebra、Selfie2Anime)及条件图像生成(ImageNet、CUB-200)等多任务广泛验证,均优于现有方法,特别在FID分数和KL散度表现卓越。
• 细致分析噪声调度对生成对齐度和多样性的影响,揭示预训练模型初始化如何引导SB训练快速收敛,避免训练不稳定和低效。
这项研究深刻连接了扩散模型与Schrödinger桥理论,开启生成模型训练的新思路,兼顾理论与实践,推动高分辨率自然图像及复杂条件生成任务的落地。
详见🔗 arxiv.org/abs/2508.18095
生成模型扩散模型Schrödinger桥无监督学习计算机视觉