众力资讯网

加州大学圣迭戈分校与苹果公司的研究人员合作,在最新发布的论文《LaDiR:潜在扩

加州大学圣迭戈分校与苹果公司的研究人员合作,在最新发布的论文《LaDiR:潜在扩散增强 LLM 文本推理》中,提出了一种创新框架。该框架使大型语言模型能够在给出答案前,同时探索多种推理路径,然后采用自回归的方式生成最终输出,从而提升结果质量。据IT之家引述的相关博客介绍,LaDiR并非一个全新的模型,而是一种可应用于现有模型的通用框架,其核心在于改变模型的推理方式。该方案融合了扩散与自回归这两种主流的生成模式,在推理阶段采用扩散模型,在最终输出阶段则使用自回归模型。这种混合设计有效增强了模型应对复杂问题的能力,既发挥了扩散模型并行处理的效率,又保持了自回归模型输出内容的连贯性。LaDiR的一个显著特点是其并行推理机制。系统在推理时会同时生成多条独立的推理路径,每条路径都从随机噪声起步,通过扩散过程逐渐演化为清晰的推理步骤。为了避免所有路径过早地趋于同一结论,框架中特别加入了鼓励多样性的机制,从而确保每条路径能够探索不同的解题视角,最终形成一个多样化的备选答案集合。(IT之家)