HY2.0采用混合专家架构,总参数406B,激活参数32B,支持256K上下文窗口,推理能力与效率居国内顶尖行列,且在文本创作与复杂指令遵循等实用场景上表现突出。
相比上一版本模型,HY2.0Think显著改进了预训练数据和强化学习策略,在数学、科学、代码、指令遵循等复杂推理场景的综合表现稳居国内第一梯队,泛化性大幅提升。
HY2.0采用混合专家架构,总参数406B,激活参数32B,支持256K上下文窗口,推理能力与效率居国内顶尖行列,且在文本创作与复杂指令遵循等实用场景上表现突出。
相比上一版本模型,HY2.0Think显著改进了预训练数据和强化学习策略,在数学、科学、代码、指令遵循等复杂推理场景的综合表现稳居国内第一梯队,泛化性大幅提升。