小米今日发布并全量开源声音理解大模型 MiDashengLM-7B 该模型由两部分组成:Xiaomi Dasheng 音频编码器 + Qwen2.5-Omni-7B 解码器,具备对语音、环境音、音乐的统一理解能力。在 22 个公开评测集上全面刷新 SOTA 成绩,首 token 延迟仅为同类模型 1/4,显存利用效率更是超出先进模型 20 倍,特别适合边缘设备或低延迟场景使用。 这意味着,未来小米智能家居和车载语音助手,不仅能听懂你说什么,还能理解“你在哪里”“环境在发生什么”,真正从听见迈向理解声音的语境。 国产声音大模型开始具备实战部署能力,小米这波,值得关注。 🟦 你期待哪类设备最先用上大声模型?智能音箱、车机、还是手机? 数码真相集 小米AI战略 国产大模型
小米今日发布并全量开源声音理解大模型MiDashengLM-7B 该模型由两
游乐看科技
2025-08-04 16:16:42
0
阅读:0