众力资讯网

[安徽日报]科大讯飞:让“中国声音”走向世界

在人工智能的星辰大海中,一家源自中国科学技术大学的企业,自1999年成立以来,便以“让机器能听会说,能理解会思考”为使命,在智能语音与人工智能的赛道上持续领跑。

它,就是科大讯飞。

从实验室的技术突破到赋能千行百业,从中文语音合成世界第一到星火大模型与国际巨头并驾齐驱,科大讯飞用二十六年的坚守与创新,奏响了让“中国声音”走向世界的强音。

源头创新:攀登技术珠峰的“中国脚印”

自主创新是科大讯飞深入骨髓的基因。公司将核心源头技术的突破置于战略高度,每年将约20%的营业收入投入研发,在人工智能发展史上刻下了一连串属于中国的里程碑:

从2008年首次让机器的语音合成超过普通人说话水平,到2012年语音评测超越人类专家,再到2015年语音识别超过人类速记员,科大讯飞一步步让机器“听得准、说得好”。在语音合成技术上,从2006年到2019年,连续14年获得BlizzardChallenge国际语音合成大赛冠军;在语音识别技术上,2016年至2023年,获得国际多通道语音分离和识别大赛CHiME四连冠,2021年在国际低资源多语种语音识别竞赛OpenASR中获得所有15个语种受限赛道和7个语种非受限赛道的冠军……

真正的突破始于让机器“能理解会思考”:2017年,“智医助理”以超过96.3%人类考生的成绩通过国家执业医师考试,展现了AI在专业领域的巨大潜力;2019年,机器阅读理解首次超越人类平均水平;直至2023年,公司在新一轮AI大模型浪潮中,毅然扛起“全国产化”大旗,发布自主可控的“讯飞星火大模型”和首个全国产算力平台“飞星一号”。

这份创新之力在近年来愈发澎湃。2024年,其“多语种智能语音关键技术及产业化”项目荣获国家科学技术进步奖一等奖,这是国家对其技术贡献的最高认可。2025年,科大讯飞更是厚积薄发,发布了基于全国产算力训练的深度推理大模型“讯飞星火X1”及升级版“X1.5”。尤为引人注目的是,X1.5模型在总参数量远小于业界同类模型的情况下,整体性能达到国际顶尖水平(GPT-5)的95%以上,并在数学等核心能力上保持领先,为世界提供了AI发展的“第二选择”。

在这背后,是科大讯飞在“无人区”的艰难探索:攻克长思维链强化学习训练效率,将其从30%提升至84%以上;全球首发非自回归语音大模型架构,实现推理成本下降520%。这些突破,不仅是对技术极限的挑战,更是在全球科技竞争格局下,夯实中国AI产业自主可控的“压舱石”。

赋能千行百业:AI技术落地生花的“中国方案”

技术唯有应用,才能创造价值。科大讯飞深谙此道,将领先的AI能力转化为赋能经济社会高质量发展的“春雨”,润物细无声。

教育领域,科大讯飞智慧教育产品已覆盖全国超1.3亿名师生。星火大模型构建了拥有4000多个标签的错因体系,能够精准分析学生学习短板,实现从作业精细批改到课堂精准教学的“小时级闭环”,正在深刻变革传统教学范式。

医疗领域,“智医助理”已成为全国800余个区县基层医生的得力助手,累计提供超11亿次AI辅诊建议,有效提升了基层诊疗的规范性和准确性。其专科AI诊疗能力更是业界首次达到等级医院主任医师水平,发布的“智医助理医院版1.0”和个人AI健康助手“讯飞晓医”,正朝着“为每个医生打造AI诊疗助理、为每个人打造AI健康助手”的愿景迈进。

工业、金融、汽车等领域,AI同样大放异彩。在工业场景,基于工业大模型的解决方案助力高端制造与能源行业提质增效;在金融领域,智能风控、智能客服等服务超200家金融机构;在汽车领域,科大讯飞的智能座舱系统已装车超6800万套,其出海解决方案覆盖23种海外语言,助力中国汽车品牌扬帆远航。

这份赋能产业的成绩单,在市场上获得了热烈回响。2024年,科大讯飞大模型解决方案中标金额高达8.48亿元,位列行业第一。从C端的AI学习机、智能办公本连续夺得销售冠军,到B端与众多央国企达成深度合作,科大讯飞的AI“火花”已在千行百业形成燎原之势。

前瞻探索:从“有用”到“懂你”的“中国温度”

科技的终极目标是服务于人。科大讯飞的探索,正从提升效率的“有用”,走向情感共鸣的“懂你”。

在2025年11月6日全球1024开发者节上,人们看到了一个更有“温度”的科大讯飞。智慧座舱2.0能通过2800多个记忆锚点“记住”用户的偏好,让车成为真正的“第三空间”;升级后的智能办公本,能将手写笔记与AI纪要深度融合,更贴合人性化记录习惯。

软硬一体支撑的多模态交互是AI融入真实世界的基础。发布会上,善解人意的数字人导览“小飞”生动展示了其多模态交互能力:她能实现多人多语种对话,根据历史信息进行个性化推荐,并完成购票、订酒店等任务。“小飞”优秀的交互体验源于讯飞麦克风远场识别、3D视觉感知、多人主动交互、类人举止反馈、视听觉融合理解、超拟人数字人、个性化记忆、情感语义等八项技术能力上的突破。

最动人的探索在于情感陪伴。发布会上亮相的“AI星朋友”,拥有高保真声音克隆和超过160种人设模型,它不仅能基于对话形成个性化记忆,更能在感知用户需要时主动联系,让科幻电影《Her》中的人机深情对话照进现实。这不仅是一项技术展示,更是科大讯飞对AI未来形态的思考——AI不应仅是高效的工具,更应是能理解、能共情、促进人类心理健康与成长的伙伴。

星火X1.5通过构建用户个性化记忆库,实现对用户长期画像、近期反馈、短期对话的综合理解,让AI真正“懂你”。此外,基于星火语音大模型,仅需一句录音即可复刻任意音色,并用一条指令创造任意风格的声音。“个性化记忆能力以及百变声音复刻都是我们的核心技术。”科大讯飞技术负责人告诉记者。