亚马逊推出Nova Sonic基础模型:可理解语音语调及情感 亚马逊发布Nova Sonic基础模型,首次将语音理解与生成整合至单一模型,使AI对话更接近人类自然交流。该模型通过Amazon Bedrock提供API服务,可应用于客服、教育、医疗等领域。 传统语音方案需协调语音识别、大语言模型和语音合成多个模块,难以保留语调、节奏等关键语境。Nova Sonic通过统一架构,能自动适配对话者的情感变化,例如当用户语气从兴奋转为担忧时,AI会调整回应方式。 模型支持实时打断识别、智能停顿处理,并生成文字转录供开发者调用工具API。演示案例显示,旅行AI助手能根据用户情绪提供机票报价,企业助手则可自动交互查询数据。
亚马逊推出NovaSonic基础模型:可理解语音语调及情感 亚马逊发布Nov
游乐看科技
2025-04-09 11:26:37
0
阅读:0