亚马逊推出了一款名为 Nova Sonic 的 AI 语音模型,它不仅能理解语音内容,还能捕捉说话者的语气、犹豫等细微变化。这个模型整合了语音识别、回复生成和语音合成功能,能够实现更自然的对话交互。Nova Sonic 可以根据说话者的语气调整回应,理解对话中的停顿,并能适当处理打断等情况,从而提供更智能、更人性化的语音交互体验。
Sierra AI主要通过OpenAI的GPT-4o、o1等模型打造了一个对话式AI Agent平台,主要聚焦在客户服务领域,可以混合处理文本、语音自动执行超复杂工作流程。包括客服咨询、退订商单、订阅更新等。