零样本学习 关键字列表
Azure AI Speech升级:仅需几秒音频即可生成逼真语音克隆

Azure AI Speech升级:仅需几秒音频即可生成逼真语音克隆

微软升级了Azure AI Speech服务,用户仅需几秒钟的语音样本即可快速生成逼真的语音复制品。该个人语音功能于2024年5月21日正式发布,采用名为"DragonV2.1Neural"的零样本文本转语音模型,支持100多种语言。微软表示新版本在语音自然度、韵律稳定性和发音准确性方面都有显著提升,可用于定制聊天机器人语音、视频配音等应用。尽管微软要求用户遵守使用政策并获得原说话者同意,但该技术仍可能被恶意使用。

企业专用 AI 语音模型新秀:aiOla 推出 Jargonic,号称在企业术语识别方面优于竞品

企业专用 AI 语音模型新秀:aiOla 推出 Jargonic,号称在企业术语识别方面优于竞品

aiOla 推出了一款名为 Jargonic 的新型自动语音识别模型,专为企业使用而设计。这个模型能够处理专业术语、背景噪音和各种口音,无需大量再训练或微调。Jargonic 采用独特的关键词识别系统,可以零样本适应企业特定词汇。在多项基准测试中,Jargonic 在准确性和专业术语识别方面都优于主要竞争对手。这款模型现已通过 API 向企业客户开放使用。