谷歌推出最新AI工具Gemini 3.5 Live Translate,支持超过70种语言的实时语音翻译,覆盖数千种语言组合。该工具采用"连续流翻译"架构,无需等待说话者停顿即可实时生成译文,延迟仅数秒,翻译效果更自然流畅。它能自动识别语种,适应嘈杂环境及非正式表达,并尽量保留说话者的语气与情感。目前已向开发者、企业及普通用户开放,可在任意智能手机上运行。
谷歌发布Gemini 3.5 Live Translate模型,支持70余种语言的实时语音互译,能保留语调、节奏与音调,实现流畅自然的连续翻译输出,避免传统逐句翻译的尴尬停顿。该功能已在Android与iOS版Google翻译中上线,并新增"听筒模式",无需耳机即可使用。Google Meet同步引入该功能,支持2000余种语言组合。企业用户本月进入私有预览阶段,开发者可通过Gemini Live API及AI Studio访问。所有生成音频均附带SynthID水印以防范虚假信息。
Google正式推出Gemini 3.5 Live Translate,这是一款支持超过70种语言的语音到语音实时翻译模型。该模型能够自动检测语言、匹配语调与语速,延迟仅几秒,翻译效果自然流畅。开发者可通过Gemini Live API或AI Studio提前体验,企业用户将在Google Meet中率先获得访问权限,Google翻译应用也将很快在Android和iOS平台更新。此外,所有音频流均嵌入SynthID水印,标记其为AI生成内容。
T-Mobile宣布开放Live Translation功能的公测,支持超过50种语言实时AI翻译,无需特定机型,普通功能机也可使用。与谷歌、苹果设备端翻译不同,T-Mobile的方案运行于网络层,所有后付费套餐用户均可参与测试。用户通话中按*87*即可激活,AI自动识别语言并克隆说话者声线进行翻译,保留语调与情感。T-Mobile表示不录制用户通话,AI模型也不基于用户数据训练。
DeepL以文字翻译工具著称,近日正式发布语音到语音翻译套件,支持会议、移动端及网页对话、一线员工群组对话等多种场景,并开放API供开发者定制使用。新产品支持Zoom和Microsoft Teams插件,可实现实时语音翻译或字幕显示。DeepL表示,其系统通过"语音转文字→翻译→文字转语音"流程实现翻译,未来将研发跳过文字步骤的端到端模型。目前该产品面临Sanas、Camb.AI、Palabra等竞争对手的挑战。