OpenAI近日推出三款面向开发者的实时语音模型,分别专注于不同应用场景。GPT-Realtime-2基于GPT-5级别能力,支持在实时对话中进行推理、工具调用及中断处理;新翻译语音模型支持70种输入语言和13种输出语言;GPT-Realtime-Whisper则是低延迟流式语音转文字模型,可实时生成字幕或会议记录。三款模型均已纳入OpenAI的Realtime API,开发者可在Playground中进行测试体验。