谷歌今日宣布升级AI搜索模式,新增四大核心功能。用户现可在桌面浏览器中对图像提问,未来几周将支持PDF文档上传分析。Canvas功能让用户跨会话构建项目计划,通过动态侧边栏持续更新进度。Search Live集成视频输入,基于Project Astra技术实现实时多模态交互。谷歌镜头正式登陆Chrome桌面版,用户可直接询问页面内容并获得AI概览。
亚马逊推出了一款名为 Nova Sonic 的 AI 语音模型,它不仅能理解语音内容,还能捕捉说话者的语气、犹豫等细微变化。这个模型整合了语音识别、回复生成和语音合成功能,能够实现更自然的对话交互。Nova Sonic 可以根据说话者的语气调整回应,理解对话中的停顿,并能适当处理打断等情况,从而提供更智能、更人性化的语音交互体验。
Sierra AI主要通过OpenAI的GPT-4o、o1等模型打造了一个对话式AI Agent平台,主要聚焦在客户服务领域,可以混合处理文本、语音自动执行超复杂工作流程。包括客服咨询、退订商单、订阅更新等。