新型模型 关键字列表
Anthropic发布Claude Opus 4.7:这不是Mythos预览版

Anthropic发布Claude Opus 4.7:这不是Mythos预览版

Anthropic正式发布Claude Opus 4.7模型,主要面向开发者,专为复杂编程任务优化。该模型在指令遵循方面更为精确,改进了基于文件的记忆系统,可跨会话调取信息,同时支持更大图片文件处理与图表数据分析。此外,新模型在界面与文档创作上更具审美性。值得关注的是,Opus 4.7已集成部分Mythos级别的网络安全防护机制,可自动检测并拦截高风险网络安全请求。

英伟达发布Ising AI模型,推动量子纠错与校准技术革新

英伟达发布Ising AI模型,推动量子纠错与校准技术革新

英伟达宣布推出全球首个面向量子计算的开源AI模型系列——Ising,涵盖实时量子纠错与校准两大模型。其中,Ising Decoding基于3D卷积神经网络,速度和精度分别比现有开源标准提升2.5倍和3倍;Ising Calibration则通过视觉语言模型自动优化量子处理器的控制信号。目前,该模型已被康奈尔大学、IonQ等多家机构采用。

Meta携全新模型Muse Spark重返AI竞争赛道

Meta携全新模型Muse Spark重返AI竞争赛道

Meta超级智能实验室正式发布首款模型Muse Spark,这是扎克伯格斥巨资重组公司AI团队后的首个成果。该模型目前已为美国地区的Meta AI应用及网站提供支持,未来数周内将扩展至WhatsApp、Instagram、Facebook、Messenger及Meta智能眼镜,并向其他国家推出。Muse Spark支持多模态输入,具备多AI子代理协作能力,可在"即时"与"深度思考"两种模式间切换,并特别强调在健康领域的应用潜力。

Meta推出多模态推理模型Muse Spark,医疗问答能力领先同类产品

Meta推出多模态推理模型Muse Spark,医疗问答能力领先同类产品

Meta正式推出新款推理模型Muse Spark,擅长回答健康类问题及分析多模态数据。该模型将于未来几周上线Meta AI服务,并通过API向开发者开放(目前为私测阶段)。据Meta介绍,Muse Spark在多项基准测试中超越Claude 4.6 Opus、Gemini 3.1 Pro及GPT 5.4,在医疗问答评测HealthBench Hard上领先第二名逾2%。此外,该模型计算效率大幅提升,所需算力较前代模型Llama 4 Maverick降低逾一个数量级。

谷歌发布Lyria 3 Pro音乐生成模型,支持3分钟音轨创作

谷歌发布Lyria 3 Pro音乐生成模型,支持3分钟音轨创作

谷歌周三宣布发布Lyria 3 Pro音乐生成模型,用户可创作长达三分钟的音轨,相比前代30秒限制大幅提升。新模型提供更好的创意控制和定制化功能,用户可在提示中指定音乐元素如前奏、主歌、副歌等。该模型已集成到Gemini应用的付费订阅服务中,同时推广至Google Vids视频编辑应用和新收购的ProducerAI工具。谷歌强调使用合作伙伴数据训练模型,所有生成音轨均标记SynthID以标识AI制作。

OpenAI硬件设备将主打音频交互功能并搭载全新ChatGPT模型

OpenAI硬件设备将主打音频交互功能并搭载全新ChatGPT模型

据The Information报道,OpenAI正开发基于音频的AI设备,配备全新ChatGPT音频模型。新模型将提供更自然、更富情感的回应,支持与用户同时对话并更好处理中断。该音频模型计划于2026年第一季度发布。OpenAI还在开发包括智能眼镜和无屏智能音箱在内的音频设备生态系统,预计硬件产品将在一年后推出。

Runway推出Aleph模型,承诺下一代AI视频编辑体验

Runway推出Aleph模型,承诺下一代AI视频编辑体验

Runway推出最新AI模型Aleph,旨在重新定义视频创作与编辑方式。基于通用世界模型和模拟模型研究,Aleph提供对话式AI工具,能即时对现有或生成的视频进行复杂编辑。用户只需简单提示,即可删除物体、更换背景或重塑整个场景。与以往专注于文本生成视频的模型不同,Aleph强调"流畅编辑",确保场景、角色和环境的一致性,无需逐帧修复缺陷,为电影制作者和广告商提供更高效的工作流程。

OpenAI 推出 ChatGPT 深度研究代理

OpenAI 推出 ChatGPT 深度研究代理

OpenAI 推出 ChatGPT 深度研究代理,能够在 5 到 30 分钟内分析数百个在线资源,生成全面报告。该代理使用 o3 模型搜索互联网信息,准确性比现有模型高,但仍存在一些局限性。目前仅向付费用户开放,未来将扩展功能并提高使用限制。