谷歌发布Gemma 4系列开放模型新成员,包括E2B、E4B、26B和31B变体,专为从边缘设备到高性能GPU的高效部署而设计。NVIDIA与谷歌合作优化该模型,支持从RTX PC到DGX Spark个人AI超级计算机等多种设备。新模型具备推理、编程、智能体、多模态交互等能力,支持35种以上语言。通过Ollama和llama.cpp等工具可实现本地部署。
OpenAI周二发布GPT-5.4 mini和nano两款小型模型,专为智能代理系统委托的任务设计,包括代码库搜索、文件审查和并行子任务处理。mini模型在编程基准测试中仅比完整版GPT-5.4低3个百分点,但运行速度快两倍多。nano版本是高容量工作的精简版本,主要用于分类、数据提取等任务。两款模型都强调快速响应和成本效益,反映了AI向专业化分工发展的趋势。
AI编程公司Cursor本周发布的Composer 2模型被曝光是基于中国月之暗面公司的开源模型Kimi 2.5开发。尽管Cursor是估值293亿美元的美国独角兽企业,年化收入超20亿美元,但在发布时未提及使用了中美合作的技术基础。Cursor副总裁承认约四分之一的计算资源来自Kimi基础模型,其余为自主训练。公司联合创始人表示未在发布时提及Kimi基础是一个疏忽,将在下个模型中改进。
IBM Granite语音模型在澳大利亚皇家飞行医生服务的测试中表现卓越,能在飞机引擎噪音环境下准确识别医护人员语音。该技术将医护记录时间从28分钟缩短至2分钟,显著提升工作效率。相比其他主流模型,Granite在嘈杂环境中的语音理解能力更强,为语音输入应用开辟新可能性。
本研究通过在Amazon Nova 2.0 Lite多模态推理大模型上进行全面消融实验,系统分析了LoRA微调中不同目标模块配置对性能和效率的影响。实验涵盖七个数据集的文本和视觉任务。研究发现o_proj模块作为单一目标表现最为稳健,在准确性和延迟间实现最佳平衡。对于追求最高准确性的场景,推荐使用o_proj + fc2组合配置,相比o_proj单独使用可提升2-12%性能。该研究为标准化LoRA配置提供了原则性指导。
OpenAI本周发布了GPT-5.4 mini和GPT-5.4 nano两款新模型,专为快速、高效、大量AI工作负载设计。这些预算版语言模型在保持接近旗舰级性能的同时,大幅降低了使用成本。GPT-5.4 mini运行速度比GPT-5 mini快两倍以上,而GPT-5.4 nano是最小最快的模型。两款模型特别适用于编程助手、子代理任务、计算机视觉和多模态应用等需要低延迟的场景,为用户提供了性价比更高的AI解决方案。
OpenAI周二发布了GPT-5.4 mini和nano模型,这是GPT-5.4的最小和最快版本,专为编程等任务优化。GPT-5.4 mini在编码、推理和工具使用方面的速度比前代模型快两倍以上,适合代码编辑和调试。GPT-5.4 nano更小,适合数据分类和提取等基础工作。这些模型是OpenAI在与Anthropic竞争AI软件工程市场时加强编程功能的举措,直接挑战了Anthropic的Claude Code。
谷歌在二月底发布了新一代AI图像模型Nano Banana 2,声称具备原版模型的速度和Pro版本的世界知识储备。经过测试发现,该模型在照片编辑方面表现良好,处理速度显著提升,生成图像时间不到一分钟,而Pro版本需要2-5分钟。但在处理复杂反射等高难度任务时仍有局限性,精度方面也不如Pro版本。
OpenAI今日推出新一代大语言模型GPT-5.4,在自动化工作任务方面表现更优。新模型显著减少token使用量,降低推理成本,并支持自动工具搜索功能。GPT-5.4可处理多达100万token的请求,图像处理能力大幅提升,支持超过1000万像素图片无损上传。在计算机使用基准测试中创下75%的行业记录。
OpenAI发布GPT 5.4 Thinking和GPT 5.4 Pro两款新模型,专为企业级应用和AI智能体设计。该"思考型"模型响应时间稍长但准确性更高,能更高效支持智能体活动,计算成本更低。OpenAI称其为"最真实的模型",错误率比GPT 5.2降低18%,虚假声明减少33%。目前付费用户和开发者可通过API使用。此举被视为OpenAI对Anthropic Claude的有力回击。
OpenAI宣布推出GPT-5.3 Instant更新,旨在让ChatGPT的交互体验不再那么僵硬和尴尬。新模型将减少过度谨慎的拒绝回答和不必要的免责声明,提供更准确的回复,幻觉问题减少了27%。OpenAI表示此次更新重点改善了用户日常体验中的语调、相关性和对话流畅度,直接回应了用户对早期版本过于"生硬"的反馈。
Anthropic为其Claude AI聊天机器人推出重要升级,将记忆功能扩展至免费用户,并新增数据导入工具。用户现可轻松从ChatGPT、Gemini等竞争对手平台迁移个人数据至Claude,无需重新训练AI了解用户背景和历史对话。新工具通过预设提示词帮助用户复制其他AI平台的数据。随着Claude Code等工具推动popularity上升,以及新发布的Opus 4.6和Sonnet 4.6模型在编程和复杂任务处理方面的改进,此次升级进一步增强了Claude的竞争优势。
谷歌发布全新AI图像生成模型Nano Banana 2,正式名称为Gemini 3.1 Flash。该模型在世界知识理解、图像一致性、文本渲染、指令遵循、生成速度、图像保真度和专业品质等七个方面实现重大提升。新模型能更准确创建信息图表、保持多个角色和物体的一致性、生成清晰可读的文本内容,并支持从512px到4K分辨率的高质量图像输出,现已成为Gemini网站、应用程序和API的默认模型。
谷歌发布最新图像生成模型Nano Banana 2,基于Gemini 3.1 Flash技术,兼具Nano Banana Pro的高级智能和原版的超快速度。新模型提供先进的世界知识库、精准文本渲染翻译、主体一致性控制等功能,支持512px到4K分辨率输出。目前已在Gemini应用、搜索、AI Studio等谷歌产品中推出,并集成SynthID和C2PA内容溯源技术。
谷歌今日发布最新图像生成模型Nano Banana 2,该模型基于Gemini 3.1 Flash Image技术,相比前代产品可生成更逼真的图像。新模型将成为Gemini应用中快速、思考和专业模式的默认选择。Nano Banana 2保留了Pro版本的高保真特性但生成速度更快,支持512px至4K分辨率,可保持最多5个角色的一致性和14个物体的保真度。该模型已在141个国家的搜索结果中默认启用,所有生成图像都带有SynthID水印。
阿里巴巴发布Qwen3.5人工智能模型,声称在某些任务上超越GPT-5.2和Claude 4.5 Opus。该开源模型采用专家混合架构,拥有3970亿参数,每次推理仅激活170亿参数,支持262,144个token的上下文长度。模型结合线性注意力机制和门控增量网络等优化技术,显著提升硬件效率。支持210多种语言和图像处理,在多项基准测试中表现优异。
Anthropic公司宣布推出Claude Opus 4.6模型,在编程和项目创建方面表现更加出色。作为推理模型,Opus 4.6能够分解任务步骤并制定计划,还会自动检查和修正工作。该模型专注于解决复杂应用的核心难题,同时更快地处理简单任务。新模型面向Pro、Max、Team和Enterprise付费用户开放,Pro计划月费20美元但有使用限制。
OpenAI推出GPT-5.3 Codex智能编程工具,该模型能够执行开发者在计算机上的几乎所有任务,从简单的代码编写和审查扩展到构建复杂游戏和应用程序。新模型比前代版本快25%,并首次实现自我调试和性能评估。这一发布紧跟竞争对手Anthropic的类似产品,两家公司原计划同时发布,但Anthropic提前15分钟抢占先机。
Anthropic今日发布Claude Opus 4.6,称其为最强企业级知识工作模型。相比4.5版本,新模型具有更强自主性和更高首次成功率。该模型能够处理复杂的端到端企业工作流程,支持100万token上下文窗口,并引入代理团队功能。在法律推理、金融建模等专业领域表现突出,还集成PowerPoint实现幻灯片自动化编辑。新模型显著减少了文档、表格和演示文稿的反复修改需求。
OpenAI宣布将再次移除GPT-4o等多个模型。去年8月GPT-5发布时,公司曾移除GPT-4o引发用户强烈反对,因为用户认为GPT-4o比GPT-5更温暖友好。迫于压力,OpenAI恢复了GPT-4o访问权限。目前OpenAI已提供7种不同个性选择和自定义指令功能。公司称GPT-4o日活跃用户仅占0.1%,因此决定再次移除。值得注意的是,这些模型仍将通过API向开发者提供。