英伟达发布两款开源天气预报AI模型Earth-2中期预报和实时预报模型,采用基于Transformer架构设计。中期模型可提供未来15天高精度预报,实时模型可生成公里级分辨率的国家级预报。两款模型显著降低了计算资源需求,中期模型仅需26GB GPU内存,实时模型仅需5GB。英伟达还推出全球数据同化模型,可在几秒内完成传统方法需数小时的数据处理工作。
30人初创公司Arcee AI发布名为Trinity的4000亿参数开源基础模型,采用Apache许可证,声称是美国公司训练发布的最大开源基础模型之一。该模型在编程和数学测试中与Meta的Llama 4 Maverick相当甚至略胜一筹。公司用6个月时间、2000万美元成本完成训练,旨在为美国企业提供永久开源的前沿级替代方案,避免依赖中国开源模型。
Ai2推出开源AI编码代理系列,解决现有代理封闭昂贵难适配问题。首发产品SERA在SWE-Bench基准测试中解决超55%问题,超越同规模开源模型。SERA提供32B和8B两版本,支持一行代码部署。通过专业化训练,小型模型性能可媲美千亿参数模型,成本仅需400美元,比现有方案便宜百倍。
英伟达在美国气象学会年会上发布了开源AI天气预报模型和工具,旨在降低预报成本并提高准确性。新推出的Earth-2平台包含三个核心模型:基于Atlas架构的中期预报模型、基于StormScope架构的短期暴风预报模型,以及基于HealDA架构的全球数据同化模型。这些AI模型可在笔记本电脑等小型设备上运行,大幅降低了传统超级计算机的依赖,使更多国家能够建立本地预报能力。
英伟达推出Earth-2人工智能模型和工具套件,为全球科学家、初创企业、开发者、企业和政府提供更便捷的天气预测服务。该套件包含预训练模型、框架、定制配方和推理库,支持从观测数据到生成15天全球或局部风暴预报的全流程加速。核心组件包括15天高精度预测的Medium Range、分钟级局部风暴预报的Nowcasting等多个模型。相比传统超级计算机模型,生成式AI大幅降低了计算成本和复杂度。
谷歌更新开源MedGemma模型,推出MedGemma 1.5 4B版本,新增三维CT、MRI和全切片病理学影像支持。同时发布MedASR医学语音转文本模型,专门针对医学听写优化。新版本在医学文本、影像解读等核心功能上显著提升准确性,并宣布启动10万美元奖金的MedGemma影响力挑战赛。
在CES展会上,英伟达推出了新的开源Cosmos和GR00T模型,旨在加速机器人开发。这些模型包括Cosmos Transfer 2.5、Cosmos Predict 2.5世界模型,以及Cosmos Reason 2视觉语言模型,能够理解真实世界的物理和空间属性。此外,Isaac GR00T N1.6专为人形机器人设计。英伟达还发布了Isaac Lab-Arena和OSMO开源框架,并与多家机器人公司合作推出基于其技术的新产品。
在CES 2025上,英伟达发布了Alpamayo开源AI模型家族,包含模拟工具和数据集,用于训练物理机器人和车辆。核心产品Alpamayo 1是一个100亿参数的视觉语言行动模型,能让自动驾驶汽车像人类一样思考,解决复杂边缘案例。该模型通过分解问题、推理各种可能性来选择最安全路径,并能解释其驾驶决策。英伟达还发布了包含1700小时驾驶数据的开放数据集和AlpaSim开源模拟框架。
英伟达发布Nemotron 3系列开放模型,包含Nano、Super和Ultra三个版本,旨在为透明化智能体AI开发提供支持。该系列采用混合专家架构,帮助开发者构建和部署大规模多智能体系统。多智能体系统作为新兴设计模式,相比单一智能体具有更强灵活性和可扩展性,但也带来协调复杂性等挑战。
英伟达凭借其利润丰厚的硬件业务,成为唯一能够免费提供AI模型的公司。在OpenAI、谷歌等竞争对手纷纷转向闭源模型之际,英伟达加大了对开源Nemotron模型的投入。最新发布的Nemotron 3采用混合Mamba-Transformer架构和专家混合模型,推出Nano、Super和Ultra三个版本,参数规模从30亿到500亿不等,在推理速度和准确性上均有显著提升,展现了英伟达从芯片到软件栈的全栈整合战略。
英伟达凭借其庞大的硬件业务利润,成为唯一能够承担免费提供AI模型成本的公司。随着OpenAI、Anthropic等专有模型制造商竞争加剧,Meta考虑转向封闭模型,英伟达却加倍投入开源Nemotron模型。公司可以成本价获得任何规模的AI集群进行训练,其AI Enterprise软件栈年费仅4500美元。新发布的Nemotron 3采用混合专家架构,结合Mamba-Transformer技术,显著提升推理效率和内存使用率。
IBM研究人员发布了名为CUGA的开源AI代理,旨在自动化复杂的企业工作流程,任务完成率约为50%。CUGA全称为可配置通用代理,通过多代理编排、API集成和代码生成来实现智能任务自动化。在WebArena和AppWorld基准测试中,CUGA分别获得61.7%的Web任务成功率和48.2%的场景完成率。该系统采用Apache 2.0许可证发布,支持多种开源模型。
法国AI初创公司Mistral AI发布了Devstral 2,这是一个拥有1230亿参数的开放权重编程模型,在SWE-bench Verified基准测试中获得72.2%的分数。该公司还推出了名为Mistral Vibe的开发应用,这是一个命令行接口工具,能够扫描文件结构、维护项目上下文并自主执行shell命令。同时发布的还有240亿参数的Devstral Small 2,可在消费级硬件上本地运行。
开源理念曾重塑互联网和云计算,如今AI正面临类似转折点。仅开放模型权重还不够,企业需要的是可检查、可控制的AI系统。红帽CEO认为真正的开源AI需要开放训练数据和模型权重,配合开放工具生态系统。网络安全领域面临更大挑战,CrowdStrike推出代理式安全运营中心,通过编排多个专业AI代理协作应对威胁。未来企业AI成功将取决于开源透明度与智能编排的结合,创造既可信又可防御的系统。
英伟达宣布推出Alpamayo-R1开源推理视觉语言模型,专为自动驾驶研究设计,这是首个专注于自动驾驶的视觉语言行动模型。该模型基于英伟达Cosmos Reason模型构建,能够处理文本和图像,让车辆"看见"周围环境并做出决策。英伟达还发布了Cosmos Cookbook开发指南,帮助开发者训练和使用模型。这些技术对实现L4级自动驾驶至关重要。
谷歌推出全球最强差分私有大语言模型VaultGemma,这是一个10亿参数的模型,基于Gemma架构构建。该模型采用先进数学算法防止敏感数据泄露,通过在数据集中添加受控噪声实现隐私保护。VaultGemma在多项基准测试中表现卓越,性能可媲美同等参数的非私有模型,但完全不会暴露训练数据,为金融和医疗等监管行业的AI应用提供重要保障。
腾讯今日开源混元MT系列语言模型,专门针对翻译任务进行优化。该系列包含四个模型,其中两个旗舰模型均拥有70亿参数。腾讯使用四个不同数据集进行初始训练,并采用强化学习进行优化。在WMT25基准测试中,混元MT在31个语言对中的30个表现优于谷歌翻译,某些情况下得分高出65%,同时也超越了GPT-4.1和Claude 4 Sonnet等模型。
IBM与NASA合作开发名为Surya的开源AI模型,专门用于预测太阳耀斑和日冕物质抛射等太空天气事件。该模型基于NASA太阳动力学观测站九年高分辨率太阳观测数据训练,在太阳耀斑分类准确性上提升16%。目标是提供两小时预警,保护卫星、电网、通信系统等关键基础设施免受类似1859年卡林顿事件的强烈太阳风暴影响。
AI2发布开源MolmoAct 7B模型,具备三维空间推理能力,挑战英伟达和谷歌在物理AI领域的地位。该模型能让机器人理解物理世界、规划空间占用并执行动作,任务成功率达72.1%,超越谷歌、微软和英伟达的模型。与传统视觉-语言-动作模型不同,MolmoAct通过空间感知令牌实现真正的3D理解,可适应不同机器人形态。
西雅图AI研究机构Ai2发布MolmoAct 7B,这是首个动作推理模型,能让机器人在执行任务前进行"思考"和规划。该模型可将自然语言指令转化为3D空间中的运动轨迹,通过1800万样本在256个H100芯片上训练完成。在SimPLER基准测试中达到72.1%的任务成功率,超越了谷歌、微软等公司的同类模型。