开源模型文章列表第1页-至顶网频道 - 至顶网

/

开源模型关键字列表

月之暗面完成20亿美元融资，估值达200亿美元

人工智能

大语言模型

开源模型

2026-05-12

月之暗面完成20亿美元融资，估值达200亿美元

北京AI实验室Moonshot AI近日完成约20亿美元融资，估值达200亿美元，本轮由美团旗下风投Long-Z Investment领投，清华资本、中国移动及CPE源峰参与跟投。过去六个月，该公司累计融资39亿美元。Moonshot AI由前Meta AI及Google Brain研究员杨植麟于2023年创立，旗下开源模型Kimi K2.5在编程基准测试中表现亮眼，最新模型Kimi K2.6已成为OpenRouter平台第二大热门模型。今年4月，公司年化营收突破2亿美元。

小米发布MIT许可的MiMo模型，专为长任务AI智能体设计

人工智能

自然语言处理

开源模型

2026-05-08

小米发布MIT许可的MiMo模型，专为长任务AI智能体设计

小米正式开源MiMo-V2.5与MiMo-V2.5-Pro两款模型，均采用MIT许可证，支持100万token上下文窗口。前者为全模态模型，支持文本、图像、视频和音频；后者专为复杂智能体与编程任务优化。两款模型均采用稀疏MoE架构，大幅降低推理成本。分析人士指出，其MIT授权和高token效率，有望成为企业构建高频自动化智能体工作流的经济型选择。

Ai2发布MolmoAct 2，大幅提升机器人现实世界操作能力

人工智能

机器人技术

开源模型

2026-05-08

Ai2发布MolmoAct 2，大幅提升机器人现实世界操作能力

西雅图人工智能研究机构Ai2发布新一代开源基础AI模型MolmoAct 2，专为机器人现实环境操作而设计。该模型性能大幅超越市场上的专有机器人模型，任务处理速度较前代提升最高37倍。Ai2同步发布了迄今最大的开源双臂操作数据集，包含逾720小时训练数据。MolmoAct 2已在斯坦福大学医学院CRISPR实验室完成真实环境测试，展现出协助湿实验室操作的强大潜力。

26人团队Arcee推出Trinity推理模型挑战中美AI巨头

人工智能

开源模型

推理能力

2026-04-08

26人团队Arcee推出Trinity推理模型挑战中美AI巨头

美国初创公司Arcee仅用2000万美元预算打造出4000亿参数的开源大语言模型，近日发布新推理模型Trinity Large Thinking。CEO称这是"非中国公司发布的最强开源模型"。该公司旨在为美西方企业提供替代中国模型的选择，用户可下载模型进行本地训练和部署，也可通过API使用云端版本。虽然性能未超越OpenAI等闭源模型，但避免了被大厂控制的风险，采用Apache 2.0开源许可协议。

谷歌发布Gemma 4开源AI模型，转向Apache 2.0许可证

人工智能

自然语言处理

开源模型

2026-04-03

谷歌发布Gemma 4开源AI模型，转向Apache 2.0许可证

谷歌正式推出Gemma 4开源AI模型系列，包含四个不同规格的版本，专为本地运行优化。其中26B混合专家模型和31B密集模型可在单张80GB GPU上运行，而E2B和E4B模型则针对移动设备优化。新模型在推理、数学和代码生成方面表现显著提升，支持原生函数调用和结构化JSON输出。最重要的是，谷歌放弃了此前限制性较强的自定义许可证，改用更加开放的Apache 2.0许可证，为开发者提供更大自由度。

谷歌发布Gemma 4开源模型系列，基于Gemini 3技术打造

人工智能

大语言模型

开源模型

2026-04-03

谷歌发布Gemma 4开源模型系列，基于Gemini 3技术打造

谷歌推出Gemma 4开源模型家族，包含2B、4B、26B和31B四个参数版本，分别适用于边缘设备和高性能机器。新模型支持视频、图像和音频处理，具备光学字符识别和离线代码生成能力，支持140多种语言。在Arena AI文本排行榜上，31B和26B版本分别位列第三和第六，性能超越了体积大20倍的模型。采用Apache 2.0许可证发布，为开发者提供更大的修改自由度。

Google发布Gemma 4对抗中国开源模型

人工智能

大语言模型

开源模型

2026-04-03

Google发布Gemma 4对抗中国开源模型

谷歌发布新一代开放权重Gemma 4模型，针对智能体AI和编程进行优化，采用更宽松的Apache 2.0许可证。该发布旨在应对来自月之暗面、阿里巴巴等中国厂商开源大模型的竞争压力。Gemma 4由DeepMind团队开发，包含310亿参数和260亿参数的MoE架构模型，以及面向边缘设备的轻量级版本，支持140多种语言、原生函数调用和多模态输入，为企业提供本土化AI替代方案。

Allen AI发布开源网络智能体MolmoWeb

人工智能

网络智能体

开源模型

2026-04-02

Allen AI发布开源网络智能体MolmoWeb

艾伦人工智能研究所发布MolmoWeb，这是一个开源视觉网络代理，属于Molmo 2模型家族。该模型提供40亿和80亿参数两个版本，体积小巧可本地运行。与其他网络代理不同，MolmoWeb未使用专有模型蒸馏训练，而是基于合成轨迹和人工演示数据。在多项基准测试中表现优异，超越了GPT-4o等模型。训练数据集包含3万个人工任务轨迹，涵盖1100多个网站。

中国在开源AI竞赛中领先，但美国公司仍控制底层基础设施

人工智能

开源模型

基础设施控制

2026-04-02

中国在开源AI竞赛中领先，但美国公司仍控制底层基础设施

中国在开源AI模型领域正迅速崛起，根据Hugging Face最新数据显示，中国开源模型下载量已超越美国，占据41%的月度下载份额。DeepSeek R1等模型的成功推动了百度、字节跳动、腾讯等公司大幅增加开源模型发布。然而，尽管中国在模型层面取得领先，英伟达仍牢牢控制着AI基础设施，大多数AI模型仍需依赖其GPU架构运行。

Mistral发布开源语音合成AI模型Voxtral TTS

人工智能

语音合成

开源模型

2026-03-27

Mistral发布开源语音合成AI模型Voxtral TTS

巴黎AI公司Mistral发布首个文本转语音模型Voxtral TTS，参数量仅40亿，可在消费级设备运行。该模型采用开源架构，支持英法德西等9种语言，仅需3秒音频即可实现声音克隆，能准确表达情感和语调变化。在自然度测试中与ElevenLabs等主流产品相当，为企业本地化语音应用提供了新选择。

Cohere发布首个开源语音转录模型Transcribe

人工智能

语音识别

开源模型

2026-03-27

Cohere发布首个开源语音转录模型Transcribe

企业AI公司Cohere推出首个语音模型Transcribe，这是一款专为转录设计的开源自动语音识别模型，可用于笔记记录和语音分析。该模型参数量仅20亿，适合消费级GPU自主部署，目前支持14种语言。在Hugging Face开放ASR排行榜上表现优异，平均词错率为5.42%。Cohere计划将其集成到企业智能体编排平台North中，并通过API免费提供服务。

Google医疗AI：从实验室到临床应用的突破性进展

人工智能

医疗诊断

开源模型

2026-03-18

Google医疗AI：从实验室到临床应用的突破性进展

谷歌在The Check Up活动中展示了医疗AI领域的最新突破，包括个人健康助手、乳腺癌检测、糖尿病视网膜病变筛查等应用。通过AMIE多智能体系统、MedGemma开源模型等技术，AI正从工具转变为医疗服务提供者的真正合作伙伴。谷歌还利用地球AI技术进行公共卫生研究，并在基因组学、科学计算等领域取得进展，致力于让AI惠及全球医疗健康事业。

大基因组模型：基于万亿碱基训练的开源AI

人工智能

基因组学

开源模型

2026-03-05

大基因组模型：基于万亿碱基训练的开源AI

研究团队发布了开源AI系统Evo 2，该系统在包含8.8万亿个碱基的数据集上训练，覆盖细菌、古菌和真核生物三大生命领域。与专注于细菌基因组的前代系统不同，Evo 2能够识别复杂真核生物基因组中的关键特征，包括调控DNA和剪接位点等。该系统采用卷积神经网络架构，具备零样本预测能力，无需特定任务微调。测试显示其在基因组注释、突变评估等方面表现出色，有望成为基因组分析的重要工具。

微软开源150亿参数多模态推理模型Phi-4

人工智能

多模态处理

开源模型

2026-03-05

微软开源150亿参数多模态推理模型Phi-4

微软发布硬件高效推理模型Phi-4-reasoning-vision-15B，可处理科学图表等多模态文件。该模型基于SigLIP-2和Phi-4 Reasoning算法，采用中融合技术降低硬件需求。模型主要使用开源数据训练，并通过GPT-4o优化图像标注。在MathVista_Mini基准测试中，性能比谷歌同类模型高出17%。可用于构建AI代理，分析用户界面和科学图表，代码已在多个平台开源。

让AI分清前后左右的新方法！北大与字节破解AI画画的“空间盲区”

人工智能

多模态

开源模型

2026-03-03

让AI分清前后左右的新方法！北大与字节破解AI画画的“空间盲区”

北大与字节跳动Seed团队合作提出SpatialScore，一个专用于评估AI生成图片空间位置准确度的奖励模型。

英伟达推出智能体AI蓝图和电信推理模型，推进自主网络发展

人工智能

智能体技术

开源模型

2026-03-02

英伟达推出智能体AI蓝图和电信推理模型，推进自主网络发展

NVIDIA发布基于Nemotron的大型电信模型，与AdaptKey AI合作开发300亿参数的开源模型，专门针对电信行业术语进行优化。同时推出网络配置和节能的AI蓝图，通过多智能体编排系统实现网络自主运营。该模型可理解电信语言并处理故障隔离、修复规划等复杂工作流程，为运营商构建自主网络提供完整的端到端智能体系统解决方案。

英伟达开源AI天气预报模型，无需超级计算机也能预测天气

人工智能

天气预报

开源模型

2026-02-10

英伟达开源AI天气预报模型，无需超级计算机也能预测天气

英伟达发布两款开源天气预报AI模型Earth-2中期预报和实时预报模型，采用基于Transformer架构设计。中期模型可提供未来15天高精度预报，实时模型可生成公里级分辨率的国家级预报。两款模型显著降低了计算资源需求，中期模型仅需26GB GPU内存，实时模型仅需5GB。英伟达还推出全球数据同化模型，可在几秒内完成传统方法需数小时的数据处理工作。

小型AI创企Arcee公司推出4000亿参数开源大模型挑战Meta Llama

人工智能

大语言模型

开源模型

2026-01-29

小型AI创企Arcee公司推出4000亿参数开源大模型挑战Meta Llama

30人初创公司Arcee AI发布名为Trinity的4000亿参数开源基础模型，采用Apache许可证，声称是美国公司训练发布的最大开源基础模型之一。该模型在编程和数学测试中与Meta的Llama 4 Maverick相当甚至略胜一筹。公司用6个月时间、2000万美元成本完成训练，旨在为美国企业提供永久开源的前沿级替代方案，避免依赖中国开源模型。

Ai2发布开源AI开发智能体系列可适应任意代码库

人工智能

代码生成

开源模型

2026-01-28

Ai2发布开源AI开发智能体系列可适应任意代码库

Ai2推出开源AI编码代理系列，解决现有代理封闭昂贵难适配问题。首发产品SERA在SWE-Bench基准测试中解决超55%问题，超越同规模开源模型。SERA提供32B和8B两版本，支持一行代码部署。通过专业化训练，小型模型性能可媲美千亿参数模型，成本仅需400美元，比现有方案便宜百倍。

英伟达在AI天气预报领域选择开源路线

人工智能

天气预报

开源模型

2026-01-27

英伟达在AI天气预报领域选择开源路线

英伟达在美国气象学会年会上发布了开源AI天气预报模型和工具，旨在降低预报成本并提高准确性。新推出的Earth-2平台包含三个核心模型：基于Atlas架构的中期预报模型、基于StormScope架构的短期暴风预报模型，以及基于HealDA架构的全球数据同化模型。这些AI模型可在笔记本电脑等小型设备上运行，大幅降低了传统超级计算机的依赖，使更多国家能够建立本地预报能力。

1
2
3

白皮书

更多

数字化转型方略

更多

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

- 关注官方公众号
- 关注官方微博
- 关注官方喜马拉雅

友情链接

北京第二十六维信息技术有限公司（至顶网）版权所有. 京ICP备15039648号-7 京ICP证161336号京公网安备 11010802021500号

举报电话：010-62641205-5060　涉未成年人举报专线：010-62641208 举报邮箱：jubao@zhiding.cn

网上有害信息举报专区：https://www.12377.cn

安全联盟认证