开源模型 关键字列表
月之暗面完成20亿美元融资,估值达200亿美元

月之暗面完成20亿美元融资,估值达200亿美元

北京AI实验室Moonshot AI近日完成约20亿美元融资,估值达200亿美元,本轮由美团旗下风投Long-Z Investment领投,清华资本、中国移动及CPE源峰参与跟投。过去六个月,该公司累计融资39亿美元。Moonshot AI由前Meta AI及Google Brain研究员杨植麟于2023年创立,旗下开源模型Kimi K2.5在编程基准测试中表现亮眼,最新模型Kimi K2.6已成为OpenRouter平台第二大热门模型。今年4月,公司年化营收突破2亿美元。

小米发布MIT许可的MiMo模型,专为长任务AI智能体设计

小米发布MIT许可的MiMo模型,专为长任务AI智能体设计

小米正式开源MiMo-V2.5与MiMo-V2.5-Pro两款模型,均采用MIT许可证,支持100万token上下文窗口。前者为全模态模型,支持文本、图像、视频和音频;后者专为复杂智能体与编程任务优化。两款模型均采用稀疏MoE架构,大幅降低推理成本。分析人士指出,其MIT授权和高token效率,有望成为企业构建高频自动化智能体工作流的经济型选择。

Ai2发布MolmoAct 2,大幅提升机器人现实世界操作能力

Ai2发布MolmoAct 2,大幅提升机器人现实世界操作能力

西雅图人工智能研究机构Ai2发布新一代开源基础AI模型MolmoAct 2,专为机器人现实环境操作而设计。该模型性能大幅超越市场上的专有机器人模型,任务处理速度较前代提升最高37倍。Ai2同步发布了迄今最大的开源双臂操作数据集,包含逾720小时训练数据。MolmoAct 2已在斯坦福大学医学院CRISPR实验室完成真实环境测试,展现出协助湿实验室操作的强大潜力。

26人团队Arcee推出Trinity推理模型挑战中美AI巨头

26人团队Arcee推出Trinity推理模型挑战中美AI巨头

美国初创公司Arcee仅用2000万美元预算打造出4000亿参数的开源大语言模型,近日发布新推理模型Trinity Large Thinking。CEO称这是"非中国公司发布的最强开源模型"。该公司旨在为美西方企业提供替代中国模型的选择,用户可下载模型进行本地训练和部署,也可通过API使用云端版本。虽然性能未超越OpenAI等闭源模型,但避免了被大厂控制的风险,采用Apache 2.0开源许可协议。

谷歌发布Gemma 4开源AI模型,转向Apache 2.0许可证

谷歌发布Gemma 4开源AI模型,转向Apache 2.0许可证

谷歌正式推出Gemma 4开源AI模型系列,包含四个不同规格的版本,专为本地运行优化。其中26B混合专家模型和31B密集模型可在单张80GB GPU上运行,而E2B和E4B模型则针对移动设备优化。新模型在推理、数学和代码生成方面表现显著提升,支持原生函数调用和结构化JSON输出。最重要的是,谷歌放弃了此前限制性较强的自定义许可证,改用更加开放的Apache 2.0许可证,为开发者提供更大自由度。

谷歌发布Gemma 4开源模型系列,基于Gemini 3技术打造

谷歌发布Gemma 4开源模型系列,基于Gemini 3技术打造

谷歌推出Gemma 4开源模型家族,包含2B、4B、26B和31B四个参数版本,分别适用于边缘设备和高性能机器。新模型支持视频、图像和音频处理,具备光学字符识别和离线代码生成能力,支持140多种语言。在Arena AI文本排行榜上,31B和26B版本分别位列第三和第六,性能超越了体积大20倍的模型。采用Apache 2.0许可证发布,为开发者提供更大的修改自由度。

Google发布Gemma 4对抗中国开源模型

Google发布Gemma 4对抗中国开源模型

谷歌发布新一代开放权重Gemma 4模型,针对智能体AI和编程进行优化,采用更宽松的Apache 2.0许可证。该发布旨在应对来自月之暗面、阿里巴巴等中国厂商开源大模型的竞争压力。Gemma 4由DeepMind团队开发,包含310亿参数和260亿参数的MoE架构模型,以及面向边缘设备的轻量级版本,支持140多种语言、原生函数调用和多模态输入,为企业提供本土化AI替代方案。

Allen AI发布开源网络智能体MolmoWeb

Allen AI发布开源网络智能体MolmoWeb

艾伦人工智能研究所发布MolmoWeb,这是一个开源视觉网络代理,属于Molmo 2模型家族。该模型提供40亿和80亿参数两个版本,体积小巧可本地运行。与其他网络代理不同,MolmoWeb未使用专有模型蒸馏训练,而是基于合成轨迹和人工演示数据。在多项基准测试中表现优异,超越了GPT-4o等模型。训练数据集包含3万个人工任务轨迹,涵盖1100多个网站。

中国在开源AI竞赛中领先,但美国公司仍控制底层基础设施

中国在开源AI竞赛中领先,但美国公司仍控制底层基础设施

中国在开源AI模型领域正迅速崛起,根据Hugging Face最新数据显示,中国开源模型下载量已超越美国,占据41%的月度下载份额。DeepSeek R1等模型的成功推动了百度、字节跳动、腾讯等公司大幅增加开源模型发布。然而,尽管中国在模型层面取得领先,英伟达仍牢牢控制着AI基础设施,大多数AI模型仍需依赖其GPU架构运行。

Mistral发布开源语音合成AI模型Voxtral TTS

Mistral发布开源语音合成AI模型Voxtral TTS

巴黎AI公司Mistral发布首个文本转语音模型Voxtral TTS,参数量仅40亿,可在消费级设备运行。该模型采用开源架构,支持英法德西等9种语言,仅需3秒音频即可实现声音克隆,能准确表达情感和语调变化。在自然度测试中与ElevenLabs等主流产品相当,为企业本地化语音应用提供了新选择。

Cohere发布首个开源语音转录模型Transcribe

Cohere发布首个开源语音转录模型Transcribe

企业AI公司Cohere推出首个语音模型Transcribe,这是一款专为转录设计的开源自动语音识别模型,可用于笔记记录和语音分析。该模型参数量仅20亿,适合消费级GPU自主部署,目前支持14种语言。在Hugging Face开放ASR排行榜上表现优异,平均词错率为5.42%。Cohere计划将其集成到企业智能体编排平台North中,并通过API免费提供服务。

Google医疗AI:从实验室到临床应用的突破性进展

Google医疗AI:从实验室到临床应用的突破性进展

谷歌在The Check Up活动中展示了医疗AI领域的最新突破,包括个人健康助手、乳腺癌检测、糖尿病视网膜病变筛查等应用。通过AMIE多智能体系统、MedGemma开源模型等技术,AI正从工具转变为医疗服务提供者的真正合作伙伴。谷歌还利用地球AI技术进行公共卫生研究,并在基因组学、科学计算等领域取得进展,致力于让AI惠及全球医疗健康事业。

大基因组模型:基于万亿碱基训练的开源AI

大基因组模型:基于万亿碱基训练的开源AI

研究团队发布了开源AI系统Evo 2,该系统在包含8.8万亿个碱基的数据集上训练,覆盖细菌、古菌和真核生物三大生命领域。与专注于细菌基因组的前代系统不同,Evo 2能够识别复杂真核生物基因组中的关键特征,包括调控DNA和剪接位点等。该系统采用卷积神经网络架构,具备零样本预测能力,无需特定任务微调。测试显示其在基因组注释、突变评估等方面表现出色,有望成为基因组分析的重要工具。

微软开源150亿参数多模态推理模型Phi-4

微软开源150亿参数多模态推理模型Phi-4

微软发布硬件高效推理模型Phi-4-reasoning-vision-15B,可处理科学图表等多模态文件。该模型基于SigLIP-2和Phi-4 Reasoning算法,采用中融合技术降低硬件需求。模型主要使用开源数据训练,并通过GPT-4o优化图像标注。在MathVista_Mini基准测试中,性能比谷歌同类模型高出17%。可用于构建AI代理,分析用户界面和科学图表,代码已在多个平台开源。

让AI分清前后左右的新方法!北大与字节破解AI画画的“空间盲区”

让AI分清前后左右的新方法!北大与字节破解AI画画的“空间盲区”

北大与字节跳动Seed团队合作提出SpatialScore,一个专用于评估AI生成图片空间位置准确度的奖励模型。

英伟达推出智能体AI蓝图和电信推理模型,推进自主网络发展

英伟达推出智能体AI蓝图和电信推理模型,推进自主网络发展

NVIDIA发布基于Nemotron的大型电信模型,与AdaptKey AI合作开发300亿参数的开源模型,专门针对电信行业术语进行优化。同时推出网络配置和节能的AI蓝图,通过多智能体编排系统实现网络自主运营。该模型可理解电信语言并处理故障隔离、修复规划等复杂工作流程,为运营商构建自主网络提供完整的端到端智能体系统解决方案。

英伟达开源AI天气预报模型,无需超级计算机也能预测天气

英伟达开源AI天气预报模型,无需超级计算机也能预测天气

英伟达发布两款开源天气预报AI模型Earth-2中期预报和实时预报模型,采用基于Transformer架构设计。中期模型可提供未来15天高精度预报,实时模型可生成公里级分辨率的国家级预报。两款模型显著降低了计算资源需求,中期模型仅需26GB GPU内存,实时模型仅需5GB。英伟达还推出全球数据同化模型,可在几秒内完成传统方法需数小时的数据处理工作。

小型AI创企Arcee公司推出4000亿参数开源大模型挑战Meta Llama

小型AI创企Arcee公司推出4000亿参数开源大模型挑战Meta Llama

30人初创公司Arcee AI发布名为Trinity的4000亿参数开源基础模型,采用Apache许可证,声称是美国公司训练发布的最大开源基础模型之一。该模型在编程和数学测试中与Meta的Llama 4 Maverick相当甚至略胜一筹。公司用6个月时间、2000万美元成本完成训练,旨在为美国企业提供永久开源的前沿级替代方案,避免依赖中国开源模型。

Ai2发布开源AI开发智能体系列 可适应任意代码库

Ai2发布开源AI开发智能体系列 可适应任意代码库

Ai2推出开源AI编码代理系列,解决现有代理封闭昂贵难适配问题。首发产品SERA在SWE-Bench基准测试中解决超55%问题,超越同规模开源模型。SERA提供32B和8B两版本,支持一行代码部署。通过专业化训练,小型模型性能可媲美千亿参数模型,成本仅需400美元,比现有方案便宜百倍。

英伟达在AI天气预报领域选择开源路线

英伟达在AI天气预报领域选择开源路线

英伟达在美国气象学会年会上发布了开源AI天气预报模型和工具,旨在降低预报成本并提高准确性。新推出的Earth-2平台包含三个核心模型:基于Atlas架构的中期预报模型、基于StormScope架构的短期暴风预报模型,以及基于HealDA架构的全球数据同化模型。这些AI模型可在笔记本电脑等小型设备上运行,大幅降低了传统超级计算机的依赖,使更多国家能够建立本地预报能力。