法国AI初创公司Mistral发布Mistral 3系列开放权重模型,包含一个大型前沿模型和九个小型离线模型。该公司试图证明小型模型在企业应用中更具优势,可在单GPU上运行,成本更低且效率更高。Mistral Large 3具备多模态和多语言能力,参数达675亿。Ministral 3小型模型系列提供三种规格,支持视觉处理和大上下文窗口,可部署在边缘设备上。
亚马逊云科技宣布在其AI模型组合中新增全托管开放权重模型Qwen3和DeepSeek-V3.1。这些模型为依赖Amazon Bedrock生成式AI服务的客户提供更大灵活性。Qwen3来自阿里巴巴,在编程和推理方面表现出色;DeepSeek-V3.1在数学、编程和智能体任务方面性能卓越。开放权重模型具有成本优势和选择优势,支持模型精调和定制化。AWS计划在亚洲、拉美、欧洲和北美等全球关键市场推出这些新模型。
Meta周六推出了最新一代生成式AI模型家族Llama 4,包括Scout和Maverick两款开放权重的多模态模型。Scout是较小的170亿参数模型,Maverick则是中型模型,拥有170亿参数和128个专家子网络。测试显示Maverick在文本生成方面超越了ChatGPT-4o。更多Llama 4系列模型将在本月晚些时候公布。