模型优化文章列表第2页-至顶网频道 - 至顶网

/

模型优化关键字列表

OpenAI GPT-5.2 Pro数学能力大幅提升

人工智能

数学推理

模型优化

2026-01-29

OpenAI GPT-5.2 Pro数学能力大幅提升

非营利研究机构Epoch AI最新研究显示，OpenAI的GPT-5.2 Pro在解决复杂数学问题方面表现出色，超越了该公司此前的大语言模型版本。该模型成功解决了4个此前任何AI都无法处理的难题，并在13个已有模型能解决的问题中成功处理了11个，使整体解题率从19%提升至31%。数学问题一直是AI的难点，而此次测试表明AI在处理复杂数学问题方面正变得更加熟练。

IBM推出Mellea开源库助力轻量级AI模型提升效率

人工智能

开源技术

模型优化

2026-01-22

IBM推出Mellea开源库助力轻量级AI模型提升效率

大型语言模型仍占据AI排行榜主导地位，但轻量级模型正在缩小差距。IBM推出的新型开源库Mellea旨在通过结构化设计让小型语言模型表现更佳。该项目属于IBM"生成式计算"研究议程的一部分，通过将复杂任务分解为可验证的子任务，让Granite等轻量开源模型能以更低能耗实现与大型模型相当的性能。

OpenAI发布新旗舰图像生成AI模型GPT Image 1.5

人工智能

图像生成

模型优化

2025-12-17

OpenAI发布新旗舰图像生成AI模型GPT Image 1.5

OpenAI推出全新旗舰图像生成模型GPT Image 1.5，具备更强的指令理解能力、精准图片编辑功能，生成速度提升四倍。新模型在修改现有照片方面表现出色，支持实用的照片编辑、逼真的服装发型试穿效果，以及保持原图精髓的风格滤镜和概念转换。ChatGPT侧边栏新增专用图像标签页，提供预设滤镜和热门提示。OpenAI将此定位为企业级实用工具，从新奇图像生成转向实用高保真视觉创作。

OpenAI推出GPT Image 1.5模型加速图像生成竞争

人工智能

图像生成

模型优化

2025-12-17

OpenAI推出GPT Image 1.5模型加速图像生成竞争

OpenAI推出ChatGPT Images新版本GPT Image 1.5，承诺更好的指令遵循、更精确的编辑功能和高达4倍的图像生成速度。该模型面向所有ChatGPT用户和API开放。这是OpenAI在CEO奥特曼宣布"红色警报"后与谷歌Gemini竞争的最新升级。新模型提供后期制作功能，支持更精细的编辑控制，能在编辑过程中保持面部相似度、光照、构图和色调的视觉一致性，解决了传统AI图像工具迭代编辑时缺乏一致性的问题。

OpenAI发布GPT-5.2挑战谷歌和Anthropic

人工智能

大语言模型

模型优化

2025-12-12

OpenAI发布GPT-5.2挑战谷歌和Anthropic

OpenAI推出GPT-5.2模型，专为专业工作场景优化。新模型在创建电子表格、制作演示文稿、编写代码等方面表现更佳。GPT-5.2 Thinking版本在多项基准测试中超越前代产品，数学问题获得满分，事实性回答错误率降低30%。该发布被视为OpenAI对谷歌Gemini 3 Pro的"红色警报"回应，旨在重新夺回AI领域领先地位。

Runway与DeepSeek发布新一代基础模型，性能超越行业巨头算法

人工智能

视频生成

模型优化

2025-12-02

Runway与DeepSeek发布新一代基础模型，性能超越行业巨头算法

AI初创公司Runway和深度求索今日发布两款新基础模型，声称性能超越科技巨头算法。Runway的Gen-4.5提供文本转视频功能，在人工智能分析文本转视频基准测试中创下新纪录，能更好地遵循提示并生成更逼真的视频内容。深度求索发布的V3.2版本在编程和数学任务方面表现更优，采用新的注意力机制实现DSA，降低硬件使用率。两款模型均针对不同应用场景进行了优化。

Anthropic发布Opus 4.5版本，集成Chrome和Excel新功能

人工智能

自然语言处理

模型优化

2025-11-25

Anthropic发布Opus 4.5版本，集成Chrome和Excel新功能

Anthropic周一发布了旗舰模型Opus 4.5，这是4.5系列的最后一个模型。新版本在编程、工具使用和问题解决等基准测试中表现出色，是首个在SWE-Bench验证测试中得分超过80%的模型。同时推出Claude for Chrome和Claude for Excel产品，分别面向不同用户群体。Opus 4.5还改进了长文本处理的内存管理，支持付费用户的"无限聊天"功能，并针对智能体应用场景进行了优化，将与OpenAI的GPT 5.1和谷歌的Gemini 3展开竞争。

OpenAI GPT-5.1模型全面升级：个性化交互与推理能力双提升

人工智能

自然语言处理

模型优化

2025-11-13

OpenAI GPT-5.1模型全面升级：个性化交互与推理能力双提升

OpenAI宣布推出GPT-5的首个重大升级版本GPT-5.1，包含Instant和Thinking两个变体。新模型在对话风格上更加自然温暖，具备自适应推理能力，能根据问题复杂度调整思考深度。GPT-5.1提供八种个性化对话模式供用户选择，减少专业术语使用，提升易理解性。该升级旨在解决GPT-5发布后用户反馈的不足，将逐步向订阅用户推出。

OpenAI发布更智能温暖的GPT-5.1版本

人工智能

大语言模型

模型优化

2025-11-13

OpenAI发布更智能温暖的GPT-5.1版本

OpenAI正式推出GPT-5.1，主打更温暖自然的对话风格和增强的智能水平。新版本包含即时模式和思考模式两种变体，其中思考模式在简单任务上速度更快，复杂任务上更持久。GPT-5.1默认采用更对话化的语调，并提供友好、高效、专业等多种个性化选项。模型在遵循特定指令方面也有显著改进。该更新首先面向付费用户推出，随后扩展至免费用户。

Google Veo 3.1视频生成模型升级，图像转视频能力增强

人工智能

视频生成

模型优化

2025-10-16

Google Veo 3.1视频生成模型升级，图像转视频能力增强

谷歌发布Veo 3.1 AI视频生成模型更新，显著改进了提示词遵循能力和图像转视频功能。新版本可同时生成视频和音频，并在Flow视频编辑器中新增"帧到视频"功能，用户可上传首尾帧自动生成中间内容。虽然在真实感方面仍不如OpenAI的Sora 2，但谷歌专注于为专业视频工作者提供实用工具的策略值得认可。

苹果全新语言模型实现超快速长文本生成

文本生成

流匹配模型

模型优化

2025-10-14

苹果全新语言模型实现超快速长文本生成

苹果与俄亥俄州立大学研究人员发布名为FS-DFM的新模型，采用少步离散流匹配技术，仅需8轮快速优化即可生成完整长文本，效果媲美需要上千步骤的扩散模型。该模型通过三步训练法：处理不同优化预算、使用教师模型指导、调整迭代机制来实现突破。测试显示，参数量仅1.7亿至17亿的FS-DFM变体在困惑度和熵值指标上均优于70-80亿参数的大型扩散模型。

Liquid AI发布超小型高性能基础模型，专为设备端处理设计

人工智能

设备端AI

模型优化

2025-09-26

Liquid AI发布超小型高性能基础模型，专为设备端处理设计

AI初创公司Liquid AI发布名为"Nanos"的突破性小型AI模型，参数规模在3.5亿到26亿之间，可在手机、笔记本和嵌入式设备上本地运行。该模型在专门任务上可达到GPT-4o级别性能，支持多语言翻译、数据提取、数学推理等功能。公司采用"液态神经网络"架构，使模型能以极小体积提供前沿级性能，实现设备端AI处理，确保隐私安全并降低成本。

Gemini"香蕉"AI图像编辑体验：有趣但问题不少

人工智能

图像处理

模型优化

2025-09-08

Gemini"香蕉"AI图像编辑体验：有趣但问题不少

谷歌发布的Gemini 2.5 Flash Image AI图像编辑模型被用户昵称为"纳米香蕉"。该模型在添加图像元素和保持人物一致性方面表现出色，处理速度快且自动添加水印。但存在明显局限：只能生成方形图像、会降低照片分辨率、难以处理复杂编辑任务如移除反射等。谷歌表示正在改进相关问题。该功能免费提供，付费用户可获得更多使用额度。

本地大语言模型崛起：为何用户开始选择自主部署AI

人工智能

本地部署

模型优化

2025-09-01

本地大语言模型崛起：为何用户开始选择自主部署AI

随着AI服务成本上升和数据隐私担忧加剧，越来越多用户开始尝试本地部署大语言模型。硬件性能提升和软件工具优化使得在个人设备上运行AI模型变得可行。通过量化技术降低模型精度要求，配合llama.cpp等开源工具，用户可在消费级硬件上运行各类专业模型。虽然本地模型在通用性上仍逊色于云端大模型，但在特定场景下已能满足需求，且在隐私保护和成本控制方面优势明显。

OpenAI与微软发布全新语音生成模型

人工智能

语音生成

模型优化

2025-08-29

OpenAI与微软发布全新语音生成模型

OpenAI和微软发布了两款新的语音人工智能模型。OpenAI的gpt-realtime被称为其最强语音模型，可生成更自然的语音并能在句中改变语调和语言。微软推出的MAI-Voice-1模型已集成到Copilot助手中，具有高硬件效率，单个GPU即可在一秒内生成一分钟音频。两家公司还发布了MAI-1-preview模型，采用专家混合架构提高效率。

Gemini 2.5 Flash Image企业级图像编辑一致性与精准控制升级

人工智能

图像编辑

模型优化

2025-08-27

Gemini 2.5 Flash Image企业级图像编辑一致性与精准控制升级

Google正式发布Gemini 2.5 Flash Image模型，该模型此前在测试版中被称为nanobanana。新模型为企业创意项目提供更多选择，能够快速修改图像外观并提供比以往模型更强的控制能力。该模型在保持人物相似度和编辑一致性方面表现出色，支持多轮编辑、照片融合等功能，并已集成到Gemini应用中供付费和免费用户使用。

Gemini 2.5 Flash Image发布，图像编辑精度大幅提升

人工智能

图像处理

模型优化

2025-08-27

Gemini 2.5 Flash Image发布，图像编辑精度大幅提升

谷歌升级Gemini聊天机器人，推出新的AI图像模型Gemini 2.5 Flash Image，让用户能更精确地控制照片编辑。该模型基于自然语言请求进行图像编辑，同时保持面部、动物等细节的一致性，解决了竞争对手工具的常见问题。新工具在LMArena等基准测试中表现出色，专为消费者使用场景设计，支持多轮对话和多参考融合功能，并配备安全防护措施防止不当内容生成。

使用Llama.cpp在家中私密运行大语言模型

人工智能

命令行工具

模型优化

2025-08-26

使用Llama.cpp在家中私密运行大语言模型

本文详细介绍了如何使用Llama.cpp在个人电脑上本地运行大语言模型。内容涵盖了Llama.cpp的安装配置、模型部署、性能优化、量化压缩、推测解码、工具调用等核心功能。文章指出虽然训练大模型需要巨额投资，但运行已训练好的模型在普通硬件上是完全可行的。通过Llama.cpp，用户可以获得无限制的本地AI服务，避免数据上传云端，同时享受更好的性能和更多定制选项。

Hugging Face：企业在不牺牲性能下降低AI成本的5种方法

人工智能

模型优化

能源效率

2025-08-19

Hugging Face：企业在不牺牲性能下降低AI成本的5种方法

企业普遍认为AI模型需要大量算力，但Hugging Face专家认为应该更智能地使用AI。五个关键策略包括：为特定任务选择合适规模的模型而非通用大模型；将效率设为默认选项，避免不必要的高成本计算模式；通过批处理和精度调整优化硬件利用；推广能耗透明度评级系统；重新思考"更多算力更好"的观念，专注于智能架构和优质数据而非简单扩大GPU集群规模。

Anthropic的Claude AI模型现可处理更长的提示内容

人工智能

自然语言处理

模型优化

2025-08-14

Anthropic的Claude AI模型现可处理更长的提示内容

Anthropic宣布为企业客户增加Claude单次提示词的信息处理量，以吸引更多开发者使用其AI编程模型。Claude Sonnet 4现支持100万token上下文窗口，可处理75万词或7.5万行代码的请求，是此前限制的5倍，超过OpenAI GPT-5的40万token。该功能也将通过Amazon Bedrock和Google Cloud等云合作伙伴提供。更大的上下文窗口有助于AI模型更好地处理软件工程问题和长期自主编程任务。

1
2
3
4

白皮书

更多

数字化转型方略

更多

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

- 关注官方公众号
- 关注官方微博
- 关注官方喜马拉雅

友情链接

北京第二十六维信息技术有限公司（至顶网）版权所有. 京ICP备15039648号-7 京ICP证161336号京公网安备 11010802021500号

举报电话：010-62641205-5060　涉未成年人举报专线：010-62641208 举报邮箱：jubao@zhiding.cn

网上有害信息举报专区：https://www.12377.cn

安全联盟认证