推理优化 关键字列表
OpenAI与Anthropic发布推理优化大语言模型

OpenAI与Anthropic发布推理优化大语言模型

OpenAI发布两款开源推理模型gpt-oss-120b和gpt-oss-20b,分别具有1170亿和210亿参数,可运行代码并与外部系统交互。其中20b版本仅需16GB显存,适合设备端部署。同时Anthropic推出Claude Opus 4.1升级版,在编程能力测试中得分提升至74.5%,并改进了研究和数据分析功能。

Deep Cogito发布四款开源混合推理大语言模型,具备自我改进"直觉"能力

Deep Cogito发布四款开源混合推理大语言模型,具备自我改进"直觉"能力

旧金山AI研究初创公司Deep Cogito发布四款新的大语言模型,参数规模从700亿到6710亿不等。这些模型采用混合推理系统设计,能够学习更有效的推理方式并自我改进。通过迭代蒸馏放大技术,模型将推理过程内化到训练中,发展出"机器直觉",使用比同类模型短60%的推理链条就能达到相似性能。模型在数学、法律推理和多跳问题等任务中表现出色,训练成本仅350万美元。

AlphaOne 为 AI 开发者提供控制大语言模型"思考"的新旋钮,提升性能表现

AlphaOne 为 AI 开发者提供控制大语言模型"思考"的新旋钮,提升性能表现

AlphaOne 框架使开发者能在模型推理过程中灵活调节“慢思考”与“快思考”,从而提高复杂任务的准确性与效率,同时降低计算成本。

Google Gemini 2.5 成为最新对标 DeepSeek R1 的模型

Google Gemini 2.5 成为最新对标 DeepSeek R1 的模型

Google 发布新一代 AI 模型 Gemini 2.5,在 LMArena 评测中位居榜首。该模型采用递归分析方法提供输出,在推理、科学、数学和代码生成等方面表现出色。目前已向付费高级用户开放使用,并将在 2025 年投入 750 亿美元用于 AI 开发,以争夺未来万亿规模的 AI 市场。

Elon Musk 的 xAI 为 Grok-3 增添"大脑"推理能力

Elon Musk 的 xAI 为 Grok-3 增添"大脑"推理能力

xAI 推出新一代人工智能模型 Grok-3,计算能力大幅提升,新增高级推理功能。该模型在初步测试中表现优于同类产品,并推出"思考"和"大脑"两种推理模式。xAI 还将推出名为"深度搜索"的 AI 代理产品。Grok-3 致力于追求真相,即使可能与政治正确相悖。

Microsoft 不讲理?不,是让 Copilot 更会"讲理"了:免费集成 OpenAI GPT-o1

Microsoft 不讲理?不,是让 Copilot 更会"讲理"了:免费集成 OpenAI GPT-o1

微软宣布将OpenAI的GPT-o1推理模型免费集成到Copilot中,增强其推理能力。这一决定紧随Microsoft 365涨价和竞争对手DeepSeek发布免费开源AI模型之后。GPT-o1作为链式思考模型,可通过产生中间输出来改善结果质量。此举旨在应对市场竞争,但也引发了对"免费"定义的争议。