至顶网

参加完这场阿里云中企出海大会，我脑海中浮现出三个类比

智算“破壁者”：华为穿越AI生态周期的两张“底牌”

在算力“狂飙突进”的表象之下，华为正试图用“鲲鹏”与“昇腾”两张“底牌”，给出新的解题思路。
蓝牙出新招，连接未来，比你想象更快

时隔五年，蓝牙亚洲大会再次回到深圳，释放出清晰信号：蓝牙技术联盟正加速本地化运营、技术标准制定与场景创新。
集中式全闪，为中国移动与曙光存储补齐合作拼图

近日，曙光存储集中式全闪存储FlashNexus，在“中国移动2025-2027年全闪存存储产品集中采购项目”中以第二份额（27%）中标，合同金额高达3871万元，补齐了集中式存储的拼图。

YC加速器掌门人Gary Tan深度对话：下一代AI独角兽的逻辑变了，先去大厂再创业的时代已成往事，那里只是高智商人群的托儿所？

AI正在彻底改写创业规则：YC最新数据显示，10人团队12个月达成千万美元营收已成常态，"氛围编程"让技术不再是瓶颈，而创始人能否深度理解客户需求成为成败关键。当6人团队就能创造八位数收入时，我们看到的不仅是速度革命，更是对公司本质的重新定义。

日期碎片化：大语言模型时间推理的隐藏瓶颈，阿伯丁大学与格勒诺布尔阿尔卑斯大学联合研究揭示

这项由阿伯丁大学和格勒诺布尔阿尔卑斯大学研究者联合完成的研究揭示了大语言模型处理日期时的关键问题：现代分词器常将日期分割成无意义的碎片，如"20250312"被切分为"202"、"503"、"12"，这严重影响时间推理能力。研究提出了日期碎片化率指标，创建了DATEAUGBENCH测试集，并通过内部机制分析发现，大型模型能在早期层快速"修复"碎片化日期，但其推理路径与人类理解方式显著不同，这解释了模型在处理非标准日期时的准确率下降。

MUG-Eval: 让多语言模型评估像玩游戏一样简单 — KAIST与Trillion Labs联合研究突破

人工智能

多语言评估

大型语言模型

2025-05-28

MUG-Eval: 让多语言模型评估像玩游戏一样简单 — KAIST与Trillion Labs联合研究突破

MUG-Eval是KAIST和Trillion Labs联合开发的创新多语言评估框架，通过让语言模型在目标语言中进行自我对话来评估其生成能力。该方法独特之处在于不依赖语言特定工具或人工标注数据，而是通过任务完成率间接衡量语言能力。研究团队测试了8种顶级语言模型在30种语言上的表现，发现其结果与传统评估方法高度一致（相关系数>0.75）。MUG-Eval揭示了模型在低资源语言上表现显著落后，并发现英语并非评估低资源语言的最佳替代。该框架理论上支持2,102种语言，为真正包容的AI评估提供了新途径。

大型语言模型

自我调节推理

计算效率优化

2025-05-28

告别过度思考：浙江大学研究团队开发自制动力训练让大型语言模型更高效推理

浙江大学研究团队开发的"自制动力训练"（Self-Braking Tuning，SBT）方法解决了大型语言模型在推理过程中的过度思考问题。该方法不依赖外部干预，而是培养模型自主识别冗余推理并适时终止的能力。研究者通过分析推理效率比率和过度思考标记比率，构建了两种数据策略：SBT-E（精确版）和SBT-D（动态版）。实验结果表明，经过训练的模型在多个数学基准测试上保持原有准确率的同时，将标记消耗减少了30%到60%，显著提高了推理效率。这项创新使AI系统能更像人类一样有效思考，为资源受限环境下的AI部署提供了新解决方案。

推荐专题

昇腾AI开发者峰会

鲲鹏开发者峰会

驭浪者无疆：破界而生，重构制造新坐标

鲲鹏异腾开发者大会2025

算启当下即见未来

AI Agent制造业落地实战-从技术场景到效益提升的应用场景全解析

用出海找出口，以科技领航全球新赛道

用出海找出口驾驭“智造升维”的新变量

研华 x Jetson，加速突破边缘AI工业应用边界

用出海找出口——智造升级，全球布局

用出海找出口从“本土制造”到“世界智链”的跃迁

借力打力开天辟地——电信业如何借生成式AI之力，助推行业创新？

数据科学“茶水间——GTC导航篇

2024 亚马逊云科技 re:Invent

用出海找出口解锁海外成长密码

IBM打造可持续未来

破除 AI“算网”瓶颈加速企业创新转型

现代集成塑造创新未来

IT设备焕新唤醒无限创意

打造AI引擎加速度，激发企业创新潜力

NVIDIA AI加速精讲堂 7月25日14:00线上直播

数字化领航

2023 NVIDIA 初创企业展示报名开启

人工智能

自然语言处理

新型算法

2025-05-28

OnePlus 全力投身 AI 革新

OnePlus 推出多项 AI 功能，包括语音记录、翻译、智能拍照及屏幕录制，并通过全新 Plus Key 整合这些体验，将率先在印度市场的 OnePlus 13 系列手机中应用。

Mistral 推出 API 构建能够运行 Python、生成图像、执行 RAG 等任务的 AI 代理

人工智能

生成式 AI

动态编排

2025-05-28

Mistral 推出 API 构建能够运行 Python、生成图像、执行 RAG 等任务的 AI 代理

Mistral AI 推出新专有 API，利用 Mistral Medium 3 模型快速集成自主生成 AI 代理。平台内置 Python 执行、图像生成、文档库 ( RAG ) 及网络搜索等功能，支持多代理协同处理复杂任务，适用于各领域应用。

人工智能

时间推理

分词技术

2025-05-28

日期碎片化：大语言模型时间推理的隐藏瓶颈，阿伯丁大学与格勒诺布尔阿尔卑斯大学联合研究揭示

人工智能

多语言评估

大型语言模型

2025-05-28

MUG-Eval: 让多语言模型评估像玩游戏一样简单 — KAIST与Trillion Labs联合研究突破

大型语言模型

自我调节推理

计算效率优化

2025-05-28

告别过度思考：浙江大学研究团队开发自制动力训练让大型语言模型更高效推理

多模态大模型

空间理解

视觉几何

2025-05-28

SpatialScore：多模态空间理解的统一评测基准——上海交通大学AI团队如何挑战大模型的3D空间感知能力

上海交通大学AI团队提出的SpatialScore是迄今最全面的多模态空间理解评测基准，包含28K样本，涵盖各类空间任务。研究首创VGBench专门评估视觉几何感知能力，并开发SpatialAgent多代理系统，集成9种专业工具增强空间理解。实验表明，即使最先进的大模型在空间理解方面仍存显著局限，特别是在视觉几何感知任务上，而SpatialAgent通过结构化工具调用显著提升性能。这项工作为未来多模态模型在实体AI应用中的发展提供关键方向，填补了AI系统在3D空间认知能力评估的重要空白。

多模态大语言模型

思维奖励

强化学习

2025-05-28

SophiaVL-R1：为多模态大语言模型注入思维奖励，让AI推理能力更上一层楼

SophiaVL-R1是香港中文大学和上海人工智能实验室联合开发的多模态大语言模型，创新性地引入了"思维奖励"机制来提升AI的推理能力。与传统方法不同，该研究不仅关注AI是否得出正确答案，还评估整个思考过程的质量，通过Trust-GRPO算法智能地整合思维奖励和结果奖励。实验表明，即使只有7B参数，SophiaVL-R1也能在MathVista、MMMU等多个基准测试中超越参数量大10倍的模型，证明了思维过程监督对提升AI泛化推理能力的重要价值。

人工智能

强化学习

选择性推理

2025-05-28

思考还是不思考？为视觉-语言模型打造通过强化学习的选择性推理

这项由香港中文大学和新加坡国立大学研究者合作开发的"思考或不思考"（TON）框架，通过创新的"思考丢弃"策略和两阶段训练方法，实现了让视觉-语言模型能够像人类一样根据问题难度选择性推理的能力。实验表明，TON可减少高达90%的输出长度，同时保持或提升性能，在计数、数学和导航等多种任务中展现出显著优势，为AI系统在保持推理质量的同时大幅提升效率提供了新思路。

人工智能

多模态大语言模型

视觉推理

2025-05-28

让AI学会用图像思考：GRIT框架如何教会多模态大语言模型在视觉推理中打下坚实基础

GRIT是一种创新框架，它教会多模态大语言模型（MLLMs）在视觉推理过程中"边看边思考"。传统MLLMs虽能处理图像和文字，但无法明确指出推理时关注的具体图像区域。GRIT通过引入一种新的推理范式，让模型生成的推理内容自然地混合文本和边界框坐标，使AI能像人类一样在思考时明确参考视觉信息。研究团队开发的GRPO-GR强化学习方法不需要详细标注数据，仅用20个训练样本就能赋予模型这种能力。

人工智能安全

大型推理模型

安全对齐技术

2025-05-28

SafeKey：放大“啊哈时刻“洞察力，增强安全推理能力

这项研究提出了SafeKey框架，针对大型推理模型安全问题的新解决方案。研究者发现模型在思考过程中存在"安全啊哈时刻"，关键在于理解查询后的第一个句子。SafeKey通过双路径安全头和查询掩码建模两种方法增强这一安全信号，显著提升了模型对越狱攻击的防御能力，平均降低9.6%的有害率，同时保持模型的通用能力。这为AI安全领域提供了新的研究方向。

视觉语言模型

机器人操作数据

空间推理

2025-05-28

从机器人感知到智能理解：UC伯克利推出Robo2VLM，利用真实机器人操作数据训练视觉语言模型

UC伯克利研究团队开发了Robo2VLM，一个创新框架，利用真实机器人操作数据增强视觉语言模型的空间推理能力。该研究从176K真实机器人轨迹创建了一个包含684,710个问题的大规模VQA数据集，涵盖463个场景和3,396个操作任务。实验表明，这些数据可显著提升模型在空间关系理解、目标推理和物理交互方面的能力，为机器人与AI系统的融合开辟新方向。

人工智能

强化学习

多工具推理

2025-05-28

Tool-Star：如何让AI更聪明地使用多种工具解决问题？人民大学的强化学习新突破

Tool-Star是人民大学研究团队开发的AI多工具协作系统，它通过强化学习使大型语言模型能够自主调用多种外部工具进行推理。该系统采用创新的数据合成流程和两阶段训练框架，包括冷启动微调和带有层级奖励的自我批评强化学习。在10项挑战性推理任务中，Tool-Star展现出卓越性能，证明了多工具协作方法的有效性，为AI系统扩展能力边界开辟了新路径。

强化学习

大型语言模型

参数稀疏性

2025-05-28

强化学习只是微调了大型语言模型中的小型子网络 — 伊利诺伊大学厄巴纳-香槟分校研究发现

伊利诺伊大学厄巴纳-香槟分校研究发现，强化学习在微调大型语言模型时，实际上只更新了模型中5%-30%的参数，而非整个模型。这种"参数更新稀疏性"在各种RL算法和模型中普遍存在，且仅微调这个子网络就能达到与完全微调相同的效果。研究表明，训练数据与模型策略分布的接近程度是导致这种现象的主要原因，为未来开发更高效的RL训练方法提供了新思路。

无需训练的视觉语言大模型推理与反思能力：武汉大学研究团队开创性FRANK模型让AI自我纠错

多模态大语言模型

层次化权重合并

视觉推理能力

2025-05-28

无需训练的视觉语言大模型推理与反思能力：武汉大学研究团队开创性FRANK模型让AI自我纠错

武汉大学研究团队提出了FRANK模型，一种无需训练的方法，能让视觉语言大模型获得推理和反思能力。研究发现多模态模型中，浅层解码器负责视觉理解，深层负责文本推理，据此设计了一种层次化权重合并策略，将视觉模型与推理模型智能融合。他们通过泰勒展开推导出闭式融合权重公式，并引入注意力引导的指数衰减先验，使模型既保留视觉感知又获得推理能力。实验显示FRANK-38B在MMMU测试中达到69.2%准确率，超越GPT-4o，且展现出卓越的自我纠错能力，为多模态AI提供了无需昂贵训练的新途径。

人工智能生成

扩散模型

卷积神经网络

2025-05-28

DiCo：ByteDance团队重新激活卷积神经网络，实现高效率扩展的扩散模型

ByteDance和中国科学院的研究团队提出了Diffusion ConvNet (DiCo)，一种完全基于卷积神经网络的扩散模型架构，实现了图像生成任务中质量与效率的双重突破。研究发现DiT模型中的全局自注意力机制存在冗余，通过引入紧凑通道注意力机制，解决了卷积模型中的通道冗余问题。在ImageNet基准测试中，DiCo-XL比DiT-XL/2生成速度快2.7-3.1倍，同时实现了更优的图像质量，证明了纯卷积架构在扩散模型中的巨大潜力。