最新文章
联想携手中足联点亮首个全栈AI总指挥中心
2025-11-18

联想携手中足联点亮首个全栈AI总指挥中心

国内首个全栈AI总指挥中心在京点亮,助推足球赛事迈入AI新时代

AI模型突破理解与生成鸿沟:港科大团队推出GIR-Bench基准测试套件

AI模型突破理解与生成鸿沟:港科大团队推出GIR-Bench基准测试套件

香港科技大学团队发表重要研究,开发GIR-Bench测试基准评估统一多模态AI模型的推理与生成能力。研究发现即使最先进的AI模型在理解与生成之间也存在显著差距,无法有效将推理过程转化为准确的视觉生成,为AI行业发展提供重要警示。

Meta研究团队:让AI写作也能接受"奖惩教育"的新方法

Meta研究团队:让AI写作也能接受"奖惩教育"的新方法

Meta超级智能实验室联合麻省理工学院开发了SPG三明治策略梯度方法,专门解决扩散语言模型强化学习训练中的技术难题。该方法通过上下界策略为AI模型提供精确的奖惩反馈机制,在数学和逻辑推理任务上实现了显著性能提升,为AI写作助手的智能化发展提供了新的技术路径。

上海AI实验室推出Vlaser:让机器人像人一样思考和行动的突破性模型

上海AI实验室推出Vlaser:让机器人像人一样思考和行动的突破性模型

上海AI实验室联合多所知名高校推出的Vlaser模型,成功将机器人的视觉理解、语言处理和精确行动能力统一在单一架构中。该模型基于600万个高质量训练样本构建,在12项综合测试中全面领先同类产品,实际机器人操作成功率超过64%,为机器人智能从工具向伙伴的转变奠定了重要基础。

首尔国大团队重磅发现:视觉幻觉背后的"不确定性"秘密被破解

首尔国大团队重磅发现:视觉幻觉背后的"不确定性"秘密被破解

首尔国立大学研究团队通过深入分析大型视觉语言模型发现,AI产生视觉幻觉的根本原因在于视觉编码器中存在"不确定性"标记。他们创新性地使用对抗性攻击识别这些不确定标记,并通过智能屏蔽策略显著降低了物体幻觉率。该方法无需重新训练模型,与现有AI系统高度兼容,为构建更可靠的人工智能系统提供了实用解决方案。

港大团队推出数学AI新突破:让计算机"画图思考"解决数学难题

港大团队推出数学AI新突破:让计算机"画图思考"解决数学难题

这项由港大、美团、港中大联合开展的研究提出了CodePlot-CoT系统,让AI通过生成绘图代码来进行数学视觉推理。该系统解决了现有AI无法有效处理需要画图辅助的数学题难题,在专门构建的Math-VR数据集上取得21%的性能提升,为AI数学推理开辟了新方向。

不只是训练智能助手,环境也需要"调教":谷歌、西湖大学等顶尖机构联合发现AI训练的全新思路

不只是训练智能助手,环境也需要"调教":谷歌、西湖大学等顶尖机构联合发现AI训练的全新思路

这项研究提出了革命性的"环境调教"AI训练方法,通过让AI的练习环境变得更智能来提升学习效果。仅用400个样本就让基础模型成功率从7%提升至37%,超越多个商业模型。该方法包含四阶段渐进训练、智能环境反馈、细粒度奖励机制,解决了数据稀缺和泛化能力差的核心问题,为AI训练开辟全新范式。

腾讯团队革命性突破:让代码自己"看"自己写出来的网页,再改进到完美

腾讯团队革命性突破:让代码自己"看"自己写出来的网页,再改进到完美

腾讯团队开发的ReLook框架首次让AI具备"看见"自己编写网页效果的能力。该系统通过建立生成-诊断-改进循环,让AI能够实时预览代码的视觉呈现,并基于多模态大模型的视觉反馈不断优化。ReLook在多个基准测试中显著超越传统方法,为AI辅助前端开发开辟了全新路径。

普林斯顿大学重磅发现:AI模型也需要"个性化教学",STAT方法让数学能力飞跃提升

普林斯顿大学重磅发现:AI模型也需要"个性化教学",STAT方法让数学能力飞跃提升

普林斯顿大学研究团队开发了STAT方法,通过让AI"老师"分析"学生"模型的技能缺陷,针对性制定训练方案。该方法在数学能力测试中实现了7.5%的显著提升,并在未见过的竞赛中平均提升4.6%。这种个性化AI训练方法突破了传统"一刀切"训练的局限,证明AI模型也需要因材施教的精准指导。

OceanBase发布首款AI数据库seekdb,探索数据库AI范式的跃迁

OceanBase发布首款AI数据库seekdb,探索数据库AI范式的跃迁

三行代码构建AI应用,实现百亿级多模数据的混合搜索。

浙江大学团队打造会玩浏览器的AI助手:真正像人类一样上网搜索信息

浙江大学团队打造会玩浏览器的AI助手:真正像人类一样上网搜索信息

这项由中科院、滑铁卢大学等多所院校联合完成的研究开发了BrowserAgent,一个能够像人类一样直接操作网页浏览器的AI助手。与传统需要转换工具的方法不同,它能直接点击、滚动、搜索网页,仅用5300个训练样本就在多跳推理任务上比最先进模型提升20%准确率。

字节跳动虚拟宽度网络:不扩张主干也能拥有更强大脑的秘密
2025-11-18

字节跳动虚拟宽度网络:不扩张主干也能拥有更强大脑的秘密

字节跳动Seed团队提出的虚拟宽度网络(VWN)通过解耦嵌入宽度与主干宽度,在几乎不增加计算成本的情况下显著提升模型表示能力。8倍虚拟宽度扩展使训练效率提升2.5-3.5倍,且发现虚拟宽度因子与损失呈对数线性关系,为大模型效率优化开辟新维度。

亚马逊研究揭示AI记忆陷阱:当智能助手"记住"你的身份背景,竟然影响了它对情感的理解

亚马逊研究揭示AI记忆陷阱:当智能助手"记住"你的身份背景,竟然影响了它对情感的理解

亚马逊研究团队通过测试15个AI模型发现,当AI助手记住用户背景信息时,会对相同情感情况产生不同理解,称为"个性化陷阱"。优势社会地位用户获得更准确的情感解释,而弱势群体接受质量较低的理解。这种系统性偏见可能在心理健康、教育等领域放大社会不平等,提醒我们需要在追求AI个性化的同时确保算法公平性。

微软团队打造文档"美学评委":AI如何判断文件的专业度?

微软团队打造文档"美学评委":AI如何判断文件的专业度?

微软等机构联合研发了DOCREWARD文档奖励模型,专门评估文档的结构布局和视觉风格专业度。该模型基于包含11.7万对文档的大规模数据集训练,在人类偏好准确性测试中超越GPT-5达19.4个百分点。研究解决了现有AI工作流忽视文档视觉呈现的问题,为智能文档生成和专业化排版提供了新的技术方案。

龙蜥操作系统装机量突破1000万,市占率近50%,用户迁移意愿最高
2025-11-18

龙蜥操作系统装机量突破1000万,市占率近50%,用户迁移意愿最高

龙蜥社区AI引擎生态加速合作计划正式发布,首发支持 RISC-V RVA23 预览版。

人机合一的秘密:多伦多大学如何让电脑瞬间"看懂"人体动作,速度提升2.3倍!

人机合一的秘密:多伦多大学如何让电脑瞬间"看懂"人体动作,速度提升2.3倍!

多伦多大学研究团队开发的FastHMR系统通过"智能偷懒"策略革命性地提升了人体姿态识别效率。该系统采用错误约束层合并和掩码引导标记合并技术,在减少计算量的同时配合扩散解码器保持精度,实现了2.3倍速度提升。这项技术为VR游戏、健身指导、医疗康复等实时应用开启了新可能。

图宾根大学团队突破:让AI像魔法师一样创造无限个逼真3D人物

图宾根大学团队突破:让AI像魔法师一样创造无限个逼真3D人物

德国图宾根大学研究团队开发的InfiniHuman系统实现了3D人物生成的重大突破,能够通过文字描述、身体参数和服装图像精确控制生成过程。该系统包含11万个多样化身份的数据库,提供12秒快速生成和4分钟高质量制作两种模式,在游戏开发、影视制作、电商试衣等领域具有广阔应用前景,并承诺开源以推动行业发展。

UC伯克利团队首次揭示:大型推理模型在紧急情况下会"恐慌"和"自我怀疑"

UC伯克利团队首次揭示:大型推理模型在紧急情况下会"恐慌"和"自我怀疑"

加州大学伯克利分校研究团队首次系统性地研究了大型推理模型在动态环境中的表现,发现这些AI在面对中断时会出现推理泄露、恐慌和自我怀疑等类似人类的情绪化反应,准确率最多下降60%。研究揭示了传统静态评估的局限性,并提出了包括提示引导和渐进式训练在内的多种改进方案,为AI技术从实验室走向实际应用指明了方向。

高质量训练数据越来越稀缺,卡内基梅隆大学研究者用小模型"回收"网络垃圾数据

高质量训练数据越来越稀缺,卡内基梅隆大学研究者用小模型"回收"网络垃圾数据

卡内基梅隆大学研究团队提出REPRO方法,用4B参数小模型通过强化学习将网络低质量数据回收为高质量训练数据。该方法在22项任务上比基线提升4.7%-14.0%准确率,超越了70B参数的ReWire方法,将数据效率提升2-3倍,为解决大语言模型训练数据稀缺问题提供了新思路。

南京大学团队揭秘:仅用8亿数据就让AI既会翻译又会推理,打破传统认知

南京大学团队揭秘:仅用8亿数据就让AI既会翻译又会推理,打破传统认知

南京大学团队开发出Qwen3-XPlus模型,仅用8亿数据tokens就实现了翻译与推理能力的完美结合,打破了传统多语言AI模型"翻译强但推理弱"的局限。通过创新的分层选择性调优方法,该模型在低资源语言翻译上取得突破性进展,同时在数学推理等任务上保持优异表现,为AI领域提供了高效、实用的多语言增强新方案。