最新文章第130页

新加坡大学团队突破：让多个AI"专家"携手解决复杂文档难题，小模型也能超越大模型

新加坡国家大学研究团队开发了MACT多智能体协作框架，通过四个专门化AI智能体的分工合作，在文档理解和问答任务上超越了许多大规模单体模型。该系统创新性地采用独立判断智能体进行质量控制，结合混合奖励机制和个性化测试时扩展策略，在15个基准测试中的13个获得最佳表现，为AI协作系统设计提供了新思路。

InfiX.ai发布InfiAlign：用12%训练数据追平顶级AI模型，让机器"小体量大智慧"的数据精选秘籍

InfiX.ai和香港理工大学联合发布的InfiAlign框架，通过多维数据筛选和两阶段课程学习，仅用12%训练数据就达到顶级模型性能。该框架发现回答长度与问题难度正相关，创新性地用长度作为难度指标，结合多样性采样和质量过滤，实现了数据效率的巨大提升。在数学推理等任务中表现优异，为资源有限的机构提供了经济高效的AI模型训练方案。

南加州大学和Salesforce联手推出CoAct-1：让电脑助手不再只会点击鼠标，还能写代码干活

南加州大学和Salesforce联合推出CoAct-1多智能体系统，通过结合传统界面操作与代码执行能力，实现了计算机任务自动化的重大突破。该系统在OSWorld基准测试中达到60.76%的成功率，平均完成任务步数减少至10.15步，显著优于现有方法，为人机交互带来新范式。

阿里巴巴让机器开口说话：Marco-Voice如何让AI既会模仿声音又能表达情感

阿里巴巴研究团队开发了Marco-Voice多功能语音合成系统，能够同时实现高质量的声音克隆和情感控制。通过创新的旋转情感嵌入和说话人-情感分离技术，系统可以独立调节声音身份和情感表达。团队还构建了包含10小时中文情感语音的CSEMOTIONS数据集。实验表明Marco-Voice在语音清晰度、说话人相似度和情感表达方面都显著超越现有系统，为虚拟助手、内容创作和教育技术等领域提供了强大工具。

华东理工大学团队突破AI智能体识别难题：多轮对话让机器像人一样"边看边想"

华东理工大学团队提出I2CR框架，通过"文字优先、视觉辅助"的多轮反思机制解决多模态实体链接难题。该框架模仿人类认知过程，先用文字信息判断，再通过内部一致性检查和跨模态验证，必要时引入OCR、图像描述等视觉线索进行迭代优化。在三大数据集上准确率分别提升3.2%、5.1%、1.6%，达到业界最佳性能。

腾讯AI西雅图实验室推出R-Zero：让大语言模型从"零数据"中学会推理的革命性自进化框架

腾讯AI西雅图实验室推出的R-Zero框架实现了AI系统从零数据自主学习的突破。该框架通过挑战者和求解者两个角色的协同进化，无需人类标注数据即可显著提升大语言模型的推理能力。在Qwen3-4B模型上，数学推理能力提升6.49分，通用推理能力提升7.54分。这种自进化机制为AI超越人类知识边界提供了新路径。

SiMa.ai发布新一代物理AI系统级芯片正式投产

人工智能芯片初创公司SiMa Technologies宣布其第二代系统级芯片平台MLSoC Modalix正式出货，专为多模态物理AI工作负载设计。该芯片可嵌入机器人、工业设备和车辆等设备中，支持运行大语言模型、卷积神经网络等多种AI算法。芯片采用低功耗设计，能在边缘设备上直接处理传感器数据并运行AI模型，无需依赖云端处理，有效降低延迟。

Ai2发布开源AI模型，让机器人在3D空间"规划"动作

西雅图AI研究机构Ai2发布MolmoAct 7B，这是首个动作推理模型，能让机器人在执行任务前进行"思考"和规划。该模型可将自然语言指令转化为3D空间中的运动轨迹，通过1800万样本在256个H100芯片上训练完成。在SimPLER基准测试中达到72.1%的任务成功率，超越了谷歌、微软等公司的同类模型。

曾经的小型研究实验室如何助力英伟达成为万亿美元公司

2009年，比尔·戴利加入英伟达研究实验室时，该实验室仅有约12名员工，专注于计算机图形学中的光线追踪技术。如今这个实验室已发展至400多人，帮助英伟达从90年代的游戏GPU初创公司转型为价值4万亿美元的AI巨头。目前实验室重点开发机器人和AI技术，部分研究成果已应用于产品中。英伟达在周一发布了面向机器人开发者的新AI模型、库和基础设施，展现了从物理AI到机器人领域的技术进展。

英伟达为最小工作站GPU配备Blackwell架构

Nvidia在温哥华Siggraph大会上发布了两款小型Blackwell GPU：RTX Pro 4000 SFF和RTX Pro 2000，功耗仅70瓦。RTX 4000 SFF配备8960个CUDA核心，光线追踪性能提升1.7倍，AI性能提升2.5倍，搭载24GB GDDR7显存。RTX Pro 2000拥有4352个CUDA核心，3D建模性能提升1.6倍。两款产品将由戴尔、惠普、联想等厂商集成到OEM系统中。

佳能

打印机

2025-08-12

佳能imageFORCE赢系列10款新品齐发，覆盖多元办公场景推动企业高效前行

佳能imageFORCE赢系列彩色/黑白数码复合机和轻生产型黑白数码印刷机全面投入市场，覆盖多领域的场景化解决方案。

2025-08-12

全新搜索方式出现，字节发布宽度优先搜索基准WideSearch，垫底的竟是DeepSeek

人工智能

物理推理

综合评估平台

2025-08-12

阿里巴巴推出DeepPHY：首个专门测试AI视觉模型物理推理能力的综合评估平台

阿里巴巴团队推出DeepPHY，这是首个专门评估AI视觉语言模型物理推理能力的综合平台。通过六个不同难度的物理环境测试，研究发现即使最先进的AI模型在物理推理任务中表现也远低于人类，成功率普遍不足30%。更关键的是，AI模型虽能准确描述物理现象，却无法将描述性知识转化为有效控制行为，暴露了当前AI技术在动态物理环境中的根本缺陷。

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

PEC 2025 AI创新者大会

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: