这项由中国人民大学等机构合作完成的研究提出了Virgo系统,发现仅用5000个纯文本推理案例训练就能让AI在视觉推理任务上达到顶级商业系统水平。研究证实推理能力具有跨模态通用性,为更经济高效地开发多模态AI系统指明了新方向,同时也揭示了AI感知反思能力不足的局限性。
上海交通大学团队通过"推理时间扩展"技术让AI学会深度思考,在医学诊断中取得突破。研究发现AI思考时间越长诊断越准确,仅用500个样本就实现6%-11%准确率提升。AI模型展现出类似医生的临床推理能力,能进行差异诊断和证据权衡,特别在复杂罕见疾病诊断方面表现出色,为AI医学应用开辟新方向。
Meta团队开发出CLUE系统,这是一种无需人工标注数据就能判断图像安全问题的AI方法。该系统通过将主观安全规则客观化、智能筛选相关规则、分解复杂条件、消除判断偏见等创新技术,在测试中达到95.9%召回率和94.8%准确率,显著超越传统方法。这项突破为内容平台提供了高效灵活的安全检测工具,有望改变网络内容审核的现状。
上海AI实验室团队通过分析100多个多模态大语言模型在20多个基准上的表现,系统揭示了AI评测领域的三大冗余问题:基准内部维度重复、测试实例数量冗余、跨基准领域重叠。研究发现至少50%的测试题目是多余的,且模型能力越弱冗余度越高,为构建更高效的AI评测体系提供了科学依据和设计原则。
北京交通大学等机构联合开发出首个多图像视觉定位AI模型Migician,能像人类一样在多张图片中精确定位目标物体。该模型平均准确率达63.82%,比同类AI高出25个百分点,在自动驾驶、安防监控、医疗影像等领域具有广泛应用前景。研究团队构建了63万样本数据库和全面测试平台,并将所有资源开源,为多模态AI发展开辟新方向。
田纳西理工大学研究团队通过结合强化学习和变形金刚架构,成功开发出具备"元学习"能力的AI系统。该系统能在未见过的环境中快速适应并持续改进,展现了900%的性能提升。研究证实AI可进行技能组合、适应环境变化,且对训练数据质量具有显著鲁棒性,为通用人工智能发展指明新方向。
伊利诺伊大学和阿里巴巴联合推出Mobile-Agent-E,这是一款革命性的自我进化手机智能助手。该系统采用分层多智能体架构,能够处理复杂的跨应用任务,更重要的是具备从经验中学习的能力。在新开发的Mobile-Eval-E基准测试中,性能比现有最佳方法提升22.1%。
数字孪生技术正在改变网络安全防御模式,从被动响应转向主动预测。这种实时学习演进的虚拟副本让安全团队能够在威胁发生前预见攻击。组织可以在数字孪生环境中预演明日的攻击,将防御从事后反应转变为事前排演。通过动态更新的IT生态系统副本,团队可在真实条件下压力测试防御体系,模拟零日漏洞攻击并制定应对策略,从根本上重塑网络安全实践方式。
韩国存储巨头SK海力士宣布完成HBM4开发并准备大规模量产,消息推动其股价上涨7%。随着AMD和英伟达的下一代数据中心GPU将采用HBM4技术,高带宽内存已成为AI加速器的核心组件。SK海力士通过将I/O端子数量增至2048个,有效实现了带宽翻倍,能效提升超过40%,运行速度达到10Gb/s。美光和三星也在积极推进HBM4产品开发。
AI和高性能计算正重塑各行各业,但数据中心为适应多样化工作负载而添加各种专用加速器,反而导致运营效率下降。专用芯片与CPU、GPU等系统组合产生了前所未有的复杂性,功耗飙升至不可持续水平。随着AI模型规模增长和工作负载边界模糊,传统静态硬件分配已不适用。可重构计算提供了新方案:单一平台可动态调整架构以匹配不同需求,消除芯片间通信瓶颈,降低功耗,简化运营。
英伟达发布新款Rubin CPX GPU,专为大规模上下文处理而设计,可支持百万级token的软件编程和生成视频。该产品将搭载于Vera Rubin NVL 144 CPX平台,承诺高能效和卓越推理性能,每投资1亿美元可获得50亿美元token收入。同时,英伟达展示了Blackwell Ultra GB300系统的基准测试结果,DeepSeek-R1推理性能较前代提升1.4倍。
诺基亚与Supermicro建立战略合作伙伴关系,应对AI和云工作负载对数据中心带来的前所未有的挑战。双方将Supermicro的800G以太网交换平台与诺基亚的SR Linux网络操作系统和事件驱动自动化平台相结合,为AI、高性能计算和云环境提供完全集成的数据中心网络解决方案。该方案可实现从设计、部署到日常运营的全生命周期自动化,减少部署时间,降低运营成本,提高整体效率。
奔驰在慕尼黑IAA展会上发布全电动GLC车型,搭载高通骁龙数字底盘解决方案。新车续航里程达713公里,零排放。该车型配备先进数字座舱,集成AI语音交互、3D增强现实导航和杜比全景声等功能。系统能学习用户偏好,提供个性化推荐和免提交互体验。内置5G连接支持车辆与云端实时数据传输。
在Splunk年度会议上,该公司发布两款基于智能代理的安全运营工具。Splunk Enterprise Security基础版和高级版统一了威胁检测、调查和响应工作流程。新功能将智能代理AI置于SOC核心,通过内置AI减少警报噪音,将调查时间从数小时缩短至数分钟。Cisco计划发布更多AI功能支持智能代理SOC,包括安全警报分类、恶意软件逆向分析、剧本创作等能力,让网络安全专业人员专注于更具战略性的工作。
9月13日,由PEC China、至顶科技、软积木主办的PEC 2025 AI创新者大会暨第二届提示工程峰会在北京成功举办。
中山大学团队针对OpenAI O1等长思考推理模型存在的"长度不和谐"问题,提出了O1-Pruner优化方法。该方法通过长度-和谐奖励机制和强化学习训练,成功将模型推理长度缩短30-40%,同时保持甚至提升准确率,显著降低了推理时间和计算成本,为高效AI推理提供了新的解决方案。
上海AI实验室研究团队深入调查了12种先进视觉语言模型在自动驾驶场景中的真实表现,发现这些AI系统经常在缺乏真实视觉理解的情况下生成看似合理的驾驶解释。通过DriveBench测试平台的全面评估,研究揭示了现有评估方法的重大缺陷,并为开发更可靠的AI驾驶系统提供了重要指导。
谷歌和香港大学研究团队提出Learn-by-interact框架,让AI智能体通过自主与环境互动来学习,核心创新是"逆向构建"机制,能将失败操作转化为有价值训练数据。在四个真实环境测试中,该方法显著提升了AI在软件编程、网页操作、桌面应用等复杂任务中的表现,为构建实用AI助手开辟新路径。
TransPixeler是由香港科技大学和Adobe研究院联合开发的AI视频生成技术,专门解决生成带透明效果(RGBA)视频的难题。该技术巧妙扩展现有视频生成模型,让AI能同时生成RGB颜色和Alpha透明度信息,避免了传统"先生成后提取"方法的缺陷。通过精心设计的注意力机制和训练策略,TransPixeler在有限数据下实现了高质量透明视频生成,为电影特效、游戏开发、VR/AR等领域提供了强大工具。
腾讯混元团队通过366组实验发现了AI大模型低精度训练的关键规律,提出Capybara缩放定律。研究揭示指数位比尾数位更重要,存在训练数据临界值现象,4-8位精度具有最佳成本效益。该成果为AI训练提供精确预测工具,有助于降低训练成本、提升效率,推动AI技术普及化发展。