香港科技大学推出首个专门评估AI模型工具理解能力的基准测试PhysToolBench,研究发现即使最先进的AI模型得分仅63%,远低于人类90%的水平。测试涵盖三个难度等级,从基础识别到创造性应用,揭示了AI在物理世界理解方面的重大缺陷,特别是无法识别损坏工具和缺乏创新思维,为未来智能机器人发展指明改进方向。
香港大学团队联合多所高校开发出首个专门评估AI研究助手的标准化框架。该研究通过分析AI生成的研究报告质量,建立了包含质量、冗余度和事实准确性的三维评估体系。测试四大商业AI系统发现,Qwen在综合表现上最优,而不同系统各有特色。研究为DeepResearch系统发展提供科学评估工具,推动AI从信息检索向智能研究伙伴转变。
当云上算力面临数据安全风险,传统风冷又受困于严苛的本地部署条件;当高额电费推高成本压力,服务器散热却拖慢业务运转—— 您的企业是否正在寻找更安全、更高效、更经济的算力解决方案?
清华大学团队提出EAGLET框架,通过分离规划与执行解决AI智能体在长期任务中的盲目试错问题。该方法采用同源共识过滤确保高质量训练数据,并设计执行器能力增益奖励机制优化规划器性能。实验显示在三个复杂任务场景中性能显著提升,训练成本降低8倍,为AI从反应式向预见性智能转变提供重要技术突破。
这项由密歇根大学与NVIDIA联合开展的研究提出了TC-LoRA技术,彻底改变了AI图像生成的控制方式。不同于传统方法使用固定参数,TC-LoRA能够根据生成阶段和用户条件动态调整网络权重,就像经验丰富的画家会在不同阶段使用不同技法。实验显示,该方法在保持空间条件准确性方面显著优于现有技术,同时使用的参数更少,为可控图像生成领域带来重要突破。
这项由伊利诺伊大学团队完成的研究首次将博弈论引入大语言模型训练,提出GTALIGN方法让AI学会同时考虑用户和自身福利。通过四步推理链和互利奖励机制,新方法在数学问题求解效率上提升21.5%,用户满意度提升11.3%,并能够动态适应不同应用场景,为构建更智能人性化的AI助手提供了创新思路。
香港科技大学研究团队首次揭示了人工智能进行复杂推理时的内部神经元协作机制。他们发现AI模型内部存在"查询神经元"和"价值神经元"的精妙配合,类似侦探破案时的线索传递过程。基于这一发现,团队开发了ACE知识编辑方法,通过同时优化两类神经元的协作关系,显著提升了AI在多步推理任务中的准确性,为构建更智能、可控的AI系统奠定了重要基础。
台湾大学研究团队开发出突破性AI视频理解技术Tenet框架,让计算机能够像人类一样根据自然语言描述在视频中准确定位和追踪特定对象。该技术通过智能整合现有模型而非从零训练,大幅降低了计算成本,在标准测试中表现优异,为安防监控、医疗诊断、视频编辑等领域带来广阔应用前景。
北京大学研究团队针对大型推理模型的"过度思考"问题,提出了群组相对分段惩罚(GRSP)方法。该方法改变传统的词语级惩罚粒度,转向对推理段落进行管理,并采用长度感知加权机制。实验结果显示,GRSP在保持推理准确性的同时显著降低了计算成本,特别是在复杂任务中表现突出,为大型推理模型的实际部署提供了有效的优化方案。
Infinidat发布InfiniBox G4系列最新升级,实现容量翻倍、物理占用空间缩减31%、入门价格降低29%。新款InfiniBox SSA G4 F24仅占11个机架单元,起始容量77TB。混合系统单机架最大有效容量从17.2PBe跃升至33PBe,增幅达92%。系统原生集成S3对象存储协议,支持文件、块和对象存储统一管理,能效比竞品高7倍。
微软的MAUI跨平台应用开发框架将通过第三方框架Avalonia获得Linux和浏览器支持。MAUI目前支持Android、iOS、Mac Catalyst和Windows平台,但缺少Linux支持。AvaloniaUI公司正在为MAUI开发新的后端,使用Avalonia渲染器替代原生控件,同时支持WebAssembly在浏览器中运行。该方案预计2026年第一季度提供预览版本。
DeepMind发布新AI智能体SIMA 2,可学会玩《无人深空》、《英灵神殿》等多款游戏。该智能体首次整合Gemini AI,能够理解用户高级目标并执行复杂推理。DeepMind将其视为通向通用人工智能的重要一步,未来可能应用于机器人技术和现实世界环境中。
Infinidat发布InfiniBox SSA G4 F24,仅需11个机架单元即可提供77TB起始容量,相比前代产品占用空间减少31%,入门成本降低29%。混合系统单机架最大有效容量从17.2PB跃升至33PB,增幅达92%。系统原生集成S3对象存储协议,支持文件、块和对象三种协议。能效比竞品高7倍,功耗更低。产品定位中端市场,满足企业对高可用性和性能的需求。
数据保护服务商Druva宣布为微软云服务推出五项新增保护功能,涵盖Azure、Entra ID、Teams和Dynamics 365 ERP。该公司的数据安全云服务旨在防范勒索软件和内部威胁,提供更早的威胁检测、合规维护和清洁数据恢复。新功能包括扩展的微软Entra ID保护、Azure虚拟机高级网络恢复、Azure文件无代理云原生保护、Teams私聊保护以及Dynamics 365 ERP安全保护。
云存储服务商Backblaze公布第三季度硬盘年化故障率统计数据。本季度整体故障率从上季度的1.36%上升至1.55%,主要由三款硬盘驱动:16TB东芝硬盘故障率达16.95%,但实际是因固件更新被移除导致;10TB希捷硬盘故障率7.97%,因使用超过7年;14TB希捷硬盘故障率6.86%,历史表现较差。同时有四款硬盘实现零故障率。
LTO联盟将LTO-10磁带原始容量从30TB提升33%至40TB,采用新型芳纶基底材料实现更薄更光滑的磁带结构。然而面对高容量硬盘和SSD竞争,联盟下调了未来路线图,LTO-14容量从原计划576TB降至365TB。该技术主要用于数据归档,在AI时代档案已成为战略资产,新容量将帮助企业更高效地整合PB级数据。
微软宣布其首个人工智能"超级工厂"在亚特兰大正式投入运营,这是一座耗资数十亿美元的数据中心设施。该设施将与全国其他数据中心基础设施相连,为客户提供强大的计算能力。新设施占地85英亩,面积超过100万平方英尺,配备数十万个英伟达最强大的GPU和AI加速器。作为微软Fairwater网络的一部分,该设施专门用于训练和运行AI模型,将为OpenAI、Mistral AI和xAI等公司提供服务。
因果人工智能初创公司Alembic Technologies宣布完成1.45亿美元B轮融资,估值增长近16倍。公司将大部分资金投资于英伟达NVL72超级计算机,打造私有AI基础设施。该公司专注于企业级因果AI模型,通过理解因果关系而非仅识别模式来生成营销洞察。新超算搭载英伟达最强Blackwell GPU,将为其连续学习神经网络和时空图构建算法提供计算支持,帮助客户利用专有数据获得竞争优势。
微软计划利用合作伙伴OpenAI的定制芯片开发来加强自身薄弱的半导体业务。根据修订后的合作协议,微软获得了OpenAI芯片设计的知识产权,并可在2032年前持续使用其AI模型。微软CEO纳德拉表示,公司将采用OpenAI的芯片设计并进行扩展以满足自身需求。这一合作凸显了开发尖端AI芯片的难度和成本,微软选择通过智能合作而非独自奋战来加速其芯片发展目标。