Feedzai团队首次系统评估了AI模型理解散点图的能力,创建了包含18,000张图表的大规模数据集。测试十个先进AI模型发现,在简单计数任务中部分模型准确率超90%,但精确定位任务表现不佳,准确率多在50%以下。研究还发现图表设计对AI性能有轻微影响,为AI辅助数据分析提供了重要参考。
KAIST研究团队开发出MG-Select系统,首次让视觉语言机器人具备"货比三家"的决策能力。该系统通过生成多个行动候选方案并利用内部评估机制选择最优解,无需额外外部验证系统。在真实世界测试中,机器人精确操作成功率提升28%-35%,某些任务改进达168%,为机器人在医疗、制造等高精度应用领域的发展奠定重要基础。
加州大学圣芭芭拉分校研究团队开发了EvoPresent系统,这是首个具备自我改进能力的AI演示文稿制作框架。该系统通过四个AI代理协作和PresAesth美学评估模型,能够自动将学术论文转换为高质量演示文稿,并通过迭代优化持续改进设计效果,在多项评估指标上显著优于现有方法。
Collinear公司研究团队发现了AI学习编程推理的"谷地"现象:小型AI模型在接受大型模型指导时,性能先下降50%再上升,最终超越初始水平100%。研究还发现,训练数据中答案的正确性对学习效果无影响,但简单题比复杂题的训练效果显著更好。这项发表于NeurIPS 2025的研究为AI训练策略提供了新见解。
新加坡国立大学研究团队开发了MixReasoning技术,让AI能够像人类一样智能地选择推理深度。该技术通过监测AI的不确定性程度,自动在详细推理和简洁回答之间切换,解决了当前AI模型冗长推理的效率问题。在数学推理测试中,MixReasoning在保持甚至提升准确率的同时,将推理长度减少了20-50%,为AI推理优化提供了新思路。
香港大学团队开发的BIRD-INTERACT平台首次真实模拟了人机数据库对话的复杂性,通过900个交互任务和智能用户模拟器,揭示了即使GPT-5等先进AI在复杂对话场景中仍表现不佳的现实,为提升AI系统的交互沟通能力指明了方向。
西湖大学研究团队开发的Human3R系统实现了人体和场景的实时一体化重建突破。该技术仅需普通摄像头即可同时完成多人姿态分析、三维场景重建和相机追踪,处理速度达15帧每秒。系统采用参数高效的训练策略,仅用一天时间在单GPU上完成训练,显著降低了高精度人体分析技术的使用门槛,为影视制作、体育分析、医疗康复等多个领域提供了实用的解决方案。
阿伯丁大学研究团队开发了"分布式语义追踪"技术,深入AI内部发现其"幻觉"源于快速联想系统与慢速推理系统的冲突。研究识别出AI推理的"不归点"和"推理捷径劫持"现象,揭示了预防AI错误的新方法,为构建更可靠的AI系统提供了重要理论基础和实践工具。
Reactive AI公司研究员Adam Filipek开发了TensorBLEU,一种GPU加速的BLEU评估工具,专门用于语言模型训练中的快速评估。该技术通过创新的并行计算和内存管理方法,在消费级GPU上实现13倍速度提升,在数据中心级GPU上达到40倍提升,有效解决了强化学习训练中的评估瓶颈问题,为自然语言处理研究提供了重要的基础工具。
卢森堡大学研究团队开发了HalluGuard,一个仅需40亿参数的AI"真话检测器",专门识别大语言模型生成内容中的虚假信息。该系统在权威测试中达到75.7%准确率,与GPT-4o相当,在RAG应用测试中更是达到84.0%,超越了许多更大的模型。HalluGuard不仅能判断真假,还能提供详细解释,适合企业本地部署,将开源发布。
首款采用液冷的Strix Halo 迷你AI工作站它来了!今天,abee AI Station 395 Max迷你液冷AI工作站正式在京东开售,定价为17999元。
亚马逊向AI搜索引擎Perplexity发出停止令,要求其停止允许用户创建和使用购物代理在亚马逊网站购买商品。争议核心在于控制权:亚马逊希望保持对用户购物体验的控制,而Perplexity认为AI代理只是技术进步的自然延伸。分歧在于透明度——Perplexity的代理使用用户凭据登录而不标识自己为AI代理。这被视为自主AI代理在商务领域的首次重大法律测试,将影响AI驱动网络的未来基础。
东芝发布S300 AI视频监控硬盘,容量从10TB大幅提升至24TB。该产品采用7200转速和6Gbps SATA接口,支持64路视频摄像头和32路AI数据流分析。容量范围涵盖8TB至24TB,缓存最高达1024MB,传输速度最高309MBps,年工作负载550TB。相比竞品西数Purple Pro和希捷SkyHawk AI,东芝在传输速度方面表现更优。产品将于2026年第一季度上市。
日立Vantara推出Hitachi iQ Studio智能体构建平台,帮助客户大规模构建、部署和管理AI智能体及应用。该平台基于Nvidia AI数据平台参考设计,提供无代码/低代码智能体构建工具和工业AI模板库。集成预构建RAG管道、模型上下文协议和即用算法,简化AI应用开发。支持本地大语言模型部署,内置预测性维护等工业环境蓝图,为企业提供完整的AI开发环境。
Snowflake在Build 2025开发者大会上宣布为其产品增加智能代理AI功能,让客户的AI代理能够安全访问Snowflake数据。主要更新包括Snowflake Intelligence智能服务,支持员工使用自然语言查询数据仓库内容,无需编写SQL代码。该服务已有超过1000家客户和15000个代理在使用。此外还发布了Horizon Catalog统一安全治理框架、实时流分析、与Oracle合作等多项功能,以及Cortex Code等开发者工具。
软银与OpenAI成立五五分成的合资公司SB OAI Japan,将在日本本土化推广OpenAI的企业级AI技术。该合资公司推出名为"Crystal intelligence"的打包式企业AI解决方案,专门面向日本企业的管理和运营需求。软银将成为首个客户,在内部业务中验证AI方案效果后再向其他企业推广。软银表示已为内部使用创建了250万个定制ChatGPT实例。
研究显示,北美约五分之二的SAP用户尚未开始迁移至S/4HANA,距离传统系统主流支持结束仅剩两年。美洲SAP用户组织调查发现,173名成员中超过60%已上线或正在转换至S/4HANA。业务流程变更是49%用户面临的最大迁移障碍,定制化问题排第二。由于ECC到S/4HANA的迁移并非简单的系统替换,需要企业重新思考核心数据创建和管理流程。
AMD计划在2026年推出Helios机架级架构,直接挑战英伟达在AI基础设施市场的地位。该系统将整合AMD的MI400系列GPU、第六代Epyc Venice CPU和Pensando网卡,设计为将整个机架的加速器作为单一大型GPU运行。CEO苏姿丰表示,客户对这一解决方案兴趣浓厚,ZT Systems团队在开发中发挥关键作用。AMD第三季度营收增长36%至92亿美元。
Verizon Business宣布与亚马逊云服务(AWS)达成协议,为下一波人工智能创新提供高容量、低延迟的网络基础设施。该协议是2025年推出的Verizon AI Connect计划的一部分,旨在大规模管理AI资源密集型工作负载。Verizon将建设长途高容量光纤通道连接AWS数据中心,使AWS能够继续为构建和部署大规模先进AI应用的客户提供安全可靠的高性能云服务。
AIOps是AI驱动IT运维的新兴实践,利用机器学习和自动化帮助企业监控、管理复杂数字系统。它整合日志、指标和事件数据,提前发现问题并识别根本原因。生成式AI为传统AIOps增添了对话界面和上下文推理能力。成功实施需要从小规模开始,结合硬规则与机器学习检测,确保可解释性。AIOps工程师扮演跨学科角色,需要数据质量管理和文化变革支持。尽管自动化程度提高,人类专业知识仍不可或缺。