高通在骁龙峰会2025上发布新一代骁龙8 Elite Gen 5芯片,AI处理速度从15令牌/秒提升至220令牌/秒,为真正的AI代理性能奠定硬件基础。AI首席官马拉迪表示,个性化AI助手即将到来,能够利用设备本地文档和图片等数据提供智能服务。尽管生成式AI仍面临准确性挑战,但硬件已不再是障碍,关键在于制造商的集成应用。AI代理将改变人机交互方式,自动化繁琐任务,让用户更高效地使用设备功能。
谷歌DeepMind与初创公司联邦聚变系统合作,运用AI专业技术助力核聚变发电开发。此次研究合作基于谷歌对该聚变公司的两笔资本投资,以及获得其首座聚变电站200MW电力的协议。AI数据中心对电力的巨大需求推动科技公司投资聚变发电,这项技术有望提供清洁、几乎无限的能源。
Yoshua Bengio领衔:《2026年国际人工智能安全报告:首次关键更新》,不可忽视的AI风险
SAP S/4HANA内存ERP系统推出十多年后,95%的传统用户表示构建积极的迁移案例需要巨大努力或面临真正挑战。一项涵盖455名CIO、高级IT角色、SAP专家和业务经理的调查发现,83%的受访者不完全理解SAP最新的迁移政策和截止日期,84%对当前信息传递及其对运营的影响表示担忧。SAP为传统ECC系统设定了激进的支持截止日期,主流支持将于2027年结束。
微软通过其Planetary Computer平台将NASA的Landsat和Sentinel-2卫星数据集引入Azure云服务。该数据集包含来自NASA的Landsat 8、9号卫星以及欧洲航天局Sentinel-2系列卫星的地球监测数据,为气候变化、土地利用、农业应用等研究提供宝贵资源。用户可通过API或Azure存储直接访问这些PB级全球环境数据。微软还建议研究人员使用Azure OpenAI服务创建智能应用,结合AI技术进行土地分类、植被监测、森林砍伐趋势分析等地球观测研究。
一项针对455家企业的调研显示,几乎所有受访组织都难以证明SAP S/4Hana升级成本的合理性。31%的企业和IT领导者表示难以为S/4Hana制定积极的投资回报率案例。64%的受访者认为从SAP ECC升级需要付出相当努力。29%仍使用ECC的企业不再依赖SAP创新,转而选择基于多供应商的可组合ERP策略。83%的受访者认为可组合方案在获取AI等新兴技术方面具有明显价值。
北京大学团队开发出WoW世界模型,这是首个真正理解物理规律的AI系统。通过200万机器人互动数据训练,WoW不仅能生成逼真视频,更能理解重力、碰撞等物理定律。其创新的SOPHIA框架让AI具备自我纠错能力,在物理理解测试中达到80.16%准确率。该技术将推动智能机器人、视频制作等领域发展,为通用人工智能奠定重要基础。
希捷与ZeroPoint Technologies在OCP全球峰会上展示了CXL内存层级中的硬件加速压缩技术。希捷正在开发可组合内存设备(CMA),该设备作为CXL Type 3内存扩展器,允许连接的服务器通过CXL架构访问共享的可扩展内存资源。ZeroPoint的DenseMem技术通过透明的内联内存压缩,将有效容量提升1.85至2.25倍,从而降低DRAM成本。该技术可集成到CXL Type 3设备SoC中,在主内存速度下实现实时压缩。
华为在上海Connect 2025大会上发布智能化转型路径,帮助企业实现大规模AI应用。ACT路径包括评估高价值场景、使用垂直数据校准AI模型、通过规模化AI智能体转型业务运营三个步骤。南方电网使用昇腾平台开发电力大模型MegaWatt,将输电线路缺陷识别效率提升5倍。润达医疗与华为合作开发AI病历解决方案,病历生成时间仅需1秒。
斯坦福大学研究团队开发了名为BrainSynth的AI系统,通过生成式AI技术创建解剖学上合理的3D大脑MRI影像。该项目由精神病学和行为科学教授Kilian Pohl博士主导,旨在通过AI生成的合成数据来研究大脑疾病的细微影响。研究显示,超过一半的合成MRI脑区域在解剖学上是合理的,能够准确编码年龄和性别等生物因素的影响,为神经科学研究提供了宝贵的数据资源。
香港大学和蚂蚁集团联合推出PromptCoT 2.0,这是一种让AI自动生成高质量训练题目的创新方法。通过"概念-思路-题目"的三步策略,AI能像老师备课一样先构思解题思路再出题,大幅提升了题目质量和训练效果。实验显示该方法在数学竞赛和编程任务上都取得了显著提升,为解决AI训练数据稀缺问题提供了新思路。
ETH苏黎世和迪士尼研究院联合开发的HiGS技术,通过巧妙利用AI绘画过程中的历史信息,实现了图像生成速度6-8倍提升的同时保持更高质量。这项即插即用的技术无需重新训练模型,在ImageNet数据集上创造新纪录,为AI图像生成领域带来重要突破,具有广泛的实际应用价值。
德国Max Planck研究所团队发现AI存在"注意力不集中"问题,开发出REFAM技术通过巧妙利用停用词作为"注意力磁铁"来重分配AI注意力资源。该技术让AI能更准确地根据自然语言描述在图像中定位目标对象,在多个标准测试中创造新纪录,为医疗影像、自动驾驶等领域应用提供重要技术突破。
罗切斯特理工学院团队开发出X-CoT系统,突破传统视频推荐"黑箱"限制,利用大语言模型进行链式推理,不仅提升检索准确率5.6%,还能详细解释每个推荐选择的原因。该系统通过两两比较和Bradley-Terry模型优化排序,同时创建结构化视频注释增强语义理解,为可解释人工智能在多媒体检索领域开创新方向。
Intellindust AI实验室推出DEIMv2实时目标检测系统,融合DINOv3技术实现八个版本全场景覆盖。创新的空间调谐适配器让最大版本仅用50.3M参数达到57.8 AP,首次实现sub-10M模型突破50 AP大关。从GPU服务器到移动设备的完整产品线,为智能视觉应用提供了性能与效率完美平衡的解决方案。
莫斯科高等经济学院研究员尼古拉·斯克里普科开发了IFEval-FC基准测试,专门评估大语言模型在函数调用中遵循格式指令的能力。研究发现,即使是GPT-5和Claude Opus 4.1等最先进模型,在处理看似简单的格式要求时准确率也不超过80%,揭示了AI在实际应用中的重要局限性。
上海人工智能实验室联合多家机构推出MinerU2.5文档解析模型,仅用12亿参数就在文本、公式、表格识别等任务上全面超越GPT-4o等大型模型。该模型采用创新的两阶段解析策略,先进行全局布局分析再做局部精细识别,计算效率提升一个数量级。通过重新定义任务标准和构建高质量数据引擎,MinerU2.5能准确处理旋转表格、复杂公式、多语言文档等挑战性内容,为文档数字化提供了高效解决方案。
英伟达研究团队开发的LONGLIVE系统实现了实时交互式长视频生成的重大突破。该系统通过KV重缓存、流式长视频调优和短窗口注意力等创新技术,在单块H100显卡上达到20.7FPS的生成速度,支持240秒视频生成,速度比现有系统快41倍。核心创新在于解决了传统视频生成系统面临的效率与质量矛盾,以及交互式生成中的视觉连续性难题,为视频创作的民主化开辟了新路径。
中科大研究团队针对AI大语言模型训练中的"熵值困境"问题,提出了分位数优势估计新方法。该方法通过改进基准线设定策略,有效解决了训练过程中的熵值崩塌和爆炸问题,在数学推理任务上实现了显著性能提升。研究显示,仅需一行代码修改就能获得21.5%的准确率改进,且具有80%样本自动过滤的高效特性,为AI训练稳定性提供了理论保障和实用解决方案。