希腊塞萨洛尼基大学研究团队开发出MIR-L算法,通过"彩票假说"发现大型图像修复网络中的关键子网络。该算法采用迭代剪枝策略,将网络参数减少90%的同时保持甚至提升修复性能。MIR-L能同时处理去雨、去雾、降噪等多种图片问题,为资源受限设备的实时图像处理提供了高效解决方案,具有重要的实用价值和环保意义。
这项由OpenRouter公司团队和Andreessen Horowitz(a16z)投资机构联合开展的研究,于2025年12月发表。
卡内基梅隆大学团队提出DistCA技术,通过分离AI模型中的注意力计算解决长文本训练负载不平衡问题。该技术将计算密集的注意力任务独立调度到专门服务器,配合乒乓执行机制隐藏通信开销,在512个GPU的大规模实验中实现35%的训练加速,为高效长文本AI模型训练提供了新方案。
通用汽车宣布为部分2025款及更新凯迪拉克和雪佛兰车型推出原生Apple Music应用。凯迪拉克车型还将支持杜比全景声空间音频技术,打造沉浸式三维音效体验。作为OnStar Basics服务的一部分,通用汽车为所有2025款及更新车型提供八年免费音频流媒体服务,支持Spotify和Apple Music等应用。该应用将通过OTA更新自动安装到支持的车辆中。
清华大学研究团队提出3DThinker框架,首次让AI具备类似人类的三维空间想象能力。该系统在推理过程中插入特殊的三维想象符号,不依赖外部工具或大量标注数据,就能从有限的二维图像中构建三维心理模型。在多个空间推理基准测试中,3DThinker相比传统方法性能提升达50-100%,为自动驾驶、机器人导航、虚拟现实等领域的AI应用开辟了新路径。
GMV获得欧洲航天局合同,开发名为Beacon的先进波束成形天线接收系统,旨在提升低轨卫星C波段导航信号的抗干扰能力。该系统结合波束成形、零点导向和到达角估计技术,为自动驾驶运输、物流和无人系统提供可靠导航服务。项目为期18个月,投资80万欧元,将于2025年12月启动,通过实际环境测试验证系统性能,助力欧洲建立自主可靠的定位导航授时服务能力。
字节跳动研究团队开发出"任意深度对齐"(ADA)技术,解决了大语言模型的一个关键安全漏洞。研究发现AI模型虽然能拒绝直接的危险请求,但在被"预填充"危险内容后往往会继续生成有害信息。ADA技术通过读取模型内部的安全信号,能在任何生成深度实时检测并阻止危险内容,在多种攻击测试中达到近100%的防护效果,同时保持极低的计算开销。
据路透社报道,在成功游说特朗普政府批准向中国销售H200芯片后,英伟达正考虑增加该芯片产量,因为中国企业正急于下订单。H200是英伟达上一代Hopper图形处理器中最强大的产品,专为训练大语言模型设计。商务部上周批准英伟达向中国销售H200GPU,但需上缴25%的销售收入。阿里巴巴和字节跳动等中国企业已联系英伟达商讨大宗订单事宜。
哥德堡大学研究团队提出了ExpA框架,首次让大语言模型突破纯文本交互限制,能够直接操控外部工具。通过EARL强化学习算法,AI系统在数学计算任务中成功率提升26.3%,并在排序任务中自主发现了高效算法。这项技术分离了语言推理和环境操作,为AI与现实世界的直接交互开辟了新路径。
IBM研究人员发布了名为CUGA的开源AI代理,旨在自动化复杂的企业工作流程,任务完成率约为50%。CUGA全称为可配置通用代理,通过多代理编排、API集成和代码生成来实现智能任务自动化。在WebArena和AppWorld基准测试中,CUGA分别获得61.7%的Web任务成功率和48.2%的场景完成率。该系统采用Apache 2.0许可证发布,支持多种开源模型。
UCLA团队提出"计划扩散"新方法,让AI像项目经理一样先制定计划再并行生成文本。该技术在保持质量的同时实现1.27-1.81倍速度提升,突破了传统AI逐字生成的速度瓶颈。研究使用单一模型完成规划和执行两个阶段,为AI文本生成开辟了新的技术路径,有望应用于写作助手、客服系统等领域。