Quobyte发布GPU融合存储解决方案,通过整合GPU服务器现有驱动器创建共享存储池,将数据更靠近GPU处理单元。该技术利用GPU服务器中闲置的CPU、内存和NVMe存储资源,消除外部存储阵列需求,降低延迟并提升数据传输速度。系统具备容错能力,可应对GPU节点频繁重启和故障。相比传统架构,该方案可显著降低基础设施成本和功耗,每增加一个GPU节点即可自动扩展存储容量和吞吐量。
英国泰恩港在部署爱立信私有5G网络一年后取得显著运营成果。该港口占地620英亩,是英国主要深水港之一。私有5G网络基于BT频谱和爱立信基础设施,支持实时视频分析、传感器驱动流程和互联机械设备。网络已应用于集装箱扫描、个人防护设备监控、受限区域检测、道路状况分析等多个场景,并与卡特彼勒合作实现远程控制铲车作业,显著提升了安全性和运营效率。
艾伦人工智能研究所推出Molmo 2多模态模型系列,在图像理解基础上扩展至视频和多图像理解能力。该系列包含三个变体:8B、4B和2-O 7B模型,分别基于阿里巴巴Qwen 3和研究所自研Olmo模型构建。新模型在保持高效性能的同时显著缩小了参数规模,8B模型在关键图像理解任务上超越了原版720亿参数模型。Molmo 2具备视频定位、多对象追踪和时序推理等创新功能,为物理AI、自动驾驶、机器人等领域提供重要技术支撑。
Adobe更新其AI视频生成应用Firefly,新增支持精确提示词编辑的视频编辑器,并集成Black Forest Labs的FLUX.2和Topaz Astra等第三方模型。新编辑器允许用户通过文本提示编辑视频元素、颜色和摄像机角度,提供时间轴视图便于调整帧、声音等特性。用户可使用Runway的Aleph模型进行具体指令操作,Adobe自有Firefly Video模型支持上传起始帧和参考视频重现摄像机角度。
艾伦人工智能研究所开发的olmOCR 2通过创新的单元测试训练方法,将文档识别准确率提升至82.4%,在处理复杂数学公式、表格和多栏布局方面表现卓越。该系统采用强化学习和合成数据生成技术,实现了完全开源,为全球研究者提供了先进的OCR解决方案,推动了AI技术民主化发展。
苹果公司发布了包含40万张图片修改案例的AI训练数据集Pico-Banana-400K,涵盖35种修图操作类型。该数据集采用严格质量控制,包含成功失败案例对比和多轮修图场景。研究显示AI在全局修改方面表现优秀,但精细操作仍有挑战。这为AI修图技术发展奠定基础,未来将让修图软件更智能易用。
香港大学团队开发了VideoAgentTrek系统,通过自动分析YouTube教程视频训练AI学会电脑操作。该系统使用Video2Action模块从39000个视频中提取152万操作步骤,让AI任务成功率从9.3%提升至15.8%,为AI助手实用化开辟新路径。
微软与布朗大学联合研究发现,通过为AI助手配备18000多种专业工具,可以显著提升其在企业环境中的工作效率。研究团队创建了TheMCPCompany测试环境,使用模型上下文协议(MCP)让AI助手能够直接调用专业工具而非依赖浏览器。实验显示,使用专业工具的AI助手性能提升13.79分,成本降低54%,但在复杂Azure任务中仍面临挑战,揭示了未来智能助手发展的重要方向。
上海交通大学与OPPO研究院联合开发的ColorAgent系统,实现了从被动工具到主动伙伴的突破,通过创新的多智能体架构和个性化交互机制,在手机操作任务中达到77.2%的成功率,创造了该领域新纪录,为未来智能手机助手的发展指明了方向。
OmniNWM是由上海交通大学等机构开发的创新自动驾驶世界模型,首次实现状态、动作、奖励三维统一。系统能同时生成全景RGB、语义、深度和3D占用视频,通过规范化射线图实现精确控制,并基于3D占用直接评判驾驶安全性。该技术在视频生成质量、控制精度和长期稳定性方面均达到领先水平,支持零样本跨数据集泛化,为自动驾驶技术商业化提供了重要突破。
卡内基梅隆大学研究团队发现,AI代码助手可能生成表面正确但暗藏安全漏洞的代码补丁。通过"FCV攻击"方法,研究者在12种主流AI助手组合中都发现了这一问题,攻击成功率最高达56.3%。这种威胁只需一次查询即可实现,且攻击通过污染AI内部状态而非改变外在行为来生效,使传统防御方法效果有限。研究挑战了"功能正确即安全"的假设,呼吁重新审视AI代码助手的安全评估标准。
乔治梅森大学研究团队开发出双向长短期记忆网络,成功预测全球恐怖主义活动时间模式,预测精度比传统方法提升35.4%。该AI系统通过分析1970-2016年全球恐怖主义数据库,能同时识别袭击前的预期信号和袭击后的反应模式,为安全机构提供未来几周的风险评估,但研究团队强调该技术仅适用于宏观安全决策支持。
Nemotron 3开源模型,已经开始在架构层面针对Agentic AI 的核心痛点——无限记忆、极速推理、工具调用——进行原生的“基因改造”。
AI正深刻地重塑着我们商业世界的底层架构。我们已经见证了AI在营销领域的工具化阶段:更精准的投放、更高效的内容生产、更智能的客服应答。但这些只是起点。它不仅要回答“如何做得更好”,更要回答“为什么要这样做”。
这项由OpenRouter公司团队和Andreessen Horowitz(a16z)投资机构联合开展的研究,于2025年12月发表。
希腊塞萨洛尼基大学研究团队开发出MIR-L算法,通过"彩票假说"发现大型图像修复网络中的关键子网络。该算法采用迭代剪枝策略,将网络参数减少90%的同时保持甚至提升修复性能。MIR-L能同时处理去雨、去雾、降噪等多种图片问题,为资源受限设备的实时图像处理提供了高效解决方案,具有重要的实用价值和环保意义。
进入今年下半年,这一变化明显加速。AI开始走向业务核心,围绕具体业务域构建智能体、重塑流程,成为企业数字化与智能化转型的新抓手。从提效到赋能,从通用到专用,民营企业对AI的理解,正在发生一次更为本质的转变。
通用汽车宣布为部分2025款及更新凯迪拉克和雪佛兰车型推出原生Apple Music应用。凯迪拉克车型还将支持杜比全景声空间音频技术,打造沉浸式三维音效体验。作为OnStar Basics服务的一部分,通用汽车为所有2025款及更新车型提供八年免费音频流媒体服务,支持Spotify和Apple Music等应用。该应用将通过OTA更新自动安装到支持的车辆中。
GMV获得欧洲航天局合同,开发名为Beacon的先进波束成形天线接收系统,旨在提升低轨卫星C波段导航信号的抗干扰能力。该系统结合波束成形、零点导向和到达角估计技术,为自动驾驶运输、物流和无人系统提供可靠导航服务。项目为期18个月,投资80万欧元,将于2025年12月启动,通过实际环境测试验证系统性能,助力欧洲建立自主可靠的定位导航授时服务能力。