新加坡国立大学研究团队开发出SparseD技术,针对扩散语言模型的注意力机制进行优化。通过发现并利用注意力头的个性化模式、跨步骤的模式稳定性以及早期生成阶段的关键性,实现了在保持文本质量的同时将生成速度提升最多50%,为长文本AI应用提供了重要技术突破。
伊利诺伊大学团队通过精心设计的字符串转换实验,证明大型语言模型能够通过强化学习学会组合已有技能形成新能力。研究发现仅提供组合数据还不够,必须配合强化学习才能激发真正的组合推理能力。这种技能还能跨任务迁移,为AI发展提供了重要启示。
清华大学团队开发出InfLLM-V2密集-稀疏可切换注意力框架,解决了大型语言模型处理长文本时的计算瓶颈问题。该技术能让AI模型根据文本长度自动调整注意力模式,实现4倍速度提升的同时保持98%以上的准确率。研究团队通过参数重用和统一计算流程,实现了短到长文本处理的无缝转换,并开源了MiniCPM4.1模型供研究使用。
上海AI实验室开发的SDLM技术革命性地解决了AI语言模型生成速度慢的问题。通过"下一序列预测"和智能置信度检测,SDLM能根据内容复杂程度动态调整生成长度,在保持高准确性的同时将生成速度提升一倍以上,为AI助手的实用化应用开辟了新路径。
为了确保生成内容的专业度,夸克算法团队已经与通义实验室成立了联合研发小组,专注于搜索推理与可信生成。
6G时代曙光初现,移动生态系统正迈入技术定义与协同创新的关键阶段。第三代合作伙伴计划(3GPP)、AI-RAN联盟及O-RAN联盟等组织正协同推进工作,共同塑造首个大规模人工智能(AI)原生无线网络。
这项由伊利诺伊大学厦巴纳-香槟分校和滑铁卢大学联合完成的研究,开发了名为VideoScore2的AI视频评估系统,能够像人类专家一样从视觉质量、文本对齐和物理一致性三个维度对AI生成视频进行详细评估,并提供透明的分析过程。该系统在多项测试中显著超越现有评估工具,在准确率上提升近6个百分点,为AI视频行业提供了标准化、可解释的质量评估解决方案,有望推动整个领域的技术进步。
滑铁卢大学研究团队提出批评强化学习新方法,让AI模型在学习编程的同时学会批评代码质量。CRITIQUE-CODER模型采用8:2混合训练,不仅保持编程能力还获得代码评价能力。实验显示,该方法让小参数模型超越大模型,4B参数版本在LiveCodeBench达59分,超越基础模型4.8分。更重要的是,批评能力可迁移到逻辑推理等其他领域,为AI训练范式转变指明新方向。
OpenAI于周二发布AI浏览器ChatGPT Atlas,目标是让ChatGPT成为搜索和问答的首选界面而非谷歌。该浏览器目前仅支持Mac,但正在开发Windows、iOS和Android版本。Atlas将ChatGPT设为默认搜索选项,并具备记忆功能,可结合浏览历史提供个性化答案。与其他AI浏览器不同,Atlas更专注于强化ChatGPT生态系统,为OpenAI提供更多用户数据和分发控制权,而非改善传统浏览体验。
通用汽车宣布计划于2028年推出自动驾驶系统,允许驾驶员双眼离开道路、双手离开方向盘,首先应用于凯迪拉克Escalade IQ。该系统基于现有Super Cruise技术,采用激光雷达、雷达和摄像头感知技术,初期在高速公路使用。通用整合了已关闭的Cruise子公司的技术栈,包括基于500万英里无人驾驶数据训练的AI模型。目前美国仅奔驰拥有商用L3级自动驾驶系统。
谷歌量子AI团队利用Willow量子芯片展示了可验证的量子模拟算法,能够比经典计算机更快更准确地模拟分子物理特性。该团队开发的"量子回声"算法通过模拟核磁共振实验过程,成功重现了分子原子核在磁场中的行为。研究团队与加州大学伯克利分校合作验证了算法准确性,实验涉及15个和28个原子的分子。结果显示量子芯片运行速度比世界最快超级计算机快13000倍,为药物发现和材料科学提供了新工具。
卡内基梅隆大学研究团队开发了基于向量嵌入算法的自动化数据库系统,可将PostgreSQL默认设置性能提升2-10倍。该团队构建了名为Proto-X的整体调优代理,采用Wolpertinger架构和向量嵌入技术,能同时优化所有数据库参数。结合LLM增强技术,调优时间从12小时缩短至50分钟。研究者认为这项技术对于缺乏数据库管理经验的开发者和"氛围编程"时代至关重要,计划明年推出名为SYDHT的商业化产品。
机器学习的突破性进展颠覆了传统数据中心架构,AI模型训练的计算需求持续增长。MLPerf训练基准测试作为标准化框架应运而生,用于评估机器学习性能,帮助数据中心专业人员做出符合快速发展工作负载需求的基础设施决策。该基准测试通过"训练时间"这一核心指标,为不同系统提供公平比较标准。
Collabora的Muhammad Anjum提出了一个新的Linux内核补丁,允许用户通过按电源按钮来中途取消系统休眠过程。该补丁解决了休眠需要较长时间(约20秒)的问题。休眠功能在Linux中相对复杂,Ubuntu等发行版默认禁用此功能以避免数据丢失风险。休眠需要与物理内存同等大小的交换空间,现代PC内存容量巨大使得预留交换空间变得浪费。
亚马逊在年度技术大会上发布了多项创新技术,包括集成三套系统于一体的多臂机器人系统Blue Jay,以及帮助仓库管理者实时决策的AI助手Project Eluna。此外,公司还在开发智能配送眼镜,为配送员提供免手持导航和包裹扫描功能。Blue Jay机器人系统能够高效分拣数千件商品,大幅提升物流处理速度。这些技术体现了亚马逊在"物理AI"领域的领先地位,旨在提升员工工作安全性和客户服务体验。
MariaDB企业平台2026版本集成了RAG管道和AI代理支持,并通过基于Exasol的Exa内存引擎显著加速分析处理。该平台将事务、分析和AI数据库引擎统一到单一高性能平台中,支持检索增强生成管道和AI代理。新版本提供开箱即用的RAG功能,内置自然语言交互的AI副驾驶,包括开发者和DBA助手。MariaDB Exa分析引擎处理多TB复杂分析的速度比传统OLTP引擎快1000倍以上。
软件定义高性能全闪存存储公司PEAK:AIO正在采用并行NFS(pNFS)技术,从单节点系统向横向扩展产品演进。该公司宣布将pNFS元数据软件开源,旨在为HPC环境提供现代化文件系统替代方案。PEAK:AIO的单个2RU系统可实现320GB/s性能并支持线性扩展,同时探索CXL技术以降低GPU访问延迟,计划构建统一的块、文件和对象协议系统。
戴尔AI数据平台新增基于Elastic的数据搜索引擎和Starburst构建的数据分析引擎,同时加入数据分析引擎代理层、MCP服务器及英伟达cuVS集成。该平台分离存储与计算,专为AI训练、微调、检索增强生成和推理等工作负载设计,旨在简化数据复杂性、统一管道并大规模交付AI就绪数据。