最新文章第24页

2025-10-23

浙江大学破解AI控制难题：EasySteer让大模型秒变听话助手

浙江大学研究团队开发的EasySteer框架，通过操控AI模型内部"思维向量"实现精准行为控制，性能比现有框架提升5.5-11.4倍。该系统支持安全控制、推理优化等八大应用场景，提供完整工具套件和可视化界面，将AI控制从复杂研究技术转化为实用开发工具，为可控AI时代奠定重要基础。

当AI像人类一样挑剔：北京人工智能研究院突破图像编辑评价难题

北京人工智能研究院等机构联合开发了EditScore系统，解决了AI图像编辑评价难题。该研究建立了包含13种编辑任务的评价标准EditReward-Bench，开发了专业的AI评价模型EditScore，并首次在图像编辑领域成功应用强化学习。EditScore的评价准确性超越了GPT-5，通过其指导的强化学习训练显著提升了AI修图质量，为智能图像编辑工具的发展奠定了重要基础。

浙江大学团队推出GSM8K-V：让AI在看图解数学题时露出真面目

浙江大学研究团队通过开发GSM8K-V视觉数学推理基准，发现了AI技术的一个重大盲点：最先进的视觉语言模型在处理图片形式的数学题时表现远不如文字版本。该研究将1319道数学题转换为连环画式的多图场景，测试结果显示即使是表现最好的AI模型准确率也从95%骤降至47%，揭示了当前AI在视觉数学推理方面的根本性缺陷。

NVIDIA团队重磅突破：只用一张RTX 5090就能高速生成分钟级视频！

NVIDIA联合多所顶尖大学开发的SANA-Video模型实现重大突破，仅需RTX 5090显卡就能在29秒内生成5秒720p视频，速度比传统模型快16倍，成本降低99%。该模型采用线性注意力机制和固定内存设计，支持生成长达1分钟的高质量视频，在多项评测中表现优异，有望让高质量视频生成技术走向普及。

新加坡国立大学提出SparseD：让AI文本生成速度提升50%的神奇加速器

新加坡国立大学研究团队开发出SparseD技术，针对扩散语言模型的注意力机制进行优化。通过发现并利用注意力头的个性化模式、跨步骤的模式稳定性以及早期生成阶段的关键性，实现了在保持文本质量的同时将生成速度提升最多50%，为长文本AI应用提供了重要技术突破。

伊利诺伊大学团队重磅发现：AI也能像人类一样组合技能学出新本领！

伊利诺伊大学团队通过精心设计的字符串转换实验，证明大型语言模型能够通过强化学习学会组合已有技能形成新能力。研究发现仅提供组合数据还不够，必须配合强化学习才能激发真正的组合推理能力。这种技能还能跨任务迁移，为AI发展提供了重要启示。

清华大学团队让AI看懂长文如飞：突破传统注意力机制的革命性框架

清华大学团队开发出InfLLM-V2密集-稀疏可切换注意力框架，解决了大型语言模型处理长文本时的计算瓶颈问题。该技术能让AI模型根据文本长度自动调整注意力模式，实现4倍速度提升的同时保持98%以上的准确率。研究团队通过参数重用和统一计算流程，实现了短到长文本处理的无缝转换，并开源了MiniCPM4.1模型供研究使用。

上海AI实验室突破AI语言生成瓶颈：新模型SDLM让机器"说话"快一倍

上海AI实验室开发的SDLM技术革命性地解决了AI语言模型生成速度慢的问题。通过"下一序列预测"和智能置信度检测，SDLM能根据内容复杂程度动态调整生成长度，在保持高准确性的同时将生成速度提升一倍以上，为AI助手的实用化应用开辟了新路径。

2025-10-23

“数字主线+AI” 双驱助力智能制造

近日，PTC全球资深副总裁兼大中华区总裁刘强先生通过官方公众号发表了题为《“数字主线+AI” 双驱助力智能制造》的精彩演讲。

夸克"C计划"揭秘：上线“类豆包”AI对话助手，成为豆包劲敌？

为了确保生成内容的专业度，夸克算法团队已经与通义实验室成立了联合研发小组，专注于搜索推理与可信生成。

2025-10-23

创新，向6G：人工智能在无线接入网中的应用潜力

6G时代曙光初现，移动生态系统正迈入技术定义与协同创新的关键阶段。第三代合作伙伴计划（3GPP）、AI-RAN联盟及O-RAN联盟等组织正协同推进工作，共同塑造首个大规模人工智能（AI）原生无线网络。

伊利诺伊大学厦巴纳-香槟分校：AI视频评判专家诞生，让机器像人类一样"看懂"视频好坏

这项由伊利诺伊大学厦巴纳-香槟分校和滑铁卢大学联合完成的研究，开发了名为VideoScore2的AI视频评估系统，能够像人类专家一样从视觉质量、文本对齐和物理一致性三个维度对AI生成视频进行详细评估，并提供透明的分析过程。该系统在多项测试中显著超越现有评估工具，在准确率上提升近6个百分点，为AI视频行业提供了标准化、可解释的质量评估解决方案，有望推动整个领域的技术进步。

滑铁卢大学团队突破编程模型训练瓶颈：让AI在自我批评中成长得更聪明

滑铁卢大学研究团队提出批评强化学习新方法，让AI模型在学习编程的同时学会批评代码质量。CRITIQUE-CODER模型采用8:2混合训练，不仅保持编程能力还获得代码评价能力。实验显示，该方法让小参数模型超越大模型，4B参数版本在LiveCodeBench达59分，超越基础模型4.8分。更重要的是，批评能力可迁移到逻辑推理等其他领域，为AI训练范式转变指明新方向。

OpenAI发布ChatGPT Atlas浏览器：重在推广ChatGPT而非改进网页浏览

OpenAI于周二发布AI浏览器ChatGPT Atlas，目标是让ChatGPT成为搜索和问答的首选界面而非谷歌。该浏览器目前仅支持Mac，但正在开发Windows、iOS和Android版本。Atlas将ChatGPT设为默认搜索选项，并具备记忆功能，可结合浏览历史提供个性化答案。与其他AI浏览器不同，Atlas更专注于强化ChatGPT生态系统，为OpenAI提供更多用户数据和分发控制权，而非改善传统浏览体验。

人工智能

自动驾驶

新型算法

2025-10-23

通用汽车2028年推出解放双眼双手自动驾驶系统

通用汽车宣布计划于2028年推出自动驾驶系统，允许驾驶员双眼离开道路、双手离开方向盘，首先应用于凯迪拉克Escalade IQ。该系统基于现有Super Cruise技术，采用激光雷达、雷达和摄像头感知技术，初期在高速公路使用。通用整合了已关闭的Cruise子公司的技术栈，包括基于500万英里无人驾驶数据训练的AI模型。目前美国仅奔驰拥有商用L3级自动驾驶系统。

量子计算

核磁共振

分子模拟

2025-10-23

谷歌量子芯片实现分子形状可验证量子模拟

谷歌量子AI团队利用Willow量子芯片展示了可验证的量子模拟算法，能够比经典计算机更快更准确地模拟分子物理特性。该团队开发的"量子回声"算法通过模拟核磁共振实验过程，成功重现了分子原子核在磁场中的行为。研究团队与加州大学伯克利分校合作验证了算法准确性，实验涉及15个和28个原子的分子。结果显示量子芯片运行速度比世界最快超级计算机快13000倍，为药物发现和材料科学提供了新工具。

数据库优化

向量嵌入

自动化调优

2025-10-23

卡耐基梅隆团队声称基于向量的系统可大幅提升PostgreSQL性能

卡内基梅隆大学研究团队开发了基于向量嵌入算法的自动化数据库系统，可将PostgreSQL默认设置性能提升2-10倍。该团队构建了名为Proto-X的整体调优代理，采用Wolpertinger架构和向量嵌入技术，能同时优化所有数据库参数。结合LLM增强技术，调优时间从12小时缩短至50分钟。研究者认为这项技术对于缺乏数据库管理经验的开发者和"氛围编程"时代至关重要，计划明年推出名为SYDHT的商业化产品。

人工智能

性能评估

基准测试优化

2025-10-23

MLPerf基准测试如何指导数据中心设计决策

机器学习的突破性进展颠覆了传统数据中心架构，AI模型训练的计算需求持续增长。MLPerf训练基准测试作为标准化框架应运而生，用于评估机器学习性能，帮助数据中心专业人员做出符合快速发展工作负载需求的基础设施决策。该基准测试通过"训练时间"这一核心指标，为不同系统提供公平比较标准。

操作系统

内核开发

功能优化

2025-10-23

Linux内核新补丁支持休眠过程中途取消操作

Collabora的Muhammad Anjum提出了一个新的Linux内核补丁，允许用户通过按电源按钮来中途取消系统休眠过程。该补丁解决了休眠需要较长时间（约20秒）的问题。休眠功能在Linux中相对复杂，Ubuntu等发行版默认禁用此功能以避免数据丢失风险。休眠需要与物理内存同等大小的交换空间，现代PC内存容量巨大使得预留交换空间变得浪费。

人工智能

机器人技术

物流创新

2025-10-23

亚马逊AI机器人与智能眼镜助力快递配送升级

亚马逊在年度技术大会上发布了多项创新技术，包括集成三套系统于一体的多臂机器人系统Blue Jay，以及帮助仓库管理者实时决策的AI助手Project Eluna。此外，公司还在开发智能配送眼镜，为配送员提供免手持导航和包裹扫描功能。Blue Jay机器人系统能够高效分拣数千件商品，大幅提升物流处理速度。这些技术体现了亚马逊在"物理AI"领域的领先地位，旨在提升员工工作安全性和客户服务体验。

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

PEC 2025 AI创新者大会

用AI，在数字身份验证风暴中心重构信任坐标

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: