最新文章
华为诺亚实验室:让AI像人类一样从数据中学到"好"与"坏"的智能训练新方法

华为诺亚实验室:让AI像人类一样从数据中学到"好"与"坏"的智能训练新方法

华为诺亚实验室等机构联合提出了一种创新的AI训练方法,通过双层优化框架让AI从数据中自动学习评价标准。该方法结合了传统最大似然估计和强化学习的优势,在表格分类和模型驱动强化学习任务中展现出更好的收敛性和泛化能力,为解决强化学习中缺乏明确奖励信号的问题提供了新思路。

中科院自动化所团队重磅发布AVoCaDO:首个能精准捕捉音画时间同步的AI视频解说生成器

中科院自动化所团队重磅发布AVoCaDO:首个能精准捕捉音画时间同步的AI视频解说生成器

中科院自动化所团队发布AVoCaDO系统,这是首个能精准捕捉视听事件时间同步关系的AI视频解说生成器。通过双阶段训练和创新奖励机制,AVoCaDO不仅能识别视频内容,更能准确把握各元素的时间关系,在多个基准测试中显著超越现有开源模型,甚至在某些指标上超过商业模型,为智能视频理解开辟新方向。

NVIDIA团队推出QeRL:让大语言模型学习推理变得又快又好的神奇方法

NVIDIA团队推出QeRL:让大语言模型学习推理变得又快又好的神奇方法

NVIDIA等机构联合提出QeRL框架,通过自适应量化噪声技术实现大语言模型强化学习训练的效率与性能双重突破。该方法将显存需求减少60-70%,训练速度提升1.5倍以上,首次实现320亿参数模型单GPU训练,同时在GSM8K等数学推理测试中达到90.8%准确率,接近全参数训练效果。

纽约大学团队革命性突破:用冻结的AI"老师"训练出超强图像生成器,打破传统压缩思维

纽约大学团队革命性突破:用冻结的AI"老师"训练出超强图像生成器,打破传统压缩思维

纽约大学研究团队开发出突破性的表征自编码器(RAE)技术,颠覆传统图像生成思路。RAE直接利用已训练好的AI模型(如DINOv2)的知识,无需压缩就能生成高质量图片。配合新设计的DiTDH架构,在ImageNet测试中实现了1.51 FID的优异成绩,训练效率比传统方法提升数十倍,为内容创作、游戏开发等领域带来重大突破。

南京大学推出OmniVideoBench:AI视频理解能力的全新"考试"

南京大学推出OmniVideoBench:AI视频理解能力的全新"考试"

南京大学LINK团队发布OmniVideoBench,这是首个专门评估AI音视频协同理解能力的测试基准。研究基于628个真实视频设计了1000道测试题,要求AI必须综合音频和视频信息才能回答。测试结果显示,即使最先进的Gemini-2.5-Pro准确率也仅58.90%,未达及格线,特别是在背景音乐理解方面表现最差,揭示了当前AI在复杂多模态推理方面的显著局限。

用流动奖励让AI更会推理:中科大和上海创新院团队让大语言模型的思考过程更像人类

用流动奖励让AI更会推理:中科大和上海创新院团队让大语言模型的思考过程更像人类

中科大和上海创新院团队开发出RLFR技术,通过分析AI内部"思维流动"来优化推理训练。该技术不只看答案对错,而是评估整个推理过程质量,就像监控河流流向一样引导AI形成连贯逻辑。在数学推理等测试中显示显著提升,让AI推理过程更稳定可靠。这项开源技术为构建更智能可信的AI系统提供了新路径。

南京大学团队揭秘数学推理新突破:让AI学会真正的"变通思维"而非死记硬背

南京大学团队揭秘数学推理新突破:让AI学会真正的"变通思维"而非死记硬背

南京大学团队提出AdaR框架,解决大型语言模型数学推理中的"虚假推理"问题。该方法通过精巧的数据合成机制和强化学习策略,让AI学会基于真正逻辑而非表面记忆进行推理。仅用9000个样本就实现显著性能提升,平均改进8.5-11.44个百分点,展现出卓越的数据效率和泛化能力。

让AI变得更聪明:新加坡国立大学团队破解智能体学习的三大关键

让AI变得更聪明:新加坡国立大学团队破解智能体学习的三大关键

新加坡国立大学等机构联合研究团队通过系统分析数据质量、算法优化和推理模式三个维度,破解了AI智能体学习难题。研究发现真实完整的训练数据、恰当的探索策略和深思熟虑的工具使用模式是关键。他们开发的4B参数DemyAgent模型在数学、科学等多项测试中超越了更大规模的模型,证明了"智慧胜过蛮力"的理念,为AI智能体发展指明了新方向。

AI安全守护神:IBM研究团队推出首个面向智能代理的预执行安全系统

AI安全守护神:IBM研究团队推出首个面向智能代理的预执行安全系统

这项由美国圣母大学和IBM研究院联合完成的突破性研究,首次提出了针对AI代理系统的预执行安全防护方案。研究团队开发了AuraGen数据生成引擎、Safiron安全守护模型和Pre-Exec Bench评估基准三大核心组件,能在AI代理执行动作前就识别潜在风险。实验显示该系统在安全检测准确率上显著超越现有方法,为AI代理的安全部署提供了重要保障。

“我们曾是怪咖,我有阅读障碍,不看报表做决策”:5000亿美金市值后,美国AI落地标杆 Palantir CEO 谈20年反共识
2025-11-19

“我们曾是怪咖,我有阅读障碍,不看报表做决策”:5000亿美金市值后,美国AI落地标杆 Palantir CEO 谈20年反共识

如果美国有一家公司可以称得上是AI落地标杆,那么很多人大概率会提及Palantir。

圆满收官!2025年第二届中关村具身智能机器人应用大赛落幕,赛事亮点全面回顾
2025-11-19

圆满收官!2025年第二届中关村具身智能机器人应用大赛落幕,赛事亮点全面回顾

以“具身引智、应用未来”为主题的2025年第二届中关村具身智能机器人应用大赛圆满收官。

当宕机不可避免,混合云策略战略需具备多云弹性
2025-11-19

当宕机不可避免,混合云策略战略需具备多云弹性

对于想要保障业务连续性的企业而言,Cloudera的“复杂环境中的云”方案无疑是明智的选择。

返璞归真,行稳致远:SOLIDWORKS以AI赋能设计,渠道驱动增长
2025-11-19

返璞归真,行稳致远:SOLIDWORKS以AI赋能设计,渠道驱动增长

“返璞归真、行稳致远”八个字,既是SOLIDWORKS对未来的承诺,也将成为他带领SOLIDWORKS前行的源动力。

Cloudflare服务中断影响多个公共网络服务

Cloudflare服务中断影响多个公共网络服务

网络流量保护专家Cloudflare因其Access零信任平台发生故障向客户道歉,该故障导致包括OpenAI的ChatGPT、DownDetector和社交媒体平台X在内的多个面向公众的服务中断。故障始于英国时间上午11点20分左右,最初被描述为"内部服务降级"。Cloudflare后续确认故障根本原因是自动生成的配置文件超出预期大小并触发软件系统崩溃,强调这并非攻击所致。

戴尔推动Azure PowerScale云端部署,将PowerStore集成至Azure Local私有云

戴尔推动Azure PowerScale云端部署,将PowerStore集成至Azure Local私有云

戴尔PowerScale文件系统存储现已作为Azure托管服务提供,PowerStore块存储成为微软Azure Local产品的选项。PowerScale支持高达8.4 PB单一命名空间存储,性能比竞争对手高出4倍。Azure Local与戴尔私有云和PowerStore的集成预计于2026年春季进入早期访问阶段。

科技巨头向Anthropic投入数十亿美元,AI领域循环投资持续升温

科技巨头向Anthropic投入数十亿美元,AI领域循环投资持续升温

微软和英伟达宣布新合作计划,将分别向AI公司Anthropic投资50亿和100亿美元,同时Anthropic承诺向微软云服务投入300亿美元。此举旨在减少AI行业对OpenAI的依赖,但也凸显了AI投资的循环性质。根据协议,Claude模型将通过微软、亚马逊、谷歌三大云服务商提供服务,而Anthropic将与英伟达在芯片和模型优化方面展开合作。

VAST AI OS进驻Azure,构建全球AI运营数据平台

VAST AI OS进驻Azure,构建全球AI运营数据平台

VAST Data将其AI操作系统软件栈移植到Azure平台,作为托管服务提供。该AI操作系统包含DataSpace、DataBase、DataStore等多层数据服务,构建在DASE存储架构之上。此次合作使客户能够在本地VAST部署、云环境和Azure之间无缝迁移工作负载,形成跨环境的混合AI数据架构。VAST正在构建覆盖主流公有云的全球存储数据架构。

Cloudflare全球网络故障已修复,曾致ChatGPT等多项服务中断

Cloudflare全球网络故障已修复,曾致ChatGPT等多项服务中断

Cloudflare修复了导致全球网络应用广泛中断的故障,包括ChatGPT、X和多项政府服务受到影响。故障发生在美东时间凌晨4:30左右,公司报告遭遇内部服务降级问题。除ChatGPT和X外,Claude AI、新泽西交通应用、Spotify、Uber等服务也受到冲击。美东时间上午6:42,Cloudflare宣布已实施修复方案并持续监控。专家警告此类事件凸显了对少数服务提供商的危险依赖性。

DDN推出CORE统一AI和HPC数据平面架构

DDN推出CORE统一AI和HPC数据平面架构

DDN在SC25大会上发布了全新的CORE AI和HPC统一数据平面,整合了EXAScaler Lustre文件存储和Infinia对象存储系统,并推出A1400X3i和A12200新硬件。该公司声称其存储系统支持超过11000个客户的100万个GPU。CORE作为软件抽象层,统一管理本地部署和公有云实例,提供一致的AI数据性能,支持从模拟到训练、推理和检索增强生成的整个AI生命周期。

TACC的Horizon超算存储架构:VAST Data等四家公司打造顶级数据存储方案

TACC的Horizon超算存储架构:VAST Data等四家公司打造顶级数据存储方案

德克萨斯大学奥斯汀分校先进计算中心正在为其地平线AI和仿真超级计算机构建存储系统。该系统采用VAST Data在线存储、戴尔缓存归档前端、Versity软件和Spectra Logic离线磁带存储。地平线超算将成为全球最大的专用于开放科学研究的学术超级计算机,性能达到400千万亿次浮点运算,配备400PB全闪存存储和1EB级磁带归档系统。