最新文章
“我们曾是怪咖,我有阅读障碍,不看报表做决策”:5000亿美金市值后,美国AI落地标杆 Palantir CEO 谈20年反共识
2025-11-19

“我们曾是怪咖,我有阅读障碍,不看报表做决策”:5000亿美金市值后,美国AI落地标杆 Palantir CEO 谈20年反共识

如果美国有一家公司可以称得上是AI落地标杆,那么很多人大概率会提及Palantir。

南京大学推出OmniVideoBench:AI视频理解能力的全新“考试“

南京大学推出OmniVideoBench:AI视频理解能力的全新“考试“

南京大学LINK团队发布OmniVideoBench,这是首个专门评估AI音视频协同理解能力的测试基准。研究基于628个真实视频设计了1000道测试题,要求AI必须综合音频和视频信息才能回答。测试结果显示,即使最先进的Gemini-2.5-Pro准确率也仅58.90%,未达及格线,特别是在背景音乐理解方面表现最差,揭示了当前AI在复杂多模态推理方面的显著局限。

Cloudflare服务中断影响多个公共网络服务

Cloudflare服务中断影响多个公共网络服务

网络流量保护专家Cloudflare因其Access零信任平台发生故障向客户道歉,该故障导致包括OpenAI的ChatGPT、DownDetector和社交媒体平台X在内的多个面向公众的服务中断。故障始于英国时间上午11点20分左右,最初被描述为"内部服务降级"。Cloudflare后续确认故障根本原因是自动生成的配置文件超出预期大小并触发软件系统崩溃,强调这并非攻击所致。

用流动奖励让AI更会推理:中科大和上海创新院团队让大语言模型的思考过程更像人类

用流动奖励让AI更会推理:中科大和上海创新院团队让大语言模型的思考过程更像人类

中科大和上海创新院团队开发出RLFR技术,通过分析AI内部"思维流动"来优化推理训练。该技术不只看答案对错,而是评估整个推理过程质量,就像监控河流流向一样引导AI形成连贯逻辑。在数学推理等测试中显示显著提升,让AI推理过程更稳定可靠。这项开源技术为构建更智能可信的AI系统提供了新路径。

戴尔推动Azure PowerScale云端部署,将PowerStore集成至Azure Local私有云

戴尔推动Azure PowerScale云端部署,将PowerStore集成至Azure Local私有云

戴尔PowerScale文件系统存储现已作为Azure托管服务提供,PowerStore块存储成为微软Azure Local产品的选项。PowerScale支持高达8.4 PB单一命名空间存储,性能比竞争对手高出4倍。Azure Local与戴尔私有云和PowerStore的集成预计于2026年春季进入早期访问阶段。

南京大学团队揭秘数学推理新突破:让AI学会真正的“变通思维“而非死记硬背

南京大学团队揭秘数学推理新突破:让AI学会真正的“变通思维“而非死记硬背

南京大学团队提出AdaR框架,解决大型语言模型数学推理中的"虚假推理"问题。该方法通过精巧的数据合成机制和强化学习策略,让AI学会基于真正逻辑而非表面记忆进行推理。仅用9000个样本就实现显著性能提升,平均改进8.5-11.44个百分点,展现出卓越的数据效率和泛化能力。

科技巨头向Anthropic投入数十亿美元,AI领域循环投资持续升温

科技巨头向Anthropic投入数十亿美元,AI领域循环投资持续升温

微软和英伟达宣布新合作计划,将分别向AI公司Anthropic投资50亿和100亿美元,同时Anthropic承诺向微软云服务投入300亿美元。此举旨在减少AI行业对OpenAI的依赖,但也凸显了AI投资的循环性质。根据协议,Claude模型将通过微软、亚马逊、谷歌三大云服务商提供服务,而Anthropic将与英伟达在芯片和模型优化方面展开合作。

让AI变得更聪明:新加坡国立大学团队破解智能体学习的三大关键

让AI变得更聪明:新加坡国立大学团队破解智能体学习的三大关键

新加坡国立大学等机构联合研究团队通过系统分析数据质量、算法优化和推理模式三个维度,破解了AI智能体学习难题。研究发现真实完整的训练数据、恰当的探索策略和深思熟虑的工具使用模式是关键。他们开发的4B参数DemyAgent模型在数学、科学等多项测试中超越了更大规模的模型,证明了"智慧胜过蛮力"的理念,为AI智能体发展指明了新方向。

VAST AI OS进驻Azure,构建全球AI运营数据平台

VAST AI OS进驻Azure,构建全球AI运营数据平台

VAST Data将其AI操作系统软件栈移植到Azure平台,作为托管服务提供。该AI操作系统包含DataSpace、DataBase、DataStore等多层数据服务,构建在DASE存储架构之上。此次合作使客户能够在本地VAST部署、云环境和Azure之间无缝迁移工作负载,形成跨环境的混合AI数据架构。VAST正在构建覆盖主流公有云的全球存储数据架构。

AI安全守护神:IBM研究团队推出首个面向智能代理的预执行安全系统

AI安全守护神:IBM研究团队推出首个面向智能代理的预执行安全系统

这项由美国圣母大学和IBM研究院联合完成的突破性研究,首次提出了针对AI代理系统的预执行安全防护方案。研究团队开发了AuraGen数据生成引擎、Safiron安全守护模型和Pre-Exec Bench评估基准三大核心组件,能在AI代理执行动作前就识别潜在风险。实验显示该系统在安全检测准确率上显著超越现有方法,为AI代理的安全部署提供了重要保障。

Cloudflare全球网络故障已修复,曾致ChatGPT等多项服务中断

Cloudflare全球网络故障已修复,曾致ChatGPT等多项服务中断

Cloudflare修复了导致全球网络应用广泛中断的故障,包括ChatGPT、X和多项政府服务受到影响。故障发生在美东时间凌晨4:30左右,公司报告遭遇内部服务降级问题。除ChatGPT和X外,Claude AI、新泽西交通应用、Spotify、Uber等服务也受到冲击。美东时间上午6:42,Cloudflare宣布已实施修复方案并持续监控。专家警告此类事件凸显了对少数服务提供商的危险依赖性。

AI模型突破理解与生成鸿沟:港科大团队推出GIR-Bench基准测试套件

AI模型突破理解与生成鸿沟:港科大团队推出GIR-Bench基准测试套件

香港科技大学团队发表重要研究,开发GIR-Bench测试基准评估统一多模态AI模型的推理与生成能力。研究发现即使最先进的AI模型在理解与生成之间也存在显著差距,无法有效将推理过程转化为准确的视觉生成,为AI行业发展提供重要警示。

邮件订阅