最新文章第76页

2025-09-15

甲骨文云服务或在本十年内媲美AWS

甲骨文正在成为大规模基础设施供应商的可靠选择。该公司通过AI技术推动应用开发，构建GenAI模型并将智能代理集成到应用套件中。CEO萨弗拉·卡茨透露，公司剩余履约义务达4553亿美元，同比增长4.6倍，并预测OCI收入将从2026财年的180亿美元增长至2030财年的1440亿美元。甲骨文正积极布局AI推理市场，凭借其作为全球最大企业私有数据托管方的优势地位，有望在云计算领域实现重大突破。

AirPods Pro 3内置心率传感器，无需Apple Watch也能监测健康数据

可穿戴设备

心率监测

AI健身教练

2025-09-15

AirPods Pro 3内置心率传感器，无需Apple Watch也能监测健康数据

苹果在iPhone 17发布会上推出AirPods Pro 3，新增心率监测传感器。该耳机采用红外光传感器和AI模型，可在运动时追踪心率和卡路里消耗数据，并同步至Apple健身应用。新功能还包括改进降噪、实时翻译、更佳音质和防水设计。集成Apple Fitness Plus后，可提供个性化健身指导和实时运动数据显示。售价249美元起。

人工智能

差分隐私

开源模型

2025-09-15

Google推出VaultGemma模型，引领隐私保护AI新标准

谷歌推出全球最强差分私有大语言模型VaultGemma，这是一个10亿参数的模型，基于Gemma架构构建。该模型采用先进数学算法防止敏感数据泄露，通过在数据集中添加受控噪声实现隐私保护。VaultGemma在多项基准测试中表现卓越，性能可媲美同等参数的非私有模型，但完全不会暴露训练数据，为金融和医疗等监管行业的AI应用提供重要保障。

人工智能

智能体建模

政策模拟

2025-09-15

学者用AI智能体模拟美联储委员会会议

乔治华盛顿大学研究人员开发出"FOMC计算机模拟"项目，成功构建了美联储公开市场委员会会议的AI模型。该项目将每位委员的政策态度和投票记录输入系统，创建数字化委员档案。研究采用双轨模拟框架，结合大语言模型驱动的会议模拟与博弈论投票模型。主要发现显示，在政治压力下，委员会成员会产生分歧并破坏共识。这一技术突破为未来模拟各类群体决策会议奠定了基础。

人工智能

隐私保护

数据安全

2025-09-15

AI聊天机器人正悄然引发隐私危机

AI聊天机器人如ChatGPT、Gemini和Grok日益融入日常生活，目前最受欢迎的用途是心理治疗。人们常与它们讨论敏感话题，误以为对话会保持私密。然而，聊天机器人不受保密规则约束。近期发生多起数据泄露事件，包括ChatGPT分享功能导致对话被搜索引擎索引，Grok多达30万次聊天记录被公开。企业中"影子AI"使用也带来风险。专家建议避免分享个人敏感信息，企业应制定相关政策。

视频理解

实时交互

多模态处理

2025-09-15

香港中文大学推出Dispider：让视频AI像人一样"边看边聊"的革命性突破

香港中文大学联合上海AI实验室推出Dispider系统，首次实现AI视频"边看边聊"能力。通过创新的三分式架构设计，将感知、决策、反应功能独立分离，让AI能像人类一样在观看视频过程中进行实时交流，在StreamingBench测试中显著超越现有系统，为教育、娱乐、医疗、安防等领域的视频AI应用开启新可能。

人工智能

语言模型评估

开源技术

2025-09-15

Atla公司发布Selene Mini：一个8B参数的强大语言模型评估器，性能超越GPT-4o-mini

Atla公司发布Selene Mini，这是一个仅有80亿参数的AI评估模型，却在11个基准测试中全面超越GPT-4o-mini。通过精心的数据筛选和创新训练策略，该模型不仅能准确评判文本质量，还能在医疗、金融等专业领域表现出色。研究团队将模型完全开源，为AI评估技术的普及和发展做出贡献。

ByteDance推出Seaweed-APT：1秒生成2秒高清视频，AI视频制作迈入实时时代

人工智能

视频生成

实时生成

2025-09-15

ByteDance推出Seaweed-APT：1秒生成2秒高清视频，AI视频制作迈入实时时代

ByteDance研究团队开发出革命性的Seaweed-APT技术，实现了首个真正意义上的实时高清视频生成。该技术通过创新的对抗后训练方法，将传统需要25步和数分钟的视频生成过程压缩为单步1秒完成，能生成2秒长1280×720高清视频，视觉真实感提升37.2%。尽管在结构完整性方面存在一定权衡，但这项突破为AI内容创作、社交媒体、教育和娱乐等领域开启了实时视频生成的新时代。

人工智能

计算机视觉

物理推理

2025-09-15

AI视频能懂物理定律吗？Google DeepMind用396个视频测出了真相

Google DeepMind通过Physics-IQ基准测试发现，尽管当前AI视频模型能生成视觉上极为逼真的内容，但其物理理解能力严重不足。研究使用396个真实物理实验视频测试了8个主流模型，结果显示最佳模型得分仅为29.5%。更重要的是，视觉真实度与物理理解能力之间几乎无关联，这一发现对AI发展具有重要启示意义。

AI大模型批评能力大考验：为什么o1-mini脱颖而出？中科大深圳团队揭示传统模型批评能力之痛

人工智能

批评能力评估

o1-mini模型优势

2025-09-15

AI大模型批评能力大考验：为什么o1-mini脱颖而出？中科大深圳团队揭示传统模型批评能力之痛

中科大深圳团队开发RealCritic框架，发现AI大模型普遍存在批评能力缺陷。除o1-mini外，多数模型在自我批评时表现下降，甚至把正确答案改错。研究揭示"会做题"和"会批评"是不同技能，提出闭环评估新方法，为AI批评能力评估提供科学标准。

大语言模型的一个奇怪现象：思考让它们更自信，即使答案是错的！西班牙马德里理工大学震撼发现

人工智能

自然语言处理

认知偏见

2025-09-15

大语言模型的一个奇怪现象：思考让它们更自信，即使答案是错的！西班牙马德里理工大学震撼发现

西班牙马德里理工大学等机构联合研究发现，大语言模型在经过推理思考后会变得更加自信，但这种自信不分对错。研究测试了七个不同模型，发现当要求AI先解释推理过程再回答选择题时，所有模型都表现出更高的信心水平，且错误答案的信心增长甚至超过正确答案。这一现象类似人类"解释即相信"的认知偏见。

机器人新纪元

具身智能

2025-09-15

具身智能2025之问：新物种时代，人形机器人如何长大？

乐观估计，两年左右会出现人形机器人的ChatGPT时刻。

NVIDIA提出Omni-RGPT：一个会"看图说话"的AI，能精准理解视频和图像中每个区域的故事

多模态大语言模型

Token Mark机制

区域级视频理解

2025-09-15

NVIDIA提出Omni-RGPT：一个会"看图说话"的AI，能精准理解视频和图像中每个区域的故事

NVIDIA联合多所大学开发的Omni-RGPT实现了AI视觉理解的重要突破，首次让AI能同时精准理解图像和视频中用户指定的任何区域。通过独创的Token Mark机制，该系统解决了传统方法在视频中容易"跟丢"目标的问题，在视觉问答、区域描述等多项任务上达到最先进水平，为教育、安防、内容创作等领域的AI应用奠定了基础。

AI视觉推理新突破：中国团队让机器像人一样"慢思考"，仅用5千个文本案例就追平顶级商业系统

人工智能

多模态推理

慢思考系统

2025-09-15

AI视觉推理新突破：中国团队让机器像人一样"慢思考"，仅用5千个文本案例就追平顶级商业系统

这项由中国人民大学等机构合作完成的研究提出了Virgo系统，发现仅用5000个纯文本推理案例训练就能让AI在视觉推理任务上达到顶级商业系统水平。研究证实推理能力具有跨模态通用性，为更经济高效地开发多模态AI系统指明了新方向，同时也揭示了AI感知反思能力不足的局限性。

华为

ICT

中小企业

智能化

2025-09-15

2025华为坤灵秋季新品发布会

2025.09.17 09:45-12:00 华为坤灵助力中小企业跃升智能化

大语言模型

词汇表优化

模型架构创新

2025-09-15

ByteDance发现词汇表竟然也有「超量」：大语言模型的神秘增长密码

ByteDance研究团队发现了大语言模型扩展的新维度：通过扩大输入词汇表可显著提升模型性能而几乎不增加计算成本。他们提出的过度词汇化变换器将输入和输出词汇表分离，输入端使用1280万词条，让400M参数模型达到10亿参数模型性能。研究发现词汇表大小与性能呈对数线性关系，为大模型优化提供了新思路。

华为诺亚方舟实验室推出颠覆性文档搜索技术：让AI在长达65页的文档中秒找所需信息

多模态文档检索

视觉语言模型

信息检索基准

2025-09-15

华为诺亚方舟实验室推出颠覆性文档搜索技术：让AI在长达65页的文档中秒找所需信息

华为诺亚方舟实验室推出MMDOCIR，这是首个专门针对长文档多模态信息检索的基准测试系统。该系统能够在平均65页的复杂文档中精确定位信息，不仅理解文字内容，还能解读图表、表格等视觉元素。通过对313份真实文档的测试，研究证明视觉理解方法比传统文本转换方法准确率高出15-25个百分点，为企业知识管理、法律文书检索、医疗文献查阅等领域带来革命性改进。

人工智能

推理时间扩展

医学诊断

2025-09-15

上海交大团队首次证实：AI思考时间越长，医学诊断越精准

上海交通大学团队通过"推理时间扩展"技术让AI学会深度思考，在医学诊断中取得突破。研究发现AI思考时间越长诊断越准确，仅用500个样本就实现6%-11%准确率提升。AI模型展现出类似医生的临床推理能力，能进行差异诊断和证据权衡，特别在复杂罕见疾病诊断方面表现出色，为AI医学应用开辟新方向。

个性化文本生成

知识图谱

用户行为分析

2025-09-15

加州大学圣克鲁兹分校联合Adobe等机构：让AI真正懂你——用知识图谱帮助大语言模型实现个性化文本生成

加州大学圣克鲁兹分校等机构联合开发的PGraphRAG框架，通过构建用户中心知识图谱解决了AI个性化服务的冷启动问题。该技术不再依赖单一用户历史数据，而是利用用户相似性网络实现个性化文本生成。在12项任务测试中，PGraphRAG在长文本生成上平均提升14.8%，在短文本生成上提升4.6%，为99.99%的数据稀少用户提供了个性化AI服务的可能。

人工智能

多模态大语言模型

零样本学习

2025-09-15

AI"法官"新突破：Meta团队让机器无师自通判别图像安全问题

Meta团队开发出CLUE系统，这是一种无需人工标注数据就能判断图像安全问题的AI方法。该系统通过将主观安全规则客观化、智能筛选相关规则、分解复杂条件、消除判断偏见等创新技术，在测试中达到95.9%召回率和94.8%准确率，显著超越传统方法。这项突破为内容平台提供了高效灵活的安全检测工具，有望改变网络内容审核的现状。

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

PEC 2025 AI创新者大会

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: