最新文章第18页

2025-09-28

Meta AI团队颠覆性突破：让机器像人类一样聪明地整合多个答案

Meta AI团队开发的AggLM技术突破了传统AI多数投票的局限，通过强化学习训练模型学会智能聚合多个候选答案。在数学竞赛测试中，该技术将正确率从35%提升至50%，相比传统方法提升45%。AggLM不仅能选择正确答案，还能创造性地组合不同答案中的有用信息，展现了AI向人类专家级推理能力的重要进步。

人工智能

视觉推理

深度学习

2025-09-28

中科院团队首次让AI学会"看图反思"：视觉推理模型不再"看一眼就算数"

中科院自动化所团队开发出Reflection-V视觉推理模型，首次让AI学会在推理过程中主动回顾检查图像信息。该模型通过创新的多智能体训练数据构建和视觉注意力奖励机制，解决了传统AI视觉推理中"看一眼就算数"的问题，在数学推理、多学科知识问答等任务上显著超越现有模型，甚至在某些测试中超过参数量大5倍的模型。

人工智能

心理健康护理

预测性干预

2025-09-28

智能体AI如何填补心理健康护理的关键空白

心理健康挑战已达史无前例的水平，2024年美国近6000万成年人患有心理疾病，但仅半数接受治疗。专家正探索智能AI代理系统作为解决方案，这些自主代理具备独立决策、持续学习和主动干预能力。未来应用包括自主治疗代理、预测性心理健康生态系统和主动危机预防。该技术可提供24/7支持、实时监测心理状态、预测危机并部署个性化干预措施，有望创建更具响应性和预防性的心理健康生态系统。

4D世界建模

多模态数据集

深度学习

2025-09-28

上海人工智能实验室发布OmniWorld：首个专为4D世界建模打造的大规模多领域数据集

上海人工智能实验室发布OmniWorld，这是首个专为4D世界建模设计的大规模多领域数据集。该数据集包含超过3亿帧数据，涵盖游戏、机器人、人类活动等多个领域，配备深度、相机位置、文本等多种标注。研究证明现有AI模型在复杂时空理解方面存在局限，而使用OmniWorld微调后性能显著提升，为自动驾驶、机器人、虚拟现实等应用发展奠定基础。

人工智能

强化学习

用户界面自动化

2025-09-28

阿里通义实验室发布UI-S1：让AI掌握手机操作的新突破

阿里通义实验室与浙江大学联合发布UI-S1系统，通过创新的半在线强化学习方法，让AI掌握了复杂的手机操作能力。该系统在多个测试平台上表现优异，相比基础模型在AndroidWorld上提升12%，在AITW上提升23.8%，为实现真正的智能手机助手迈出重要一步。

图像处理

拖拽编辑

多模态扩散变换器

2025-09-28

港科大推出LazyDrag：一招搞定图片编辑难题，不用训练就能让照片"听话"

港科大研究团队开发的LazyDrag系统创新性地解决了图片拖拽编辑中的核心难题。该系统摒弃传统的隐式匹配方法，采用显式对应地图技术，实现了无需训练的高精度图片编辑。LazyDrag支持文字引导功能，能智能理解用户意图，在准确性和感知质量方面全面超越现有方法，为AI辅助图片编辑开辟了新方向。

MIT新发现：AI画画的"局部思维"其实来源于训练数据的像素关联性，而非网络结构本身

人工智能

图像生成

数据统计分析

2025-09-28

MIT新发现：AI画画的"局部思维"其实来源于训练数据的像素关联性，而非网络结构本身

MIT研究团队发现，AI图像生成模型的"局部思维"并非来自网络结构限制，而是源于训练数据中像素间的统计关联。通过巧妙实验证明，即使改变数据中的微妙模式，AI也会相应调整注意力策略。这一发现为开发更可解释、高效的AI系统提供了新思路，并揭示了数据质量在AI发展中被低估的重要性。

哥伦比亚大学科学家首次揭开数百万人偷懒的真相：大脑如何让你"心理穷"又"意志弱"

认知心理学

经济行为学

社会政策研究

2025-09-28

哥伦比亚大学科学家首次揭开数百万人偷懒的真相：大脑如何让你"心理穷"又"意志弱"

哥伦比亚大学研究团队通过精巧实验发现，经济稀缺性会像"认知病毒"一样占用大脑资源，导致注意力、工作记忆和认知灵活性下降，使人们更易做出短视决策。研究开发了注意力训练、认知重构等有效干预方法，并在就业援助、教育、医疗等领域成功应用，为重新理解贫困本质、设计认知友好政策提供了科学依据。

人工智能

音乐流媒体

反欺诈技术

2025-09-28

Spotify收紧AI政策并大幅削减音乐库存

Spotify宣布已从其目录中删除7500万首"垃圾"音乐，作为打击日益泛滥的欺诈性音频内容和"AI垃圾"的努力。公司发布新政策禁止冒充、垃圾提交和欺诈版税生成。目前流媒体服务每日收到约15万首新曲目，其中28%为纯AI生成。主要唱片公司担心低质量内容稀释人类艺术家的版税池，而AI工具进一步加速了这一趋势。

人工智能

视频生成

AI内容创作

2025-09-28

Meta AI推出基于创作者AI视频的全新"Vibes"信息流

Meta公司推出名为"Vibes"的全新信息流功能，专门展示由创作者使用AI技术制作的视频内容。该功能将人工智能生成的视频内容进行整合和分类，为用户提供更加个性化的AI视频浏览体验，标志着Meta在AI内容分发领域的又一重要布局。

人工智能

自然语言处理

个性化推荐

2025-09-28

YouTube推出AI主播音乐体验新功能

YouTube正在测试一项全新的AI实验功能，为用户的音乐体验添加AI虚拟主播。这项创新技术将人工智能与音乐内容相结合，让AI主播能够为用户介绍和解说音乐内容，提供更加个性化和互动性的音乐收听体验。该功能目前处于实验阶段，展现了YouTube在音乐服务领域的技术创新方向。

人工智能

强化学习

异构优化

2025-09-28

北大团队揭秘：为什么AI训练时有些词汇比其他词汇更重要？

北京大学团队发现AI训练中的"个性化"秘密：不同词汇在推理过程中承担不同角色，传统方法一视同仁效率低下。研究团队开发HAPO方法，根据词汇重要性动态调整训练策略，在数学推理任务上准确率提升16.6%，为AI训练的精细化控制开辟新方向。

人工智能

机器人技术

软件授权

2025-09-28

Meta致力于成为机器人领域的Android

据报道，Meta正在研发机器人技术，但与苹果、谷歌和特斯拉不同，Meta的重点不在硬件竞争。虽然公司正在开发"Metabot"，但真正目标是创建可供其他公司授权使用的软件平台，类似谷歌的安卓系统。Meta首席技术官表示"软件是瓶颈"，希望通过机器人团队和超级智能实验室的合作开发解决方案，包括能够帮助机器人进行软件模拟的"世界模型"。

多模态检索

元标记技术

俄罗斯套娃式训练

2025-09-28

Meta推出MetaEmbed：让AI搜索变得更聪明更快速的新技术

Meta研究团队推出MetaEmbed技术，通过创新的"元标记"设计解决了AI搜索中速度与精度难以兼得的问题。该技术将内容分层组织成多个智能向量，用户可根据需求灵活选择搜索精度。在大规模测试中，MetaEmbed显著超越现有方法，为多模态内容检索提供了新的解决方案。

人工智能

几何推理

视觉感知训练

2025-09-28

阿里巴巴团队破解AI视觉理解难题：让机器像人一样"看懂"几何图形

阿里巴巴达摩院联合南洋理工大学的研究团队发现，当前AI模型在几何推理中频繁出错的根本原因是视觉感知能力不足。他们提出了分阶段训练框架，先强化AI的基础视觉感知能力，再进行复杂推理训练。实验显示，这种方法使3B参数模型在几何推理任务上准确率提升9.7%，接近GPT-4o的表现水平，为AI视觉理解能力提升提供了新思路。

人工智能

文化遗产保护

多模态学习

2025-09-28

古希腊陶器遇上AI：澳洲团队打造首个专业文物识别智能助手

澳大利亚研究团队开发出首个专门识别古希腊陶器的AI系统VaseVL，通过创新的"诊断式强化学习"方法，在材质识别、工艺判断等任务上达到专家级水平。该系统基于超过3万张陶器图片训练，准确率最高达99.95%，为文化遗产保护和考古研究提供了强大的技术支持，开启了AI辅助文物分析的新时代。

智能硬件

物联网技术

产品创新

2025-09-28

Journey推出全新LOC8 FindMy智能追踪配件系列

Journey发布三款LOC8智能追踪配件：内置FindMy技术的笔记本电脑保护套、高端皮革钥匙收纳器和通用追踪器Finder Fob 2。笔记本套售价119-129美元，支持14寸和16寸设备；钥匙收纳器售价109美元，可容纳6把钥匙并内置多功能工具；Finder Fob 2售价29美元，可充电且重量与AirTag相当，适用于各种物品追踪。

人工智能

数学推理

过程奖励模型

2025-09-28

苏州大学团队突破AI数学推理瓶颈：让小模型也能精准找到错误步骤

苏州大学团队提出SCAN框架，通过分析AI模型在数学推理标注中的噪声分布规律，设计出高效的数据合成和鲁棒训练方法。该方法仅需传统方法6%的计算成本，就能让小模型达到甚至超越大模型的数学错误检测性能，为过程奖励学习领域带来重大突破。

人工智能

大语言模型

本土化技术

2025-09-28

韩国如何用本土AI技术挑战OpenAI和谷歌

韩国政府投入5300亿韩元支持五家本土公司开发大型基础AI模型，包括LG AI研究院、SK电信、Naver Cloud、NC AI和Upstage。这些公司分别推出了Exaone 4.0、A.X、HyperCLOVA X和Solar Pro 2等针对韩语和本土文化优化的模型。韩国希望通过减少对外国AI技术的依赖，加强国家安全并在AI时代保持数据控制权，与全球AI巨头展开竞争。

人工智能

技能培训

业务重组

2025-09-28

埃森哲向员工发出最后通牒：不会AI就离职

埃森哲在2025财年业绩中表示，正大力投资员工AI技能培训。CEO朱莉·斯威特明确表示，对于无法通过AI增强工作能力且无法学习新技能的员工，公司将选择让其离职。这是公司业务重组战略的一部分，将产生8.65亿美元的一次性费用。目前埃森哲拥有7.7万名经过AI培训的专业人员，GenAI收入达27亿美元。公司整体表现良好，年收入增长7%至697亿美元。

PEC 2025 AI创新者大会

用AI，在数字身份验证风暴中心重构信任坐标

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: