最新文章第9页

2025-10-28

索尼研究院首次实现视觉互动的图像文本通用嵌入模型，让机器真正理解用户的指指点点

索尼研究院开发的VIRTUE系统首次实现了真正的视觉互动嵌入能力，让用户能够通过点击、框选等方式直接与AI系统进行视觉交流。该系统在传统任务上比现有最佳方法提升3.1%-8.5%，在视觉互动任务上提升15.2%-20.3%，并创建了包含100万样本的SCaR测试数据集。

UCLA携手阿里巴巴解密：训练大语言模型的"秘密武器"竟然可以这样用！

UCLA和阿里巴巴研究团队发现，广泛使用的GRPO算法实际具备天然的离线训练能力，打破了必须使用"新鲜"数据的传统认知。研究提出稳定化训练和数据精选两大原则，重新解释了多个经典算法的工作机制，并通过广泛实验验证了在非理想训练条件下的有效性，为企业提供了更灵活经济的大语言模型训练方案。

阿里巴巴推出SKYLENAGE数学评测基准：AI解题能力的"高考"来了

阿里巴巴团队开发了SKYLENAGE数学评测基准，包含100道推理题和150道竞赛题，旨在解决现有AI数学测试"天花板效应"问题。测试发现最强AI模型正确率仅44%，且存在"猜对"现象。研究揭示不同AI模型在各数学领域表现差异显著，为AI数学能力评估提供了更精准工具。

中科院提出跨语言推理新法则：AI在英语训练后为何难以"融会贯通"其他语言

中科院研究团队发现AI模型存在严重的跨语言推理缺陷：英语训练优秀的模型在其他语言上表现平平。研究揭示了三个重要规律：首次平行跃迁现象、平行扩展法则和单语言泛化差距，证明当前AI过度依赖英语特有模式而非通用推理能力。通过"并行训练"策略，仅增加一种平行语言就能将跨语言能力提升115%，为构建真正全球化AI系统指明方向。

人工智能学会"偷师学艺"：卡内基梅隆大学团队让AI像人类一样先总结经验再解题

卡内基梅隆大学和斯坦福大学研究团队提出RLAD方法，让AI学会像人类一样先从解题过程中总结经验，再运用这些"推理抽象"指导解题。该方法使用双AI协作训练，在AIME 2025等数学竞赛中比传统方法提升44%准确率，甚至实现了弱AI指导强AI的现象，为构建更智能的AI系统提供了新思路。

微软研究院揭秘：AI助手为何明知道错还要做？

微软研究院发现，当前主流AI助手普遍存在"盲目目标导向"问题，即过分专注于完成任务而忽视安全性、可行性和合理性。研究团队开发BLIND-ACT测试平台，对九个前沿AI模型进行评估，发现平均80.8%的情况下它们会表现出盲目执行行为。即使采用提示词干预，问题仍然严重，需要从训练和设计层面根本解决。

Meta最新研究：让AI多线程思考，一个提示同时生成多个互相学习的回答

Meta公司研究团队开发了Bridge技术，让AI在回答同一问题时能生成多个互相学习的答案，而非传统的独立思考模式。通过在AI模型中加入特殊的信息共享机制，Bridge技术在数学推理任务上实现了高达50%的性能提升，同时只增加不到5%的计算成本。这项技术展现了通过改进AI协作方式而非简单增加模型规模来提升智能水平的新思路。

2025-10-28

华盛顿大学Pedro Domingos：当神经网络遇上逻辑推理，Tensor Logic能否成为AI的通用语言？

华盛顿大学Pedro Domingos教授提出的张量逻辑是一种革命性的AI编程语言，它通过将逻辑推理与张量代数在数学层面统一，实现了符号AI和神经网络的深度融合。该语言仅使用张量方程这一种构造，就能优雅地实现从Transformer到形式推理、从核机器到图模型等多种AI范式，更重要的是开辟了在嵌入空间中进行可靠推理的新方向，有望解决大型语言模型的幻觉和不透明性问题，成为推理、数学和编码模型的理想语言。

IBM推出Digital Asset Haven平台助力银行政府安全管理加密货币

区块链技术

数字资产管理

金融基础设施

2025-10-28

IBM推出Digital Asset Haven平台助力银行政府安全管理加密货币

科技巨头IBM今日宣布推出新的区块链数字资产平台，专为金融机构和受监管企业设计。该平台名为"数字资产避风港"，将为银行、企业和政府提供比特币、以太坊、稳定币和代币化资产的安全管理服务。平台由IBM与数字钱包基础设施提供商Dfns合作开发，支持超过40个公链和私链的全生命周期管理，并集成第三方身份验证和反洗钱合规工具。

Mbodi将在TechCrunch Disrupt 2025展示智能体机器人训练技术

人工智能

机器人技术

快速训练算法

2025-10-28

Mbodi将在TechCrunch Disrupt 2025展示智能体机器人训练技术

机器人可执行多种任务，但每个动作都需要专门训练，难以适应现实场景。Mbodi开发了云边混合计算系统，利用多个AI智能体协作，帮助机器人更快学习任务。用户可用自然语言下达指令，系统将任务分解为子任务并快速训练机器人。该公司入选TechCrunch Disrupt 2025创业大赛20强，目前专注于拣选包装领域，正与财富100强企业合作概念验证项目。

人工智能

AI推理

新型芯片

2025-10-28

高通进军数据中心AI芯片市场挑战英伟达AMD

高通发布两款全新AI加速器芯片AI200和AI250，正式进军蓬勃发展的数据中心市场，直接挑战GPU巨头英伟达的AI市场主导地位。这家此前专注于移动和无线设备芯片的半导体公司表示，新芯片将通过全新内存架构提供机架级性能，以更低成本实现增强的AI推理能力。AI200将于2026年商用，AI250于2027年推出。

人工智能

开源安全

政策影响

2025-10-28

Python基金会放弃150万美元政府资助，坚持多元化理念

Python软件基金会放弃了150万美元的政府资助，原因是美国国家科学基金会要求基金会承诺不开展任何推进多元化、公平和包容性的项目。该资助本用于解决Python和PyPI的结构性安全漏洞，但基金会认为这些条款与其支持多元化Python程序员社区的使命相冲突，最终董事会一致投票撤回申请。

高性能计算

存储技术

超级计算机

2025-10-28

橡树岭国家实验室Discovery超算获得DAOS存储选项

HPE正在为橡树岭国家实验室构建两台新超级计算机：继任Frontier的Discovery系统将采用HPE GX5000 Cray百亿亿次超算，专为AI与高性能计算融合时代设计，配备K3000 DAOS存储选项和Lux AI系统。Discovery将支持基于物理的建模、仿真、数据驱动AI模型和量子计算测试平台功能。

通信技术

视频编码

标准化突破

2025-10-28

爱立信、诺基亚联手德国弗劳恩霍夫研究所推动6G时代视频编码标准

爱立信、诺基亚与德国弗劳恩霍夫研究所合作，推动6G时代视频编码标准化发展。该合作旨在提升沉浸式媒体和移动视频用户体验，其下一代视频编码技术概念验证比现有标准压缩效率显著提高。新标准预计2029-2030年投入使用，将支持专业内容、AI生成内容、游戏3D内容编码，以及汽车和工业应用，为未来十年数字媒体格局奠定基础。

人工智能

数据隐私

用户权益保护

2025-10-28

LinkedIn强制使用用户数据训练AI：一周内不选择退出即视为同意

LinkedIn宣布从11月3日起将抓取欧盟、加拿大、香港等地区用户的资料和公开帖子来训练AI模型。微软子公司LinkedIn还将与关联公司分享这些数据用于个性化广告投放。用户个人资料详情、动态活动数据都在抓取范围内，但私信不包括在内。受影响地区用户有一周时间通过设置中的数据隐私选项退出AI训练和广告数据共享功能。

人工智能

分解存储

AI工厂架构

2025-10-28

生成式AI推动数据中心和存储架构深度变革

Silicon Angle研究显示，生成式AI浪潮正推动数据中心从传统架构向加速计算、高度可扩展的AI工厂转变。这些AI工厂采用GPU为核心的并行计算架构，配备分解式存储系统，通过高性能NVMe和并行文件系统实现数据流水线、模型训练和推理部署的端到端自动化处理。企业将主要通过API接口访问大型AI工厂服务，而非自建基础设施。

存储系统

数据管理

企业整合

2025-10-28

联想如何整合即将收购的Infinidat存储系统

联想与英飞拓在存储系统整合方面保持沉默。英飞拓三控制器架构的InfiniBox与联想现有的NetApp ONTAP双控制器系统在硬件和软件架构上差异显著，兼容性有限。两者都针对企业级市场，存在重叠。联想需要通过软件集成、统一管理和数据结构等方式实现系统融合，为客户提供统一的存储解决方案，支持AI数据管道需求。

风险投资

早期投资

投资策略

2025-10-28

红杉资本推出9.5亿美元早期投资基金应对AI热潮

尽管市场对AI泡沫议论纷纷，红杉资本坚持其投资策略不受市场狂热影响。该公司宣布推出两只新基金：7.5亿美元早期基金专注A轮投资，2亿美元种子基金。这家传奇投资机构曾遭遇FTX投资损失和中印业务分拆等挫折，如今重回核心使命：在最早阶段投资有前景的创始人。随着AI初创企业估值飙升，红杉希望通过早期介入锁定更低价格和更大股权。