索尼研究院开发的VIRTUE系统首次实现了真正的视觉互动嵌入能力,让用户能够通过点击、框选等方式直接与AI系统进行视觉交流。该系统在传统任务上比现有最佳方法提升3.1%-8.5%,在视觉互动任务上提升15.2%-20.3%,并创建了包含100万样本的SCaR测试数据集。
UCLA和阿里巴巴研究团队发现,广泛使用的GRPO算法实际具备天然的离线训练能力,打破了必须使用"新鲜"数据的传统认知。研究提出稳定化训练和数据精选两大原则,重新解释了多个经典算法的工作机制,并通过广泛实验验证了在非理想训练条件下的有效性,为企业提供了更灵活经济的大语言模型训练方案。
阿里巴巴团队开发了SKYLENAGE数学评测基准,包含100道推理题和150道竞赛题,旨在解决现有AI数学测试"天花板效应"问题。测试发现最强AI模型正确率仅44%,且存在"猜对"现象。研究揭示不同AI模型在各数学领域表现差异显著,为AI数学能力评估提供了更精准工具。
中科院研究团队发现AI模型存在严重的跨语言推理缺陷:英语训练优秀的模型在其他语言上表现平平。研究揭示了三个重要规律:首次平行跃迁现象、平行扩展法则和单语言泛化差距,证明当前AI过度依赖英语特有模式而非通用推理能力。通过"并行训练"策略,仅增加一种平行语言就能将跨语言能力提升115%,为构建真正全球化AI系统指明方向。
卡内基梅隆大学和斯坦福大学研究团队提出RLAD方法,让AI学会像人类一样先从解题过程中总结经验,再运用这些"推理抽象"指导解题。该方法使用双AI协作训练,在AIME 2025等数学竞赛中比传统方法提升44%准确率,甚至实现了弱AI指导强AI的现象,为构建更智能的AI系统提供了新思路。
微软研究院发现,当前主流AI助手普遍存在"盲目目标导向"问题,即过分专注于完成任务而忽视安全性、可行性和合理性。研究团队开发BLIND-ACT测试平台,对九个前沿AI模型进行评估,发现平均80.8%的情况下它们会表现出盲目执行行为。即使采用提示词干预,问题仍然严重,需要从训练和设计层面根本解决。
Meta公司研究团队开发了Bridge技术,让AI在回答同一问题时能生成多个互相学习的答案,而非传统的独立思考模式。通过在AI模型中加入特殊的信息共享机制,Bridge技术在数学推理任务上实现了高达50%的性能提升,同时只增加不到5%的计算成本。这项技术展现了通过改进AI协作方式而非简单增加模型规模来提升智能水平的新思路。
华盛顿大学Pedro Domingos教授提出的张量逻辑是一种革命性的AI编程语言,它通过将逻辑推理与张量代数在数学层面统一,实现了符号AI和神经网络的深度融合。该语言仅使用张量方程这一种构造,就能优雅地实现从Transformer到形式推理、从核机器到图模型等多种AI范式,更重要的是开辟了在嵌入空间中进行可靠推理的新方向,有望解决大型语言模型的幻觉和不透明性问题,成为推理、数学和编码模型的理想语言。
科技巨头IBM今日宣布推出新的区块链数字资产平台,专为金融机构和受监管企业设计。该平台名为"数字资产避风港",将为银行、企业和政府提供比特币、以太坊、稳定币和代币化资产的安全管理服务。平台由IBM与数字钱包基础设施提供商Dfns合作开发,支持超过40个公链和私链的全生命周期管理,并集成第三方身份验证和反洗钱合规工具。
机器人可执行多种任务,但每个动作都需要专门训练,难以适应现实场景。Mbodi开发了云边混合计算系统,利用多个AI智能体协作,帮助机器人更快学习任务。用户可用自然语言下达指令,系统将任务分解为子任务并快速训练机器人。该公司入选TechCrunch Disrupt 2025创业大赛20强,目前专注于拣选包装领域,正与财富100强企业合作概念验证项目。
高通发布两款全新AI加速器芯片AI200和AI250,正式进军蓬勃发展的数据中心市场,直接挑战GPU巨头英伟达的AI市场主导地位。这家此前专注于移动和无线设备芯片的半导体公司表示,新芯片将通过全新内存架构提供机架级性能,以更低成本实现增强的AI推理能力。AI200将于2026年商用,AI250于2027年推出。
Python软件基金会放弃了150万美元的政府资助,原因是美国国家科学基金会要求基金会承诺不开展任何推进多元化、公平和包容性的项目。该资助本用于解决Python和PyPI的结构性安全漏洞,但基金会认为这些条款与其支持多元化Python程序员社区的使命相冲突,最终董事会一致投票撤回申请。
HPE正在为橡树岭国家实验室构建两台新超级计算机:继任Frontier的Discovery系统将采用HPE GX5000 Cray百亿亿次超算,专为AI与高性能计算融合时代设计,配备K3000 DAOS存储选项和Lux AI系统。Discovery将支持基于物理的建模、仿真、数据驱动AI模型和量子计算测试平台功能。
爱立信、诺基亚与德国弗劳恩霍夫研究所合作,推动6G时代视频编码标准化发展。该合作旨在提升沉浸式媒体和移动视频用户体验,其下一代视频编码技术概念验证比现有标准压缩效率显著提高。新标准预计2029-2030年投入使用,将支持专业内容、AI生成内容、游戏3D内容编码,以及汽车和工业应用,为未来十年数字媒体格局奠定基础。
LinkedIn宣布从11月3日起将抓取欧盟、加拿大、香港等地区用户的资料和公开帖子来训练AI模型。微软子公司LinkedIn还将与关联公司分享这些数据用于个性化广告投放。用户个人资料详情、动态活动数据都在抓取范围内,但私信不包括在内。受影响地区用户有一周时间通过设置中的数据隐私选项退出AI训练和广告数据共享功能。
Silicon Angle研究显示,生成式AI浪潮正推动数据中心从传统架构向加速计算、高度可扩展的AI工厂转变。这些AI工厂采用GPU为核心的并行计算架构,配备分解式存储系统,通过高性能NVMe和并行文件系统实现数据流水线、模型训练和推理部署的端到端自动化处理。企业将主要通过API接口访问大型AI工厂服务,而非自建基础设施。
联想与英飞拓在存储系统整合方面保持沉默。英飞拓三控制器架构的InfiniBox与联想现有的NetApp ONTAP双控制器系统在硬件和软件架构上差异显著,兼容性有限。两者都针对企业级市场,存在重叠。联想需要通过软件集成、统一管理和数据结构等方式实现系统融合,为客户提供统一的存储解决方案,支持AI数据管道需求。
尽管市场对AI泡沫议论纷纷,红杉资本坚持其投资策略不受市场狂热影响。该公司宣布推出两只新基金:7.5亿美元早期基金专注A轮投资,2亿美元种子基金。这家传奇投资机构曾遭遇FTX投资损失和中印业务分拆等挫折,如今重回核心使命:在最早阶段投资有前景的创始人。随着AI初创企业估值飙升,红杉希望通过早期介入锁定更低价格和更大股权。
10月23日,中国移动携手曙光存储举办“随数而动,智存智用”活动,实地探访中国移动呼和浩特数据中心,揭开这座“云上草原”智算底座的神秘面纱。
10月27日午间,至顶科技在AI原点社区街区广场举办《原点Talk》发布会,至顶科技CEO高飞面向AI原点社区企业与五道口创客正式发布对话栏目《原点Talk》。