人工智能文章列表第55页-至顶网频道

2025-10-29

北卡罗来纳大学突破性成果：让AI学会"恰到好处"地思考，既提升准确性又节省计算资源

北卡罗来纳大学研究团队开发的TRAAC方法，首次让AI学会根据问题难易程度自适应调整思考深度。通过智能识别关键推理步骤和动态压缩冗余内容，TRAAC在提升8.4%准确率的同时缩短36.8%推理长度，解决了AI"过度思考"和"思考不足"的双重问题，为构建更智能高效的AI系统提供了新思路。

上海AI实验室开发"经验学习智能体"：让AI像人一样从经验中变聪明

上海AI实验室联合多所高校开发了ExGRPO技术，让AI能像人一样从经验中学习。该方法通过智能选择和重复利用有价值的学习经验，使AI推理能力显著提升，数学推理平均提升3.5分，通用推理提升7.6分，并解决了传统方法训练不稳定的问题，为AI自主学习开辟新路径。

清华大学团队开发STOCKBENCH：AI能否在股市中赚到真金白银？

清华大学团队开发STOCKBENCH平台，首次系统测试14个先进AI模型在真实股市环境中的投资表现。研究发现，虽然大多数AI难以显著超越简单的买入持有策略，但在风险控制方面展现优势，能将最大损失控制在更小范围内，为AI辅助投资提供了重要参考。

当AI的"方向盘"失灵：俄国科学家揭示大模型精准控制技术的意外安全隐患

俄国科学家发现AI精准控制技术"激活引导"存在严重安全漏洞，即使随机控制信号也能让安全AI模型回答有害问题，遵从率可达27%。更令人震惊的是，用于合法目的的"良性"控制特征比随机信号更危险，且攻击者只需20个简单向量就能创建通用攻击工具。这项研究颠覆了"可解释AI更安全"的基本假设，警示精确控制并不等于安全控制。

腾讯AI实验室发布CLUE：AI也能从"内心独白"中找到正确答案

腾讯AI实验室发布CLUE验证系统，通过分析AI模型内部"思维轨迹"的几何特征来判断答案正确性。该系统发现正确和错误的推理过程在AI隐藏状态空间中呈现不同的几何模式，无需训练即可实现有效验证。在数学竞赛测试中，CLUE将准确率从56.7%提升至70.0%，且在物理、法律等多领域均表现出色。研究还揭示强化学习训练的模型具有更清晰的内部几何结构，为AI系统设计提供新思路。

蚂蚁集团用6百万数据量训练出媲美巨头的文本理解AI模型

蚂蚁集团联合上海交通大学研发的F2LLM文本理解模型，仅用600万开源数据就达到了与使用数亿数据的顶级模型相当的性能。该模型在MTEB评测中表现优异，4B版本排名第7，1.7B版本在同等规模中排名第1。研究团队采用创新的单阶段训练策略和精心的数据筛选方法，实现了性能、成本和效率的完美平衡。更重要的是，整个项目完全开源，为AI技术普及和民主化做出了重要贡献。

Anthropic研究团队提出革命性AI智能体扩展方案：让电脑代理从"独行侠"变成"超级团队"

Simular Research团队提出革命性bBoN方法，通过让多个电脑智能体协同工作并从中选择最佳方案，将任务成功率从60%提升至接近人类水平的69.9%。该方法将复杂操作转换为简洁叙述，采用比较式判断机制，在Ubuntu、Windows和Android三大平台均取得显著性能提升，为AI助手的实用化发展指出了新方向。

NVIDIA推出RLP：让AI在学习过程中就学会思考的革命性训练方法

NVIDIA研究团队开发了RLP强化学习预训练方法，让AI在学习过程中就养成思考习惯。与传统训练只关注预测下一个词不同，RLP让AI每次回答前都先生成思考过程。实验显示，该方法在数学和科学推理上带来19-35%的显著提升，且适用于各类文本数据，训练成本低廉。这项突破有望改变AI训练范式，让AI具备真正的推理思考能力。

上海AI实验室联合多所顶尖高校发布全球首个深度研究智能体评估基准：从简单问答到完整报告生成的技术飞跃

上海AI实验室联合多所顶尖高校发布全球首个深度研究智能体评估基准Rigorous Bench，包含214个高难度任务，从语义质量、主题聚焦度和检索可信度三个维度评估AI生成研究报告的能力。实验证明深度研究智能体显著优于传统搜索增强模型，为AI向真正智能研究助手发展奠定了评估标准基础。

苹果明年或将推出五款全新Home产品

苹果即将发布Apple TV 4K和HomePod mini 2两款产品更新。更值得期待的是三款全新产品：配备7英寸方形显示屏的HomePod Touch将搭载全新homeOS系统，支持Safari、音乐等应用及小组件功能，预计售价350美元；此外还有智能安全摄像头和视频门铃两款配件。这标志着苹果从依赖第三方HomeKit配件转向自主研发智能家居产品的重要战略转变。

Hammerspace加入英伟达AI数据平台阵营提供数据基础支撑

数据编排和GPU数据供给商Hammerspace宣布采用英伟达AI数据平台参考设计，为AI代理提供数据基础。该公司将其AI数据平台集成到全球数据环境产品中，实现跨多厂商存储孤岛的文件和对象数据虚拟化。平台具备单一全局命名空间，支持基于活动级别的数据放置决策，包括零层存储和GPU Direct快速数据供应。系统确保训练和推理工作负载能即时访问所需数据，无需手动数据移动。该解决方案将于2025年底通过授权合作伙伴提供。

人工智能

嵌入式AI

AI芯片

2025-10-29

新唐科技在微控制器中集成微型AI功能

台湾新唐科技发布NuMicro M55M1微控制器，集成Arm Cortex M55处理器和Arm Ethos U55神经处理单元，可在低功耗环境下处理语音触发、姿态识别、手势识别和视觉任务，无需云端连接。该芯片运行频率220MHz，支持本地机器学习推理，适用于智能玩具、门铃等简单AI应用场景，为嵌入式设备提供离线AI能力。

人工智能

自然语言处理

自动化运维

2025-10-29

智能体AI技术或将淘汰命令行界面技能

数十年来，命令行界面一直是IT管理的基石，但智能代理AI技术正在颠覆这一模式。通过自然语言指令，IT专业人员可以直接向AI代理下达任务，无需掌握复杂的命令语法。尽管CLI在精确控制、性能和资源效率方面仍有优势，但随着AI工具日趋成熟、学习成本降低，智能代理有望成为常规管理任务的默认解决方案，传统命令行技能可能逐渐过时。

人工智能

企业重组

商业模式创新

2025-10-29

OpenAI非营利机构将运营尚未盈利的营利性公司

OpenAI宣布与微软达成协议，将重组为公共利益公司并进行资本重组。微软将持有OpenAI约27%股份，价值约1350亿美元，投资回报达10倍。OpenAI承诺在Azure云服务上投入2500亿美元，但微软将失去计算任务优先权。新架构下，非营利组织OpenAI基金会将控制约26%的公共利益公司股权，价值约1300亿美元。尽管公司估值达5000亿美元，但从未实现盈利。

新加坡国立大学团队破解AI多智能体"视觉幻觉雪球"难题：让AI团队协作不再"传话失真"

人工智能

多智能体系统

视觉幻觉缓解

2025-10-29

新加坡国立大学团队破解AI多智能体"视觉幻觉雪球"难题：让AI团队协作不再"传话失真"

新加坡国立大学等机构研究团队发现AI多智能体协作中存在"视觉幻觉雪球"现象，即错误信息在AI团队中像传话游戏一样逐步放大。研究提出ViF视觉流解决方案，通过直接传递关键视觉信息而非仅依赖文字描述，显著减少了幻觉现象，性能提升2.4%-3.8%，为AI团队协作可靠性提供重要保障。

人工智能

自然语言处理

市场策略

2025-10-29

OpenAI向印度用户免费提供ChatGPT Go服务一年

OpenAI宣布从11月4日开始向印度用户免费提供一年ChatGPT Go订阅服务。该计划月费不到5美元，于8月在印度推出，是OpenAI最实惠的付费订阅方案。印度拥有超过7亿智能手机用户，是OpenAI仅次于美国的第二大市场。ChatGPT Go提供比免费版本多10倍的使用量，包括生成回复、创建图像和上传文件功能。

Skyline Nav AI推出无GPS导航技术，将亮相TechCrunch Disrupt 2025

人工智能

计算机视觉

导航技术

2025-10-29

Skyline Nav AI推出无GPS导航技术，将亮相TechCrunch Disrupt 2025

天际线导航AI公司开发出基于视觉的导航系统Pathfinder，可在没有GPS信号的情况下提供实时导航。该软件通过AI识别建筑物、道路等场景，快速匹配数据库生成导航信息。技术主要应用于GPS信号被阻挡的城市峡谷或山区，以及对抗GPS干扰攻击。公司已与美国国防部、NASA等机构合作，并推出边缘计算版本Pathfinder Edge。

人工智能

无线通信

网络架构优化

2025-10-29

英伟达向诺基亚6G网络注入AI技术并投资10亿美元

英伟达宣布与诺基亚建立合作伙伴关系，将AI技术集成到诺基亚的移动网络基础设施中，为6G网络铺平道路。作为合作的一部分，英伟达将向诺基亚投资10亿美元。此次合作将通过AI-RAN产品提升频谱效率，并使AI推理在移动设备上更易获得。双方还将共同开发边缘AI推理工作负载基础设施。

人工智能

超级计算机

智能体科学家

2025-10-29

美国能源部与英伟达合作建造7台超级计算机，包括史上最大系统

美国能源部与英伟达、甲骨文合作建造7台新型AI超级计算机，用于加速科学研究和开发智能AI。其中位于阿贡国家实验室的两套系统将组成能源部最大的AI超算基础设施。Solstice系统配备10万颗Blackwell GPU，与Equinox系统互联后总计算性能达2200 exaFLOPs。此外还宣布了与Palantir的合作以及洛斯阿拉莫斯实验室的新系统计划。

人工智能

数据管理

存储优化

2025-10-29

HPE构建基于Alletra MP的数据纤维架构

HPE正在使用其分解式Alletra MP X10000存储系统构建分布式边缘到核心数据中心的数据结构。这是基于Nvidia的AI工厂和智慧城市计划的一部分，包括第二代私有云AI产品。HPE推出统一的分布式数据结构，连接核心和边缘数据中心、托管站点和公有云，具有全局命名空间、通用访问、多协议支持等功能。该软件支持S3 over RDMA，可将延迟降低80%，CPU使用率降低99%。

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: