人工智能 关键字列表
北卡罗来纳大学突破性成果:让AI学会"恰到好处"地思考,既提升准确性又节省计算资源

北卡罗来纳大学突破性成果:让AI学会"恰到好处"地思考,既提升准确性又节省计算资源

北卡罗来纳大学研究团队开发的TRAAC方法,首次让AI学会根据问题难易程度自适应调整思考深度。通过智能识别关键推理步骤和动态压缩冗余内容,TRAAC在提升8.4%准确率的同时缩短36.8%推理长度,解决了AI"过度思考"和"思考不足"的双重问题,为构建更智能高效的AI系统提供了新思路。

上海AI实验室开发"经验学习智能体":让AI像人一样从经验中变聪明

上海AI实验室开发"经验学习智能体":让AI像人一样从经验中变聪明

上海AI实验室联合多所高校开发了ExGRPO技术,让AI能像人一样从经验中学习。该方法通过智能选择和重复利用有价值的学习经验,使AI推理能力显著提升,数学推理平均提升3.5分,通用推理提升7.6分,并解决了传统方法训练不稳定的问题,为AI自主学习开辟新路径。

清华大学团队开发STOCKBENCH:AI能否在股市中赚到真金白银?

清华大学团队开发STOCKBENCH:AI能否在股市中赚到真金白银?

清华大学团队开发STOCKBENCH平台,首次系统测试14个先进AI模型在真实股市环境中的投资表现。研究发现,虽然大多数AI难以显著超越简单的买入持有策略,但在风险控制方面展现优势,能将最大损失控制在更小范围内,为AI辅助投资提供了重要参考。

当AI的"方向盘"失灵:俄国科学家揭示大模型精准控制技术的意外安全隐患

当AI的"方向盘"失灵:俄国科学家揭示大模型精准控制技术的意外安全隐患

俄国科学家发现AI精准控制技术"激活引导"存在严重安全漏洞,即使随机控制信号也能让安全AI模型回答有害问题,遵从率可达27%。更令人震惊的是,用于合法目的的"良性"控制特征比随机信号更危险,且攻击者只需20个简单向量就能创建通用攻击工具。这项研究颠覆了"可解释AI更安全"的基本假设,警示精确控制并不等于安全控制。

腾讯AI实验室发布CLUE:AI也能从"内心独白"中找到正确答案

腾讯AI实验室发布CLUE:AI也能从"内心独白"中找到正确答案

腾讯AI实验室发布CLUE验证系统,通过分析AI模型内部"思维轨迹"的几何特征来判断答案正确性。该系统发现正确和错误的推理过程在AI隐藏状态空间中呈现不同的几何模式,无需训练即可实现有效验证。在数学竞赛测试中,CLUE将准确率从56.7%提升至70.0%,且在物理、法律等多领域均表现出色。研究还揭示强化学习训练的模型具有更清晰的内部几何结构,为AI系统设计提供新思路。

蚂蚁集团用6百万数据量训练出媲美巨头的文本理解AI模型

蚂蚁集团用6百万数据量训练出媲美巨头的文本理解AI模型

蚂蚁集团联合上海交通大学研发的F2LLM文本理解模型,仅用600万开源数据就达到了与使用数亿数据的顶级模型相当的性能。该模型在MTEB评测中表现优异,4B版本排名第7,1.7B版本在同等规模中排名第1。研究团队采用创新的单阶段训练策略和精心的数据筛选方法,实现了性能、成本和效率的完美平衡。更重要的是,整个项目完全开源,为AI技术普及和民主化做出了重要贡献。

Anthropic研究团队提出革命性AI智能体扩展方案:让电脑代理从"独行侠"变成"超级团队"

Anthropic研究团队提出革命性AI智能体扩展方案:让电脑代理从"独行侠"变成"超级团队"

Simular Research团队提出革命性bBoN方法,通过让多个电脑智能体协同工作并从中选择最佳方案,将任务成功率从60%提升至接近人类水平的69.9%。该方法将复杂操作转换为简洁叙述,采用比较式判断机制,在Ubuntu、Windows和Android三大平台均取得显著性能提升,为AI助手的实用化发展指出了新方向。

NVIDIA推出RLP:让AI在学习过程中就学会思考的革命性训练方法

NVIDIA推出RLP:让AI在学习过程中就学会思考的革命性训练方法

NVIDIA研究团队开发了RLP强化学习预训练方法,让AI在学习过程中就养成思考习惯。与传统训练只关注预测下一个词不同,RLP让AI每次回答前都先生成思考过程。实验显示,该方法在数学和科学推理上带来19-35%的显著提升,且适用于各类文本数据,训练成本低廉。这项突破有望改变AI训练范式,让AI具备真正的推理思考能力。

上海AI实验室联合多所顶尖高校发布全球首个深度研究智能体评估基准:从简单问答到完整报告生成的技术飞跃

上海AI实验室联合多所顶尖高校发布全球首个深度研究智能体评估基准:从简单问答到完整报告生成的技术飞跃

上海AI实验室联合多所顶尖高校发布全球首个深度研究智能体评估基准Rigorous Bench,包含214个高难度任务,从语义质量、主题聚焦度和检索可信度三个维度评估AI生成研究报告的能力。实验证明深度研究智能体显著优于传统搜索增强模型,为AI向真正智能研究助手发展奠定了评估标准基础。

苹果明年或将推出五款全新Home产品

苹果明年或将推出五款全新Home产品

苹果即将发布Apple TV 4K和HomePod mini 2两款产品更新。更值得期待的是三款全新产品:配备7英寸方形显示屏的HomePod Touch将搭载全新homeOS系统,支持Safari、音乐等应用及小组件功能,预计售价350美元;此外还有智能安全摄像头和视频门铃两款配件。这标志着苹果从依赖第三方HomeKit配件转向自主研发智能家居产品的重要战略转变。

Hammerspace加入英伟达AI数据平台阵营提供数据基础支撑

Hammerspace加入英伟达AI数据平台阵营提供数据基础支撑

数据编排和GPU数据供给商Hammerspace宣布采用英伟达AI数据平台参考设计,为AI代理提供数据基础。该公司将其AI数据平台集成到全球数据环境产品中,实现跨多厂商存储孤岛的文件和对象数据虚拟化。平台具备单一全局命名空间,支持基于活动级别的数据放置决策,包括零层存储和GPU Direct快速数据供应。系统确保训练和推理工作负载能即时访问所需数据,无需手动数据移动。该解决方案将于2025年底通过授权合作伙伴提供。

新唐科技在微控制器中集成微型AI功能

新唐科技在微控制器中集成微型AI功能

台湾新唐科技发布NuMicro M55M1微控制器,集成Arm Cortex M55处理器和Arm Ethos U55神经处理单元,可在低功耗环境下处理语音触发、姿态识别、手势识别和视觉任务,无需云端连接。该芯片运行频率220MHz,支持本地机器学习推理,适用于智能玩具、门铃等简单AI应用场景,为嵌入式设备提供离线AI能力。

智能体AI技术或将淘汰命令行界面技能

智能体AI技术或将淘汰命令行界面技能

数十年来,命令行界面一直是IT管理的基石,但智能代理AI技术正在颠覆这一模式。通过自然语言指令,IT专业人员可以直接向AI代理下达任务,无需掌握复杂的命令语法。尽管CLI在精确控制、性能和资源效率方面仍有优势,但随着AI工具日趋成熟、学习成本降低,智能代理有望成为常规管理任务的默认解决方案,传统命令行技能可能逐渐过时。

OpenAI非营利机构将运营尚未盈利的营利性公司

OpenAI非营利机构将运营尚未盈利的营利性公司

OpenAI宣布与微软达成协议,将重组为公共利益公司并进行资本重组。微软将持有OpenAI约27%股份,价值约1350亿美元,投资回报达10倍。OpenAI承诺在Azure云服务上投入2500亿美元,但微软将失去计算任务优先权。新架构下,非营利组织OpenAI基金会将控制约26%的公共利益公司股权,价值约1300亿美元。尽管公司估值达5000亿美元,但从未实现盈利。

新加坡国立大学团队破解AI多智能体"视觉幻觉雪球"难题:让AI团队协作不再"传话失真"

新加坡国立大学团队破解AI多智能体"视觉幻觉雪球"难题:让AI团队协作不再"传话失真"

新加坡国立大学等机构研究团队发现AI多智能体协作中存在"视觉幻觉雪球"现象,即错误信息在AI团队中像传话游戏一样逐步放大。研究提出ViF视觉流解决方案,通过直接传递关键视觉信息而非仅依赖文字描述,显著减少了幻觉现象,性能提升2.4%-3.8%,为AI团队协作可靠性提供重要保障。

OpenAI向印度用户免费提供ChatGPT Go服务一年

OpenAI向印度用户免费提供ChatGPT Go服务一年

OpenAI宣布从11月4日开始向印度用户免费提供一年ChatGPT Go订阅服务。该计划月费不到5美元,于8月在印度推出,是OpenAI最实惠的付费订阅方案。印度拥有超过7亿智能手机用户,是OpenAI仅次于美国的第二大市场。ChatGPT Go提供比免费版本多10倍的使用量,包括生成回复、创建图像和上传文件功能。

Skyline Nav AI推出无GPS导航技术,将亮相TechCrunch Disrupt 2025

Skyline Nav AI推出无GPS导航技术,将亮相TechCrunch Disrupt 2025

天际线导航AI公司开发出基于视觉的导航系统Pathfinder,可在没有GPS信号的情况下提供实时导航。该软件通过AI识别建筑物、道路等场景,快速匹配数据库生成导航信息。技术主要应用于GPS信号被阻挡的城市峡谷或山区,以及对抗GPS干扰攻击。公司已与美国国防部、NASA等机构合作,并推出边缘计算版本Pathfinder Edge。

英伟达向诺基亚6G网络注入AI技术并投资10亿美元

英伟达向诺基亚6G网络注入AI技术并投资10亿美元

英伟达宣布与诺基亚建立合作伙伴关系,将AI技术集成到诺基亚的移动网络基础设施中,为6G网络铺平道路。作为合作的一部分,英伟达将向诺基亚投资10亿美元。此次合作将通过AI-RAN产品提升频谱效率,并使AI推理在移动设备上更易获得。双方还将共同开发边缘AI推理工作负载基础设施。

美国能源部与英伟达合作建造7台超级计算机,包括史上最大系统

美国能源部与英伟达合作建造7台超级计算机,包括史上最大系统

美国能源部与英伟达、甲骨文合作建造7台新型AI超级计算机,用于加速科学研究和开发智能AI。其中位于阿贡国家实验室的两套系统将组成能源部最大的AI超算基础设施。Solstice系统配备10万颗Blackwell GPU,与Equinox系统互联后总计算性能达2200 exaFLOPs。此外还宣布了与Palantir的合作以及洛斯阿拉莫斯实验室的新系统计划。

HPE构建基于Alletra MP的数据纤维架构

HPE构建基于Alletra MP的数据纤维架构

HPE正在使用其分解式Alletra MP X10000存储系统构建分布式边缘到核心数据中心的数据结构。这是基于Nvidia的AI工厂和智慧城市计划的一部分,包括第二代私有云AI产品。HPE推出统一的分布式数据结构,连接核心和边缘数据中心、托管站点和公有云,具有全局命名空间、通用访问、多协议支持等功能。该软件支持S3 over RDMA,可将延迟降低80%,CPU使用率降低99%。