人工智能 关键字列表
大模型推理验证也需要"火眼金睛":上海人工智能实验室团队重新定义长链条思维验证

大模型推理验证也需要"火眼金睛":上海人工智能实验室团队重新定义长链条思维验证

上海人工智能实验室团队开发的OPV系统巧妙结合结果验证和过程验证,通过智能总结复杂推理过程并精准检查关键步骤,显著提升AI推理可靠性,在数学竞赛中准确率提升18个百分点,为AI系统大规模应用提供重要质量保障。

西安工程大学联合中科院推出AR3D-R1:用强化学习让AI学会像人类一样"思考"3D建模

西安工程大学联合中科院推出AR3D-R1:用强化学习让AI学会像人类一样"思考"3D建模

西安工程大学联合中科院等机构开发出AR3D-R1系统,首次将强化学习系统性应用于文本生成3D建模。该技术采用分层思维,先构思整体轮廓再精雕细琢,模拟人类艺术家创作过程。研究构建了MME-3DR评测基准和多维评价体系,在性能上显著超越现有模型,为AI创作领域向"思考型"创造者转变提供重要突破。

清华大学与阿里达摩院联手打造MOA:让AI角色扮演不再困难重重的神奇方法

清华大学与阿里达摩院联手打造MOA:让AI角色扮演不再困难重重的神奇方法

清华大学与阿里达摩院合作开发的MOA(多目标对齐)方法,通过动态优化策略和思维增强技术,解决了AI角色扮演中技能冲突的难题。该方法在保持角色知识、语言风格和指令遵循等多维度平衡方面表现出色,8B参数模型在关键测试中超越GPT-4o达21%,为AI角色扮演技术实用化提供了重要突破。

人工大脑学会自我反思:中国人大团队破解AI强化学习训练难题

人工大脑学会自我反思:中国人大团队破解AI强化学习训练难题

中国人民大学团队发现AI强化学习中正面和负面样本对模型训练的不同作用机制。研究表明正面样本让AI专注于已掌握方法,负面样本促进探索新思路,两者缺一不可。基于此发现,团队开发出A3PO训练方法,能精确调节不同样本类型的影响力,显著提升AI推理性能。这项研究为开发更强大可靠的AI系统提供了重要指导。

设备端AI革命:廉价快速安全的人工智能新时代

设备端AI革命:廉价快速安全的人工智能新时代

传统AI依赖云端处理存在延迟和隐私问题。越来越多开发者将AI处理从数据中心转移到手机、笔记本等个人设备上。设备端AI具有三大优势:速度更快,无需等待云端响应;隐私更安全,数据不离开设备;成本更低,无需支付云服务费用。目前iPhone已运行30亿参数的设备端AI模型,谷歌Pixel手机也搭载Gemini Nano模型。未来五年内,随着硬件升级和算法优化,设备端AI将实现物体识别、导航翻译等更复杂功能。

机器人咖啡杯?自动隔热垫?AI研究人员让它变成现实

机器人咖啡杯?自动隔热垫?AI研究人员让它变成现实

卡内基梅隆大学研究人员开发了一项革命性技术,通过摄像头、AI模型和微型轮子,让咖啡杯、订书机等日常物品能够自主移动到需要的位置。这种"智能物品"技术避免了传统人形机器人的复杂性和安全隐患,通过蓝牙微控制器和AI视觉系统,物品能够识别用户行为并预测需求。虽然技术已相对成熟,但隐私保护和安全性仍是推广前需要解决的关键问题。

AI行业2025年迎来现实检验

AI行业2025年迎来现实检验

2025年上半年AI投资热情依然高涨,OpenAI以3000亿美元估值融资400亿美元,Meta、Anthropic等巨头纷纷加大投入。然而下半年行业开始面临现实检验:AI泡沫担忧、用户安全问题、技术进步可持续性质疑等逐渐显现。从模型突破到商业模式探索,从基础设施狂欢到版权纠纷,AI行业正从盲目乐观转向理性审视,2026年将是验证其真正商业价值的关键一年。

IBM收购Confluent 强化数据和自动化投资组合

IBM收购Confluent 强化数据和自动化投资组合

IBM宣布将以110亿美元收购云原生企业数据流平台Confluent,预计明年中完成交易。Confluent基于Apache Kafka构建,为企业提供数据源连接和清理服务。分析师认为此次收购填补了IBM watsonx平台在实时数据监控方面的关键空白,使IBM能够与Snowflake等AI原生大数据公司竞争,为企业提供全栈垂直AI平台解决方案。

谷歌推出代码进化智能体,助力企业降低云计算隐性成本

谷歌推出代码进化智能体,助力企业降低云计算隐性成本

企业很少公开承认,但他们的云计算账单中相当大的一部分可以追溯到一个看似平凡的问题:代码效率低下。软件交付平台提供商Harness与AWS联合发布的研究报告显示,在美国和英国接受调查的700名工程领导者和开发者中,52%的人表示财务运营与开发者之间的脱节导致了云基础设施成本的浪费支出。谷歌推出了新的编码代理AlphaEvolve,专注于代码进化而非代码生成,通过算法优化来减少计算浪费和降低成本。

Nvidia押注开放基础设施迎接智能体AI时代的Nemotron 3模型家族

Nvidia押注开放基础设施迎接智能体AI时代的Nemotron 3模型家族

AI智能体必须能够在大型上下文和长期时间段内进行合作、协调和执行,Nvidia表示,这需要一种新型的基础设施,一种开放的基础设施。

微软停用Visual Studio Code的IntelliCode AI代码补全扩展

微软停用Visual Studio Code的IntelliCode AI代码补全扩展

微软正式弃用Visual Studio Code编辑器的IntelliCode AI代码补全扩展,建议C#开发者改用GitHub Copilot Chat对话式AI助手。被弃用的扩展包括IntelliCode、IntelliCode Completions、IntelliCode for C# Dev Kit和IntelliCode API Usage Examples。微软建议开发者卸载相关扩展,继续使用Roslyn内置语言服务器支持或安装GitHub Copilot Chat。弃用后,开发者将不再看到代码补全列表中的星标提示和内联灰色文本建议,这些扩展也将立即停止bug修复和支持服务。

中东2026年科技趋势:AI、网络安全和主权基础设施成为焦点

中东2026年科技趋势:AI、网络安全和主权基础设施成为焦点

到2026年,中东技术市场将由人工智能、网络安全和大规模基础设施投资融合塑造。全球技术支出预计增长10.2%,突破6万亿美元。中东虽增速7.94%略慢,但仍将推动区域市场达到1749亿美元。AI正从辅助工具演变为企业核心平台,与物联网深度融合。网络安全从静态防御转向适应性韧性。主权AI成为战略重点,云扩张持续,但生态系统实力比规模更重要。

风投预测企业AI明年将强劲增长——再次

风投预测企业AI明年将强劲增长——再次

ChatGPT发布三年来,企业AI投资激增但回报有限。MIT调查显示95%企业未从AI投资中获得有意义回报。TechCrunch调研24位企业级风投,他们普遍认为2026年将是企业真正开始大规模采用AI并从中获益的关键年份。投资人预测企业将增加AI预算,专注于定制模型、数据主权等领域,AI代理将成为企业重要组成部分。

Anthropic最新CJE技术:让AI评判AI不再瞎猜,终结LLM评估乱象

Anthropic最新CJE技术:让AI评判AI不再瞎猜,终结LLM评估乱象

这篇论文提出了CJE(因果法官评估)框架,解决了当前LLM评估中的三大致命问题:AI法官偏好倒置、置信区间失效和离线策略评估失败。通过AutoCal-R校准、SIMCal-W权重稳定和OUA不确定性推理,CJE仅用5%的专家标签就达到了99%的排名准确率,成本降低14倍,为AI评估提供了科学可靠的解决方案。

东京大学等机构联手打造Mio:全球首个具备"交互智能"的数字人类

东京大学等机构联手打造Mio:全球首个具备"交互智能"的数字人类

这项由东京山田AI研究院领导的突破性研究,首次实现了具备"交互智能"的数字人类Mio。该系统通过五个核心模块的协同工作,让数字人类具备了真正的理解、学习和成长能力,而不仅仅是外表的模仿。研究团队提出了全新的评估标准Interactive Intelligence Score,Mio获得76.0分,相比现有技术提升8.4分,标志着数字人类从被动播放向主动智能交互的历史性转变。

当AI画师只会画"美图":UBC研究揭示图像生成模型的美学偏见陷阱

当AI画师只会画"美图":UBC研究揭示图像生成模型的美学偏见陷阱

英属哥伦比亚大学研究团队发现,当前主流AI图像生成模型存在严重的美学偏见,过度追求"普遍美感"导致无法执行用户的反美学创作意图。研究通过构建300个反美学提示词数据集,测试发现经过美学对齐的模型会自动"美化"输出,即使用户明确要求生成低质量或"丑陋"图像。这种偏见不仅限制了艺术表达多样性,还可能构成无意识的创作审查,威胁文化多元化发展。

华中科技大学与MiniMax联手突破:让AI画画的"眼睛"更懂艺术的秘密

华中科技大学与MiniMax联手突破:让AI画画的"眼睛"更懂艺术的秘密

华中科技大学与MiniMax联合研究团队在2025年12月发表重要论文,提出VTP视觉标记器训练框架。该研究解决了AI绘画系统中的关键问题:传统训练只注重像素复制而忽视语义理解,导致扩展性差。VTP通过整合图片重建、图文对比学习和自监督学习三种任务,让AI既能准确重现细节又能理解深层含义。实验显示VTP具有优秀扩展性,投入十倍计算资源可获得65.8%性能提升,为AI绘画技术带来突破性进展。

苹果公司首次实现"读心术":让大脑直接控制AI聊天机器人

苹果公司首次实现"读心术":让大脑直接控制AI聊天机器人

苹果公司研究团队在2024年12月发表了突破性研究成果,首次实现用大脑信号直接控制AI聊天机器人进行自然对话。这项技术通过"思维解码器"系统捕捉大脑电信号并转换为文字,让AI代替用户表达想法,准确率超过85%。该技术将为失语患者带来重新交流的希望,并可能彻底改变人机交互方式,开启"思维计算"新时代。

微信AI团队创新突破:像人类一样"记忆"全局的智能问答系统

微信AI团队创新突破:像人类一样"记忆"全局的智能问答系统

中科院信息工程研究所与腾讯微信AI团队等机构联合开发出首个具备"全局记忆"的智能问答系统Mindscape-Aware RAG,模仿人类阅读时构建心智地图的认知机制。系统通过分层摘要建立文档全局记忆,结合全局感知检索器和生成器,在长文本理解任务中显著超越传统方法,140亿参数模型性能甚至超过720亿参数传统系统。

阿里巴巴推出MAI-UI:让手机像人类助手一样智能操作的革命性技术

阿里巴巴推出MAI-UI:让手机像人类助手一样智能操作的革命性技术

阿里巴巴通义实验室发布MAI-UI,这是一套革命性的手机AI操作技术。该技术能让AI像人类助手一样理解屏幕、与用户对话、使用外部工具,并实现本地云端智能协作。在测试中,MAI-UI在视觉识别上达到73.5%准确率,在复杂任务执行上达到76.7%成功率,全面超越现有竞品,标志着手机智能交互进入新时代。