人工智能文章列表第86页-至顶网频道

2025-09-24

大模型的"认知僵化"问题：ByteDance团队揭示AI为何总是"按套路出牌"

ByteDance团队发现大语言模型存在"认知僵化"问题：当用户要求执行与训练习惯冲突的指令时，AI往往难以遵从。研究团队开发了Inverse IFEval测试体系，包含8种反常规指令类型和1012个测试样本，发现即使最先进的模型在此类任务上表现也不理想。研究揭示了过度标准化训练导致模型缺乏灵活性的根本原因，为开发更适应用户真实需求的AI系统提供了重要指导。

沙特科技大学揭秘：AI推理能力竟然可以像U盘一样"拷贝粘贴"

沙特阿卜杜拉国王科技大学研究团队首次发现AI推理能力可以像文件一样被提取和转移。通过简单的数学运算从强化学习模型中提取"推理向量"，然后添加到其他模型上，实现推理能力的快速传递。实验显示模型在数学、代码生成等任务上性能提升4-12%，且在对抗性测试中保持稳定。这项技术有望让AI推理能力的获取从昂贵训练变为低成本复用，加速AI技术普及。

上海人工智能实验室首创：用学术讲座训练AI研究助手的全新评测方案

上海人工智能实验室等多所高校联合开发了DeepResearch Arena评测基准，专门评估AI研究助手的真实能力。该系统创新性地使用学术讲座作为测试素材，通过MAHTG系统从200多场讲座中提取研究灵感并生成超过1万个研究任务。实验显示即使最先进的AI模型也面临显著挑战，为未来AI研究能力发展提供了重要参考。

视频AI出现了"幻觉症"？SenseTime研究揭示长视频理解的隐秘缺陷

SenseTime研究院发现AI在理解长视频时存在"语义聚合幻觉"现象——AI能正确识别每个画面，但会错误地将不同事件的信息混合，如将第一个新闻段落的主持人与第三个段落的星巴克信息错误组合。研究团队创建了全球首个长视频幻觉检测基准ELV-Halluc，测试16个主流模型后发现这一问题普遍存在，并提出了有效解决方案，将错误率降低27.7%。

Google Photos对话式编辑功能向Android用户推出

Google Photos正向美国Android用户推出会话式编辑功能，用户可通过语音或文字提示来编辑照片，而无需手动操作。该功能首先在Pixel 10手机上推出，现已扩展到更多设备。用户需将Google账户设置为英文，并开启人脸分组和位置估算功能。通过点击"帮我编辑"按钮，用户可直接说出编辑需求，如去除背景中的陌生人、调亮颜色或消除眩光。该功能使用先进的Gemini技术，并提供原图与编辑后照片的对比显示。

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: