最新文章第66页

2025-08-07

西班牙和芬兰顶尖大学联合揭示：人工智能绘画界的"破案神探"其实是个近视眼

这项由多国顶尖大学联合完成的研究，通过测试六个先进AI模型对近4万幅画作的识别能力，揭示了当前人工智能在艺术鉴定领域的严重局限。研究发现，即使最优秀的AI模型准确率也仅有60%，且无法识别《蒙娜丽莎》等世界名画，同时容易被某些AI生成的仿制品"欺骗"。

文本到动作生成

检索增强生成

多模态学习

2025-08-07

北京大学团队突破性进展：让AI从看懂动作变成创造表演者

北京大学团队开发的ReMoMask系统实现了文本到3D人体动作生成的重大突破，通过双向动量学习、语义时空注意力和检索增强指导三项核心创新，在权威数据集上取得显著性能提升，为电影制作、游戏开发、虚拟现实等领域提供了高质量的动作生成解决方案，标志着人工智能向更自然人机交互迈进的重要进展。

量子机器学习

量子支持向量机

Vision Transformer嵌入

2025-08-07

量子机器学习的新突破：爱尔兰都柏林大学团队发现Vision Transformer嵌入让量子计算机在图像识别上首次超越经典算法

爱尔兰都柏林大学研究团队发现了量子机器学习的重要突破：通过Vision Transformer嵌入，量子支持向量机首次在图像识别任务上显著超越传统算法，在Fashion-MNIST上提升8.02%准确率。研究揭示量子优势关键在于选择合适的数据表示方法，而非单纯依赖量子算法。

人工智能

过程奖励模型

数学推理

2025-08-07

蒙纳什大学新突破：让AI数学推理像侦探破案一样精准

蒙纳什大学研究团队提出了一套基于不确定性驱动的自动化过程奖励数据构建框架，解决了训练数学推理AI的关键难题。该方法通过识别AI推理中的不确定性来精准定位错误步骤，显著提高了数据标注效率，同时开发了两种创新的输出聚合策略，结合群体智慧与专家判断，在多个数学推理数据集上取得了显著的性能提升。

强化学习

指令遵循

自监督学习

2025-08-07

复旦大学突破AI助手困境：不依赖外部"老师"也能学会精准执行指令

复旦大学研究团队提出了一种突破性的自监督强化学习框架，让AI推理模型在不依赖外部强大模型指导的情况下显著提升指令遵循能力。该方法通过渐进式约束课程和智能奖励建模，成功解决了推理能力与指令执行能力之间的权衡难题，在多个基准测试中实现10-16个百分点的性能提升，同时保持了原有推理能力，为AI助手的实用性改进提供了低成本、高效率的技术路径。

网络安全

人工智能

专业对话模型

2025-08-07

基金会AI用"万亿级"网络安全数据训练出首个专业安全助手，竟能读懂黑客心思

Cisco基金会AI团队开发出全球首个网络安全专业对话AI助手Foundation-Sec-8B-Instruct，基于Llama 3.1架构并用50亿网络安全词汇训练。该AI助手在专业测试中超越GPT-4o-mini等大型模型，同时具备出色的对话能力和安全防护机制，能识别99%的恶意请求。已开源发布，为网络安全行业提供了accessible的专业智能助手解决方案。

人工智能

视觉-语言-动作模型

机器人控制

2025-08-07

机器人终于学会"察言观色"：上海AI实验室让机器人像人类一样边思考边行动

上海AI实验室团队开发的InstructVLA系统实现了机器人"边思考边行动"的突破，解决了传统机器人语言理解与动作执行分离的难题。该系统通过创新的两阶段训练和混合专家架构，让机器人能理解抽象指令并灵活执行任务，在复杂推理任务中比现有系统提升92%，标志着智能机器人助手时代的重要进展。

人工智能

个性化安全对齐

图像生成安全

2025-08-07

北大等高校联手：让AI图像生成"因人而异"，1000种个性安全标准重塑创作边界

这项由北京大学、电信人工智能研究院、耶鲁大学和新加坡国立大学联合完成的研究，提出了PSA个性化安全对齐框架，首次实现了AI图像生成的"因人而异"安全控制。通过构建包含1000个虚拟用户档案的Sage数据集，该框架能根据用户的年龄、宗教、健康状况等特征动态调整内容过滤策略，既保护敏感用户又避免过度限制，为AI安全领域从"一刀切"向个性化转变提供了重要突破。

ByteDance种子实验室重磅推出VeOmni：让AI训练像搭积木一样简单的全新框架

分布式系统

全模态学习

AI训练优化

2025-08-07

ByteDance种子实验室重磅推出VeOmni：让AI训练像搭积木一样简单的全新框架

ByteDance种子实验室推出VeOmni全模态AI训练框架，通过模块化设计和分布式优化策略，解决了同时训练处理文字、图像、视频、音频等多种数据类型AI模型的技术难题。该框架让300亿参数模型在128个GPU上实现每秒2800+ tokens处理速度，支持16万长度序列，在与主流框架对比中展现显著性能优势。

Cloudera

2025-08-07

Cloudera Data Services将私有AI引入数据中心

致力于将 AI 技术应用于复杂环境中数据的Cloudera宣布推出最新版本Cloudera Data Services，将私有 AI 引入本地环境，并为企业在其防火墙后提供安全可靠的 GPU 加速生成式 AI 功能。

2025-08-07

工业软件行业发展概况

工业软件的创新是持续的，渐进的，分阶段发展的。工业软件的发展史，大致可分为三个阶段。

自然语言处理

情境感知嵌入

文档理解优化

2025-08-07

香港科技大学联合腾讯：让AI懂得"察言观色"的阅读理解新突破

香港科技大学联合腾讯微信AI等机构开发出SitEmb-v1.5情境感知文本嵌入模型，突破传统AI只能孤立处理文本片段的局限。该技术让AI在理解文本时能考虑上下文环境，就像人类阅读一样。仅10亿参数的模型就超越了多个70-80亿参数的先进系统，在书籍理解等复杂任务中表现优异，已开源供全球开发者使用。

机器人技术

终身学习

仿生记忆系统

2025-08-07

中科大团队打造机器人大脑：让机器人像人类一样终身学习记忆

RoboMemory是中科大等机构联合开发的仿生机器人记忆框架，模仿人脑构建四重记忆系统，让机器人具备终身学习能力。在标准测试中超越当前最先进模型5个百分点，真实环境测试显示机器人重复任务成功率提升75%。该框架解决了传统机器人"健忘"问题，为智能机器人发展奠定重要基础。

为什么机器人最终学会"偷懒"反而更聪明？——田纳西理工大学重新定义探索与利用的关系

元强化学习

探索利用平衡

记忆增强架构

2025-08-07

为什么机器人最终学会"偷懒"反而更聪明？——田纳西理工大学重新定义探索与利用的关系

田纳西理工大学研究发现，在特定条件下，纯粹追求短期利益的人工智能反而会自发表现出探索行为。研究通过多臂老虎机和网格世界实验证实，当环境具有重复结构且智能体拥有足够记忆时，贪婪策略能够产生类似Thompson采样的探索效果。这一发现挑战了探索与利用必须对立的传统观点，为简化强化学习算法设计提供了新思路。

AI模型也要学会精打细算：宾夕法尼亚大学团队揭示多阶段任务中的智能计算预算分配秘诀

人工智能

测试时缩放

优化模型

2025-08-07

AI模型也要学会精打细算：宾夕法尼亚大学团队揭示多阶段任务中的智能计算预算分配秘诀

宾夕法尼亚大学研究团队开发了AgentTTS系统，解决多阶段AI任务中的计算资源分配难题。通过发现不同子任务对模型大小的偏好差异、最优预算点存在性和子任务间相互依赖关系三个关键规律，该系统能智能分配计算预算，在六个数据集上的测试显示其在搜索效率和最终性能上均超越传统方法，为AI资源管理提供了新思路。

人工智能

稀疏注意力

计算优化

2025-08-07

港科大团队让AI注意力机制学会"挑重点"：动态掩码稀疏注意力让大模型更聪明更高效

港科大团队提出的动态掩码稀疏注意力机制通过内容感知的动态掩码生成和位置感知的稀疏计算，让大语言模型学会智能分配注意力资源。该方法在保持完整信息的同时大幅降低计算复杂度，在长序列处理中实现10倍以上加速，并在多项基准测试中超越现有方法，为高效长文本处理提供了新的解决方案。

人工智能

智能体框架

开源模型

2025-08-07

腾讯AI实验室打造全新开源智能体框架：让AI助手真正走向免费开放

腾讯AI实验室推出认知内核-专业版，这是首个完全开源且几乎免费的AI智能体框架。该框架通过创新的分层架构和统一接口设计，最大化利用大语言模型能力，避免对昂贵专有工具的依赖。研究团队还训练了8B参数的CK-Pro-8B模型，在GAIA基准测试中超越同等规模开源模型，为AI助手的民主化发展提供了重要技术基础。

人工智能

多模态处理

跨语言评估

2025-08-07

打破语言和视觉边界：斯图加特团队创造首个跨语言多模态AI测试基准

这项由意大利布鲁诺·凯斯勒基金会等机构联合完成的研究创建了首个跨语言多模态AI评测基准MCIF，涵盖英德意中四种语言，包含文字、语音、视频三种模态和13项任务。通过对21个先进AI模型的测试，发现AI在长文本处理、跨模态融合和指令鲁棒性方面存在显著不足，为AI技术改进指明了方向。

人工智能

游戏开发

多模态评估

2025-08-07

三星SAIL实验室开发AI游戏制作神器：让电脑学会看着录像来改进自己做的游戏

三星SAIL实验室开发了一套AI游戏制作系统，包含评测器AVR-Eval和制作器AVR-Agent。系统能通过观看游戏录像来评判质量，并基于反馈不断改进游戏。测试显示该方法比一次性生成效果好79.2%，但AI目前还不能有效利用外部资源和反馈，展现了人机创作的根本差异。

三大AI巨头同时发布新模型：OpenAI、Anthropic、Google齐亮剑

人工智能

大语言模型

新型算法

2025-08-07

三大AI巨头同时发布新模型：OpenAI、Anthropic、Google齐亮剑

三家AI巨头同时发布重磅新模型。OpenAI推出首批开放权重模型OSS 120b和OSS 20b，具备Apache许可证，大模型推理能力与o4-mini相当，小模型可在智能手机运行。Anthropic发布Claude Opus 4.1，在代码编程和推理任务上显著提升。Google DeepMind推出Genie 3世界模型，可实时生成可交互的720p游戏世界，被视为通向AGI的重要步骤。

用AI，在数字身份验证风暴中心重构信任坐标

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: