最新文章
2025-10-16

深度解密Testin云测AI测试“三驾马车”——(AGI+RAG+多模态)技术栈

10月14日,由中国科学院主管的《互联网周刊》正式公布了备受瞩目的“2025年度数字化创新实践TOP50”榜单。

2025-10-16

思科人工智能研究:人工智能就绪型企业在价值竞赛中遥遥领先

思科今日发布第三份年度《思科人工智能就绪指数》报告(Cisco AI Readiness Index)。报告显示,在过去三年中,一小部分始终表现突出的企业群体——被称为“领导者”(Pacesetters)——在AI价值的各项衡量指标上均显著优于同行。

上海AI实验室推出科学推理大模型:让AI像科学家一样思考

上海AI实验室推出科学推理大模型:让AI像科学家一样思考

上海AI实验室联合多家顶尖机构开发出全球首个科学推理大模型SciReasoner,该模型在2060亿科学数据上训练,支持103个科学任务,能够像科学家一样进行逻辑推理并展示思考过程。它实现了化学、生物学、材料科学等多领域知识整合,在分子设计、性质预测、文献分析等方面表现出色,为科学研究提供了强大的AI助手工具。

南洋理工大学团队突破:让AI学会在复杂光影中完美合成图像,无需额外训练就能处理水面倒影和阴影效果

南洋理工大学团队突破:让AI学会在复杂光影中完美合成图像,无需额外训练就能处理水面倒影和阴影效果

南洋理工大学研究团队开发出SHINE方法,这是一种无需额外训练就能实现高质量图像合成的新技术。该方法通过巧妙引导现有AI模型的潜能,能够在复杂光影条件下完美合成图像,包括准确的阴影生成和水面倒影效果。研究团队还创建了ComplexCompo基准测试集,验证了SHINE在各种挑战性场景中的卓越性能,为图像编辑技术的发展开辟了新方向。

这支来自AWorld团队的多智能体浏览器助手,让网页操作变得像团队协作一样智能

这支来自AWorld团队的多智能体浏览器助手,让网页操作变得像团队协作一样智能

AWorld团队开发的Recon-Act系统采用"侦察-行动"双团队协作模式,通过工具中心的自我进化机制实现智能浏览器操作。系统在VisualWebArena测试中达到36.48%成功率,超越现有自动化方案。其创新性在于将信息收集与任务执行分离,通过对比成功失败案例自动生成专用工具,为未来智能浏览器助手发展提供了新思路。

中科院团队让庞大的3D重建AI"瘦身":压缩75%体积却保持98%精度

中科院团队让庞大的3D重建AI"瘦身":压缩75%体积却保持98%精度

中科院团队提出QuantVGGT技术,首次解决大规模3D重建AI模型的部署难题。通过双重平滑精细量化和噪声过滤多样化采样两项核心技术,成功将12亿参数的VGGT模型压缩75%体积、提升2.5倍速度,同时保持98%原始性能。实验结果显示该方法在相机位置估计和点云地图生成任务上均显著优于现有量化技术,为3D AI技术的产业化普及提供了重要突破。

机器人学会了"照葫芦画瓢"还能举一反三:亚马逊团队让机器人在真实世界中边学边进步

机器人学会了"照葫芦画瓢"还能举一反三:亚马逊团队让机器人在真实世界中边学边进步

亚马逊研究团队开发了ResFiT技术,让机器人先通过模仿学会基本技能,再通过实践自主改进。该方法在29自由度人形机器人上成功验证,双手协调任务成功率从23%提升至64%,样本效率比传统方法提高200倍。这是首次在现实世界完全训练五指灵巧手双臂机器人的突破,为机器人实用化奠定了基础。

台湾大学研究团队突破语音情感识别难题:用两个"老师"教出更聪明的AI学生

台湾大学研究团队突破语音情感识别难题:用两个"老师"教出更聪明的AI学生

台湾大学研究团队提出MI-Fuse框架,创新性地融合专业情感识别模型与大型语言模型的优势,通过互信息量化不确定性并动态调整权重,解决了语音情感识别中的跨域适应难题。该方法在六种转换场景中平均准确率达58.38%,比最强基准高3.9%,且训练过程稳定,为闭源模型环境下的实际部署提供了有效解决方案。

阿里巴巴DAMO院携手南洋理工大学,让AI数学推理告别"梯度消失"困扰

阿里巴巴DAMO院携手南洋理工大学,让AI数学推理告别"梯度消失"困扰

阿里巴巴DAMO院联合南洋理工大学等机构,针对AI多模态推理训练中的梯度消失问题,开发了方差感知采样(VAS)策略。该方法通过智能选择具有不同答题结果和推理路径多样性的训练题目,显著提升了强化学习效果。团队还构建了包含160万长链式思考数据的大规模数据集,其开源的MMR1模型在多个数学推理基准测试中取得最佳性能,为AI推理能力提升提供了重要突破。

阿里巴巴提出全新的AI数学学习方法:让机器像人类一样从易到难学数学

阿里巴巴提出全新的AI数学学习方法:让机器像人类一样从易到难学数学

阿里巴巴研究团队提出VCRL方法,让AI像人类一样从易到难学习数学。该方法通过观察AI模型解题时表现的差异程度来判断题目难度,自动选择最适合当前能力水平的训练材料。实验显示,VCRL将AI数学能力提升75%-85%,在奥林匹克数学竞赛等高难度测试中表现尤为突出,为AI教育训练提供了新思路。

Tree-GRPO:让AI智能体学会像人类一样思考——阿里巴巴集团革命性突破提升人工智能决策能力

Tree-GRPO:让AI智能体学会像人类一样思考——阿里巴巴集团革命性突破提升人工智能决策能力

阿里巴巴集团研究团队提出了Tree-GRPO,一种革命性的AI智能体训练方法。该方法通过树状结构让AI探索多种思考路径并进行比较学习,在多跳推理任务中实现了69%的性能提升,同时将训练成本降低至传统方法的四分之一。这项创新为解决AI稀疏监督和高昂训练成本问题提供了新思路。

AI评判官出错了!北大等高校联手揭开LLM评估系统的严重漏洞

AI评判官出错了!北大等高校联手揭开LLM评估系统的严重漏洞

北京大学等高校联合研究发现,当前广泛使用的AI评判系统存在严重的自相矛盾问题,经常出现评分与直接比较结果不一致的情况。研究团队开发了TrustJudge框架,通过分布感知评分和智能聚合技术,将评判不一致性降低了8-10个百分点,同时提升了准确率,为AI系统的可靠评估提供了重要解决方案。

清华大学团队打造CHARM框架:让AI学会生成动漫角色发型,从此告别手工建模的繁琐!

清华大学团队打造CHARM框架:让AI学会生成动漫角色发型,从此告别手工建模的繁琐!

清华大学与腾讯联合开发CHARM框架,首次实现动漫发型的AI自动生成。该系统将复杂发型转化为控制点序列,采用语言化表示方法,让AI像写文章一样逐步生成发型。基于37000个样本的AnimeHair数据集训练,CHARM在几何精度和视觉效果上全面超越现有方法,数据压缩率达98%以上,为游戏、动画等领域提供高效的角色建模解决方案。

微软研究院重磅发现:让AI提前"思考",学习效率飙升3倍!

微软研究院重磅发现:让AI提前"思考",学习效率飙升3倍!

微软研究院发布思维增强预训练技术,通过在AI训练中加入自动生成的思考过程,显著提升学习效率。该方法让AI模型在数学推理任务上正确率大幅提升,数据利用效率提高3倍。技术简单易实现,在多种模型规模上都显示出显著效果,为AI训练开辟新路径。

上海AI实验室推出游戏编程界的"智能教练":V-GameGym如何让AI学会写游戏代码?

上海AI实验室推出游戏编程界的"智能教练":V-GameGym如何让AI学会写游戏代码?

上海AI实验室推出V-GameGym测试平台,首次全面评估AI模型的游戏开发能力。该平台包含2219个高质量游戏样本,采用代码、视觉、动态三维评估体系。测试70个AI模型发现,即使最优秀的GPT-5也只能成功开发45%的游戏,AI在编程逻辑方面表现良好但视觉设计能力不足,为AI辅助游戏开发指明了改进方向。

AI图像生成迎来"闪电时刻":Stability AI让手机也能秒生高清图片

AI图像生成迎来"闪电时刻":Stability AI让手机也能秒生高清图片

Stability AI推出SD3.5-Flash系统,将AI图像生成速度提升18倍,仅需4步即可完成高质量图片生成,并通过量化优化让普通手机也能运行。该技术通过"时间步共享"和"分时间步微调"等创新方法,成功解决了传统AI绘画速度慢、硬件要求高的问题,让AI图像生成技术实现真正的民主化普及。

上海AI实验室重磅发现:让数学推理模型变聪明的秘密武器

上海AI实验室重磅发现:让数学推理模型变聪明的秘密武器

上海人工智能实验室联合多所高校提出ScaleDiff方法,通过智能识别困难数学问题并大规模生成类似难题来训练AI模型。该方法在多个数学竞赛基准上实现显著性能提升,证明了困难样本对提升AI推理能力的重要价值,为构建更强大的数学推理模型提供了高效可行的技术路径。

KAIST与微软研究院新发现:让AI"看懂"位置信息的隐藏机制

KAIST与微软研究院新发现:让AI"看懂"位置信息的隐藏机制

这项由KAIST与微软研究院合作完成的研究揭示了AI语言模型中一个被忽视的重要机制。研究团队发现,除了明确的位置编码技术外,因果掩码这个看似只负责维持处理顺序的组件,实际上也在为AI提供位置信息。通过严密的数学推导和实验验证,研究证明因果掩码会让AI产生偏向较近位置的注意力模式,并且会与RoPE位置编码产生相互作用,影响现代大型语言模型的行为。

从“支撑工具”到“智能中枢”,端点科技的“AI原生ERP”进化

从“支撑工具”到“智能中枢”,端点科技的“AI原生ERP”进化

今天,经过十余年的打磨与试错,这套体系已经成型并在云栖大会上发布了AI原生ERP,这也将引领ERP进入一个,以AI为核心的技术创新与行业价值跨越时代。

中科院团队揭示深度学习优化与评估的隐秘矛盾:为什么最好的评分模型不一定带来最佳训练效果

中科院团队揭示深度学习优化与评估的隐秘矛盾:为什么最好的评分模型不一定带来最佳训练效果

中科院微电子研究所团队揭示深度学习中感知优化与质量评估存在意外不对称现象。研究发现评估性能优秀的模型在训练指导中效果有限,对抗性训练具主导作用,传统卷积网络在某些场景仍具优势。这项发现颠覆了"评估性能等同于优化能力"的传统认知,为AI图像处理技术改进提供新方向。