人工智能文章列表第16页-至顶网频道 - 至顶网

/

人工智能关键字列表

超越扩散模型的新突破：DP Technology让AI图像生成迎来全新变革

人工智能

自回归生成

图像生成技术

2025-10-22

超越扩散模型的新突破：DP Technology让AI图像生成迎来全新变革

这项由DP Technology和北京大学联合完成的研究提出了SphereAR方法，通过超球面约束解决连续标记自回归图像生成中的方差崩溃问题。该方法将所有输入输出限制在固定半径球面上，实现尺度不变性，在ImageNet数据集上创下自回归模型新纪录，SphereAR-H达到1.34 FID分数，首次让纯自回归方法在同等参数规模下超越扩散和遮蔽生成模型。

人工智能与人类协作的新境界：北京传媒大学和微软团队破解云端智能压缩难题

人工智能

令牌化压缩

人机协作通信

2025-10-22

人工智能与人类协作的新境界：北京传媒大学和微软团队破解云端智能压缩难题

这项由中国传媒大学和微软联合开展的研究提出了UniMIC框架，创新性地采用令牌化技术解决人机协作中的通信效率问题。该技术将多媒体数据转换为紧凑令牌进行传输，避免了传统方法的累积损失，在文本生成图像、图像编辑等任务中实现60-80%的带宽节省，同时保持近乎无损的质量，为未来AI原生通信协议奠定了基础。

NVIDIA突破4位浮点训练瓶颈：让大模型训练速度翻倍的NVFP4技术

人工智能

NVFP4格式

训练效率优化

2025-10-22

NVIDIA突破4位浮点训练瓶颈：让大模型训练速度翻倍的NVFP4技术

NVIDIA团队成功实现了4位浮点精度(NVFP4)的大语言模型训练突破，通过创新的双级缩放、随机哈达玛变换、二维块缩放和随机舍入技术，在120亿参数模型上完成了史上最长的4位精度训练实验。相比传统方法，NVFP4将训练速度提升2-3倍，内存使用减半，同时保持了与8位精度相当的模型性能，为大模型训练的效率优化开辟了新路径。

腾讯和武汉大学研发的"思维型AI智能体"：会思考、会推理、像人类一样学习游戏

人工智能

强化学习

可解释AI

2025-10-22

腾讯和武汉大学研发的"思维型AI智能体"：会思考、会推理、像人类一样学习游戏

这项由腾讯与武汉大学合作的研究开发了一种革命性的AI智能体CEL，它能像人类一样从零开始学习游戏规则并制定策略。与传统需要大量数据训练的"黑箱"AI不同，CEL通过观察、思考和反思的方式自主学习，整个决策过程完全透明。在扫雷、冰湖导航和推箱子三种游戏测试中，CEL都表现出色，甚至超越了预先知道规则的传统AI。这种"会思考的AI"为未来可解释人工智能的发展指明了新方向。

可穿戴设备、AI与个人医疗数字化身的融合趋势

人工智能

可穿戴设备

个性化医疗

2025-10-22

可穿戴设备、AI与个人医疗数字化身的融合趋势

随着大语言模型在人工智能时代展现强大力量，可穿戴设备成为收集人体数据的重要载体。通过实时监测血压、心率、血糖等生命体征，结合AI边缘计算能力，医疗正向个性化转型。基因治疗、数字孪生技术让每个人都能拥有专属的医疗数字化身，实现从"报销型医疗"向"创新循证医疗"的转变，为疾病预防和健康管理带来革命性突破。

OpenAI寻求"谷歌Chrome"时刻：推出Atlas网页浏览器

人工智能

智能体技术

浏览器创新

2025-10-22

OpenAI寻求"谷歌Chrome"时刻：推出Atlas网页浏览器

OpenAI发布Atlas浏览器，旨在将ChatGPT深度集成到网页浏览体验中。该浏览器支持用户与网页对话，提供侧边聊天功能，可直接在Gmail等应用中编辑文本。Agent模式允许AI代理自动执行跨网站任务，如将食谱配料添加到购物车。目前支持macOS下载，Windows和移动版本即将推出。

软件推动AI帕累托前沿超越硬件

人工智能

GPU计算

性能优化

2025-10-22

软件推动AI帕累托前沿超越硬件

英伟达CEO黄仁勋在GTC 2025大会上展示了AI推理吞吐量与响应时间之间的帕累托前沿曲线。数据显示，从Hopper H200到Blackwell B200系统，通过硬件升级和软件优化，性能提升达25倍。值得注意的是，在AI领域，硬件性能提升约2倍，而软件优化可带来额外5倍提升。英伟达在数周内通过软件优化实现了过去需要两年才能达到的5倍性能提升，证明软件在AI性能提升中发挥着更关键的作用。

AWS与e&联合推出AI和云计算培训项目，培养阿联酋未来就绪人才

人工智能

云计算

人才培养

2025-10-22

AWS与e&联合推出AI和云计算培训项目，培养阿联酋未来就绪人才

亚马逊云科技AWS与科技集团e&联合推出"AI Nation - Afaaq"全国培训项目，计划通过e& Academy平台为3万名学员提供人工智能和机器学习技术培训。该项目是双方10亿美元战略联盟的重要组成部分，旨在解决阿联酋AI技能短缺问题。项目将提供3万张AWS认证代金券，学员可免费使用AWS技能构建平台和云教练辅导服务，支持阿联酋2071百年计划的数字化转型目标。

NotebookLM即将推出幻灯片功能，或成职场办公必备AI工具

人工智能

自然语言处理

功能增强

2025-10-22

NotebookLM即将推出幻灯片功能，或成职场办公必备AI工具

NotebookLM原本主要面向学生用户，但即将推出的幻灯片制作功能可能让其成为职场演示的强大工具。该AI工具基于Gemini技术，能够根据用户上传的文档、网站、视频等资料生成内容。最新发现的未发布功能显示，用户将能够基于上传资源快速创建幻灯片，并结合集成的图像生成器进行定制。此外还可能推出信息图表生成功能，帮助用户将数据可视化。

三星将发布Vision Pro竞品，揭示四大关键信息

人工智能

虚拟现实

产品发布

2025-10-22

三星将发布Vision Pro竞品，揭示四大关键信息

三星今日正式发布其混合现实头显设备，该产品被视为苹果Vision Pro的直接竞争对手。据此前体验报告显示，该设备在整体性能上与Vision Pro相当，但其内置的AI功能成为最大亮点。设备搭载多模态Gemini AI，能够实时识别用户视野中的内容并提供相应回答，这是Vision Pro目前缺乏的功能。发布会将揭示设备正式名称、最终功能配置、上市时间和定价策略等关键信息。

戴尔科技在中东地区推进AI和数字化转型

人工智能

数字化转型

自动化解决方案

2025-10-22

戴尔科技在中东地区推进AI和数字化转型

戴尔科技在迪拜Gitex Global 2025展会上展示其在中东地区的影响力，重点展现其在推动公私部门AI和数字化转型方面的作用。公司专注于AI数据解决方案、多云架构、信息安全、数字化工作场所创新和边缘计算。戴尔与阿联酋Emcode Technology签署合作备忘录，将在执法、医疗和政府部门开展AI驱动的培训和咨询服务，助力实现真正的业务转型。

多模态AI初创公司Fal.ai完成新一轮融资估值超40亿美元

人工智能

多模态技术

基础设施服务

2025-10-22

多模态AI初创公司Fal.ai完成新一轮融资估值超40亿美元

多模态AI基础设施公司Fal.ai完成新一轮融资，估值超过40亿美元，融资金额约2.5亿美元。此轮融资由凯鹏华盈和红杉资本领投。该公司为开发者提供图像、视频和音频AI模型托管服务，拥有超过600个模型和数千块英伟达H100、H200 GPU。客户包括Adobe、Canva等知名企业，主要应用于广告、电商和游戏内容创作。

哥伦比亚大学揭秘AI数学能力新测试法：用"频率指纹"看透AI的数学思维盲点

人工智能

数学推理

动态测试

2025-10-21

哥伦比亚大学揭秘AI数学能力新测试法：用"频率指纹"看透AI的数学思维盲点

哥伦比亚大学研究团队开发了MathBode动态诊断工具，通过让数学题参数按正弦波变化来测试AI的动态推理能力。研究发现传统静态测试掩盖了AI的重要缺陷：几乎所有模型都表现出低通滤波特征和相位滞后现象，即在处理快速变化时会出现失真和延迟。该方法覆盖五个数学家族的测试，为AI模型选择和部署提供了新的评估维度。

港中文（深圳）发布新突破：让AI推理模型学会"自我纠错"，告别思维雪球效应

人工智能

思维链推理

安全对齐

2025-10-21

港中文（深圳）发布新突破：让AI推理模型学会"自我纠错"，告别思维雪球效应

这项研究首次发现AI推理模型存在"雪球效应"问题——推理过程中的小错误会逐步放大，导致AI要么给出危险回答，要么过度拒绝正常请求。研究团队提出AdvChain方法，通过训练AI学习"错误-纠正"过程来获得自我纠错能力。实验显示该方法显著提升了AI的安全性和实用性，用1000个样本达到了传统方法15000个样本的效果，为AI安全训练开辟了新方向。

清华大学联合多校推出REMA：像X光一样透视AI大脑的推理过程，发现AI犯错的秘密

人工智能

几何分析

推理解释

2025-10-21

清华大学联合多校推出REMA：像X光一样透视AI大脑的推理过程，发现AI犯错的秘密

清华大学联合多校团队开发REMA框架，首次实现AI推理过程的几何可视化。通过"推理流形"概念，该框架能够像X光机一样透视AI内部思维过程，精确定位推理错误的起始点。实验覆盖多种模型和任务，发现正确推理遵循低维几何结构，错误推理则表现为明显的几何偏离，为AI可解释性和安全性提供新工具。

上海AI实验室团队首创视频驱动交互网页重建基准：让AI看视频就能写出完整网站代码

人工智能

交互式网页重建

视频理解技术

2025-10-21

上海AI实验室团队首创视频驱动交互网页重建基准：让AI看视频就能写出完整网站代码

上海AI实验室团队首创视频驱动的交互网页重建评测基准IWR-Bench，挑战AI从用户操作视频中理解并重建完整交互网页。测试28个顶级AI模型发现，最强的GPT-5综合得分仅36.35%，虽然视觉重现能力达64%，但交互功能实现仅24%，揭示了AI在动态逻辑理解方面的根本性不足，为未来研究指明方向。

东北大学团队突破人类移动预测难题：让AI像人类一样理解出行规律

人工智能

移动预测

大型语言模型

2025-10-21

东北大学团队突破人类移动预测难题：让AI像人类一样理解出行规律

这项研究提出了RHYTHM框架，通过时间令牌化将移动轨迹按日分段，结合层次化注意力机制捕捉多尺度时间依赖关系。系统采用冷冻的大型语言模型作为推理引擎，融入丰富的语义信息来理解移动模式。实验显示整体准确率提升2.4%，周末预测准确率提升5.0%，训练时间减少24.6%，在资源效率和预测性能间实现良好平衡。

中航大学研究团队揭秘：AI聊天机器人的"假身份证"攻击如何骗过智能助手

人工智能

提示注入攻击

AI安全防护

2025-10-21

中航大学研究团队揭秘：AI聊天机器人的"假身份证"攻击如何骗过智能助手

中航大学研究团队发现了一种名为ChatInject的新型AI攻击方式，能够通过伪造AI系统内部通信格式来欺骗智能助手执行恶意操作。研究显示这种攻击的成功率比传统方法高出数倍，甚至能够跨模型传播，对包括GPT-4o、Grok-3在内的九个主流AI系统都有效。更令人担忧的是，现有的安全防护措施对此类攻击基本无效，揭示了当前AI助手系统存在的严重安全漏洞。

马里兰大学携手英特尔实验室：用AI给视频字幕打分，彻底改变视频评估游戏规则

人工智能

视频理解

评估算法

2025-10-21

马里兰大学携手英特尔实验室：用AI给视频字幕打分，彻底改变视频评估游戏规则

马里兰大学与英特尔实验室联合开发VC-Inspector系统，革命性地解决了视频描述评估难题。该系统无需标准答案即可准确评判视频描述质量，通过事实核查识别物体动作错误，提供1-5分评分及详细解释。在标准数据集测试中超越现有方法，为内容创作、教育技术、视频搜索等领域提供强大工具。

东南大学团队突破大模型对齐瓶颈：让AI智能学会什么时候说"不"的全新训练法

人工智能

偏好优化

元学习

2025-10-21

东南大学团队突破大模型对齐瓶颈：让AI智能学会什么时候说"不"的全新训练法

东南大学团队提出MetaAPO方法，通过引入智能元学习器动态平衡AI训练中的离线数据与在线数据使用，解决了传统对齐方法效率低下的问题。该方法在三个标准测试中表现优异，在减少42%数据标注成本的同时显著提升了模型性能，为AI训练提供了全新的"学会学习"思路。

1
2
...
15
16
17
...
306
307

白皮书

更多

数字化转型方略

更多

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

PEC 2025 AI创新者大会

用AI，在数字身份验证风暴中心重构信任坐标

- 关注官方公众号
- 关注官方微博
- 关注官方喜马拉雅

友情链接

北京第二十六维信息技术有限公司（至顶网）版权所有. 京ICP备15039648号-7 京ICP证161336号京公网安备 11010802021500号

举报电话：010-62641205-5060　涉未成年人举报专线：010-62641208 举报邮箱：jubao@zhiding.cn

网上有害信息举报专区：https://www.12377.cn

安全联盟认证