人工智能 关键字列表
中国人民大学重磅突破:让AI"聪明"地用工具,不再像没头苍蝇一样瞎忙活

中国人民大学重磅突破:让AI"聪明"地用工具,不再像没头苍蝇一样瞎忙活

中国人民大学研究团队开发了Tool-Light框架,通过信息熵理论解决AI工具使用中的过度调用、调用不足和过度思考问题。该框架采用熵引导采样和两阶段自演化训练,让AI学会合理使用外部工具。在10个推理任务测试中,Tool-Light显著提升了AI的效率和准确性,为AI工具集成推理提供了新的解决方案。

新加坡国立大学开创性突破:让AI不再被"好心帮倒忙"的推理示例困扰

新加坡国立大学开创性突破:让AI不再被"好心帮倒忙"的推理示例困扰

新加坡国立大学研究团队发现现代AI推理模型存在意外困境:传统的推理示例反而会降低性能,最高降幅达35%。研究识别出两个关键问题并开发了I2S解决方案,通过将示例转化为抽象指导而非具体模仿,在多个模型上实现显著提升。该方法轻量级、免训练,为AI推理能力优化开辟新思路。

埃默里大学团队首创AceSearcher:让小体量AI模型也能像侦探一样精准推理

埃默里大学团队首创AceSearcher:让小体量AI模型也能像侦探一样精准推理

埃默里大学团队发布AceSearcher框架,通过让单一AI模型扮演分析师和调查员双重角色,实现复杂问题的系统性分解和推理。该技术在多跳问答等任务上平均提升7.6%准确率,15亿参数的小模型即可媲美数百亿参数大模型,显著提升参数效率,为AI推理能力发展提供了新的技术路径。

腾讯混元团队发布史上最强开源图像生成AI:一个模型既能看懂图片又能生成图片

腾讯混元团队发布史上最强开源图像生成AI:一个模型既能看懂图片又能生成图片

腾讯混元团队发布HunyuanImage 3.0,这是全球首个统一图像理解与生成的原生多模态开源模型。该模型基于800亿参数架构,在推理时激活130亿参数,具备思维链推理能力,在文本-图像对齐和视觉质量评估中达到业界领先水平,成为目前最强大的开源图像生成模型,为AI图像生成领域带来重大突破。

GUI智能体重获新生:北京理工大学团队让AI在电脑上的操作效率狂飙5倍

GUI智能体重获新生:北京理工大学团队让AI在电脑上的操作效率狂飙5倍

北京理工大学团队提出DART框架,通过去耦合训练和自适应数据管理策略大幅提升GUI智能体训练效率。DART-GUI-7B在OSWorld测试中达到42.13%成功率,比基础模型提高14.61%,训练吞吐量提升1.9倍,环境利用率提升5.5倍。该方法解决了传统GUI智能体训练中的效率瓶颈和数据质量问题,为AI自动化电脑操作技术发展奠定重要基础。

中山大学重新定义视频理解:让AI像人一样"放大镜观看"长视频

中山大学重新定义视频理解:让AI像人一样"放大镜观看"长视频

中山大学研究团队开发出LOVE-R1视频理解模型,通过模仿人类"先粗后细、重点观察"的认知方式,让AI能够智能地在长视频中定位关键片段进行高分辨率分析。该模型采用快慢结合的处理策略和三阶段训练方案,在四个长视频理解基准上平均提升3.1个百分点,为解决长视频理解中的时空信息平衡难题提供了新思路。

超越扩散模型的新突破:DP Technology让AI图像生成迎来全新变革

超越扩散模型的新突破:DP Technology让AI图像生成迎来全新变革

这项由DP Technology和北京大学联合完成的研究提出了SphereAR方法,通过超球面约束解决连续标记自回归图像生成中的方差崩溃问题。该方法将所有输入输出限制在固定半径球面上,实现尺度不变性,在ImageNet数据集上创下自回归模型新纪录,SphereAR-H达到1.34 FID分数,首次让纯自回归方法在同等参数规模下超越扩散和遮蔽生成模型。

人工智能与人类协作的新境界:北京传媒大学和微软团队破解云端智能压缩难题

人工智能与人类协作的新境界:北京传媒大学和微软团队破解云端智能压缩难题

这项由中国传媒大学和微软联合开展的研究提出了UniMIC框架,创新性地采用令牌化技术解决人机协作中的通信效率问题。该技术将多媒体数据转换为紧凑令牌进行传输,避免了传统方法的累积损失,在文本生成图像、图像编辑等任务中实现60-80%的带宽节省,同时保持近乎无损的质量,为未来AI原生通信协议奠定了基础。

NVIDIA突破4位浮点训练瓶颈:让大模型训练速度翻倍的NVFP4技术

NVIDIA突破4位浮点训练瓶颈:让大模型训练速度翻倍的NVFP4技术

NVIDIA团队成功实现了4位浮点精度(NVFP4)的大语言模型训练突破,通过创新的双级缩放、随机哈达玛变换、二维块缩放和随机舍入技术,在120亿参数模型上完成了史上最长的4位精度训练实验。相比传统方法,NVFP4将训练速度提升2-3倍,内存使用减半,同时保持了与8位精度相当的模型性能,为大模型训练的效率优化开辟了新路径。

腾讯和武汉大学研发的"思维型AI智能体":会思考、会推理、像人类一样学习游戏

腾讯和武汉大学研发的"思维型AI智能体":会思考、会推理、像人类一样学习游戏

这项由腾讯与武汉大学合作的研究开发了一种革命性的AI智能体CEL,它能像人类一样从零开始学习游戏规则并制定策略。与传统需要大量数据训练的"黑箱"AI不同,CEL通过观察、思考和反思的方式自主学习,整个决策过程完全透明。在扫雷、冰湖导航和推箱子三种游戏测试中,CEL都表现出色,甚至超越了预先知道规则的传统AI。这种"会思考的AI"为未来可解释人工智能的发展指明了新方向。

可穿戴设备、AI与个人医疗数字化身的融合趋势

可穿戴设备、AI与个人医疗数字化身的融合趋势

随着大语言模型在人工智能时代展现强大力量,可穿戴设备成为收集人体数据的重要载体。通过实时监测血压、心率、血糖等生命体征,结合AI边缘计算能力,医疗正向个性化转型。基因治疗、数字孪生技术让每个人都能拥有专属的医疗数字化身,实现从"报销型医疗"向"创新循证医疗"的转变,为疾病预防和健康管理带来革命性突破。

OpenAI寻求"谷歌Chrome"时刻:推出Atlas网页浏览器

OpenAI寻求"谷歌Chrome"时刻:推出Atlas网页浏览器

OpenAI发布Atlas浏览器,旨在将ChatGPT深度集成到网页浏览体验中。该浏览器支持用户与网页对话,提供侧边聊天功能,可直接在Gmail等应用中编辑文本。Agent模式允许AI代理自动执行跨网站任务,如将食谱配料添加到购物车。目前支持macOS下载,Windows和移动版本即将推出。

软件推动AI帕累托前沿超越硬件

软件推动AI帕累托前沿超越硬件

英伟达CEO黄仁勋在GTC 2025大会上展示了AI推理吞吐量与响应时间之间的帕累托前沿曲线。数据显示,从Hopper H200到Blackwell B200系统,通过硬件升级和软件优化,性能提升达25倍。值得注意的是,在AI领域,硬件性能提升约2倍,而软件优化可带来额外5倍提升。英伟达在数周内通过软件优化实现了过去需要两年才能达到的5倍性能提升,证明软件在AI性能提升中发挥着更关键的作用。

AWS与e&联合推出AI和云计算培训项目,培养阿联酋未来就绪人才

AWS与e&联合推出AI和云计算培训项目,培养阿联酋未来就绪人才

亚马逊云科技AWS与科技集团e&联合推出"AI Nation - Afaaq"全国培训项目,计划通过e& Academy平台为3万名学员提供人工智能和机器学习技术培训。该项目是双方10亿美元战略联盟的重要组成部分,旨在解决阿联酋AI技能短缺问题。项目将提供3万张AWS认证代金券,学员可免费使用AWS技能构建平台和云教练辅导服务,支持阿联酋2071百年计划的数字化转型目标。

NotebookLM即将推出幻灯片功能,或成职场办公必备AI工具

NotebookLM即将推出幻灯片功能,或成职场办公必备AI工具

NotebookLM原本主要面向学生用户,但即将推出的幻灯片制作功能可能让其成为职场演示的强大工具。该AI工具基于Gemini技术,能够根据用户上传的文档、网站、视频等资料生成内容。最新发现的未发布功能显示,用户将能够基于上传资源快速创建幻灯片,并结合集成的图像生成器进行定制。此外还可能推出信息图表生成功能,帮助用户将数据可视化。

三星将发布Vision Pro竞品,揭示四大关键信息

三星将发布Vision Pro竞品,揭示四大关键信息

三星今日正式发布其混合现实头显设备,该产品被视为苹果Vision Pro的直接竞争对手。据此前体验报告显示,该设备在整体性能上与Vision Pro相当,但其内置的AI功能成为最大亮点。设备搭载多模态Gemini AI,能够实时识别用户视野中的内容并提供相应回答,这是Vision Pro目前缺乏的功能。发布会将揭示设备正式名称、最终功能配置、上市时间和定价策略等关键信息。

戴尔科技在中东地区推进AI和数字化转型

戴尔科技在中东地区推进AI和数字化转型

戴尔科技在迪拜Gitex Global 2025展会上展示其在中东地区的影响力,重点展现其在推动公私部门AI和数字化转型方面的作用。公司专注于AI数据解决方案、多云架构、信息安全、数字化工作场所创新和边缘计算。戴尔与阿联酋Emcode Technology签署合作备忘录,将在执法、医疗和政府部门开展AI驱动的培训和咨询服务,助力实现真正的业务转型。

多模态AI初创公司Fal.ai完成新一轮融资 估值超40亿美元

多模态AI初创公司Fal.ai完成新一轮融资 估值超40亿美元

多模态AI基础设施公司Fal.ai完成新一轮融资,估值超过40亿美元,融资金额约2.5亿美元。此轮融资由凯鹏华盈和红杉资本领投。该公司为开发者提供图像、视频和音频AI模型托管服务,拥有超过600个模型和数千块英伟达H100、H200 GPU。客户包括Adobe、Canva等知名企业,主要应用于广告、电商和游戏内容创作。

哥伦比亚大学揭秘AI数学能力新测试法:用"频率指纹"看透AI的数学思维盲点

哥伦比亚大学揭秘AI数学能力新测试法:用"频率指纹"看透AI的数学思维盲点

哥伦比亚大学研究团队开发了MathBode动态诊断工具,通过让数学题参数按正弦波变化来测试AI的动态推理能力。研究发现传统静态测试掩盖了AI的重要缺陷:几乎所有模型都表现出低通滤波特征和相位滞后现象,即在处理快速变化时会出现失真和延迟。该方法覆盖五个数学家族的测试,为AI模型选择和部署提供了新的评估维度。

港中文(深圳)发布新突破:让AI推理模型学会"自我纠错",告别思维雪球效应

港中文(深圳)发布新突破:让AI推理模型学会"自我纠错",告别思维雪球效应

这项研究首次发现AI推理模型存在"雪球效应"问题——推理过程中的小错误会逐步放大,导致AI要么给出危险回答,要么过度拒绝正常请求。研究团队提出AdvChain方法,通过训练AI学习"错误-纠正"过程来获得自我纠错能力。实验显示该方法显著提升了AI的安全性和实用性,用1000个样本达到了传统方法15000个样本的效果,为AI安全训练开辟了新方向。