最新文章第44页

2025-11-21

联想基础设施业务增势强劲盈利基础稳固第二财季营收近300亿元

“联想集团基础设施业务第二财季营收近300亿元，同比增长24%。

人工智能

适配器融合

商业化模式

2025-11-21

滑铁卢大学破解AI付费难题：LOCKET让大模型"按需付费"成为现实

滑铁卢大学研究团队开发出LOCKET技术，解决AI服务"按需付费"的商业化难题。该技术通过创新的"适配器融合"方式替代易泄露的密码验证，实现100%有效拒绝未授权功能，同时保持已授权功能性能损失不超过7%。面对恶意攻击的成功率控制在5%以下，为AI服务提供商提供了可行的精细化定价解决方案。

人工智能

扩散模型

音频字幕生成

2025-11-21

KAIST团队创造"音频-文字翻译器"：让AI更聪明地理解声音世界

KAIST研究团队开发出Diffusion-Link技术，通过扩散模型解决AI系统中音频与文字信息的"沟通障碍"。该技术采用轻量级设计，无需外部知识即可将音频特征转换为文字特征，在音频字幕生成任务上取得突破性成果，零样本性能提升52.5%，为多模态AI系统发展开辟新路径。

2025-11-21

枫清科技与麒麟软件达成战略合作，国产AI一体机亮相京津冀信创大会

11月21日，2025京津冀信创产业集群对接交流活动在天津举办。

人工智能

并行解码

推理框架

2025-11-21

蚂蚁集团突破性发布dInfer：让AI写作比人类打字还快的神奇技术

蚂蚁集团联合多所顶尖高校发布dInfer，这是首个高效扩散语言模型推理框架。该技术突破传统AI逐字生成限制，采用并行生成方式，速度比现有系统快10倍，比传统模型快2-3倍。通过模块化设计、创新解码策略和系统优化，在保持生成质量的同时大幅提升推理效率，为AI写作、代码生成等应用带来质的飞跃。

人工智能

多模态处理

信息检索

2025-11-21

香港大学推出RAG-Anything：让AI也能"过目不忘"地处理图文混合文档

香港大学研究团队开发的RAG-Anything框架解决了AI系统无法有效处理图文混合文档的关键问题。该系统通过双图谱构建技术，将文字、图像、表格、公式等不同模态信息统一整合，采用混合检索机制实现精准信息定位。实验显示，在处理长文档时性能优势明显，为学术研究、商业分析、医疗诊断等领域提供了强大的多模态信息处理能力，标志着AI助手向全能化方向的重要进步。

人工智能

检索增强技术

智能体系统

2025-11-21

人工智能可以模拟现实吗？AWS推出能"想象"未来的R-WoM智能体验

这项研究开发了R-WoM系统，让AI能够结合外部教程进行未来场景模拟，解决了传统AI在长期规划中容易出错的问题。测试显示该系统在复杂计算机操作任务中的性能提升达到7.2%-25.3%，特别在多步骤操作中表现突出，为智能AI助手的发展开辟了新路径。

算力

第七届中国超级算力大会

榜单

2025-11-21

一张“慢”榜单与一场“快”战争：中国算力排行榜的变与不变

在这样一个节点，一张“慢”的榜单，其发布的意义何在？

深度研究AI

AI安全评估

新型攻击策略

2025-11-21

慕尼黑大学重磅发现：AI研究助手可能成为危险信息的"隐形传播者"

慕尼黑大学联合多所知名院校的研究团队发现，AI深度研究助手虽然能力强大，但存在严重安全漏洞。通过"计划注入"和"意图劫持"两种新攻击方法，这些AI助手可能绕过安全防护，生成比普通AI更详细、更危险的有害内容。研究测试了六款主流AI模型，发现在医学等敏感领域风险尤其突出。团队开发了新的安全评估框架并提出多层防护建议。

让大模型安全防护失效的"黑科技"袋子：牛津大学团队揭露AI推理安全系统的致命弱点

人工智能

AI安全

推理模型

2025-11-21

让大模型安全防护失效的"黑科技"袋子：牛津大学团队揭露AI推理安全系统的致命弱点

牛津大学研究团队发现了针对AI推理安全系统的四种"黑科技"攻击方法，能以超过90%的成功率让最先进的安全防护失效。这些方法利用AI对话模板的结构性缺陷，从简单的符号插入到复杂的推理劫持，门槛极低但威力巨大。研究揭示了当前AI安全架构的根本性问题，特别是在开源AI时代，这些漏洞的影响范围前所未有。

人工智能

图像水印

内容溯源

2025-11-21

Google DeepMind首次公开揭秘SynthID-Image：互联网级别AI图像水印系统的实战部署经验

Google DeepMind团队公开了SynthID-Image系统的完整技术细节和部署经验。该系统已为超过100亿张AI图像添加不可见水印，实现互联网规模的内容溯源。研究详细阐述了水印技术的核心原理、质量保持方法、鲁棒性设计和安全防护策略，并分享了从实验室技术转向大规模实际部署的宝贵经验，为AI内容溯源技术的产业化应用提供重要参考。

人工智能

扩散模型

优化算法

2025-11-21

KAIST团队破解AI绘画难题：让机器不再"跑偏"的神奇时间魔法

KAIST团队提出TAG（时间对齐引导）技术，解决扩散模型在接受外部指导时容易偏离正轨的问题。通过训练时间预测器判断样本时间状态，TAG能主动将偏差样本拉回正确轨道，显著提升生成质量。实验显示该方法在图像生成、音频处理、分子设计等多领域均有显著改进，为AI生成技术的实用化提供重要突破。

北卡罗来纳大学教堂山分校突破性AI研究：让计算机从一次游戏体验中学会整个虚拟世界的运行规律

符号世界建模

概率推理

快速学习

2025-11-21

北卡罗来纳大学教堂山分校突破性AI研究：让计算机从一次游戏体验中学会整个虚拟世界的运行规律

这项由北卡罗来纳大学教堂山分校完成的研究提出了ONELIFE框架，让AI仅通过一次无引导的游戏探索就能学会复杂虚拟世界的运行规律。系统将世界理解为可编程法则的组合，通过法则合成器和推理算法自动发现并评估这些规律。在Crafter-OO环境的23个测试场景中，ONELIFE在16个场景超越现有方法，并成功用于实际决策规划，为开发快速适应新环境的自主AI系统奠定了基础。

人工智能

反知识蒸馏

推理轨迹重构

2025-11-21

西安交大与微软联手：破解AI推理偷学难题的巧妙伪装术

西安交大与微软联合提出PART方法，巧妙解决AI推理过程展示与知识产权保护的矛盾。通过移除自言自语行为和重排推理结构，该方法在保持人类可读性的同时有效阻止模型蒸馏，使偷学模型性能下降6-13%，为AI行业提供了创新的技术保护方案。

人工智能

推理模型

可信度评估

2025-11-21

加州大学圣地亚哥分校突破性研究：让AI推理像人类一样可信赖

加州大学圣地亚哥分校研究团队提出ReFIne框架，专门解决大型AI推理模型的信任危机。该框架通过两阶段训练让AI学会结构化推理、诚实展示信息来源并准确评估置信度。实验显示可解释性提升44%、忠实性提升18.8%、可靠性提升42.4%，同时保持原有性能。这项研究为构建可信AI系统建立了新标准，对未来AI在医疗、金融等关键领域的应用具有重要意义。

多模态AI能否像人类一样判断用户界面设计？来自加州大学伯克利分校和Adobe研究院的突破性研究

人工智能

多模态大语言模型

用户界面设计

2025-11-21

多模态AI能否像人类一样判断用户界面设计？来自加州大学伯克利分校和Adobe研究院的突破性研究

这项由加州大学伯克利分校和Adobe研究院联合开展的研究，首次系统性地评估了多模态大语言模型在用户界面设计评判方面的能力。研究通过对比GPT-4o、Claude和Llama三个AI模型与500名人类评估者的判断，发现AI在绝对评分任务中能达到75%以上的±1准确率，在界面差异明显的配对比较中准确率可超过90%，但在细微差别判断和情感维度评估上仍存在不足，适合作为设计早期阶段的辅助工具。

人工智能

张量逻辑

神经符号融合

2025-11-21

华盛顿大学推出Tensor Logic：AI界的"通用语言"终于现身了？

华盛顿大学的佩德罗·多明戈斯教授提出了张量逻辑这一革命性的AI编程语言概念。该研究发现神经网络的张量运算与符号推理的逻辑规则在数学上等价，只需一种构造——张量方程——就能统一表示所有AI方法。张量逻辑能够在嵌入空间中进行可靠推理，通过温度参数控制从严格逻辑推导到类比推理的连续过渡，有望解决大型语言模型的幻觉问题，为AI发展提供更透明可靠的基础工具。

人工智能

多模态学习

缩放定律

2025-11-21

阿里巴巴DAMO院揭秘：为什么AI模型会说话就能做好图片搜索？

阿里巴巴DAMO学院最新研究发现AI模型的隐藏天赋：仅通过文本训练就能显著提升图像、音频、视频处理能力。研究提出语言中心的全模态嵌入学习框架，使用21倍更少的数据创造多项国际记录，并发现"生成-表示缩放定律"，为AI发展指明新方向。

2025-11-21

昆仑元AI携手AMD重磅发布GPT-Factory Mini AI工作站

AI工作站以AMD锐龙 AI MAX+ 395处理器为核心，集成昆仑元AI ”GPT-Factory”，内置多款开源大模型及自动化工具链和应用，旨在打造轻量化AI生产力实践平台，依托昆仑元AI资源优势，致力于推动AI教育等行业应用场景落地。

人工智能

图像生成

高分辨率模型

2025-11-21

Google发布Nano Banana Pro最新图像生成模型

谷歌推出升级版图像生成模型Nano Banana Pro，基于最新Gemini 3语言模型构建。新模型支持更高分辨率（2K/4K）、准确文本渲染、网络搜索功能，并提供专业级图像控制能力，包括摄像角度、场景光照、景深等。虽然质量更高但成本也相应增加，1080p图像费用为0.139美元。模型已集成到Gemini应用、NotebookLM等多个谷歌AI工具中，并通过API向开发者开放。

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: