最新文章第20页

2025-12-05

大型推理模型的"注意力劫持"危机——亚马逊研究团队揭示AI推理过程的致命弱点

亚马逊研究团队发现大型推理模型存在严重的"推理分心"安全漏洞：攻击者通过在输入中嵌入复杂干扰任务，可让顶级AI系统准确率下降60%。研究揭示了三种攻击模式，发现强化学习训练反而会增加脆弱性，并提出了有效的防御训练方法，为构建更安全可靠的AI系统提供了重要指导。

Salesforce发布EDR：让AI智能体像专业分析师一样做企业深度研究

Salesforce AI Research开发了EDR企业深度研究系统，这是一个可操控的多智能体AI框架，能像专业分析师团队一样处理复杂企业研究任务。系统包含主规划智能体、四个专业搜索智能体、企业工具生态和反思机制，支持实时人工指导。在多个基准测试中表现卓越，同时提供完整的研究轨迹数据集，为企业AI研究应用树立新标准。

苹果AI研究院惊人突破：让电脑代理人既能点击又能编程的混合行动技术

苹果公司和香港大学联合研究团队开发了UltraCUA系统，这是首个能够同时使用GUI操作和程序工具的混合行动AI。该系统通过自动化工具收集、合成数据生成和两阶段训练，在OSWorld基准测试中实现了41%的成功率，比传统方法提高22%，步骤数减少11%，为电脑操作AI开辟了新方向。

Meta发布Embody 3D：首个覆盖500小时完整人体动作的3D数据集，重新定义虚拟人运动研究

Meta Codec Avatars实验室发布了Embody 3D，这是迄今最大规模的3D人体动作数据集，包含500小时个人动作数据和超过5400万帧记录。该数据集覆盖七大类动作场景，从基础动作到复杂多人互动，使用80台高精度摄像机和640通道音频系统收集。与现有数据集相比，它首次同时提供了大规模、高质量3D追踪、完整身体形状、手部追踪、音频和文本标注，为虚拟人技术、机器人学和人机交互研究提供了前所未有的综合资源。

云计算

数据安全

主权云

2025-12-05

私有化云端：私有云和主权云的崛起

Gartner预测，到2029年，超过50%的企业将采用数字主权策略，以确保对数据和关键系统的国家控制。主权云将在这些策略中发挥关键作用，使企业能够在确保合规性的同时实现系统"云化"。企业正在采用私有云、主权云和本地数据中心等多种云私有化模式，主要驱动因素包括业务一致性、IT资源、成本和性能考量。

便携显示器

双铰链设计

外接显示器

2025-12-05

测评：Sotsu FlipAction便携显示器为何成为我iPad Pro和Mac的最佳第二屏幕

这款16英寸便携显示器采用分离式设计，包含显示屏和磁吸式支架，均由阳极氧化铝制成。支架采用双铰链设计，支持360度旋转调节，收纳时厚度仅约1.3厘米。FlipAction Pro Gen 1配备2560×1600分辨率、60Hz刷新率、350尼特亮度和100% DCI-P3色域。无需外接电源，可直接从设备取电。适合与iPad配合提升多任务处理效率，或作为Mac的垂直副屏使用。

人工智能

自然语言处理

智能化转型

2025-12-05

中兴通讯首席发展官崔丽在《经济学人》AI亚洲创新峰会分享智能体AI战略

中兴通讯首席发展官崔丽在经济学人影响力AI创新亚洲2025峰会上分享了智能体AI战略愿景。她强调组织应从机械化向有机化转型，在不确定性中寻求稳定，保持敏捷适应变化。数字化和智能化转型需要长期投资，AI建立在数字和网络基础之上。在关键环节需要人机协同，大模型存在固有风险，而人类具备社会智能和道德判断。智能体AI正在重塑人才战略，未来最重要的三类人才是AI专家、AI高级用户和超越AI的高阶思维人才。

人工智能

智能体

企业合作

2025-12-05

Snowflake携手Anthropic推进智能体AI战略部署

Snowflake与Anthropic宣布建立合作伙伴关系，将在Snowflake的数据治理环境中部署能够执行复杂多步骤分析的AI代理。该合作使金融和医疗等严格监管行业的客户能够部署代理，并从企业Snowflake实例中获取答案，在复杂的文本转SQL任务上准确率超过90%。服务将通过Amazon Bedrock、Google Cloud Vertex AI和Microsoft Azure向超过12600名Snowflake客户提供。

人工智能

大语言模型

企业合作

2025-12-05

Anthropic与Snowflake签署2亿美元合作协议，将大语言模型引入企业客户

AI研究公司Anthropic宣布与云数据公司Snowflake扩大合作伙伴关系，签署价值2亿美元的多年AI协议。此次合作将把Anthropic的大语言模型引入Snowflake平台，服务其庞大客户群。Claude Sonnet 4.5将为Snowflake Intelligence企业AI服务提供支持，客户可使用Claude模型进行多模态数据分析并构建定制AI代理。

人工智能

客户服务

系统优化

2025-12-05

Meta推出Facebook和Instagram统一客服中心测试AI客服助手

Meta宣布推出全新的Facebook和Instagram统一支持中心，承认此前的支持选项未能满足用户期望。该中心提供账户问题报告、账户恢复以及AI搜索和助手等工具。新的AI助手将为账户恢复、个人资料管理和设置更新提供个性化帮助。Meta声称AI系统帮助全球Facebook和Instagram账户被黑事件减少超过30%，并加快申诉处理速度，但仍有大量用户因系统错误失去账户访问权限。

人工智能

网络技术

业务整合

2025-12-05

英特尔取消网络芯片业务NEX分拆计划

英特尔公司周三宣布取消出售其价值数十亿美元的NEX网络芯片业务的计划。该公司在经过全面战略评估后认为，NEX业务在英特尔内部发展更有优势。NEX去年营收58亿美元，营业收入9.31亿美元，主要为数据中心、边缘和消费市场提供网络硬件。保留NEX有助于英特尔在AI、数据中心和边缘领域加强硅片、软件和系统的整合。

人工智能

大语言模型

风险管理

2025-12-05

Anthropic CEO评估AI行业泡沫风险和竞争对手激进策略

Anthropic CEO达里奥·阿莫代在纽约时报峰会上表示，AI行业存在复杂的泡沫风险情况。他看好AI技术潜力，但警告某些公司可能出现"时机错误"或经济回报方面的"坏事"。阿莫代指出，AI经济价值增长时机的不确定性以及数据中心建设滞后是主要问题。他批评部分竞争对手采取"YOLO"式冒险策略，暗指OpenAI。Anthropic收入三年增长10倍，但他强调要保守规划，避免过度投资风险。

人工智能

虚拟现实

新型平台

2025-12-05

元宇宙的挽歌：Meta错失的机遇

Meta计划明年裁减30%的Reality Labs团队，标志着元宇宙热潮的终结。疫情本应为虚拟现实技术提供黄金机遇，但Meta时机把握失当，产品推出过晚。公司战略摇摆不定，频繁转向，从游戏、健身到教育培训都浅尝辄止。许多企业盲目跟风建设虚拟世界，却无法回答用户为何要访问的根本问题。尽管失败，元宇宙概念仍有潜力，AI驱动的个性化体验或许能重新点燃市场兴趣。

人工智能

视频生成

技术突破

2025-12-05

Runway 4.5：AI视频生成新王者正式登场

Runway发布代号"Whisper Thunder"的4.5版本AI视频生成模型，展现出强大的视频生成能力。该模型能够创建高质量的人物和动物奔跑、形态变换等复杂场景视频，在文本转视频排行榜上表现卓越。新模型支持多种风格控制，包括写实、动画和电影风格，具备快速生成、无水印等特点。Runway作为AI视频领域的黑马公司，获得了英伟达等知名投资方支持，其CEO表示希望防止AI技术被少数公司垄断。

re:Invent

re:Invent2025

亚马逊云科技

2025-12-05

Trainium3+Graviton5打出组合拳，Lambda迈入可控时代

re:Invent第三天披露了更多AWS Trainium 3与Amazon EC2 Trn3 UltraServers的技术细节，并且新一代AWS Graviton5也如期而至。

计算机视觉

注意力机制

卫星图像识别

2025-12-04

印度学者创新卫星图像识别：不靠"前人经验"也能达到97%准确率的新方法

印度学者在卫星图像识别领域取得突破，设计出无需预训练的神经网络架构，在EuroSAT数据集上达到97.23%准确率。通过三轮迭代优化，研究者发现卫星图像需要平衡空间和光谱两种特征，创新性地开发了可学习融合参数的双路径注意力机制。该方法证明了专用架构设计在特定领域的巨大潜力，为无法获得大规模预训练数据的应用场景提供了有效解决方案。

人工智能

图像生成

评测体系

2025-12-04

UC伯克利团队：让AI更懂人心的秘密武器——从社交媒体学习用户真正想要什么

UC伯克利研究团队开发了ECHO框架，通过分析社交媒体上真实用户对GPT-4o图像生成的使用反馈，构建了更贴近实际需求的AI评测体系。该框架收集了超过31000个用户提示词，发现传统评测无法覆盖的复杂任务需求，并识别出用户关心的色彩偏移、身份保持等具体问题，为AI模型评估提供了全新的用户导向思路。

人工智能

强化学习

视觉问答

2025-12-04

中科院发布Wiki-PRF：让AI像侦探一样聪明地查资料答题

中科院团队开发Wiki-PRF技术，让AI具备"侦探式"查资料能力，能看图回答需要专业知识的复杂问题。该系统采用处理-检索-筛选三步法，配备描述、定位、翻转等工具，通过强化学习训练提升推理能力。在E-VQA和InfoSeek测试中分别达到36.0%和42.8%准确率，刷新最好成绩，为智能问答和知识获取开辟新路径。

人工智能

自动评估

多任务学习

2025-12-04

Salesforce再下一城：FARE评估模型让AI判断AI变得更精准可靠

Salesforce AI Research团队开发的FARE评估模型，通过250万样本的大规模训练，实现了对AI生成内容的精准评估。该模型涵盖五种评估任务和多个应用领域，在推理评估、步骤级错误识别等方面表现出色，为AI质量控制提供了可靠工具，将显著提升未来AI服务的准确性和可信度。

杜克大学和Adobe联手打造"会聊天的AI大脑"：让人工智能边思考边解释，还能被随时打断！

实时语音交互

异步智能代理

人机协作系统

2025-12-04

杜克大学和Adobe联手打造"会聊天的AI大脑"：让人工智能边思考边解释，还能被随时打断！

杜克大学和Adobe研究团队开发了AsyncVoice Agent系统，实现了AI推理过程的实时语音解释和用户随时中断功能。该系统采用异步架构分离推理后端和语音前端，响应延迟仅15毫秒，比传统方法快600-1800倍，同时保持竞争性的推理质量。测试显示系统在数学求解、旅行规划等任务中表现优异，为人机协作开辟了新的交互范式。

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: