亚马逊研究团队发现大型推理模型存在严重的"推理分心"安全漏洞:攻击者通过在输入中嵌入复杂干扰任务,可让顶级AI系统准确率下降60%。研究揭示了三种攻击模式,发现强化学习训练反而会增加脆弱性,并提出了有效的防御训练方法,为构建更安全可靠的AI系统提供了重要指导。
Salesforce AI Research开发了EDR企业深度研究系统,这是一个可操控的多智能体AI框架,能像专业分析师团队一样处理复杂企业研究任务。系统包含主规划智能体、四个专业搜索智能体、企业工具生态和反思机制,支持实时人工指导。在多个基准测试中表现卓越,同时提供完整的研究轨迹数据集,为企业AI研究应用树立新标准。
苹果公司和香港大学联合研究团队开发了UltraCUA系统,这是首个能够同时使用GUI操作和程序工具的混合行动AI。该系统通过自动化工具收集、合成数据生成和两阶段训练,在OSWorld基准测试中实现了41%的成功率,比传统方法提高22%,步骤数减少11%,为电脑操作AI开辟了新方向。
Meta Codec Avatars实验室发布了Embody 3D,这是迄今最大规模的3D人体动作数据集,包含500小时个人动作数据和超过5400万帧记录。该数据集覆盖七大类动作场景,从基础动作到复杂多人互动,使用80台高精度摄像机和640通道音频系统收集。与现有数据集相比,它首次同时提供了大规模、高质量3D追踪、完整身体形状、手部追踪、音频和文本标注,为虚拟人技术、机器人学和人机交互研究提供了前所未有的综合资源。
Gartner预测,到2029年,超过50%的企业将采用数字主权策略,以确保对数据和关键系统的国家控制。主权云将在这些策略中发挥关键作用,使企业能够在确保合规性的同时实现系统"云化"。企业正在采用私有云、主权云和本地数据中心等多种云私有化模式,主要驱动因素包括业务一致性、IT资源、成本和性能考量。
这款16英寸便携显示器采用分离式设计,包含显示屏和磁吸式支架,均由阳极氧化铝制成。支架采用双铰链设计,支持360度旋转调节,收纳时厚度仅约1.3厘米。FlipAction Pro Gen 1配备2560×1600分辨率、60Hz刷新率、350尼特亮度和100% DCI-P3色域。无需外接电源,可直接从设备取电。适合与iPad配合提升多任务处理效率,或作为Mac的垂直副屏使用。
中兴通讯首席发展官崔丽在经济学人影响力AI创新亚洲2025峰会上分享了智能体AI战略愿景。她强调组织应从机械化向有机化转型,在不确定性中寻求稳定,保持敏捷适应变化。数字化和智能化转型需要长期投资,AI建立在数字和网络基础之上。在关键环节需要人机协同,大模型存在固有风险,而人类具备社会智能和道德判断。智能体AI正在重塑人才战略,未来最重要的三类人才是AI专家、AI高级用户和超越AI的高阶思维人才。
Snowflake与Anthropic宣布建立合作伙伴关系,将在Snowflake的数据治理环境中部署能够执行复杂多步骤分析的AI代理。该合作使金融和医疗等严格监管行业的客户能够部署代理,并从企业Snowflake实例中获取答案,在复杂的文本转SQL任务上准确率超过90%。服务将通过Amazon Bedrock、Google Cloud Vertex AI和Microsoft Azure向超过12600名Snowflake客户提供。
AI研究公司Anthropic宣布与云数据公司Snowflake扩大合作伙伴关系,签署价值2亿美元的多年AI协议。此次合作将把Anthropic的大语言模型引入Snowflake平台,服务其庞大客户群。Claude Sonnet 4.5将为Snowflake Intelligence企业AI服务提供支持,客户可使用Claude模型进行多模态数据分析并构建定制AI代理。
Meta宣布推出全新的Facebook和Instagram统一支持中心,承认此前的支持选项未能满足用户期望。该中心提供账户问题报告、账户恢复以及AI搜索和助手等工具。新的AI助手将为账户恢复、个人资料管理和设置更新提供个性化帮助。Meta声称AI系统帮助全球Facebook和Instagram账户被黑事件减少超过30%,并加快申诉处理速度,但仍有大量用户因系统错误失去账户访问权限。
英特尔公司周三宣布取消出售其价值数十亿美元的NEX网络芯片业务的计划。该公司在经过全面战略评估后认为,NEX业务在英特尔内部发展更有优势。NEX去年营收58亿美元,营业收入9.31亿美元,主要为数据中心、边缘和消费市场提供网络硬件。保留NEX有助于英特尔在AI、数据中心和边缘领域加强硅片、软件和系统的整合。
Anthropic CEO达里奥·阿莫代在纽约时报峰会上表示,AI行业存在复杂的泡沫风险情况。他看好AI技术潜力,但警告某些公司可能出现"时机错误"或经济回报方面的"坏事"。阿莫代指出,AI经济价值增长时机的不确定性以及数据中心建设滞后是主要问题。他批评部分竞争对手采取"YOLO"式冒险策略,暗指OpenAI。Anthropic收入三年增长10倍,但他强调要保守规划,避免过度投资风险。
Meta计划明年裁减30%的Reality Labs团队,标志着元宇宙热潮的终结。疫情本应为虚拟现实技术提供黄金机遇,但Meta时机把握失当,产品推出过晚。公司战略摇摆不定,频繁转向,从游戏、健身到教育培训都浅尝辄止。许多企业盲目跟风建设虚拟世界,却无法回答用户为何要访问的根本问题。尽管失败,元宇宙概念仍有潜力,AI驱动的个性化体验或许能重新点燃市场兴趣。
Runway发布代号"Whisper Thunder"的4.5版本AI视频生成模型,展现出强大的视频生成能力。该模型能够创建高质量的人物和动物奔跑、形态变换等复杂场景视频,在文本转视频排行榜上表现卓越。新模型支持多种风格控制,包括写实、动画和电影风格,具备快速生成、无水印等特点。Runway作为AI视频领域的黑马公司,获得了英伟达等知名投资方支持,其CEO表示希望防止AI技术被少数公司垄断。
re:Invent第三天披露了更多AWS Trainium 3与Amazon EC2 Trn3 UltraServers的技术细节,并且新一代AWS Graviton5也如期而至。
印度学者在卫星图像识别领域取得突破,设计出无需预训练的神经网络架构,在EuroSAT数据集上达到97.23%准确率。通过三轮迭代优化,研究者发现卫星图像需要平衡空间和光谱两种特征,创新性地开发了可学习融合参数的双路径注意力机制。该方法证明了专用架构设计在特定领域的巨大潜力,为无法获得大规模预训练数据的应用场景提供了有效解决方案。
UC伯克利研究团队开发了ECHO框架,通过分析社交媒体上真实用户对GPT-4o图像生成的使用反馈,构建了更贴近实际需求的AI评测体系。该框架收集了超过31000个用户提示词,发现传统评测无法覆盖的复杂任务需求,并识别出用户关心的色彩偏移、身份保持等具体问题,为AI模型评估提供了全新的用户导向思路。
中科院团队开发Wiki-PRF技术,让AI具备"侦探式"查资料能力,能看图回答需要专业知识的复杂问题。该系统采用处理-检索-筛选三步法,配备描述、定位、翻转等工具,通过强化学习训练提升推理能力。在E-VQA和InfoSeek测试中分别达到36.0%和42.8%准确率,刷新最好成绩,为智能问答和知识获取开辟新路径。
Salesforce AI Research团队开发的FARE评估模型,通过250万样本的大规模训练,实现了对AI生成内容的精准评估。该模型涵盖五种评估任务和多个应用领域,在推理评估、步骤级错误识别等方面表现出色,为AI质量控制提供了可靠工具,将显著提升未来AI服务的准确性和可信度。
杜克大学和Adobe研究团队开发了AsyncVoice Agent系统,实现了AI推理过程的实时语音解释和用户随时中断功能。该系统采用异步架构分离推理后端和语音前端,响应延迟仅15毫秒,比传统方法快600-1800倍,同时保持竞争性的推理质量。测试显示系统在数学求解、旅行规划等任务中表现优异,为人机协作开辟了新的交互范式。