人工智能 关键字列表
大型推理模型的"注意力劫持"危机——亚马逊研究团队揭示AI推理过程的致命弱点

大型推理模型的"注意力劫持"危机——亚马逊研究团队揭示AI推理过程的致命弱点

亚马逊研究团队发现大型推理模型存在严重的"推理分心"安全漏洞:攻击者通过在输入中嵌入复杂干扰任务,可让顶级AI系统准确率下降60%。研究揭示了三种攻击模式,发现强化学习训练反而会增加脆弱性,并提出了有效的防御训练方法,为构建更安全可靠的AI系统提供了重要指导。

Salesforce发布EDR:让AI智能体像专业分析师一样做企业深度研究

Salesforce发布EDR:让AI智能体像专业分析师一样做企业深度研究

Salesforce AI Research开发了EDR企业深度研究系统,这是一个可操控的多智能体AI框架,能像专业分析师团队一样处理复杂企业研究任务。系统包含主规划智能体、四个专业搜索智能体、企业工具生态和反思机制,支持实时人工指导。在多个基准测试中表现卓越,同时提供完整的研究轨迹数据集,为企业AI研究应用树立新标准。

苹果AI研究院惊人突破:让电脑代理人既能点击又能编程的混合行动技术

苹果AI研究院惊人突破:让电脑代理人既能点击又能编程的混合行动技术

苹果公司和香港大学联合研究团队开发了UltraCUA系统,这是首个能够同时使用GUI操作和程序工具的混合行动AI。该系统通过自动化工具收集、合成数据生成和两阶段训练,在OSWorld基准测试中实现了41%的成功率,比传统方法提高22%,步骤数减少11%,为电脑操作AI开辟了新方向。

中兴通讯首席发展官崔丽在《经济学人》AI亚洲创新峰会分享智能体AI战略

中兴通讯首席发展官崔丽在《经济学人》AI亚洲创新峰会分享智能体AI战略

中兴通讯首席发展官崔丽在经济学人影响力AI创新亚洲2025峰会上分享了智能体AI战略愿景。她强调组织应从机械化向有机化转型,在不确定性中寻求稳定,保持敏捷适应变化。数字化和智能化转型需要长期投资,AI建立在数字和网络基础之上。在关键环节需要人机协同,大模型存在固有风险,而人类具备社会智能和道德判断。智能体AI正在重塑人才战略,未来最重要的三类人才是AI专家、AI高级用户和超越AI的高阶思维人才。

Snowflake携手Anthropic推进智能体AI战略部署

Snowflake携手Anthropic推进智能体AI战略部署

Snowflake与Anthropic宣布建立合作伙伴关系,将在Snowflake的数据治理环境中部署能够执行复杂多步骤分析的AI代理。该合作使金融和医疗等严格监管行业的客户能够部署代理,并从企业Snowflake实例中获取答案,在复杂的文本转SQL任务上准确率超过90%。服务将通过Amazon Bedrock、Google Cloud Vertex AI和Microsoft Azure向超过12600名Snowflake客户提供。

Anthropic与Snowflake签署2亿美元合作协议,将大语言模型引入企业客户

Anthropic与Snowflake签署2亿美元合作协议,将大语言模型引入企业客户

AI研究公司Anthropic宣布与云数据公司Snowflake扩大合作伙伴关系,签署价值2亿美元的多年AI协议。此次合作将把Anthropic的大语言模型引入Snowflake平台,服务其庞大客户群。Claude Sonnet 4.5将为Snowflake Intelligence企业AI服务提供支持,客户可使用Claude模型进行多模态数据分析并构建定制AI代理。

Meta推出Facebook和Instagram统一客服中心测试AI客服助手

Meta推出Facebook和Instagram统一客服中心测试AI客服助手

Meta宣布推出全新的Facebook和Instagram统一支持中心,承认此前的支持选项未能满足用户期望。该中心提供账户问题报告、账户恢复以及AI搜索和助手等工具。新的AI助手将为账户恢复、个人资料管理和设置更新提供个性化帮助。Meta声称AI系统帮助全球Facebook和Instagram账户被黑事件减少超过30%,并加快申诉处理速度,但仍有大量用户因系统错误失去账户访问权限。

英特尔取消网络芯片业务NEX分拆计划

英特尔取消网络芯片业务NEX分拆计划

英特尔公司周三宣布取消出售其价值数十亿美元的NEX网络芯片业务的计划。该公司在经过全面战略评估后认为,NEX业务在英特尔内部发展更有优势。NEX去年营收58亿美元,营业收入9.31亿美元,主要为数据中心、边缘和消费市场提供网络硬件。保留NEX有助于英特尔在AI、数据中心和边缘领域加强硅片、软件和系统的整合。

Anthropic CEO评估AI行业泡沫风险和竞争对手激进策略

Anthropic CEO评估AI行业泡沫风险和竞争对手激进策略

Anthropic CEO达里奥·阿莫代在纽约时报峰会上表示,AI行业存在复杂的泡沫风险情况。他看好AI技术潜力,但警告某些公司可能出现"时机错误"或经济回报方面的"坏事"。阿莫代指出,AI经济价值增长时机的不确定性以及数据中心建设滞后是主要问题。他批评部分竞争对手采取"YOLO"式冒险策略,暗指OpenAI。Anthropic收入三年增长10倍,但他强调要保守规划,避免过度投资风险。

元宇宙的挽歌:Meta错失的机遇

元宇宙的挽歌:Meta错失的机遇

Meta计划明年裁减30%的Reality Labs团队,标志着元宇宙热潮的终结。疫情本应为虚拟现实技术提供黄金机遇,但Meta时机把握失当,产品推出过晚。公司战略摇摆不定,频繁转向,从游戏、健身到教育培训都浅尝辄止。许多企业盲目跟风建设虚拟世界,却无法回答用户为何要访问的根本问题。尽管失败,元宇宙概念仍有潜力,AI驱动的个性化体验或许能重新点燃市场兴趣。

Runway 4.5:AI视频生成新王者正式登场

Runway 4.5:AI视频生成新王者正式登场

Runway发布代号"Whisper Thunder"的4.5版本AI视频生成模型,展现出强大的视频生成能力。该模型能够创建高质量的人物和动物奔跑、形态变换等复杂场景视频,在文本转视频排行榜上表现卓越。新模型支持多种风格控制,包括写实、动画和电影风格,具备快速生成、无水印等特点。Runway作为AI视频领域的黑马公司,获得了英伟达等知名投资方支持,其CEO表示希望防止AI技术被少数公司垄断。

UC伯克利团队:让AI更懂人心的秘密武器——从社交媒体学习用户真正想要什么

UC伯克利团队:让AI更懂人心的秘密武器——从社交媒体学习用户真正想要什么

UC伯克利研究团队开发了ECHO框架,通过分析社交媒体上真实用户对GPT-4o图像生成的使用反馈,构建了更贴近实际需求的AI评测体系。该框架收集了超过31000个用户提示词,发现传统评测无法覆盖的复杂任务需求,并识别出用户关心的色彩偏移、身份保持等具体问题,为AI模型评估提供了全新的用户导向思路。

中科院发布Wiki-PRF:让AI像侦探一样聪明地查资料答题

中科院发布Wiki-PRF:让AI像侦探一样聪明地查资料答题

中科院团队开发Wiki-PRF技术,让AI具备"侦探式"查资料能力,能看图回答需要专业知识的复杂问题。该系统采用处理-检索-筛选三步法,配备描述、定位、翻转等工具,通过强化学习训练提升推理能力。在E-VQA和InfoSeek测试中分别达到36.0%和42.8%准确率,刷新最好成绩,为智能问答和知识获取开辟新路径。

Salesforce再下一城:FARE评估模型让AI判断AI变得更精准可靠

Salesforce再下一城:FARE评估模型让AI判断AI变得更精准可靠

Salesforce AI Research团队开发的FARE评估模型,通过250万样本的大规模训练,实现了对AI生成内容的精准评估。该模型涵盖五种评估任务和多个应用领域,在推理评估、步骤级错误识别等方面表现出色,为AI质量控制提供了可靠工具,将显著提升未来AI服务的准确性和可信度。

大型语言模型真的有情感吗?阿联酋AI大学首次破解"情感电路"奥秘

大型语言模型真的有情感吗?阿联酋AI大学首次破解"情感电路"奥秘

阿联酋AI大学研究团队首次系统性发现并验证了大型语言模型内部的"情感电路",这些电路由特定神经元和注意力头组成,负责处理六种基本情感。研究开发了精准的情感控制技术,实现99.65%的情感表达准确率,超越传统方法。发现揭示AI情感处理机制与人类大脑相似,为开发更智能、人性化的AI系统提供科学基础,在心理健康、教育、客服等领域具有广阔应用前景。

慕尼黑大学突破:一个神奇"令牌"就能生成高质量图像

慕尼黑大学突破:一个神奇"令牌"就能生成高质量图像

慕尼黑大学研究团队提出RepTok技术,用单个"令牌"代替传统图像生成中的数千个数据点,在保持图像质量的同时将训练成本降低90%以上。该技术基于自监督学习模型的微调,既能高效重建图像又能用于文本生成图像,仅需四台GPU训练20小时就能达到竞争性能,为图像生成技术的普及和应用开辟了新路径。

南京大学全新理论框架:让AI推理更聪明更节省,准确率提升50%的秘密武器

南京大学全新理论框架:让AI推理更聪明更节省,准确率提升50%的秘密武器

南京大学研究团队首次建立AI推理完整理论框架,提出RPC新方法将计算需求减半的同时提升准确率。研究将推理错误分解为估计误差和模型误差,解决了领域长期缺乏理论指导的问题,为AI推理从经验驱动向科学方法的转变奠定基础,有望大幅降低AI服务成本并提升用户体验。

WordPress实验性AI开发工具Telex已投入实际应用

WordPress实验性AI开发工具Telex已投入实际应用

WordPress实验性AI开发工具Telex在9月发布几个月后已投入实际使用。在"State of the Word"年度活动中,WordPress联合创始人展示了Telex的多个应用案例,包括创建价格比较工具、价格计算器和实时营业时间显示等功能。该工具能够生成Gutenberg模块,让开发者在几秒内完成过去需要数千美元定制开发的功能。同时WordPress还推出了Abilities API等AI架构开发。

威廉姆斯车队与Atlassian合作:打破传统赞助模式

威廉姆斯车队与Atlassian合作:打破传统赞助模式

威廉姆斯车队与Atlassian的合作超越了传统F1赞助模式。在F1成本上限规则下,威廉姆斯必须为Atlassian软件支付全价,技术投入直接影响赛车性能预算。车队使用Jira、Confluence等平台优化团队协作,目标是在2026-2027赛季实现竞争优势。这种合作模式为企业技术投资提供了新思路:在极限约束下测试技术价值,用公开的成绩验证效果。

美光科技放弃消费级存储品牌Crucial追逐AI商机

美光科技放弃消费级存储品牌Crucial追逐AI商机

美光公司宣布将停止旗下英睿达消费级内存和存储产品线,转而专注于企业级芯片供应,特别是AI系统所需芯片。该决定源于AI驱动的数据中心需求激增,公司希望改善对大型战略客户的供应和支持。英睿达产品将持续出货至2026年2月底。受AI服务器需求推动,DRAM和NAND存储器价格近期大幅上涨,分析师预测DRAM价格可能翻倍。