中科院自动化所与百度联合研究提出CLEAR框架,首次解决了多模态AI在处理降质图像时生成与理解能力割裂的问题。通过行为初始化、潜在表示桥梁和交替强化学习三步策略,CLEAR让AI学会在面对模糊、噪声等问题图像时先修复再理解,在重度降质情况下性能提升8.5%,为自动驾驶、医疗影像等实际应用提供了重要技术突破。
第九届国际智能工业大会于2026年4月12日在深圳国际会展中心(宝安新馆)圆满落幕,深圳市栎新源科技有限公司受邀出席并作专题报告,围绕“检测装备国产化”与“芯片人才培养”两大战略方向,分享了面向新型工业化的智能感知与智能制造实践的理念。
谷歌联合纽约大学开展研究,推出名为Vantage的实验项目,利用生成式AI在模拟环境中评估批判性思维、协作与创造力等"未来必备技能"。研究显示,AI评分结果与人类专家评分高度吻合。该系统通过AI虚拟角色与学习者进行动态对话,实时采集技能表现数据并生成可视化反馈报告。目前,Vantage已在Google Labs向英语用户开放注册。
ServiceNow近期发布多项重磅产品更新,全面将AI嵌入其市场战略。公司推出三级AI定价体系,涵盖辅助AI、任务自动化和完整角色自动化,满足不同成熟度客户需求。新发布的Build Agent SDK允许开发者在GitHub Copilot、Cursor等惯用工具中直接构建ServiceNow应用。Context Engine引入消费级个性化体验至企业软件。此外,面向中型企业的服务管理套件可将传统六个月的部署周期压缩至约30天。
浙江大学联合蚂蚁集团等机构提出的在线标签改善方法,通过让AI在训练中自主识别和纠正错误标签,解决了强化学习中噪声数据的关键问题。该方法基于"早期正确一致性"现象,实现了在高达90%错误标签环境下的稳定性能提升,为AI训练的数据质量问题提供了创新解决方案。
DeepReinforce团队开发的GrandCode在2026年三场Codeforces实时编程竞赛中均夺得第一名,成为首个持续击败所有人类选手的AI系统。该系统采用多智能体强化学习架构,包含主解题、假设生成、总结和测试用例生成四个协作模块,通过创新的Agentic GRPO算法和测试时强化学习技术,实现了从64%基础正确率到85%的显著提升,标志着AI在复杂认知任务上的重大突破。
这项由GigaAI、多伦多大学等机构联合完成的研究,首次实现了自动驾驶中深度感知、视频想象和路径规划的统一建模。DriveDreamer-Policy系统能够同时"看见现在"和"预见未来",在权威Navsim测试中达到89.2分综合评分,超越所有现有方法,为更安全智能的自动驾驶技术开辟了新路径。
普林斯顿大学研究团队开发了Vero视觉推理系统,通过完全开源的强化学习方法训练AI处理图表分析、数学推理、空间理解等六类视觉任务。该系统使用60万样本数据集和任务导向奖励机制,在30个基准测试中平均提升3.7-5.5分,部分指标超越商业模型。研究发现不同任务会激发AI产生不同思维模式,证明了多样化训练对培养通用视觉推理能力的重要性。
Anthropic旗下AI助手Claude近期遭遇多重困境:本周一出现重大服务中断,错误率升高影响Claude.ai及Claude Code约50分钟。与此同时,社交媒体和GitHub上关于Claude回答质量下降的投诉持续增加。有趣的是,当被要求分析自身GitHub问题库时,Claude得出结论称"质量投诉急剧上升",4月份质量问题已超20条,是1至2月基准的3.5倍。不过,Anthropic尚未对此作出回应。
Cloudflare正在重构其命令行工具Wrangler,核心驱动力是AI智能体已成为其API的主要用户。新版Wrangler将为智能体提供一致、可编程的接口,覆盖Workers绑定、SDK、配置文件等全产品线。公司同时发布技术预览版,支持通过npx cf运行。此外,面向人类开发者推出Local Explorer测试版,可直观查看Workers绑定及本地存储数据,填补了原有调试盲区。
微软正测试将类OpenClaw功能集成至Microsoft 365 Copilot中,主要面向企业客户,并提供比开源OpenClaw更强的安全控制。此前微软已推出Copilot Cowork和Copilot Tasks等多款代理工具,前者由Anthropic的Claude驱动并运行于云端,后者面向专业消费者。新代理的核心特性是"持续运行",能够长时间完成多步骤任务。微软预计将在6月的Build大会上正式展示该工具。
Meta正强制将公司顶尖软件工程师并入新成立的应用AI(AAI)工程部门,目标是让自主AI智能体承担产品构建、测试与发布的核心工作,人类工程师转变为监督角色。该部门将与超级智能实验室协作,打造驱动模型持续优化的数据引擎。分析师指出,Meta此举标志着AI正从生产力工具升级为核心工程执行基础设施,但在治理框架、问责机制尚未完善前,大规模落地仍面临显著挑战。
受AI基础设施需求激增影响,电力供应已成为数据中心选址的首要因素,美国超大规模数据中心建设重心正加速向内陆转移。德克萨斯州及中西部各州预计将承接超过半数的新增建设项目。Synergy Research Group数据显示,未来三年新建数据中心的平均容量将是现有设施的近两倍。北弗吉尼亚仍是最大集群,但扩张重心已转移。亚马逊、微软、谷歌三巨头合计掌控全球58%的超大规模数据中心容量。
英国数据中心已成为国家关键基础设施,正面临日趋严格的监管环境。在数据隐私方面,运营商须遵守UK GDPR及DPA 2018等法规,确保个人数据处理合规;在网络安全方面,《网络韧性法案》将数据中心纳入NIS监管框架,要求24小时内上报安全事件,违规将面临营业额比例罚款。此外,数据跨境流动规则也随《数据使用与访问法》更新而调整。运营商需建立清晰的合规流程与合同安排,以应对多重法律风险。
Anthropic宣布,其AI助手Claude现已作为插件集成至Microsoft Word,可作为Copilot的替代选择。该功能目前面向Team和Enterprise计划用户开放,处于Beta测试阶段,免费试用。Claude此前已支持Gmail、Google日历、Google Drive及Slack等平台。在Word中,Claude可协助创建内容、编辑文档、处理评论,并识别合同中的关键变更条款。
浙江大学与蚂蚁集团联合研发的SkillX框架,解决了AI助手无法积累和传承经验的问题。通过建立三层级技能体系和自动化技能管理流程,让AI助手能够从成功经验中学习并共享知识。实验显示使用SkillX的助手任务成功率提升约10%,为AI系统实现持续自我改进开辟了新路径。
北卡大学教堂山分校等机构联合推出ClawArena评测平台,专门测试AI代理在复杂信息环境中的表现。该平台模拟现实工作场景,包含相互矛盾的信息源、动态更新和隐性用户偏好三重挑战。通过64个跨8个专业领域的场景测试,研究发现模型能力比框架设计影响更大,即使最先进系统在复杂场景中准确率仍低于30%,为改进AI助手提供重要评估工具。
多款高端苹果电脑在官网显示"暂无库存",受影响机型包括M4 Mac Mini的32GB/64GB内存版本,以及Mac Studio的128GB/256GB版本。现有配置的发货周期也长达18周。分析人士认为,这与全球内存供应危机密切相关——生成式AI需求激增导致超过70%的全球内存产能被AI企业占用,预计短缺状况将持续至2030年。此外,也有观点认为苹果可能正在为Mac Mini和Mac Studio准备M5芯片更新,最早或于2026年WWDC前发布。
斯坦福大学人本AI研究所发布2026年AI指数报告,揭示全球AI格局深刻变化。报告指出,中国在多项AI基准测试中已与美国并驾齐驱,在专利、论文及物理AI领域甚至反超。与此同时,生成式AI普及速度超越历史上任何技术,全球53%人口已在使用。然而,主要AI企业的透明度持续下降,公众对AI监管的信任度降至新低,能源与水资源消耗问题日益突出。
斯坦福大学人工智能研究所发布的2026年AI指数报告显示,AI普及速度超越个人电脑和互联网,三年内渗透率达53%。与此同时,AI危害事件从2024年的233起增至2025年的362起。报告指出,负责任AI的发展明显滞后于AI能力提升。专家与公众在AI影响上分歧明显,但在"AI将损害选举公正和人际关系"这一判断上罕见达成共识。此外,中国AI模型与美国的性能差距正在持续缩小。