IBM Spyre加速器将于本月晚些时候正式推出,为z17大型机、LinuxONE 5和Power11系统等企业级硬件的AI能力提供显著提升。该加速器基于定制芯片的PCIe卡,配备32个独立加速器核心,专为处理AI工作负载需求而设计。系统最多可配置48张Spyre卡,支持多模型AI处理,包括生成式AI和大语言模型,主要应用于金融交易欺诈检测等关键业务场景。
意大利初创公司Ganiga开发了AI驱动的智能垃圾分拣机器人Hoooly,能自动识别并分类垃圾和可回收物。该公司产品包括机器人垃圾桶、智能盖子和废物追踪软件,旨在解决全球塑料回收率不足10%的问题。2024年公司收入50万美元,已向谷歌和多个机场销售超120台设备,计划融资300万美元并拓展美国市场。
思科发布8223路由器,搭载自研Silicon One P200 ASIC芯片,提供51.2 Tbps带宽。结合800 Gbps相干光学技术,可支持1000公里跨度连接。该架构理论上可实现3 EB/s聚合带宽,足以连接当今最大的AI训练集群,支持数百万GPU的多站点部署。微软和阿里巴巴等云服务商正在评估该技术。尽管延迟仍是挑战,但谷歌DeepMind研究表明通过模型压缩和通信调度可克服相关问题。
GPU租赁公司CoreWeave发布无服务器强化学习平台,旨在让企业更容易使用强化学习技术。该平台基于其收购的OpenPipe和Weights & Biases构建,客户无需手动配置虚拟机或裸机服务器,仅需为生成的令牌付费。据称该方案比本地Nvidia H100快1.4倍且成本降低40%。这是CoreWeave拓展AI服务业务、实现客户群体多元化战略的一部分。
OpenAI发布了音视频生成模型Sora 2,同时推出配套社交应用Sora,用户可生成包含自己的视频并在类似TikTok的信息流中分享。Sora 2在物理定律遵循方面有显著改进,视频更加真实。应用提供"客串"功能,允许用户将自己植入生成场景中,并可与朋友分享形象使用权限。该iOS应用目前在美加地区采用邀请制,ChatGPT Pro用户可直接体验。
大语言模型和生成式AI自诞生以来问题频发,从推理模型表现不佳到AI幻觉现象,再到版权诉讼,这些都表明当前技术路径可能并非通往真正智能的正确道路。专家认为,仅靠增加数据和算力的扩展模式已显现边际效应递减,无法实现通用人工智能。研究者提出智能应包含统计、结构、推理和目标四个层次的协调,并强调时间因果性的重要性。面对LLM技术局限,业界开始探索神经符号AI等替代方案。
微软发布Microsoft 365新功能,知识工作者可通过文本提示生成复杂的Word文档或Excel电子表格。该功能包含两个产品:基于GPT-5的代理模式和基于Anthropic模型的Office代理。代理模式能进行多步骤工作规划和验证循环,目前仅支持Web版本。微软将此称为"氛围办公",类似于氛围编程概念。不过在电子表格应用中存在风险,代理模式准确率为57.2%,而人类为71.3%,需要谨慎使用。
DeepSeek发布实验版本DeepSeek-V3.2-Exp,引入"稀疏注意力"技术来解决长对话处理中的计算瓶颈。该技术通过选择性处理词汇关系而非全量计算,将API成本降低50%。稀疏注意力并非新概念,OpenAI早在2019年就使用过类似技术,但DeepSeek声称实现了"细粒度稀疏注意力"的突破。基准测试显示该模型性能与前代相当,且开源发布。
ServiceNow发布AI Experience多模态用户界面,主张界面而非模型将决定企业AI竞争胜负。该平台将AI代理、数据结构和工作流程整合到单一环境中,支持语音、图像和文本交互。公司已实现超3.5亿美元节省,AI代理可自动化89%支持工作流程。ServiceNow直接挑战微软和Salesforce,通过开放性集成和AI控制塔提供治理优势,力图成为企业AI的前门入口。
AI技术发展推动数据中心基础设施重构,新一代AI加速器使机架密度超过100千瓦,部分高达600千瓦,传统冷却系统面临极限。液体冷却市场年复合增长率达20%,成为增长最快的数据中心冷却细分领域。这不仅是冷却升级,更是架构演进。支持高密度AI工作负载需要从设施设计、散热、管道到配电和机架集成的全面重新思考,热管理已成为跨学科挑战。
为应对AI基础设施连接缺乏标准的问题,通信基础设施提供商Zayo与数字基础设施公司Equinix联合发布业界首个AI基础设施蓝图。该框架明确定义了高容量网络、互连枢纽、训练和推理数据中心的角色及连接模式。随着AI驱动的带宽需求预计到2030年增长六倍,该蓝图为新云服务商和AI提供商提供可扩展的私有连接指导。
据报道,OpenAI正准备发布一款由即将推出的Sora 2视频模型驱动的独立社交应用。该应用与TikTok高度相似,采用垂直视频信息流和滑动滚动导航。不过,该应用仅支持AI生成的内容,用户无法从手机相册上传照片或视频。Sora 2在应用内生成的视频时长限制为10秒或更短。应用还包含身份验证工具,允许用户使用自己的肖像生成视频,其他用户可以标记并在重新混合视频时使用他们的肖像。
微软发布全新Agent Mode功能,支持Excel和Word中的AI代理协作。该模式可自动生成高质量文档、电子表格和演示文稿,让非专业用户也能使用复杂功能。Excel代理模式在准确性测试中达到57.2%,远超原版Copilot的20%。Word代理模式则专注于内容起草和格式优化,让写作变成对话式体验。目前已向商业用户和个人订阅用户开放。
微软为Word和Excel添加了AI代理模式,由Microsoft 365 Copilot驱动,即使是经验不足的用户也能创建高质量的专业文档和电子表格。该功能采用自然语言提示方式,用户可通过简单指令让AI协助完成多步骤任务。Excel代理模式可创建预算表格和财务分析,Word代理模式可协助撰写简历、报告等各类文档。微软还在Copilot聊天中添加了Office代理功能,目前已在前沿计划中向订阅用户开放。
高通在骁龙峰会上发布两款旗舰处理器:骁龙8 Elite Gen 5手机芯片和骁龙X2 Elite PC芯片,旨在成为新一代智能体AI的硅基础设施。新芯片采用3纳米工艺,CPU性能提升20%,能效提升35%,GPU性能提升23%,NPU速度提升37%。重点是支持情境感知、多模态AI代理,能实时理解用户需求并主动响应,实现设备间无缝协作。
微软宣布为Word和Excel推出基于OpenAI的AI代理模式,通过简单提示即可自动生成文档和分析数据。Word用户可享受"氛围写作"功能,利用现有文档组装报告和提案。Excel代理能分析电子表格数据并生成可视化报告。尽管在SpreadsheetBench基准测试中准确率仅为57.2%,低于人类平均水平71.3%,但微软强调其针对实际工作场景优化。此外,微软还发布了基于Anthropic的Office代理,显示其正逐步减少对OpenAI的依赖。
OpenAI为美国ChatGPT用户推出"即时结账"功能,用户可在对话中直接购买Etsy和Shopify商品,无需跳转至外部网站。该功能支持Apple Pay、Google Pay等多种支付方式,并计划接入超过100万家Shopify商户。OpenAI还将开源其代理商务协议技术,与谷歌的代理支付协议形成竞争。这标志着电商购物模式的重大转变,AI聊天机器人可能重塑在线零售发现和支付生态系统。
中国AI实验室DeepSeek本周爆红,其聊天机器人应用登顶苹果和谷歌应用商店榜首。DeepSeek由量化对冲基金High-Flyer支持,使用计算高效技术训练AI模型,让华尔街分析师质疑美国能否保持AI领先地位。该公司发布的V3和R1推理模型在多项基准测试中表现出色,价格远低于同类产品。尽管面临美国芯片出口限制和政府设备禁用,DeepSeek仍凭借技术创新和低成本策略在全球AI市场引发关注。
初创公司ComplexChaos正在开发AI工具来促进合作并缩短群体达成共识的时间。该工具结合了谷歌的Habermas Machine和OpenAI的ChatGPT,能够生成问题、设定对话目标并总结长文档。在与九个非洲国家的年轻代表进行的气候谈判准备试验中,参与者报告协调时间减少了60%,91%的参与者表示AI工具帮助他们看到了原本会错过的观点。