Anthropic发布了面向成本敏感用户的Claude Haiku 4.5大语言模型,定价为每百万输入令牌1美元,输出令牌5美元,比旗舰版Sonnet 4.5便宜三倍。该模型采用混合推理架构,可根据需求调整计算资源,支持多模态输入最多20万令牌。在八项基准测试中,性能仅比Sonnet 4.5低不到10%,但在编程和数学任务上超越了前代Sonnet 4。模型响应速度比Sonnet 4快两倍以上,适用于客服聊天机器人等低延迟应用场景。
英国初创公司Nscale将为微软建设四个AI数据中心,总计部署约20万个GPU,合同价值高达240亿美元。首个数据中心将于明年在葡萄牙开建,配备1.26万个GPU。德州数据中心规模最大,将部署10.4万个GPU,容量从240兆瓦扩展至1.2吉瓦。所有设施将采用英伟达最新Blackwell Ultra显卡。
谷歌宣布计划在印度安得拉邦维沙卡帕特南建立AI和数据中心枢纽,这是其在印度的首个AI专用设施。该项目是2026-2030年五年150亿美元投资计划的一部分,将整合大规模计算能力、可再生能源基础设施和扩展的光纤连接。该设施将与AdaniConneX和印度电信公司Airtel合作开发,预计提供"千兆瓦级计算能力"。项目还包括在印度东海岸建设新的海底电缆登陆站,扩大国际连接。
Eightfold联合创始人推出AI数字孪生初创公司Viven,获得3500万美元种子轮融资。该公司通过为每位员工创建专门的大语言模型数字孪生,让团队成员即使在同事不在线时也能获取关键信息。Viven通过访问员工的内部电子文档创建数字孪生,其他员工可查询获得即时答案。公司采用配对上下文和隐私技术确保信息安全共享。
由黑石、微软、英伟达、xAI和MGX组成的财团以约400亿美元收购Aligned Data Centers,创下数据中心收购纪录。该公司在北美和南美拥有50个数据中心,总容量达5GW。AI基础设施合作伙伴关系计划调动300亿美元股权投资,包含债务融资可达1000亿美元。高盛预测未来两年数据中心容量将激增50%,但警告当前AI投资存在狂热氛围,公司为避免落后而大举借债投资。
谷歌发布Veo 3.1 AI视频生成模型更新,显著改进了提示词遵循能力和图像转视频功能。新版本可同时生成视频和音频,并在Flow视频编辑器中新增"帧到视频"功能,用户可上传首尾帧自动生成中间内容。虽然在真实感方面仍不如OpenAI的Sora 2,但谷歌专注于为专业视频工作者提供实用工具的策略值得认可。
企业软件公司Infor将亚太地区作为关键增长引擎,凭借制造业软件专长和AI平台能力吸引新客户。CEO表示亚太制造业基础雄厚,是重要市场。公司专注年收入1亿至50亿美元企业,提供行业特定解决方案。通过Leap项目推动客户向云端迁移,与AWS合作解决数据主权问题。在AI方面,Infor开发智能代理功能,结合流程挖掘技术帮助企业识别低效工作流并实现实时自动化改进。
Anthropic发布了Claude Haiku 4.5小型AI语言模型,性能接近五个月前的前沿模型Claude Sonnet 4,但成本降低三分之二,速度提升一倍以上。该模型在SWE-bench编程测试中得分73.3%,与Sonnet 4的72.7%相当。API定价为每百万输入令牌1美元,输出令牌5美元,远低于其他大型模型。新模型专为实时低延迟任务设计,可与Sonnet 4.5协同工作处理复杂编程任务。
DAOS是英特尔Optane时代的并行文件系统产品,现已被英特尔抛弃。Enakta Labs等DAOS基金会成员正在重新激活这一高性能系统。DAOS曾在2023年IO500测试中获得1.3TBps带宽的顶级成绩。作为开源并行文件系统,DAOS需要与Storage Scale、Lustre等成熟产品竞争。Enakta Labs正在商业化DAOS,推出基于其的Enakta数据平台产品,支持S3、SMB、NFS和PyTorch。该公司认为DAOS凭借卓越性能和开源特性,有望在新兴云服务商中获得采用。
思科2025年AI准备度指数显示,尽管86%的企业期望AI在三年内提升员工生产力,但大多数公司在部署AI时缺乏必要的基础设施和明确策略。调查发现,54%的受访者表示其基础设施无法应对AI驱动的工作负载增长,仅15%认为网络具备足够灵活性。更关键的是,只有32%的企业明确了AI代理要执行的人类任务,31%准备好控制和保护AI代理系统。思科警告这种"AI基础设施债务"可能成为业务瓶颈。
半导体设计公司Arm与Meta达成合作伙伴关系,以增强这家社交媒体巨头的AI系统。根据协议,Meta的排名和推荐系统将迁移到Arm的Neoverse平台,该平台最近针对云端AI系统进行了优化。这项多年合作协议正值Meta大举投资扩建数据中心网络之际,包括代号"普罗米修斯"和"海伯利昂"的大型项目。
AI超大规模初创公司Nscale宣布与微软签署重大合作协议,将向欧洲三个数据中心和美国一个数据中心部署约20万块英伟达GB300 GPU。其中10.4万块GPU将在未来12-18个月内部署到德州数据中心,1.26万块将于2026年第一季度部署到葡萄牙数据中心。该协议还涵盖英国和挪威的数据中心建设计划。这家2024年成立的公司已融资超过17亿美元,计划最早明年底IPO。
工作压力源于大脑储存混乱而非系统。本文介绍5个ChatGPT提示词,帮你将工作压力转化为结构化行动:优先级排序任务清单、快速撰写专业邮件回复、从冗长文档中提取关键信息、生成问题解决方案、高效准备会议内容。通过系统化处理工作事务,将分散的精力转为专注执行,让大脑专注于决策而非重复劳动。
英伟达推出售价3000-4000美元的DGX Spark,号称"全球最小AI超算"。该设备搭载128GB内存,基于Blackwell架构的GB10芯片,虽然速度不及RTX 5090,但能运行消费级显卡无法处理的大模型。支持2000亿参数模型推理和700亿参数模型微调,在AI开发领域具有独特优势,但软件生态仍需完善。
周一OpenAI与博通达成数百万美元协议,这是美国科技巨头高风险并购和战略合作的最新案例。美国正在少数主导企业间形成AI影响力的集中整合,而中国AI企业则采取不同路线,强调开源创新并在更广泛的企业中分散发展机会。OpenAI将于明年下半年推出定制芯片组并建设总容量10吉瓦的数据中心,此前还与AMD签署数十亿美元多年协议。这些对比鲜明的策略正在塑造动态竞争的全球AI格局。
微软将在葡萄牙锡尼什的Start Campus数据中心园区租用Nscale的计算能力,以满足人工智能需求的快速增长。该项目将使用英伟达最新的1.26万颗Blackwell Ultra GB300 GPU芯片,计划于2026年初投入运营。面对算力短缺,微软近期与多家"新云"提供商签署合作协议。该数据中心园区总投资预计85亿欧元,全部使用可再生能源供电并采用海水冷却技术。
Oracle宣布推出Oracle AI Database 26ai和Oracle Autonomous AI Lakehouse两款产品。AI数据库26ai作为长期支持版本,在数据库引擎中原生集成AI功能,包括AI向量搜索、模型上下文协议服务器支持和AI代理框架。该版本还提供量子安全加密和硬件加速支持。自主AI湖仓平台结合了自主AI数据库和Apache Iceberg表格式,支持跨云和混合环境的AI分析工作负载,提供动态扩展和统一数据治理能力。
沃尔玛宣布与OpenAI达成合作,消费者将能够通过ChatGPT聊天机器人购买沃尔玛产品,包括日用品、家庭必需品等,并可即时结账。该智能购物功能还支持山姆会员店用户进行餐食规划和补货。用户需将沃尔玛账户与ChatGPT关联,点击"购买"按钮即可完成购物。此外,沃尔玛还推出了自主研发的生成式AI购物助手Sparky,旨在提供更个性化和主动式的购物体验。
NetApp发布全闪存AFX阵列,采用分解式架构独立扩展存储与计算资源。新增AI数据引擎可为大语言模型预处理ONTAP数据,提供勒索软件防护服务并增强谷歌云集成。AFX系统支持高达128个存储控制器集群,容量超过1EB,内置AI驱动的自主勒索软件防护。该架构借鉴了VAST Data等厂商的设计理念,为NetApp两万多客户提供更好的AI企业工作负载支持。