谷歌宣布在搜索中推出新的AI驱动旅行预订和规划功能。公司将AI驱动的"飞行优惠"工具扩展到全球200多个国家和地区,支持60多种语言。新增的Canvas工具可帮助用户在AI模式下制定旅行计划,整合实时搜索数据、航班酒店信息和地图评价。此外,AI模式的代理预订功能现已向所有美国用户开放,可协助预订餐厅、活动门票等服务。
到2026年,AI数据中心年耗电量将超过90太瓦时。国际能源署最新报告显示,AI正迫使数据中心、公用事业和技术供应商重新思考电力生产、传输和消耗方式。Dell Technologies和Lancium高管在数据中心世界电力会议上讨论了这一快速变化的格局,其中电力可用性、电网集成和机架级工程已成为支持AI增长的核心要素。
甲骨文在科技股抛售潮中跌幅领先,过去一个月股价下跌25%,几乎是其他大型科技公司跌幅的两倍。公司为进军AI领域承诺未来几年投入数千亿美元建设芯片和数据中心,主要用于向OpenAI提供算力服务。然而,激进的举债扩张策略引发投资者担忧,其长期债务已从750亿美元增至960亿美元,预计2028年将飙升至2900亿美元。分析师警告称,甲骨文过度依赖OpenAI等少数AI公司存在巨大信贷风险。
戴尔在超级计算大会2025上宣布闪电项目已成功将PowerScale并行化,显著提升文件读写性能。通过pNFS和Flex Files布局支持,PowerScale实现了元数据服务器与客户端间的双向通信,在集群多个节点间实现更好的并行数据分布。新增NIXL库KV缓存卸载集成,支持软件订阅许可模式。ObjectScale新增AI优化搜索功能,包括S3表格和向量搜索API。
亚马逊云服务宣布AI开发环境Kiro正式上线,该工具通过自然语言提示快速构建软件。Kiro独特之处在于先生成规范文档,包含清晰需求、结构化设计和测试任务。新版本支持团队协作,管理员可统一管理访问权限和成本。团队可共享引导文件,为Kiro提供编码约定和环境知识。此外还推出集成开发环境和命令行界面,提高开发效率。
前英特尔芯片设计师Joe Fioti创立的Luminal公司宣布完成530万美元种子轮融资,由Felicis Ventures领投。该公司专注于优化GPU编译器技术,通过改进代码与GPU硬件之间的编译系统来提升计算效率。与专注于GPU硬件的云计算公司不同,Luminal致力于从现有基础设施中挤出更多计算性能。公司瞄准英伟达CUDA系统的开源部分,为客户提供推理优化服务,在AI模型运行速度和成本优化方面寻求突破。
MCP安全初创公司Runlayer宣布完成1100万美元种子轮融资,投资方包括Khosla Ventures的Keith Rabois和Felicis。该公司由三度创业者Andrew Berman创立,专注于为AI代理提供全方位安全防护。自四个月前隐秘发布产品以来,已签约数十家客户,包括Gusto、Rippling等8家独角兽公司。Runlayer提供集网关、威胁检测、可观测性和企业开发于一体的安全解决方案,旨在解决MCP协议本身缺乏安全机制的问题。
阿布扎比科技创新研究院团队首次发现大语言模型生成的JavaScript代码具有独特"指纹"特征,开发出能够准确识别代码AI来源的系统。研究创建了包含25万代码样本的大规模数据集,涵盖20个不同AI模型,识别准确率在5类任务中达到95.8%,即使代码经过混淆处理仍保持85%以上准确率,为网络安全、教育评估和软件取证提供重要技术支持。
哥伦比亚大学团队首创FINAUDITING基准,评估AI财务审计能力。研究发现即使最先进的AI模型在处理真实企业XBRL财务报告时表现有限,最好模型准确率仅11.89%-91.82%不等。该研究揭示了AI在结构化专业任务中的瓶颈,为金融科技应用提供重要参考,推动AI从通用智能向专业智能发展。
伊利诺伊大学研究团队开发出测试时自我改进技术,让AI智能体能在执行任务时识别困难问题并实时学习。该技术包含自我觉察、数据增强和参数调整三个环节,仅用一个练习样本就能平均提升5.48%准确率,且使用数据量比传统方法少68倍。这种"边做边学"的方式让AI更接近人类学习模式,为构建自适应智能系统开辟新路径。
新加坡科技设计大学研究团队发现AI模型推理冗长的根本原因,并提出PEAR训练方法。该方法通过分析模型在思考和回答阶段的不确定性差异,实现了37.8%-59.4%的输出长度缩减,同时准确率几乎不受影响。这项突破性研究为开发更高效的AI推理系统提供了新思路。
宾夕法尼亚大学研究团队开发出首个能模拟病理专家诊断思维的AI系统Pathologist-o3。该系统通过创新的"AI会话记录器"收集专家操作数据,学会了像人类医生一样选择观察区域、调节倍数并解释诊断逻辑。在淋巴结转移检测中达到84.5%准确率和100%敏感度,显著超越现有AI模型,为实现专家级医疗服务普及化提供了新路径。
加州大学洛杉矶分校等机构联合提出ARMOR技术,通过自适应矩阵分解解决大型语言模型2:4稀疏化后性能严重下降的问题。该方法将权重矩阵分解为稀疏核心和轻量级包装器,在保持硬件加速优势的同时,将性能差距缩小近50%,在多个基准测试中显著超越现有方法。
国际能源署发布的2025年世界能源展望报告显示,全球AI竞赛推动创纪录的石油、天然气、煤炭和核能消耗,加剧地缘政治紧张局势和气候危机。数据中心用电量预计到2035年将增长三倍,全球数据中心投资预计2025年达5800亿美元,超过全球石油供应投资的5400亿美元。报告呼吁采取新方法实现2050年净零排放目标。
AMD首席执行官苏姿丰在纽约金融分析师日活动中表示,公司已准备好迎接AI浪潮并获得传统企业计算市场更多份额。AMD预计未来3-5年数据中心AI收入复合年增长率将超过80%,服务器CPU收入份额超过50%。公司2025年预期收入约340亿美元,其中数据中心业务160亿美元。MI400系列GPU采用2纳米工艺,Helios机架系统将提供强劲算力支持。
德国铁电存储公司FMC获得1亿欧元C轮融资,用于将FERAM芯片技术应用于AI数据中心,替代DRAM和SRAM。FERAM具有与DRAM和SRAM相似的速度,但具备非易失性特征且耗电更少。公司推出DRAM+和3D CACHE+两款产品,旨在解决AI技术栈中的内存瓶颈问题。该技术采用标准CMOS工艺制造,但面临供应链接受度的挑战。
本文探讨了AI在垂直市场中的应用前景。垂直市场指专门服务特定行业客户的细分市场,如医疗或金融行业。专家认为,生成式AI首次实现了知识工作的真正自动化,在医疗、金融、法律等高成本知识密集型领域具有显著ROI潜力。成功的垂直AI应用需要拥有客户工作流程,采用基于价值而非按席位的定价模式,并将AI从工具逐步发展为团队合作伙伴。
谷歌宣布将在未来两年内向德州投资400亿美元,用于建设三个新数据中心以支持云计算和人工智能业务。新建设施将分布在阿姆斯特朗县和哈斯克尔县。这是谷歌在美国任何州的最大投资,将使其在德州的总投资达到427亿美元。此前谷歌已在该州建有两个数据中心。