推断工作负载 关键字列表
AI推断工作负载正将基础设施拉回城市数据中心

AI推断工作负载正将基础设施拉回城市数据中心

随着AI工作负载从训练转向推理,基础设施布局正悄然改变。推理任务对网络延迟、互联密度和成本更为敏感,促使部分企业将基础设施迁回靠近用户的城市数据中心。以文档处理平台Mathpix为例,该公司将Nvidia B300 GPU部署于布鲁克林的DataVerge机房,通过本地化推理与混合云架构,实现了更快响应速度和更低运营成本。分析人士指出,AI基础设施正逐步分化为集中式大规模训练与分布式城市推理两种模式。