Datadog在其可观测性平台中新增GPU监控功能,帮助企业深入了解GPU资源的使用情况。随着AI投资持续攀升,GPU实例已占云计算成本的14%。该工具提供跨云端、私有部署的统一视图,将GPU健康状态、成本与性能数据关联至各业务团队,支持识别闲置进程、错误配置及资源浪费。Datadog内部测试显示,该工具每月可节省数万美元开支。Grafana、Nutanix等厂商也在同期推出类似的AI可观测性工具。