随着AI工作负载大规模投入生产,业界关注焦点正从GPU数量转向系统运行效率。在北卡罗来纳州举办的Tech Fest活动上,企业IT和基础设施领域专家探讨了电网压力、集群复杂性及大规模AI部署带来的运营挑战。北卡卫生部门CIO指出,电网供能与算力需求之间的缺口日益扩大,行业评估标准也从单纯的FLOPS转向"每瓦特生成token数"。软件优化与工作负载调度正成为AI基础设施规划的重要组成部分。
加州空气资源委员会通过监管文件正式确认了特斯拉Semi卡车的电池容量:长续航版为822千瓦时,标准续航版为548千瓦时,均采用NCMA锂离子化学体系与4680电芯。长续航版比马斯克2022年估计的900千瓦时少约80千瓦时,但仍可实现500英里续航,这得益于生产版车重减轻近1000磅带来的效率提升。两款车型均搭载800千瓦三电机系统,支持1.2兆瓦超级充电,在同级电动卡车中续航领先优势显著。
AI为数据中心带来全新的高能耗工作负载,但大多数部署仍使用传统的CPU加速卡服务器模式和稳定的x86指令集。尽管AI服务器通常将GPU与x86 CPU配对,但x86并非唯一可行选择。ARM、RISC-V和ASIC等替代架构在匹配合适工作负载和软件栈时,能够有效运行AI并降低数据中心成本,同时提高可持续性。
随着数据中心能耗预计在未来十年内增长三倍,运营商面临提高效率和缓解电网压力的巨大压力。后门热交换器(RDHx)作为机架级解决方案,可在不大幅改造白空间的前提下减少机械冷却能耗并扩展密度空间。RDHx通过液冷线圈替换机架后门,在服务器排气进入机房前捕获热量,通过闭环液体回路将热量转移至设施散热设备。该技术具有高能效、基础设施改动最小、成本较低等优势。
数据中心作为数字世界的基础设施,产生大量废热通常被浪费。传统上,数据中心废热温度约38摄氏度,无法直接用于区域供暖等应用。但通过热泵、改进冷却系统等创新技术,现在能够捕获并再利用这些热能。北欧运营商atNorth将废热用于区域供暖系统,为8000多户家庭供热。美国实验室通过整合废热实现了1.04的PUE值。热泵技术和相变材料存储等新兴技术正推动废热回收成为数据中心设计的新标准。
AI技术快速发展正在重新定义数据中心的设计、建设和运营规则。美国AI数据中心的能耗需求预计在2023至2030年间将增长两倍。传统的静态设计和可预测工作负载方法已不再适用。现代AI工作负载对单个机架功耗需求高达130千瓦,对电力和冷却基础设施提出了极高要求。行业正转向模块化和自适应架构设计,通过预组装标准化组件和智能能源管理系统,在满足高性能计算需求的同时实现可持续发展目标。
低功耗芯片初创公司Efficient Computer发布旗舰产品Electron E1处理器,大幅降低通用计算工作负载的能耗需求。该芯片采用创新的"Fabric架构",实现空间数据流计算,与传统冯·诺依曼架构相比,能效提升可达100倍。通过消除内存与处理核心间的频繁数据传输开销,特别适用于传感器、可穿戴设备和无人机等边缘计算场景。
在2025年格勒诺布尔Leti创新日大会上,能耗问题成为焦点。随着AI驱动计算需求激增,数据中心规模和能耗急剧膨胀,部分数据中心功耗将达500兆瓦。CEA-Leti启动Resolve计划,目标到2032年实现能效提升1000倍。大会展示了3D集成、光子互连等节能技术,以及无PFAS芯片制造方法。业界呼吁通过先进封装、宽禁带功率器件等实用技术,平衡AI发展与可持续性需求。
AMD宣布已超越其雄心勃勃的30x25能效目标,在AI和高性能计算系统中加速推进绿色倡议。该公司原计划在2020年至2025年期间将能效提升30倍,最终实现了38倍的显著改进,并提前完成目标。面对AI工作负载日益增长的需求,AMD的这一成就不仅展现了公司的技术实力,更体现了其在加速计算领域推动可持续解决方案的坚定承诺,为整个半导体行业树立了新的能效标准。
随着摩尔定律接近极限和数据中心功耗问题日益突出,AMD制定了到2030年将芯片能效提升20倍的宏伟目标,并将机架级架构视为关键设计方向。AMD高级副总裁表示,设备规模越大效率越高,机架级计算能将整个机架的计算设备集成到单一封装中。AMD计划明年推出首个机架级计算平台MI400,未来五年内光学互连可能取代铜质连接。除硬件创新外,软硬件协同设计将是实现目标的关键因素。
这篇文章介绍了AI芯片初创公司EnCharge的创新技术,该公司声称其模拟人工智能加速器在功耗上仅需传统桌面GPU的一小部分,却能提供相当的计算性能。EnCharge的推理芯片在8位精度下能以1瓦特的功耗提供150 TOPS的AI计算能力。该技术经过多年的研发,旨在通过在内存中进行计算来提高效率,并支持多种AI工作负载。