GPU集群 关键字列表
英美签署科技繁荣协议共建欧洲最大AI工厂

英美签署科技繁荣协议共建欧洲最大AI工厂

英美两国签署科技繁荣协议,推动人工智能、量子和核技术发展。英国政府投资440亿英镑,微软、英伟达、谷歌、OpenAI等承诺投资310亿英镑,目标建设欧洲最大AI工厂。协议包括联合研究计划,开发AI模型用于癌症等疾病的靶向治疗。英伟达将在12个月内向英国提供12万块GPU,OpenAI部署8000块GPU并计划扩展至6万块,微软投资220亿英镑建设英国最大AI超级计算机。

Llama-3公布基础训练设施,使用49,000个H100

Llama-3公布基础训练设施,使用49,000个H100

Meta宣布了两个新的24K H100 GPU集群,用于训练大模型Llama-3,预计4月末或5月中旬上线。集群使用RoCEv2网络和基于Tectonic/Hammerspace的存储解决方案,支持PyTorch。

并行科技陈健:超算架构大模型算力,买不如租!

并行科技陈健:超算架构大模型算力,买不如租!

大模型的训练需要大量的计算资源,企业的资金投入几十亿到上百亿,因此在算力投入上要特别谨慎。大模型的训练是个典型的超算场景,采用超算的方式对企业来说更具性价比。租用算力方式比自建方式能让企业风险更低、现金流更充裕。