OpenAI与博通合作推出定制芯片Jalapeno,专为大语言模型推理任务设计。该芯片在每瓦性能上显著优于现有主流方案,其架构着重减少数据移动以提升效率。推理集群将搭配博通Tomahawk网络交换芯片,并由加拿大公司Celestia协助完成服务器机架设计。OpenAI计划年内上线首批Jalapeno服务器,并将其定位为多代计算平台的起点,未来或扩展至模型训练等领域。
OpenAI与博通宣布推出名为"Jalapeno"的定制ASIC芯片,专为数据中心大语言模型推理设计。该芯片历时九个月研发,基于OpenAI研究人员的深度反馈及其未来模型路线图打造。OpenAI表示,早期测试显示其每瓦性能显著优于现有最先进方案,详细技术报告将于数月内发布。两家公司计划于今年底前在数据中心部署该芯片,此举也是OpenAI减少对英伟达依赖、实现全栈自研战略的重要一步。