英伟达CUDA平台自2006年推出以来走过20年历程,从最初十年亏损的数十亿美元投资,发展为如今支撑公司成功的核心软件栈。CUDA副总裁Ian Buck回顾了平台发展历程,强调其成功在于采用C语言而非全新编程范式,确保跨代GPU兼容性。如今CUDA生态拥有超过1000个软件库,AI代码生成正加速CUDA应用普及。面对智能体AI需求,英伟达通过授权Groq的LPU技术提升推理能力,并坚持通用可编程性而非定制芯片路线。
微软表示"可靠性是Visual Studio AI的优先考虑",这一表态可能会让已经在使用Copilot并遇到各种问题的开发者感到意外。近年来微软不断向这款老牌代码编辑器中加入AI助手功能,现在表示"我们正将重点转向可靠性和完善"。该公司正致力于保持Copilot在上下文增长时的快速响应,并优先考虑IntelliSense补全而非Copilot建议。
AMD推出ROCm 7.0软件平台,在推理性能上实现3.5倍提升,训练浮点性能提升3倍。该平台支持OCP微缩放数据类型硬件加速,引入AI张量引擎AITER,可将MLA解码操作提升17倍。结合MI355X芯片,AMD声称在DeepSeek R1推理负载中性能超越英伟达B200芯片1.3倍,并已集成至vLLM和SGLang等主流推理引擎中。