由于客户仍然对博通针对VMware制定的计划感到不安,因此VMware正在极力确保客户的Tanzu应用开发和现代化工具包不仅继续存在而且运行良好,并且是收购后战略的一个关键组成部分。
2023年数据中心物理基础设施(DCPI)行业实现了两位数的增长,克服了长期存在的、疫情引发的供应链问题,开始意识到AI热潮带来的好处。
根据Synergy Research Group的预测,未来六年超大规模数据中心的平均容量将是当前运营的超大规模设施的两倍多。2024年初发布的多项公告都预测未来将出现强劲的增长趋势。
英特尔正努力对外发布尚在开发的硬件,同时辅以对开源的高度重视,希望借此将自身与竞争对手区分开来、吸引更多开发人员使用其云方案。
延电科技通过部署IBM Engineering Lifecycle Management(ELM)工程全生命周期管理解决方案,建设内部系统平台、强化研发流程、优化管理体系,与IBM长期携手共创,成功加速研发和运营的全链高质量转型。
NVIDIA GTC 2024大会重点介绍了新一代GPU架构Blackwell及其产品B100、B200。SXM架构相比PCIe在带宽和多GPU互联方面具优势,适合大模型AI计算中心。B200是两颗B100 Chiplet化,提升全方位,特别是显存容量达到192GB。Blackwell架构新增FP4和FP6精度,B200在算力上相对B100有全面提升,但非理想倍数增长,显示NVIDIA有所保留。
NVIDIA GTC 2024大会发布新一代GPU架构Blackwell,特点为MCM设计,集成2080亿晶体管,采用4NP TSMC工艺。Blackwell架构提供显著算力提升,低精度推理优化,以及高互联带宽,特别适合大模型训练和推理。新架构搭载产品包括B100、B200、GB200,未来RTX50系列也将采用。性能提升包括5倍AI性能,4倍显存,以及更高的显存带宽和NVLink速度。
基于鲲鹏软硬件平台进行产品研发后,我们现在的技术栈虽然相对之前有了明显的提升,但在国际市场来看,仍需要有更进一步的提升。
4月2日,由中共山东省委网络安全和信息化委员会办公室指导、青岛市大数据局支持、浪潮云主办的“云端眺望 向‘数’而生”数字创新生态大会在青岛市成功举办。会议聚焦服务新质生产力,正式发布海若大模型业务战略,通过数字生态创新共同体,联合生态伙伴合力拥抱大模型浪潮,培育行业新业态。
作为半导体行业和计算创新领域的全球领先厂商,英特尔积极推动整个半导体价值链向可持续的方向协同前行,目前已经取得了良好的进展。而为进一步推进到2050年在整个价值链中实现范围3上游温室气体净零排放的目标,英特尔仍在不断探索。
第五代至强可扩展处理器的最新MLPerf测试结果充分展示了英特尔及其生态合作伙伴在提升生成式AI性能方面的成果。
3月31日是一年一度的世界备份日,其初衷是为了提醒公众,达成有效数据备份,制定恢复策略与保护协议这些事项是很有必要的。采用高效稳妥的数据备份解决方案,可缓解数据丢失的风险,显著加快数据恢复进程。
随着大模型的火爆,另一种AI也推向了大众视野,即被称为生成式AI。无论是云端AI服务加速,还是近期能够本地运行200亿参数大语言模型的AI PC,它们的思维是发散且具有创造性的,同时对硬件也提出了更高的要求。
据悉,国内首个AI算力栈——NEX AI Lab(Nettrix AI Open Lab)已在桐乡市成功落地。NEX AI Lab集成加速计算节点、全闪存存储节点,可为GPT、LLaMA、Stable Diffusion等AI模型,提供多元场景应用优化支持。目前,NEX AI Lab已开放预约试用,以支持用户体验大模型、数据科学、推荐系统等领域的解决方案工作流。
3月29日,宁畅发布“全局智算”战略,并揭幕了包括“AI算力栈”在内的一系列战略性新品与系统解决方案,旨在有效解决大模型产业落地的全周期问题。
近日,MLCommons公布了针对AI推理的MLPerf v4.0基准测试结果。与第四代至强在MLPerf推理v3.1基准测试中的结果相比,第五代至强的测试结果平均提升1.42倍。
在生成式AI和LLM狂奔的同时,CPU也在与时俱进,让自己适配客户需求和选择。依托软硬件和生态协同,CPU正在迎来新的高光时刻,推动人工智能行业迈向新的高度,展现出无限的潜力与可能性。