性能基准测试 关键字列表
OpenAI发布GPT-5.6系列大语言模型,挑战Claude Mythos 5

OpenAI发布GPT-5.6系列大语言模型,挑战Claude Mythos 5

OpenAI推出GPT-5.6系列大语言模型,包含高端Sol、中端Terra和入门级Luna三款。Sol在TerminalBench-2.1编程基准测试中得分88.8%,开启"ultra"模式后升至91.9%,超越Anthropic旗舰模型Claude Mythos 5的88%。新系列新增"max"和"ultra"两种模式,后者可并行调用多个子智能体。Sol定价为每百万输入token 5美元,输出30美元;Terra和Luna分别提供更低价格选项。目前访问权限仅限受信合作伙伴,数周内将开放公测。

Claude Mythos 5与Fable 5发布,刷新AI性能基准记录

Claude Mythos 5与Fable 5发布,刷新AI性能基准记录

Anthropic正式推出Claude Mythos 5和Claude Fable 5两款大语言模型,在多项基准测试中超越竞品。Fable 5面向公众开放,内置安全护栏屏蔽网络安全等高风险请求;Mythos 5则面向有限机构开放,并与美国政府合作管理访问权限。Mythos 5是Claude系列首个能持续提出科学假设的模型,已在分子生物学领域取得实验验证成果。两款模型在SWE-Bench Pro编程基准上以80.3%得分创下纪录,定价较前代削减逾半。

iPad Pro M5评测:距离"未来Mac"只差一步

iPad Pro M5评测:距离"未来Mac"只差一步

苹果iPad Pro M5在外观设计与上代基本一致,但搭载全新M5芯片,性能提升约10%,多核跑分达16116。超视网膜XDR OLED屏峰值亮度达1535尼特,为CNET测试史上最亮平板屏幕。配合iPadOS 26的类Mac多窗口系统,使用体验愈发接近笔记本电脑。起售价999美元,整体性价比仍偏低,但追求顶级性能与显示效果的用户值得考虑。

华硕 Zenbook A16 评测:真正的 AI 笔记本,而非徒有其名

华硕 Zenbook A16 评测:真正的 AI 笔记本,而非徒有其名

华硕Zenbook A16搭载高通骁龙X2 Elite Extreme处理器,NPU性能高达80TOPS,在AI基准测试中以85328分领跑同类产品,远超苹果M5 MacBook Pro的57528分。这款16英寸笔记本重量不足3磅,采用独特Ceraluminum材质,兼顾轻薄与刚性。配备3K OLED触控屏,色彩表现出色,续航约14.5小时。售价1700美元,3D图形性能是其明显短板。

苹果Mac芯片性能测试曝光,引领AI PC新时代

苹果Mac芯片性能测试曝光,引领AI PC新时代

苹果最新Mac处理器的早期基准测试显示,M5 Max MacBook Pro在单核和多核性能方面均创下业界新高,成为全球最快的消费级PC处理器。新款MacBook Neo虽定位入门级,但在日常任务处理上表现出色。测试数据表明,M5 Max多核得分达29233,远超竞争对手,在AI模型处理等高端任务中优势明显。所有新Mac均支持Apple Intelligence,具备强大的人工智能处理能力。

CNET实验室计算机性能测试全流程解析

CNET实验室计算机性能测试全流程解析

CNET采用实验室性能测试和专家体验评估相结合的方式评测计算机。测试流程包括:按用户习惯设置设备,更新系统和驱动程序,运行Geekbench、Cinebench等基准测试评估CPU和GPU性能,通过游戏基准测试评估图形处理能力,进行电池续航测试,并针对特定用途运行扩展测试。最终评分综合客观测试数据和主观使用体验。

Lightbits与Supermicro联合测试创共享块存储IOPS性能新高

Lightbits与Supermicro联合测试创共享块存储IOPS性能新高

Lightbits宣布在使用超微服务器硬件的基准测试中,为容器化事务处理展示了最快的共享块存储性能。测试配置采用AMD EPYC 9575F处理器和8块三星NVMe SSD,实现了360万4K随机读IOPS、160万4K随机写IOPS等卓越性能。两家公司发布参考架构,展示如何在Kubernetes环境中部署高性能可扩展存储系统,为金融交易、实时分析、AI训练等应用提供解决方案。

Nvidia 基准测试方案为实际 AI 性能带来深度洞察

Nvidia 基准测试方案为实际 AI 性能带来深度洞察

Nvidia 推出 DGX Cloud 基准测试工具包,帮助企业和开发者评估其基础设施运行先进 AI 模型的能力。该工具包提供性能测试容器和脚本,可在不同配置下测试 AI 模型性能,支持企业在大规模部署 AI 工作负载前做出明智决策,优化基础设施效能。