快科技6月17日消息,MLCommons发布了MLPerf Training 6.0基准测试最新结果,英伟达Blackwell平台在全部7项基准测试中拿下最快训练成绩,并成为唯一覆盖全部测试项目的平台。
MLPerf Training是业界广泛使用的AI训练基准测试体系,用于比较不同硬件在模型训练任务中的速度和效率。
英伟达提交了GB200 NVL72和GB300 NVL72两套机架级系统,每套NVL72内部通过第5代NVLink Switch连接72块GPU,将算力和内存整合成统一资源池。

在性能层面,GB300 NVL72较GB200 NVL72在同等规模下最高可带来1.6倍训练速度提升,关键驱动力包括NVFP4带来的更高计算密度、更大内存容量以及更高的功耗上限。
在规模层面,英伟达将Blackwell训练集群扩展至8192块GPU,在DeepSeek-V3 671B任务上完成大规模提交,成为MLPerf Training迄今规模最大的Blackwell成绩。
CoreWeave借助采用Spectrum-X以太网的GB300 NVL72系统,在8192块GPU规模上将DeepSeek-V3 671B训练到目标质量,耗时仅2.02分钟。

微软Azure用GB200 NVL72将Llama 3.1 405B扩展到8192块GPU,7.07分钟达成参考质量目标。
本次测试共24家机构提交了95份结果,英伟达平台在性能、规模和可靠性三项指标上均处于领先。

值得一提的是,MLPerf Training 6.0新增了DeepSeek-V3 671B和GPT-OSS-20B两个混合专家模型预训练工作负载,反映MoE架构在AI领域的日益重要。

热门排序
推荐文章
1辆出租车4个计价器引关注 官方回应:拼车时单独计费 打车更便宜
第三代擎天柱今夏投产!马斯克直言没有任何对手
以冠军致敬精英 问界M9携手重庆女马诠释新豪华内核
京东打造行业首款“自由态数字人” 精准适配五大行业场景
黄仁勋呼吁所有人使用AI提升自己:大学生毕业时都要成AI专家
巴菲特慈善午餐时隔多年回归!最终成交价900万美元 比上次少拍了1000万美元
网红小胖一周透析3次:曾因表情包爆火 自称要做嘚瑟的病秧子
买榴莲仅退款圆满进展:商家称平台已通过申诉退款 后者承诺调整相关规则
铠大师携手摩尔线程 共筑AIPC生态 激活端侧AI新动能
抖音生活服务“心动三里屯艺术生活节”正式启动 激发商圈消费新活力





