마일스톤 단신 달성 2026년 6월
DeepSeek-V3를 ~2분 만에 학습 (MLPerf v6.0 기록)
CoreWeave / NVIDIA — CoreWeave가 MLPerf Training v6.0 신기록 수립 — DeepSeek-V3(6,710억 파라미터)를 NVIDIA GB300 NVL72 GPU 8,192장으로 2.02분 만에 학습. 이번 라운드 최대 GB300 클러스터이자 DeepSeek-V3에서 2,048장을 넘어 확장한 유일한 제출. 고객이 실제 프로덕션에서 쓰는 인프라로 수행 — 대형 모델 학습 시간이 얼마나 빠르게 단축되는지 보여주는 지표.
검증된 측정값에서 초안이 자동 생성된 뒤 사람이 확인했습니다.