엔비디아, MLPerf HPC 벤치마크서 최고 AI 성능 입증

[아이티비즈 박채균 기자] 엔비디아(CEO 젠슨 황) 기반 시스템이 고성능컴퓨팅(HPC) 과학 애플리케이션에 대한 AI 성능에 대한 업계 벤치마크인 MLPerf HPC 1.0의 5개 테스트 중 4개에서 우위를 차지했다.

MLPerf는 2018년 5월에 처음 출시된 딥러닝에 대한 업계 공인 벤치마크 테스트이다. MLPerf HPC에서는 AI를 사용하여 슈퍼컴퓨터에서 시뮬레이션을 가속화하고 강화하는 컴퓨팅 스타일을 중점적으로 다룬다. 최근 과학 및 산업 분야의 사용자들은 엑사스케일 AI의 채택을 통해 분자 역학, 천문학 및 기후 시뮬레이션에서 HPC와 AI로 과학적 혁신을 이루고 있다.

MLPerf HPC 1.0은 HPC 센터에 대한 △코스모플로우(CosmoFlow)로 망원경의 이미지에 있는 물체의 세부 정보를 추정 △딥캠(DeepCAM)으로 기후 데이터에서 허리케인과 대기의 강(atmospheric river) 탐지를 테스트 △오픈 카탈리스트(OpenCatalyst)로 시스템이 분자 내 원자 간의 힘을 얼마나 잘 예측하는지 추적 등 세 가지 일반적인 워크로드에서 AI 모델의 훈련을 측정했다.

각 테스트는 시스템이 모델을 얼마나 빨리 훈련시키는지 측정하는 강력 스케일링과 이에 상응하는 최대 시스템 처리량, 즉 주어진 시간에 시스템이 훈련할 수 있는 모델 수를 측정하는 약 스케일링(Weak Scaling)의 두 부문으로 구성되었다.

엔비디아는 작년 MLPerf 0.7 라운드에 비해 5배 더 향상된 코스모플로우 성과를 냈다. 딥캠 테스트에서는 대략 7배 나아진 성능을 보였다. 로렌스 버클리 국립 연구소의 펄머터 페이즈1(Perlmutter Phase 1) 시스템은 6,144개의 엔비디아 A100 텐서코어 GPU 중 512개를 사용하여 오픈카탈리스트 테스트 내의 강력 스케일링 부문에서 우위를 뽐냈다.

또한, 약 스케일링 부문에서는 작업당 16개의 노드와 256개의 동시 작업을 사용하여 딥캠 테스트를 주도하였다. 모든 테스트는 사내 시스템이자 엔비디아의 세계 최대 산업용 슈퍼컴퓨터인 엔비디아 셀린(Selene)에서 실행되었다.

MLPerf의 최신 결과는 엔비디아 AI 플랫폼과 성능 리더십의 또 다른 차원을 보여준다. 엔비디아는 데이터센터, 클라우드 및 네트워크 엣지에서 AI 교육 및 추론을 포괄하는 MLPerf 벤치마크에서 8년 연속 최고 점수를 달성하였다.

박채균 기자 다른기사 보기