엔비디아 A100 GPU, MLPerf 벤치마크서 최고 성능 달성
엔비디아 A100 GPU, MLPerf 벤치마크서 최고 성능 달성
  • 박채균 기자
  • 승인 2021.07.01 14:27
  • 댓글 0
이 기사를 공유합니다

엔비디아 A100 GPU는 MLPerf 벤치마크서 최고 성능을 달성했다.
엔비디아 A100 GPU는 MLPerf 벤치마크서 최고 성능을 달성했다.

[아이티비즈 박채균 기자] 엔비디아(CEO 젠슨 황)가 자사의 파트너사인 델, 후지쯔, 기가바이트, 인스퍼, 레노버, 네트릭스, 슈퍼마이크로가 A100 텐서 코어(Tensor Core) GPU를 통해 MLPerf 벤치마크 테스트에서 업계 최고의 결과를 기록했다고 1일 밝혔다.

이번 벤치마크 테스트에서 8개의 워크로드를 모두 실행한 기업은 엔비디아 및 엔비디아의 파트너사 뿐이었으며, 제출한 작업물은 전체 제출물의 4분의 3 이상을 차지했다. 또한, 작년에 보여준 테스트 점수와 대비해 최대 3.5배 이상 더 뛰어난 성능을 보였다. 엔비디아는 가장 많은 성능이 필요한 대규모 작업을 위해, 테스트 제출물 중에서 가장 많은 4,096개의 GPU을 사용해 리소스를 모았다.

2018년 5월에 설립된 MLPerf 훈련 테스트에 엔비디아는 네 번째로 참여했으며, 가장 강력한 성능을 기록했다. MLPerf는 사용자가 테스트 결과를 토대로 구매를 결정하도록 도와준다. 벤치마크는 컴퓨터 비전, 자연어 처리, 추천 시스템, 강화 학습과 같이, 현재 가장 인기있는 AI 워크로드와 시나리오를 측정한다. 

이는 사용자들이 가장 궁금해하는 새로운 AI 모델 훈련 시간에 중점을 둔다. AI 모델 사용자는 보통 다양한 AI 모델을 신속하게 생산에 도입해, 시장 출시 기간을 단축하고 데이터 사이언스 팀의 업무 효율성을 극대화할 수 있는 유연하면서도 강력한 시스템이 필요하다.

엔비디아는 슈퍼컴퓨터 세계 상위 500대 중에서 가장 빠른 상용 AI 슈퍼컴퓨터인 셀린에서 테스트를 실행했다. 셀린은 상위 500대에 있는 다른 12 개의 시스템에서 탑재된 DGX 슈퍼POD 아키텍처를 기반으로 한다. 셀린은 상용 시스템의 8개 벤치마크 모두에서 기록을 세웠다. 

대규모 클러스터로 확장할 수 있는 능력은 가장 어려운 AI 과제이자, 엔비디아의 핵심 강점 중 하나다. 성능이 향상되면 더 빠르게 반복해 데이터 사이언스팀의 생산성을 높이고 AI 기반 제품과 서비스 출시 기간을 단축할 수 있다.

엔비디아와 파트너사들은 상용 시스템의 칩 성능을 비교하는 최신 테스트에서 8개의 벤치마크에서 기록을 세웠다. 2년 반 만에 성능이 최대 6.5배 상승됐으며, 이는 풀 스택 엔비디아 플랫폼에서 모두 적용된다.

MLPerf 결과는 새롭고 혁신적인 시스템을 탑재한 엔비디아 기반 AI 플랫폼의 성능을 보여줬다. 엔비디아 AI 플랫폼은 엔트리 레벨 엣지 서버에서 수천 개의 GPU를 탑재한 AI 슈퍼 컴퓨터에 이르기까지 다양하다.

이번 벤치마크 테스트에 참여한 파트너사 7곳은 온라인 인스턴스, 서버, PCIe 카드 관련 제품이나 계획을 갖고 있는 20여 곳의 클라우드 업체 및 OEM에 포함된다. 해당 업체들은 40개의 엔비디아 인증 시스템(NVIDIA-Certified Systems)을 포함해 엔비디아 A100 GPU를 사용 중이다.

 



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.