엔비디아, 빅데이터 분석 벤치마크 테스트서 신기록 수립
엔비디아, 빅데이터 분석 벤치마크 테스트서 신기록 수립
  • 박채균 기자
  • 승인 2020.06.23 17:44
  • 댓글 0
이 기사를 공유합니다

DGX A100 시스템으로 구동되는 래피즈 활용해 약 20배 빠른 TPCx-BB 성능 달성
엔비디아는 빅데이터 분석 벤치마크 테스트서 신기록을 수립했다.
엔비디아는 빅데이터 분석 벤치마크 테스트서 신기록을 수립했다.

[아이티비즈 박채균 기자] 엔비디아(CEO 젠슨 황)는 TPCx-BB로 알려진 표준 빅데이터 분석 벤치마크 테스트에서 약 20배 빠른 성능을 달성했다고 23일 밝혔다. 

엔비디아는 16개의 엔비디아 DGX A100 시스템으로 구동되는 래피즈(RAPIDS) 오픈소스 데이터 사이언스 소프트웨어 라이브러리 제품군을 사용하여 불과 14.5분만에 벤치마크를 실행했다. 현재 CPU 시스템에서 달성한 최고 결과는 4.7시간이다. 엔비디아 DGX A100에는 총 128개의 엔비디아 A100 GPU가 탑재됐으며, 엔비디아 멜라녹스 네트워킹을 활용했다. 

데이터 분석에 있어 중요한 것은 실제 결과이므로, 많은 조직들은 인공지능(AI)을 사용해 데이터로부터 통찰력을 이끌어낸다. TPCx-BB 벤치마크는 구조화된 데이터에 대한 머신러닝과 SQL을 결합한 쿼리, 그리고 자연어 처리와 비정형 데이터를 통해 오늘날 데이터 분석 워크플로우에서 발견되는 다양성을 반영한다. 이러한 결과는 업계에 새로운 표준을 제시하게 되는데, 새로운 표준의 획기적인 발전은 엔비디아 소프트웨어 및 하드웨어 생태계를 통해 이루어진다. 

이 벤치마크를 실행하기 위해 엔비디아는 데이터 처리 및 머신러닝에 래피즈, 수평 스케일링에 Dask, 초고속 통신에 UCX 오픈소스 라이브러리를 각각 사용했으며, 이 모든 것들은 엔비디아 DGX A100을 기반으로 구동됐다. 

엔비디아 DGX A100 시스템은 단일 소프트웨어 정의 플랫폼에서 분석, AI 교육 및 추론을 효과적으로 수행할 수 있다. 또한, 엔비디아의 최신 암페어 아키텍처를 기반으로 하는 엔비디아 A100 텐서 코어 GPU와 엔비디아 멜라녹스 네트워킹을 턴키 시스템으로 통합하여 쉽게 확장 가능하도록 한다. 

TPCx-BB는 ETL(추출, 변환, 로드)과 머신러닝 워크플로우를 대표하는 기업들을 위한 빅데이터 벤치마크다. 벤치마크의 30개 질의에는 재고 관리, 가격 분석, 판매 분석, 추천 시스템, 고객 세분화, 감정 분석 등의 빅데이터 분석 활용사례가 포함된다.

분산 컴퓨팅 시스템은 지속적으로 개선되고 있음에도 불구하고, 이러한 빅데이터 워크로드가 CPU에서 실행될 경우 여전히 병목현상이 나타난다. 엔비디아 DGX A100을 기반으로 래피즈를 활용해 달성한 이번 결과는 GPU와 관련한 최초의 비공식 TPCx-BB 벤치마크로, CPU 전용 시스템에서 실행된 역사적인 테스트라 할 수 있다. 

이번 벤치마크에서 레피즈 소프트웨어 에코시스템과 DGX A100 시스템은 컴퓨팅, 통신, 네트워킹 및 스토리지 인프라를 가속화했으며, 이를 통해 데이터 사이언스 워크로드를 규모에 맞게 실행할 수 있는 새로운 기준을 제시했다. 


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.