엔비디아, 암페어 아키텍처에서 멀티 인스턴스 GPU 지원
엔비디아, 암페어 아키텍처에서 멀티 인스턴스 GPU 지원
  • 박채균 기자
  • 승인 2020.05.29 10:51
  • 댓글 0
이 기사를 공유합니다

엔비디아 A100 GPU를 최대 7개 독립된 GPU 인스턴스로 분할
GPU 활용도 극대화해 보다 신속한 AI 모델 개발 및 배포 가능
엔비디아 암페어(Ampere) 아키텍처에서 멀티 인스턴스 GPU를 지원한다.
엔비디아 암페어(Ampere) 아키텍처에서 멀티 인스턴스 GPU를 지원한다.

[아이티비즈 박채균 기자] 엔비디아(CEO 젠슨 황)는 자사의 암페어(Ampere) 아키텍처에서 멀티 인스턴스 GPU(MIG)를 지원해 기업들이 보다 신속하게 인공지능(AI) 모델을 개발 및 배포하도록 돕는다고 29일 밝혔다.

MIG는 엔비디아 A100 GPU를 최대 7개의 독립된 GPU 인스턴스로 분할한다. 인스턴스들은 각각 고유한 메모리, 캐시, 스트리밍 멀티프로세서를 사용해 동시에 실행된다. 이를 통해 모든 작업에 대해 보장된 서비스 품질로 적합한 크기의 GPU를 제공해 이전 GPU 대비 최대 7배 향상된 활용도를 구현한다. 

MIG 모드의 A100은 최대 7개의 다양한 크기의 AI 또는 고성능컴퓨터(HPC) 워크로드를 혼합해 실행할 수 있다. 이 기능은 일반적으로 최신 GPU가 제공하는 성능을 모두 필요로 하지 않는 AI 추론 작업에 유용하다. 예컨대 사용자는 20GB의 메모리를 갖춘 2개의 MIG 인스터스 혹은 10GB의 3개 인스턴스, 5GB의 7개 인스턴스를 생성할 수 있어 각각의 워크로드에 맞는 최적의 조합을 만들 수 있다.

MIG는 GPU 인스턴스를 차단시키므로 결함격리 기능을 제공하여 한 인스턴스의 문제가 동일한 GPU에서 실행되는 다른 사용자에게 영향을 주지 않는다. 각 인스턴스는 보장된 QoS를 제공해 사용자의 워크로드가 예상되는 레이턴시(지연시간)과 처리량을 확보할 수 있도록 한다.

클라우드 서비스제공업체와 그 외의 기업은 MIG를 통해 GPU 서버의 활용률을 향상시켜 사용자에게 최대 7배 많은 GPU 인스턴스를 제공할 수 있다. 구글 클라우드의 수석 소프트웨어 엔지니어 팀 호킨은 “엔비디아는 구글 클라우드의 전력적 파트너로 고객을 위해 혁신을 거듭하고 있다. MIG는 공유 쿠버네티스 클러스터에서 GPU의 효율성과 활용도를 새로운 수준으로 끌어올린다. 구글 클라우드는 엔비디아, 그리고 쿠버네티스 커뮤니티와 협력해 이러한 공유 GPU 활용사례를 만들어내고, 이를 구글 쿠버네티스 엔진을 통해 이용할 수 있기를 기대한다”고 말했다.

기업은 MIG를 통해 AI 모델의 개발과 배포속도를 향상시킬 수 있다. MIG는 최대 7명의 데이터 사이언티스트가 전용 GPU와 같은 기능에 동시에 액세스할 수 있으므로 최적의 정확성과 성능을 위해 딥 러닝 모델을 세부적으로 조정할 수 있다. 이는 시간이 많이 소요되지만, 많은 컴퓨팅 성능이 필요하지 않는다.

모델을 실행할 준비가 되면 MIG는 단일 GPU에서 한번에 최대 7개의 추론작업을 할 수 있다. 이런 작업에는 GPU 전체를 사용할 필요가 없고 레이턴시가 짧은 작은 모델을 사용하는 배치-1 추론 워크로드가 가장 적합하다.

사용자들은 AI와 HPC용 MIG를 활용하기 위해 쿠다(CUDA) 프로그래밍 모델을 변경할 필요가 없다. MIG는 쿠버네티스와 컨테이너뿐만 아니라 기존의 리눅스 운영체제에도 구동된다. MIG는 A100용으로 제공된 소프트웨어에도 작동된다.

레드 햇(Red Hat)의 마케팅 디렉터 척 더뷰크는 “고객들은 가상 시스템에서 실행되는 멀티 테넌트 워크 플로우를 관리하면서 격리와 보안 기능도 제공해야 할 필요를 점점 더 느끼고 있다. 엔비디아 A100 GPU의 새로운 멀티 인스턴스 GPU 기능을 통해 클라우드에서 엣지까지 레드 햇 플랫폼에서 실행되는 AI 가속 워크로드가 가능해진다"고 소감을 밝혔다.


관련기사

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.