[특별기고] 플래시 홍수: 플래시 스토리지 비즈니스 사례
[특별기고] 플래시 홍수: 플래시 스토리지 비즈니스 사례
  • 김문구 기자
  • 승인 2015.09.10 16:03
  • 댓글 0
이 기사를 공유합니다

▲ 신동민 HGST코리아 지사장

[아이티비즈] 기업 경쟁력 강화 측면에서 애플리케이션 성능과 데이터 관리의 중요성이 날로 증가하고 있다. 데이터에 실시간으로 액세스하고, 이를 처리 및 분석해 비즈니스에 도움이 되는 통찰력을 획득하는 것이 중요해졌다. 때문에 많은 기업들이 스토리지 인프라에 플래시(Flash) 솔루션을 추가하는 방법을 적극 검토 중이다.

기업의 최고정보책임자(CIO) 사이에서도 데이터베이스, 데이터 웨어하우스, 빅데이터 분석 등 고성능 애플리케이션에는 플래시가 제격이라는 인식이 확산 중이다.

올플래시 및 하이브리드 플래시 스토리지 어레이에 대한 논의가 활발해지면서 서버 사이드의 플래시, 특히 PCIe가 주목 받고 있다. 가트너가 2015년 2월 발표한 차세대 서버 사이드 SSD 시장 보고서에 따르면, 올해 출고되는 PCIe 수량이 100만 대가 넘을 것으로 전망되며, PCIe 가격도 GB당 1달러대로 움직이면서 2018년에는 PCIe가 데이터 센터에 출하되는 전체 SSD 저장 장치의 50%에 달할 것으로 전망된다.

PCIe 플래시는 가격 대비 성능 측면에서 경쟁력이 있어, 많은 기업들이 사용하고 있다. 예전에는 고가의 SAN 기반 솔루션이 있어야만 사용 가능했던 분야들을 지금은 소프트웨어 정의 스토리지(SDS)의 새로운 기능을 활용해 많은 엔터프라이즈 사용 사례들을 만들어가고 있다. 많은 엔터프라이즈 사용 사례들을 만들어 가고 있다.

◆ 캐싱에서 중요한 문제

PCIe 플래시는 기존 SAN 앞쪽에 캐싱을 구성할 때 가장 널리 사용된다. 이러한 작업은 기존의 SAN에 완전히 투명한 방식으로 이루어지기 때문에, 지연 시간을 몇 천 분의 1초 단위에서 몇 백 만분의 1초 단위로 단축하고 몇천분의 1초 단위에서 몇백만분의 1초 단위로 대폭 단축하고 기존 인프라에 수천 개의 IOPS를 추가할 수 있다.

이러한 이유로 Microsoft SQL Server 같이 10,000달러 미만의 가격으로 단일 PCIe 장치 및 캐싱 소프트웨어를 구입할 수 있는 데이터베이스에 널리 사용된다. PCIe 플래시는 기존의 SAN 환경에 놀라운 성능향상효과를 가져오지만, 기존의 SAN 환경에서 이러한 성능향상효과를 가져오기 위해서는 5배 이상의 비용이 들며, 그러한 비용에도 PCIe 플래시로 구축했을 때와 같은 지연시간 수준에는 결코 이를 수 없다.

PCIe 플래시는 기존의 SAN 환경에 놀라운 성능향상효과를 가져오지만, 기존의 SAN 환경에서 이러한 성능향상효과를 가져오기 위해서는 5배 이상의 비용이 들며, 그러한 비용에도 PCIe 플래시로 구축했을 때와 같은 지연시간 수준에는 결코 이를 수 없다. 데이터베이스 환경에서 지연 시간이 길다는 것은 사용자 응답 대기 시간이 길거나 초당 처리되는 트랜잭션 수가 적다는 뜻으로, 시간이 곧 돈으로 연결되기 때문에 캐싱 소프트웨어가 설치된 PCIe 플래시가 신속하면서도 손쉬운 대안으로 떠오르는 추세이다.

◆ 공유 플래시 액세스

많은 경우 엔터프라이즈 데이터베이스는 공유 스토리지 액세스를 요구한다. 단일 인스턴스 Oracle Databases 및 Oracle RAC(Real Application Clusters)가 가장 대표적인 예다. RAC는 데이터베이스의 볼륨 관리자로 Oracle ASM(Automatic Storage Management)을 사용한다. ASM은 디스크 그룹을 통해 데이터 파일을 저장하고 유연한 서버 기반의 미러링 옵션을 지원한다.

지금까지 Oracle ASM에서 플래시를 사용하는 유일한 방법은 SAN 어레이를 기반으로 하는 것뿐이었다. 그런데 지연 시간과 비용을 고려해 볼 때, 특히 환경이 계속 확장되고 워크로드 헤드룸에 더 많은 IOPS가 필요할 경우에는SAN 기반의 Oracle 데이터베이스를 구축하는 데 엄청난 비용이 발생한다.

이에, HGST는 데이터베이스 서버 내에서 직접 PCIe 플래시에 ASM 디스크 그룹 단위로 액세스하고 관리할 수 있는 소프트웨어 정의 스토리지를 제공한다. ASM은 데이터 저장소에 필요한 만큼 PCIe 플래시를 모을 수 있다. 서버 버스 상에서 스토리지에 직접 액세스할 수 있기 때문에 데이터베이스의 올플래시 계층에서 지연 시간을 백만 분의 1초 수준으로(Oracle의 Calibrate IO 도구로 측정 불가능) 단축할 수 있다.

또한, ASM은 모든 스토리지를 인식하기 때문에 데이터를 SAN상의 저렴한 스토리지로 이전해 최적의 가격 대비 성능을 실현할 수 있다. 서버 코어의 활용도를 높일 수 있다는 것도 공유 플래시 액세스의 또 다른 이점이다. 덕분에 Oracle 라이선스 비용을 줄이거나 기존 라이선스의 사용 기간을 연장할 수 있다.

◆ 클러스터링 및 서버 통합

MySQL 같은 데이터베이스에서는 마스터 혹은 슬레이브로 서버를 배포하는 것이 전통적인 접근 방식이다. 마스터 서버는 대형 클러스터를 이루는 요소로서, 여러 마스터 서버들 간에 데이터베이스 행이 수평으로 ‘공유’되기 때문에 수평 확장이 가능하다. 슬레이브 서버는 읽기 트래픽의 로드를 분산시키는 데 사용되며, 마스터 서버가 고장이 나거나 데이터가 손상된 경우에 페일오버 노드의 역할을 한다.

PCIe 플래시는 단일 장치가 읽기 및 쓰기 트래픽을 마스터 서버에서 모두 처리할 수 있을 정도로 속도가 빠르고 지연 시간이 짧다. 데이터베이스 손상 및 서버 고장은 극히 드문 경우이기 때문에 많은 슬레이브 서버들이 유휴 상태로 있으면서 전력을 소모하고 공간을 차지하며 냉각을 필요로 한다. PCIe 플래시 장치와 서버 사이드 서버 사이드 플래시 클러스터링 소프트웨어를 이용하면 이러한 ‘서버 확산(server sprawl)’을 손쉽게 해결할 수 있다.

클러스터링 소프트웨어는 여러 마스터 서버에서 모든 플래시 리소스를 하나로 모아 단일 풀에 통합한 다음, 해당 풀에서 각각의 마스터 서버에 리소스를 할당할 수 있도록 해준다. 소수의 오픈 소스 소프트웨어가 설치된 단일 슬레이브 서버나 ‘다기능 서버’는 ‘리스너(listener)’ 역할을 한다. 마스터 서버가 고장 나면 이 다기능 서버는 리소스 볼륨을 늘려서 중단 없이 계속해 협업이 이루어지도록 한다.

이와 동시에 모든 마스터 서버들이 풀에 복제되기 때문에 페일오버가 일어날 때도 데이터 손실이 발생하지 않는다. 기본적으로 지원되는 MySQL 복제는 비동기식으로 이루어지기 때문에 일부 트랜잭션이 손실될 수 있다는 점에서 이는 특히 중요하다. 이렇듯 물리적 MySQL 시스템으로의 마이그레이션이 간단하면서도 자연스럽게 이루어지기 때문에 클러스터의 규모에 따라 서버 수를 38~70% 줄일 수 있다.

◆ 미래 예측: 트렌드 전망

이런 미션 크리티컬 엔터프라이즈 환경에서 지연 시간이 길다는 것은 사용자 응답 대기 시간이 길거나 초당 처리되는 트랜잭션 수가 적다는 뜻으로, 시간이 곧 돈으로 연결되기 때문에 플래시가 매력적인 대안으로 점차 주목 받고 있다. 따라서 앞으로 효율성, 성능 및 확장성 기준에 대한 면밀한 검토가 이루어질 것으로 보인다. 성공을 원하는 기업이라면 현재 보유한 데이터로부터 더 많은 가치를 이끌어내야 할 것이다.

하드웨어 및 소프트웨어 솔루션은 CIO들이 성능과 복잡성, 비용 사이에서 균형을 도모하도록 도울 수 있어야 하며, 이를 위해서는 모든 SSD 환경에서 피크 시간대에 애플리케이션을 가속화하는 데 초점을 두어 티어링(tiering) 또는 캐싱을 통해 HDD와 플래시가 통합된 환경을 활용함으로써 부족한 성능을 향상시켜야 한다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.