AWS, 아마존 데브옵스 구루 발표
AWS, 아마존 데브옵스 구루 발표
  • 김아라 기자
  • 승인 2020.12.03 15:21
  • 댓글 0
이 기사를 공유합니다

애플리케이션 가용성을 개선하기 위한 맞춤형 추천 제공
아마존웹서비스(AWS) 로고
아마존웹서비스(AWS) 로고

[아이티비즈 김아라 기자] 아마존웹서비스(AWS)는 AWS 리인벤트 행사에서 아마존 데브옵스 구루(Amazon DevOps Guru)를 발표했다.

아마존 데브옵스 구루는 머신러닝을 이용하는 완전 관리형 운영 서비스로 개발자들이 자동으로 운영 문제를 감지하고 개선을 위한 구체적인 조치를 추천하여 애플리케이션 가용성을 향상시킨다.

아마존 데브옵스 구루는 수년 동안 아마존닷컴 및 AWS 운영 우수성을 통해 학습된 머신러닝을 적용하여 정상적인 운영 패턴에서 벗어나는 동작 식별을 위한 애플리케이션 메트릭, 로그, 이벤트 및 추적과 같은 데이터를 자동으로 수집하고 분석한다. 아마존 데브옵스 구루는 잠재적인 정지나 서비스 중단을 야기할 수 있는 비정상적인 애플리케이션 동작을 식별하면, 아마존 SNS(Simple Notification Service)와 아틀라시안 옵스지니나 페이저듀티와 같은 파트너와의 통합을 통해 개발자에 문제의 세부사항을 알리고 개선을 위한 구체적인 추천을 통해 문제의 잠재적인 영향과 가능한 원인을 신속하게 이해할 수 있도록 돕는다.

개발자는 아마존 데브옵스 구루의 개선 제안을 사용하여 문제 발생 시 해결 시간을 단축하고, 수동 설정이나 머신러닝 전문 지식 없이도 애플리케이션 가용성과 신뢰성을 개선할 수 있다. 아마존 데브옵스 구루는 선결제 비용이나 약정은 없으며, 고객들은 아마존 데브옵스 구루가 분석한 데이터에 대해서만 지불한다. 

아마존 데브옵스 구루의 머신러닝 모델은 아마존닷컴의 고가용성 애플리케이션 구축, 확장 및 유지에 대한 20년 이상의 운영 전문 지식을 활용한다. 이를 기반으로 아마존 데브옵스 구루는 운영 문제(를 자동 감지하고, 관련 리소스 및 이벤트에 대한 컨텍스트를 제공하고 개선 조치를 추천할 수 있으며, 사용하는데 머신러닝 경험은 필요하지 않다.

아마존 데브옵스 구루 콘솔에서 단 몇 번의 클릭만으로 모든 리소스에 대한 지연 시간, 오류율, 요청률과 같은 과거 애플리케이션 및 인프라 메트릭을 자동으로 수집하고 분석하여 정상적인 작동 범위를 설정하고, 그 다음 사전 훈련된 머신러닝 모델을 사용해 설정된 기준과의 편차를 식별한다. 아마존 데브옵스 구루가 시스템 및 애플리케이션 데이터를 분석하여 이상 징후를 자동으로 감지할 때, 해당 데이터를 변칙적인 메트릭, 시간에 따른 애플리케이션 동작 시각화, 개선 조치에 대한 추천 등의 운영 통찰력으로 그룹화하기도 한다.

또한 아마존 데브옵스 구루는 중복 경보를 줄이고 사용자가 심각도가 높은 문제에 집중할 수 있도록 돕기 위해, 관련 애플리케이션 및 인프라 메트릭을 상호 연관시키고 그룹화한다. 고객은 시스템 및 사용자 활동에 따라 구성 변경 이력 및 배포 이벤트를 볼 수 있으며, 아마존 데브옵스 구루 콘솔에서 운영 문제의 가능한 원인 우선순위 목록을 생성할 수 있다. 고객이 문제를 신속하게 해결할 수 있도록 아마존 데브옵스 구루는 개선 조치를 포함한 지능형 추천을 제공하고 AWS 시스템 매니저(AWS Systems Manager)와 연계하여 런북 및 협업 툴링을 제공함으로써 고객이 애플리케이션을 보다 효과적으로 유지하고 배포 인프라를 관리할 수 있도록 돕는다.

아마존 데브옵스 구루는 코드 품질을 개선하고 애플리케이션에서 가장 비싼 코드 라인을 식별하기 위한 지능형 추천을 제공하는 머신러닝 기반 개발자 툴인 아마존 코드구루와 함께 개발자가 애플리케이션 가용성과 안정성을 보다 쉽게 개선할 수 있도록 고객의 운영 데이터에 대해 머신러닝의 자동화된 이점을 제공한다.

스와미 시바수브라마니안 AWS 아마존 머신러닝 부사장은 "고객들은 우리가 아마존닷컴을 운영하면서 얻은 수년간의 경험을 통해 얻은 전문지식을 애플리케이션 가용성 개선에 적용할 수 있었던 분야를 중심으로 서비스를 계속 추가해 줄 것을 계속 요청했다. 경험을 바탕으로, 아마존 데브옵스 구루는 고객이 운영 문제를 감지, 해결 및 예방하는 데 도움이 되는 전문 머신러닝 모델을 구축했고, 문제 발생 시 지능형 추천을 제공한다. 이를 통해 팀들은 아마존이 아마존닷컴을 운영하면서 배운 모범 사례를 즉시 활용할 수 있게 되어, 여러 모니터링 시스템을 구성하고 관리하는 데 드는 고객의 시간과 노력을 절약할 수 있다"고 말했다. 


관련기사

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.