오라클, MySQL 애플리케이션에 머신러닝 기능 추가
오라클, MySQL 애플리케이션에 머신러닝 기능 추가
  • 김문구 기자
  • 승인 2022.04.05 13:28
  • 댓글 0
이 기사를 공유합니다

모델 학습과 추론, 설명 완전 자동화
니푼 아가르왈 오라클 연구 및 고급 개발 부문 수석부사장은 5일 온라인 미디어 브리핑에서 발표하고 있다.
니푼 아가르왈 오라클 연구 및 고급 개발 부문 수석부사장이 5일 온라인 미디어 브리핑에서 발표하고 있다.

[아이티비즈 김문구 기자] 오라클은 5일 온라인 미디어 브리핑을 개최하고, 오라클 MySQL 히트웨이브(Oracle MySQL HeatWave)에 데이터베이스 내 머신러닝(ML) 기능을 추가했다고 발표했다.

오라클은 기존 트랜잭션 프로세싱과 분석에 이번에 출시한 머신러닝 기능을 추가하며 MySQL 클라우드 데이터베이스 서비스 중 해당 기능을 제공하는 유일한 업체가 되었다.

MySQL 히트웨이브 ML은 머신러닝의 수명 주기를 완전 자동화하고 학습된 모델 모두를 MySQL 내에 저장해, 외부의 머신러닝 도구나 서비스로 데이터와 모델을 이동하지 않아도 된다. 추출, 변환 및 적재(ETL) 절차가 사라지며 애플리케이션 복잡성과 비용이 감소하고 머신러닝 모델과 데이터의 보안성이 개선되었다. 히트웨이브 ML 기능은 전 세계 37개의 모든 오라클 클라우드 인프라스트럭처(OCI) 리전에서 MySQL 히트웨이브 데이터베이스 클라우드 서비스에 포함되어 제공된다.

MySQL 애플리케이션에 머신러닝 기능을 추가하는 일은 아직까지도 많은 개발자들이 오랜 시간을 소모하는 고난이도의 작업이다. 이를 위해 먼저 데이터베이스에서 자료를 추출하여 다른 시스템에 옮긴 후 머신러닝 모델을 만들고 구축하는 과정을 거쳐야 한다. 이러한 접근 방식으로는 애플리케이션 데이터가 머신러닝에 적용되는 과정에서 다수의 데이터 사일로 현상이 나타나고 데이터 이동으로 인해 지연 시간이 발생한다. 또 급증하는 데이터로 인해 데이터베이스의 보안 취약점이 증가하고 개발자가 프로그램을 작성하는 환경이 다양해져 복잡성이 증가한다.

또한 기존 서비스를 고려하여 머신러닝 모델을 학습시키는 과정에는 개발자의 전문적인 지식이 필요하다. 이를 만족하지 못할 경우 최적화된 모델을 보장할 수 없기에 예측의 정확성은 감소한다. 마지막으로 대부분의 기존 머신러닝 솔루션은 개발자가 구축한 모델이 어떻게 그러한 결과를 예측하게 되었는 지에 대한 이유를 설명해주지 않는다.

이번에 새롭게 소개된 MySQL 히트웨이브 ML은 머신러닝 기능이 MySQL 데이터베이스 내에 기본으로 통합되어 데이터를 다른 서비스로 옮기는 ETL 과정이 필요 없기 때문에 이러한 문제가 해결된다. 완전 자동화된 히트웨이브 ML의 모델 학습 프로세스는 주어진 데이터 세트에서 지정된 작업에 최적화된 특징(feature)과 초매개변수(hyper-parameter), 알고리즘을 갖춘 모델을 생성한다. 또한, 히트웨이브 ML에서 생성한 모든 모델과 예측 결과에는 설명도 함께 제공된다. 

오라클은 뉴머라이(Numerai), 노마오(Nomao), 은행권 마케팅(Bank Marketing) 등의 데이터 세트를 비롯해 분류 및 회귀 분석 작업을 위해 일반에 공개된 다양한 머신러닝 데이터의 벤치마크 결과를 공개하였다. 가장 작은 클러스터로 구성된 머신러닝 모델의 경우, 히트웨이브 ML은 아마존 레드시프트 ML 대비 평균 1%의 비용으로 25배 빠른 학습이 가능하다. 또한, 더 큰 규모의 히트웨이브 클러스터에서 학습할 경우, 레드시프트 ML 대비 성능 향상폭은 더욱 증가한다. MySQL 히트웨이브 이용자들은 기존에 많은 시간이 소요되던 훈련을 빠른 시간 안에 효율적으로 완료할 수 있기에 주기적인 모델 재학습을 통해 잦은 데이터 변경 사항도 반영할 수 있어 모델을 최신 상태로 유지할 뿐 아니라 예측의 정확성 또한 향상시킨다. 

기타 클라우드 데이터베이스 서비스 대비 히트웨이브 ML 기능의 장점은 △완전 자동화된 모델 교육(Fully Automated Model Training) △모델 및 추론 설명(Model and Inference Explanations) △초매개변수 조정(Hyper-Parameter Tuning) △알고리즘 선택(Algorithm Selection) △지능형 데이터 샘플링(Intelligent Data Sampling) △특징 선택(Feature Selection) 등이 있다.

에드워드 스크리븐 오라클 총괄 아키텍트는 “오라클은 지난 해 이미 단일 데이터베이스에 분석과 트랜잭션 처리 기능을 통합했던 것처럼, 이번에는 MySQL 히트웨이브 내에 머신러닝을 통합하게 된 것이다”며 “MySQL 히트웨이브는 오라클에서 가장 빠른 성장세를 자랑하는 클라우드 서비스 중 하나다. 아마존 및 기타 클라우드 데이터베이스 서비스를 사용하던 고객들이 MySQL 히트웨이브로 마이그레이션하는 사례가 증가하고 있으며 성능 개선 및 비용 절감 효과가 입증되고 있다. 이번에 발표된 여러 가지 혁신적 기능들은 히트웨이브의 성능 향상뿐만 아니라 가용성을 개선하는 동시에 비용도 절감해준다. 오라클이 새롭게 발표한 벤치마크 결과는 스노우플레이크, AWS, 마이크로소프트, 구글과 비교 시 MySQL 히트웨이브가 더욱 빠르고 더 저렴하다는 사실을 다시 한번 보여주었다”고 강조했다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.