네이버, ‘EMNLP 2021’ 학회서 ‘하이퍼클로바’ 핵심 연구 등 7개 논문 채택
네이버, ‘EMNLP 2021’ 학회서 ‘하이퍼클로바’ 핵심 연구 등 7개 논문 채택
  • 김건우 기자
  • 승인 2021.09.03 09:19
  • 댓글 0
이 기사를 공유합니다

초대규모 AI 분야 글로벌 기술 경쟁력 입증...한국어 AI 가치도 인정

[아이티비즈 김건우 기자] 네이버가 자연어처리 분야의 세계적인 권위 학회인 ‘EMNLP(Empirical Methods in Natural Language Processing) 2021’에서 초대규모 AI 연구 성과를 공유한다. 클로바 및 AI랩 연구진은 네이버의 초대규모 AI ‘하이퍼클로바’의 핵심 연구 논문을 비롯해, 총 7개의 논문을 발표할 예정이다.

25년 전통을 가진 EMNLP는 ACL(Association for Computational Linguistics)과 더불어 자연어처리(NLP) 분야의 최고 AI 학회로 꼽힌다. 올해는 도미니카공화국에서 11월 7일부터 11일까지 열리며, 온라인으로도 동시 진행된다.

특히, 이번에는 네이버의 초대규모 AI인 하이퍼클로바의 핵심 연구 논문이 메인 컨퍼런스 발표에 채택되는 성과를 거뒀다. 하이퍼클로바는 네이버가 지난 5월 국내 기업 최초로 공개한 초대규모 AI이자, GPT-3보다 한국어 데이터를 6,500배 이상 학습한, 현재 공개된 단일 모델 중 전세계에서 가장 큰 한국어 초대규모 언어모델이기도 하다. 

해당 연구는 한국어 초대규모 언어모델인 ‘하이퍼클로바’와 그 학습에 사용된 데이터를 소개하고, 다양한 크기의 모델들이 갖는 성능을 검증하는 내용이다. 논문에서는 하이퍼클로바가 다양한 한국어 과제에 대해 제한된 예제만으로도 뛰어난 학습 성능을 보인다는 것을 증명했다.

이와 더불어, 초거대 언어모델에서의 프롬프트 최적화(prompt optimization), 데이터 토큰화(tokenization) 등에 대한 논의를 발전시키고, ‘하이퍼클로바 스튜디오’를 통해 ‘노 코드 AI(No Code AI)’ 등 초대규모 AI가 가져올 AI 서비스 개발 방법론의 혁신적인 변화에 대해서도 설명한다. 해당 연구에는 네이버의 클로바 및 AI랩의 연구진 뿐만 아니라, 소프트웨어 플랫폼 엔지니어, 검색 엔지니어 등 다양한 팀에 걸쳐 총 37명이 저자로 참여했다.

하정우 네이버 AI랩 소장은 “작년 하반기부터 초대규모 AI 기술에 집중적으로 투자하고 연구 역량을 결집시킨 결과, 국내 최초로 ‘하이퍼클로바’ 기술을 공개하고 성공적으로 상용화한 데 이어 세계 권위의 학회에서 그 기술력을 인정받았다”면서, “이번 논문은 영어 중심이었던 기존의 언어모델 연구를 넘어, 한국어 AI의 가치를 글로벌 자연어처리 학계가 인정했다는 점에서도 의미 있는 성과”라고 강조했다.

 



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.