엔비디아, '인터스피치 2021' 행사서 최첨단 대화형 AI 모델 발표
엔비디아, '인터스피치 2021' 행사서 최첨단 대화형 AI 모델 발표
  • 박채균 기자
  • 승인 2021.09.01 15:45
  • 댓글 0
이 기사를 공유합니다

엔비디아가 인터스피치 2021에서 표현적 음성 합성을 위한 최첨단 대화형 AI 모델을 공개한다.
엔비디아가 인터스피치 2021에서 표현적 음성 합성을 위한 최첨단 대화형 AI 모델을 공개한다.

[아이티비즈 박채균 기자] 엔비디아(CEO 젠슨 황)가 8월 30일부터 9월 3일까지 열리는 세계 음성언어처리학회 인터스피치 2021(INTERSPEECH 2021)에서 표현적 음성 합성(Expressive speech synthesis)을 위한 최첨단 대화형 AI 모델을 공개한다고 1일 밝혔다.

해당 모델은 고품질에 제어 또한 가능한 음성 합성을 구현해 인간 음성의 풍부함을 잡음 없이 담아낸다. 엔비디아의 모델들은 은행과 소매업계의 음성 자동화 고객 서비스 라인을 지원하고 비디오 게임과 소설 속 캐릭터에 생동감을 불어넣는 한편, 디지털 아바타용 실시간 음성 합성을 지원한다. 엔비디아 크리에이티브 팀은 AI의 위력을 다루는 비디오 시리즈에 삽입돼 풍부한 표현력을 자랑하는 내레이션에도 음성 합성 기술을 사용하고 있다. 

표현적 음성 합성은 엔비디아 연구진이 대화형 AI 분야에서 진행 중인 여러 연구의 일부이다. 대화형 AI는 음성 합성 외에도 자연어 처리, 자동 음성 인식, 키워드 검출, 오디오 개선 등 여러 요소를 포함한다.

엔비디아 GPU에서 효율적으로 실행되도록 최적화된 최첨단 연구의 일부는 엔비디아 네모(NeMo) 툴킷을 통해 오픈소스로 제작됐으며, 엔비디아의 NGC 컨테이너 허브와 기타 소프트웨어에서 제공된다. 


관련기사

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.