크라우드웍스, 과기정통부 AI 학습용 데이터 구축 사업 진행
크라우드웍스, 과기정통부 AI 학습용 데이터 구축 사업 진행
  • 김문구 기자
  • 승인 2020.07.30 14:21
  • 댓글 0
이 기사를 공유합니다

‘딥페이크 방지영상’과 ‘랜드마크 이미지’
크라우드웍스 로고
크라우드웍스 로고

[아이티비즈 김문구 기자] 크라우드웍스(대표 박민우)는 과학기술정보통신부가 추진하는 ‘딥페이크 방지영상’과 ‘랜드마크 이미지’의 AI 학습용 데이터 구축 사업을 진행한다고 30일 밝혔다.

이번 크라우드웍스가 추진하는 AI 학습용 데이터 구축 사업은 과기정통부가 AI통합지원 플랫폼인 AI허브를 통해 AI 개발에 필요한 데이터를 누구나 활용할 수 있는 양질의 데이터를 대규모로 구축·개방하는 것으로, 이번에 크라우드웍스가 10개 지정공모 사업 중 2개를 수주했다. 

’랜드마크 이미지 AI데이터’ 과제는 국내 특성(지리 공간적, 기능적)이 반영된 국내 도심 민간건물, 공공기관, 관광명소, 편의시설 등 국내 도시별 주요 랜드마크 이미지 데이터를 구축하는 것이다. 이를 통해 전국 주요 50개 도시의 랜드마크 이미지 총 500만장 이상을 AI 학습용 데이터로 구축하게 된다. 

크라우드웍스는 자사가 운영하는 플랫폼에 등록된 15만명 이상의 작업자를 활용해 데이터 전처리 과정으로 진행한다. 수집하고자 하는 랜드마크는 버스정류장 또는 지하철 역사 이름에 사용되는 랜드마크, 초·중·고 교과서 분석 결과 건물·지형·유적/유물에 해당되는 랜드마크로 선정하며, 랜드마크 성격은 지역별 공공기관, 주요 건물, 관광명소, 편의시설, 유적/유물로 특정하게 된다. 크라우드웍스가 구축한 랜드마크 이미지 AI 학습용 데이터는  AI 기술 및 응용 서비스 개발에 활용 가치를 높여주게 된다. 

사람의 얼굴을 악의적으로 변조한 ‘딥페이크 방지영상 AI 데이터’는 한국인 특성을 반영하는 얼굴 합성과 탐지용 합성 데이터의 생성을 주요 사업 내용으로 한다. 이 사업은 GAN(Generative Adversarial Networks) 기반의 다양한 변형 알고리즘을 통해 생성된 변조 영상(딥페이크)의 탐지‧검출하는 AI 기술 개발을 위한 학습용 변조 영상 데이터로 활용하게 된다. 

이를 위해 크라우드웍스는 15만명 이상의 국내외 작업자를 보유한 크라우드소싱 플랫폼을 통해 성별, 연령, 키, 몸무게가 다양한 참여자를 모집하고, 동시에 많은 사람이 셀프 동영상을 쉽게 업로드할 수 있도록 모바일 기반의 크라우드소싱 플랫폼도 사용(300명 분량 셀프 동영상으로 수집)한다. 그리고 참여자들이 크라우드웍스 모바일 앱을 사용해 제시된 시나리오에 따라 쉽고 빠르게 동영상을 셀프 촬영해 업로드할 수 있도록 지원할 예정이다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.