[대한민국이 좋다] 네이버, YG엔터와 음성합성 기술 활용 ‘오디오북 기부 캠페인’
상태바
[대한민국이 좋다] 네이버, YG엔터와 음성합성 기술 활용 ‘오디오북 기부 캠페인’
  • 이근우 기자
  • 승인 2016.08.04 13:36
  • 댓글 0
이 기사를 공유합니다
네이버가 YG엔터테인먼트와 함께 음성합성 기술을 활용해 오디오북 기부 캠페인을 진행한다. 사진=네이버 제공

[매일일보 이근우 기자] 네이버는 YG엔터테인먼트와 함께 음성합성 기술을 활용해 오디오북 기부 캠페인을 진행한다고 4일 밝혔다.

네이버는 네이버랩스를 통해 축적해 온 음성합성 기술과 배우 유인나씨의 음성을 기반으로, 녹음본 및 합성본이 결합된 ‘유인나 오디오북’ 3권을 제작하고, 이를 기부 플랫폼인 ‘해피빈’을 통해 무료로 제공한다.

유인나 오디오북은 청소년들의 교양서적으로 추천할 만한 3권의 책(데미안, 동물농장, 왕자와 거지)에 대해 진행됐고, 책의 전반부는 유인나씨가 직접 읽고, 후반부는 네이버의 음성합성 기술로 만들어졌다.

평소 오디오북 녹음하기 위해선 권당 10시간 이상의 녹음 시간이 필요했지만, 네이버의 음성합성 기술이 더해져 기존 대비 절반의 시간으로 오디오북을 제작했다.

특히 합성 기술이 적용된 부분은 성우의 목소리 속 고유한 운율과 자연스러움을 잘 살려내며 실제와 가까운 소리를 재현해냈다.

네이버랩스가 ‘합성단위 선택방식’을 기반으로 자체 개발한 ‘n보이스’라는 기술은 현재 뉴스 읽기, 사전 예문 읽기, 번역기 등 네이버의 실제 서비스에 적용 중이며, 향후 음성을 인터페이스로 활용하는 다양한 온오프라인 서비스에 확대될 예정이다.

송창현 네이버 최고기술경영자(CTO)는 “미래의 기기와 서비스는 사람과 기계가 음성을 주고받는 대화형 음성 인터페이스가 주를 이룰 것으로 보인다”고 설명했다.

그는 이어 “네이버도 n보이스 기술을 적용해 한국어 뿐 아니라 영어, 일본어, 중국어 등 4개국 남녀 화자를 개발했다”며 “향후 지속적으로 합성기술의 품질을 높여나가며 언어 및 적용 범위를 확대해 나갈 것”이라고 덧붙였다.

한편, 음성합성 기술이란, 텍스트의 형태소를 분석하고 음소 단위로 변환해, 어떤 운율로 읽는 것이 좋을지 모델링 한 뒤 녹음한 음성 데이터베이스(DB)로 최적의 합성단위를 선택·합성하는 것을 말한다.

텍스트로만 정보를 전달하는 시기를 지나, 음성으로 대화하고 정보를 얻고 있는 시대로 변모함에 따라 인공지능 대화 시스템을 개발하는 업체 뿐 아니라 국내외 정보통신기술(ICT) 기업들의 개발 및 학회 연구가 활발히 진행 중이다.

음성합성기술 중 합성단위 선택방식(유닛 셀렉션)은 방대한 양의 데이터베이스를 분석해, 자연스럽고 명료한 음성합성을 만들어 내는 알고리즘의 가장 큰 장점이다.

네이버의 n보이스에 적용되는 합성단위 선택방식은 이런 음질의 우수성을 바탕으로 애플 ‘시리’, 아마존의 ‘에코’, 구글 ‘나우’ 등 글로벌 IT기업들이 앞다퉈 개발 및 적용하고 있는 음성합성 방식이다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.