다음카카오는 음성 합성 오픈 API(응용 프로그램 프로그래밍 인터페이스) '뉴톤 톡(Newtone Talk)'의 낭독체 음성을 업그레이드하고 대화체를 추가해 제공한다고 17일 밝혔다.
뉴톤 톡은 다음카카오가 6월 기본 낭독체를 탑재해 첫 선을 보인 음성 합성 엔진으로 입력된 문장을 음성으로 변환해준다.
이 새로운 낭독체는 사람이 읽어주듯 자연스러운 음성이 특징이다. 음질 향상을 위해 목소리의 여러 주파수 별 파형을 조합하는 방식으로 바꿔서 딱딱한 기계음이 만들어질 가능성을 최소화했다.
이를 통해 일상적인 대화체 음성의 표현도 가능해졌다. 다음카카오는 대화체의 다양한 발화 형태를 표현하기 위해 낭독체보다 2배 이상 많은 음성 데이터를 사용했다.
대화체를 통해 합성된 음성에서는 동일한 단어라도 문장 내 위치 등 문맥에 따라 음의 높낮이가 달라지는 등 어색함이 없다.
구동욱 다음카카오 음성처리파트장은 "뉴스나 책 구절 등의 장문 낭독을 대신하거나 모바일 메시지를 대화체 음성으로 변환하고 시각 장애인을 위한 생활형 서비스를 개발하는 등 다양한 영역에서 뉴톤 톡의 기능이 활용될 수 있다"고 말했다. [미디어펜=이미경 기자]