뉴스홈 경제 정치 연예 스포츠

SK C&C, 20분만 녹음하면 내 목소리로 AI 보이스가 뚝딱

2020-09-23 09:23 | 조한진 기자 | hjc@mediapen.com
[미디어펜=조한진 기자] 20분 정도의 음성 녹음 파일만 있으면 자신의 목소리를 닮은 인공지능(AI) 보이스를 만들 수 있는 기술이 나왔다.

SK㈜ C&C는 23일 라이언로켓과 ‘AI 텍스트 음성 변환(TTS) 사업 협력 협약(MOU)’을 체결했다고 밝혔다. 코로나 19로 인한 사회적 거리두기 차원에서 화상회의로 진행된 이번 협약식에는 SK㈜ C&C 이석진 Channel & Marketing 그룹장과 정승환 라이언로켓 대표 등 관계자들이 참석했다.

이석진 SK㈜ C&C Channel&Marketing그룹장(오른쪽)과 정승환 라이언로켓 대표이사가 화상회의로 ‘인공지능 텍스트 음성변환사업 협력 협약’을 체결한 뒤 기념촬영을 하고있다. /사진=SK C&C 제공


라이언로켓은 AI를 활용해 화자의 목소리와 말투를 완벽하게 모사하는 음성합성 기술을 보유한 스타트업이다. 지난 4.15총선 관련 ‘선택 2020’ MBC 개표방송에서 인공지능 캐스터 목소리로 실시간 개표상황과 지역별 후보자들을 알려주는 ‘AI LIVE’ 방송 서비스로 화제를 모았다.

양사는 각 사가 보유한 자연어 처리 및 텍스트 음성 변환 고유 기술을 결합해 문화 및 교육 분야를 중심으로 국내외 콘텐츠 시장 공동 발굴에 나선다. 시각장애인의 학습과 문화체험을 돕기 위해 활자책을 음성으로 변환하는 사업을 우선 추진한다.

우선 양사는 문화재청 국립문화재연구소와 함께 시각장애인을 위한 천연기념물(동물) 소개용 점자감각책에 들어가는 이야기해설(내레이션) 제작을 지원했다.

양사가 힘을 합친 ‘AI 텍스트 음성 변환’의 핵심은 딥러닝과 딥보이스 기술에 기반한 빠른 음성 합성 속도에 있다. 20분 분량의 음성 녹음 데이터만 있으면 화자의 목소리, 톤, 억양, 발음, 속도 등의 특징을 분석해 어떤 문장이라도 자연스럽게 읽어 내려간다. 목소리 제공자가 오랜 시간 녹음한 음성을 자음, 모음으로 나누어 소리를 붙이는 기존 텍스트 음성 변환 기술과 달리 AI가 제공자의 말뭉치를 그대로 분석 학습하기 때문이다. 

양사는 한류 스타 및 캐릭터를 활용한 글로벌 콘텐츠 사업 및 일반인 및 아동 대상 도서 읽어 주기 등의 신규사업 개발에도 힘을 모은다.

짧은 제작 기간 덕분에 사업화에 투자되는 시간도 크게 줄일 수 있을 전망이다. 이미 녹음 파일을 보유한 한류 스타나 유명 캐릭터는 별도 녹음 없이 문자 입력과 동시에 목소리가 생성되기 때문이다. 기존에는 음성 오디오북 한 권 제작하는 데도 한 달 이상 제작 기간을 잡았다.

정승환 라이언로켓 대표는 “AI TTS를 통해 생생한 사람의 감정과 감동을 전달하는 자연스러운 목소리를 만들어 가겠다”며 “한국어 음성 데이터만으로 중국어, 영어 등 외국어 자동 생성 기능도 개발해 글로벌 시장 진출도 적극 추진할 것”이라고 말했다.

이석진 SK㈜ C&C Channel&Marketing그룹장은 “사회적가치 실현을 위해 스타트업과 상생 방안을 모색하던 중 인공지능 음성합성 기술 전문 역량을 보유한 라이언로켓과 전략적인 파트너십을 체결하게 됐다”며 “이번 협력으로 시각장애인 교육 및 문화 생활 향상에 기여할 수 있는 다양한 사회적 가치 실천 프로그램을 만들어가는데 노력하겠다”고 말했다.


[미디어펜=조한진 기자]
종합 인기기사
© 미디어펜 All rights reserved.