KT 마음톡 앱에 텍스트 입력 시 복원 목소리 구현

KT 융합기술원에서 AI 기술을 활용해 루게릭병 환우의 목소리 복원 작업을 하고 있는 모습 <사진=KT>
KT 융합기술원에서 AI 기술을 활용해 루게릭병 환우의 목소리 복원 작업을 하고 있는 모습 <사진=KT>

[현대경제신문 하지현 기자] KT는 비영리재단법인 승일희망재단과 협력해 루게릭병 환우의 목소리를 복원하고 모바일 앱 ‘마음톡(TALK)’을 통해 이 목소리를 일상에서 활용할 수 있도록 무상 지원했다고 20일 밝혔다.

루게릭병은 운동 세포가 파괴돼 신체 근육이 약화됨에 따라 여러 증상이 나타날 수 있는데, 혀의 근육이 약해질 경우 분명한 발음이 점차 어려워지며 마비가 진행돼 기도를 절개해야 하는 상황에 이르게 되면 목소리를 잃게 된다. 이에 많은 루게릭병 환우들이 목소리를 잃게 될 것을 대비해 사전에 개인의 음성을 남겨놓을 수 있기를 희망한다.

목소리 복원에는 KT가 보유한 개인화 음성합성기술(P-TTS)이 활용됐다. 이 기술은 적은 양의 음성 샘플만으로도 딥러닝 기반 AI 학습을 통해 사람의 음색, 어조, 말투 등을 반영한 목소리를 그대로 구현해낼 수 있다. KT는 환우들이 스마트폰으로 500개의 대화체 문장을 녹음해 전달한 오디오 파일을 바탕으로 이들의 음성 샘플 데이터를 교정하고 목소리를 생성했다.

루게릭병 환우들이 KT의 마음톡 앱에 텍스트를 입력하면 이 앱이 해당 환우의 목소리로 읽어준다. 텍스트를 음성으로 변환하는 과정에서 수천만 번의 연산을 거치는데 연산 시간은 1초 내외로 체감 지연이 없어 타인과 실시간으로 대화할 수 있다. 음성 및 영상통화도 가능하며, 음성통화 도중 끊김 없이 영상통화로 전환할 수도 있다.

KT는 ‘목소리 찾기’ 프로젝트를 통해 재작년부터 목소리를 잃은 농인들의 목소리를 AI 기술로 복원해 원활한 의사소통을 할 수 있도록 지원해왔다.

김무성 KT ESG경영추진실 상무는 “인공지능, 빅데이터, 클라우드 등 KT가 가진 국내 최고 수준의 혁신 기술로 각종 사각 지대를 허물어 디지털 포용을 실천하고 고객의 삶의 변화를 이끌어 내겠다는 것이 KT ESG 경영의 지향점이다”며 “목소리 찾기 프로젝트와 같이 앞으로도 KT가 가장 잘할 수 있는 기술과 솔루션으로 다양한 영역의 사회 문제를 해결하는 데 앞장서겠다”고 밝혔다.

저작권자 © 현대경제신문 무단전재 및 재배포 금지