Белорусские ученые изобрели мультиголосовой синтезатор речи

Вложили душу в голос

Похоже, артисты разговорного жанра, умеющие копировать чужие голоса, в ближайшие годы рискуют остаться без хлеба. И отнять его может мультиголосовой синтезатор речи, разработанный учеными Белорусского государственного университета информатики и радиоэлектроники совместно с коллегами из Объединенного института проблем информатики НАН. Пока перспективная разработка, выполненная по программе Республиканского фонда фундаментальных исследований, существует в виде программной модели, но изобретение уже запатентовано и имеет все шансы стать успешным коммерческим продуктом.



Особенность мультиголосового синтезатора (это не отдельное устройство, а всего лишь программное обеспечение для обычного компьютера) в том, что он способен обучаться. Достаточно ввести в его память образец речи реального человека, голос которого нужно скопировать, как электронный «звукоподражатель» тут же выдаст любой монолог, в котором с точностью воспроизведутся нужные интонации, тембр и другие особенности. Так озвучивается печатный текст. Но в планах разработчиков придать системе возможность еще и трансформировать в новом звучании записанную заранее фонограмму, а также живую речь. 

— Вы представьте: человеку, который ведет машину, приходит срочное текстовое сообщение от друга, но, находясь за рулем, прочитать его и сразу ответить он не имеет возможности, — поясняет один из авторов проекта, аспирант БГУИР Вадим Захарьев (на снимке). — В таком случае синтезатор найдет в своей базе данных нужного абонента и озвучит поступившее сообщение его же голосом. Ответить автолюбитель сможет также устно, а входящий в систему распознаватель речи переведет сказанное в текстовое сообщение и отправит адресату. Это очень удобно. И когда такая функция в бортовом компьютере или смартфоне появится, все быстро к ней привыкнут. Мы полагаем, что родители смогут также радовать своих малышей сказками, озвученными, например, голосом любимой бабушки, живущей в другом городе. У кинорежиссеров, работающих с сериалами, съемки которых затягиваются порой на долгие годы, появятся дополнительные возможности при озвучивании лент даже в том случае, если артист по каким-то причинам не сможет сделать это самостоятельно. Но главные потребители нашей разработки, которых не нужно убеждать в ее полезности, — это незрячие и слабовидящие. Мир звуков для них значит гораздо больше, чем для здоровых людей, и им исключительно важна персонификация речи синтезатора. 

В том, какой взрыв положительных эмоций у школьников вызывает озвучивание учебных текстов голосом знакомых персонажей из кинофильмов, ученые убедились, проводя эксперимент в Молодечненской общеобразовательной школе-интернате №2 для детей с нарушениями зрения. Надо сказать, что синтезатор для этих ребят — инструмент совершенно привычный и даже незаменимый. Но до сих пор он звучал только безликим «металлическим» голосом. А тут вдруг что-то родное. 

Что интересно, успеваемость по дисциплинам, где использовалась экспериментальная программа, резко поднялась. И когда учителя попросили оставить синтезатор в школе, ученые с радостью сделали такой подарок детям. 

В перспективе они готовы будут помочь и всем остальным инвалидам по зрению. Для этого, правда, потребуется время и средства. Ведь, чтобы программное обеспечение стало товарным продуктом, его нужно перевести на распространенные компьютерные языки. 

Анатолий ДМИТРИЕВ

Фото автора
Заметили ошибку? Пожалуйста, выделите её и нажмите Ctrl+Enter