Белорусские ученые научили компьютер говорить по-якутски

Не держи язык за зубами

Ученые Беларуси научили компьютер говорить по–якутски
В лаборатории распознавания и синтеза речи Объединенного института проблем информатики НАН Беларуси компьютер научили читать книги и прочую литературу.

Юрий Гецевич говорит с синтезатором на одном языке. Фото: Александр Ружечка
Юрий Гецевич говорит с синтезатором на одном языке. 

Заведующий лабораторией Юрий Гецевич нажимает кнопки на клавиатуре компьютера, и из динамиков возникают с детства знакомые стихи классика белоруской поэзии, без перевода понятные и россиянам: «Мой родны кут, як ты мне мiлы...» Затем звучат, уже по–русски, другие классические строки: «Мой дядя самых честных правил...» Потом по–якутски компьютер проговорил цифры: один, два, три...

Скажу честно: смысла каждого слова в отдельности я не понял. Все–таки тюркская группа языков — якутский, оказывается, сродни турецкому. Но характерные для оригинала интонации сохранились. Правда, с каким–то металлическим отзвуком, будто читает робот из фантастического фильма.
— Так и есть, — поясняет Юрий Станиславович. — Во всех трех случаях стихи читает не диктор, а синтезатор, созданный на основе сложных компьютерных программ.

Впервые автору этих строк с попыткой создать «говорящую машину» пришлось соприкоснуться лет 30 назад в Минском государственном педагогическом институте иностранных языков. Тогда профессор Борис Лобанов пытался использовать для этого пленочный магнитофон. С появлением компьютерной техники возможностей стало гораздо больше. Помимо лингвистов задействовать их сегодня помогают математики, компьютерщики Объединенного института проблем информатики. Так сформировалась оригинальная белорусская школа компьютерного синтеза и клонирования речи, в основе которой лежат несколько монографий, десяток патентов и авторских свидетельств на изобретения, созданных Борисом Лобановым и его учениками.

— Люди общаются с помощью голоса и слуха, — говорит Юрий Гецевич. — Этот способ взаимодействия желателен и для отношений человека и машины. Синтезатор речи разрабатывается, чтобы мобильный или стационарный компьютер, а также интернет–сайт имели возможность прочитать отдельные слова, предложения и другие текстовые фрагменты на двух государственных языках Беларуси — белорусском и русском. А также других языках.

Сегодня компьютер, читающий вслух, востребован в самых разных сферах. Например, при обучении людей с ослабленным зрением, а то и полностью незрячих. Раньше в их распоряжении были лишь книги, написанные азбукой Брайля. Но ведь сейчас большинство книг и других печатных материалов доступны в цифровой форме. Вывести их на экран монитора — не проблема. Белорусские ученые также научили компьютер читать цифровую запись вслух. Достаточно, нажав клавишу, прослушать перечень книг, имеющихся в электронной библиотеке, и нажатием другой клавиши выбрать для прослушивания нужную. Подобная система уже действует в школе для слабовидящих и незрячих детей в белорусском городе Молодечно.

Недавно такой синтезатор речи был разработан для Якутии. В этом участвовали ректор Северо–Восточного федерального университета имени М.К. Аммосова Евгения Михайлова и ее коллеги. Они предоставили электронные файлы звуков якутского языка, которые белорусские специалисты заложили в свою систему компьютерного синтеза и клонирования речи. И ЭВМ заговорила по–якутски.

— Конечно, все было не так просто. Но поскольку работали всей лабораторией, то выполнить работу смогли менее чем за год. Она уже принята якутскими заказчиками. Предполагаемая сфера применения — школы для слабовидящих и незрячих.

В целом же область применения речевого синтезатора, созданного белорусскими учеными, значительно шире. Это и персональный телефонный робот, способный голосом по заданному списку передать абонентам нужную информацию. Запись и воспроизведение поступивших GSM–сообщений. Оповещение о прибытии–отправлении поездов и самолетов, городского общественного транспорта. Оказывается, компьютер может говорить более доходчиво, чем самый красноречивый диктор.


Досье «СОЮЗа»


Символично, что эту работу для Якутии сделали именно белорусские ученые. Уроженец Минщины Эдуард Пекарский первым переложил якутский язык на латиницу, а затем и кириллицу. В далекий северный край он был сослан в 1881 году за революционную деятельность. Да так и прожил около 20 лет в 1–м Игидейском поселке Ботурусского улуса. Уже к 1887 году Пекарский при поддержке местных энтузиастов собрал 7 тысяч якутских слов, через 11 лет их было уже 20 тысяч. Эта работа легла в основу фундаментального «Словаря якутского языка». И даже получив право вернуться, Пекарский не оставил Якутский край, вел там изыскания и занимался составлением якутско–русского словаря. Впоследствии выдающийся фольклорист и этнограф был избран членом–корреспондентом, а затем и почетным членом Академии наук СССР.
Заметили ошибку? Пожалуйста, выделите её и нажмите Ctrl+Enter