Язык до Вильнюса довел

Белорусы создали для литовцев синтезатор устной речи

Белорусские программисты и лингвисты подтвердили свою высокую репутацию

Родной язык для любого народа – это святое. При трепетном отношении к его чистоте, допуск иностранцев в национальную лингвистику всегда был делом немыслимым. Но времена меняются. В век информационных технологий востребованным наукоемким продуктом стали компьютерные программы синтеза устной речи, в создании которых преуспели лишь несколько стран. Языков же на планете, как известно, около пяти тысяч. Стало быть, если хочешь обеспечить работу различных речевых информационных систем, использующих национальный язык, приходится размещать заказ за рубежом. Именно так и поступили наши литовские соседи.

Попытавшись самостоятельно решить проблему озвучивания книг для незрячих и не добившись нужного результата, они обратились за помощью в Минск. Ведь наша страна благодаря многолетнему опыту работы в области речевых технологий специалистов минской компании «Сакрамент ИТ» — резидента Парка высоких технологий, а также исследованиям ученых Минского государственного лингвистического университета прочно закрепилась в числе лидеров в создании программ синтеза устной речи.

Свою репутацию белорусские программисты и лингвисты подтвердили блестяще. Всего за полгода программа была ими разработана и получила высокую оценку заказчика, хотя большими знатоками литовского языка исполнителей назвать, конечно, нельзя. Да, в коллективе лингвистов были два человека, знающие язык соседней страны на бытовом уровне, но его фонетикой они никогда не занимались. Тем не менее больших проблем при работе с материалом не возникло, так как универсальность разработанных в республике программных средств позволяет успешно работать и с литовским, и с белорусским, и с английским, и даже с суахили, – была бы хорошая исходная база, надиктованная квалифицированным носителем языка. Дело в том, что в основе такого синтеза, называемого компилятивным, лежит не смоделированная компьютером полностью искусственная речь, а взятые из живого голоса аллофоны – звуковые «кирпичики», из которых складываются слова. Поэтому, встретив в тексте даже незнакомое слово, компьютер моментально составит его из таких строительных блоков и произнесет так, как будто оно у него было в базе данных всегда.

При этом, естественно, привнести в программу синтеза акцент чужого языка (в данном случае белорусского в литовский) невозможно в принципе. Ведь все особенности, которые будет нести синтетическая речь, могут проистекать только от своеобразия произношения диктора – донора голоса. Его, кстати, помогла найти белорусская община литовцев, но когда большая часть работы учеными и программистами была сделана, заказчики посчитали, что произношение этого человека все же не совсем стандартно, слишком индивидуально, и предложили новую кандидатуру, утвержденную литовскими лингвистами.

– За десять лет у нас сформировался слаженный коллектив программистов и лингвистов, которые понимают друг друга с полуслова, и это предопределило успех, — поясняет научный руководитель лингвистических разработок компании «Сакрамент ИТ» заведующая кафедрой фонетики английского языка Минского государственного лингвистического университета профессор Елена Карневская. – Основа созданных нами речевых технологий – лингвистическое обеспечение синтеза. То есть, начиная работу, надо было изучить особенности фонетической системы языка, создать оптимальный список звуковых единиц, позволяющий отразить не только различия между звучащими словами, но и те изменения, которым звуки подвергаются в потоке речи. Ведь это только кажется, что звук «а» всюду звучит одинаково. На самом деле из-за особенностей артикуляции органов речи человека после «п» он звучит совсем не так как после «с», например. Человек произносит так, «как нужно», не задумываясь, а машину, если мы не хотим слышать в ее речи «машинный» акцент, следует всему этому научить. То есть необходимо заложить в ее память все необходимые варианты звуков, чтобы она могла выбрать подходящий. В результате только небольшое число гласных превращается в 1,5 тысячи звуков — аллофонов. Всего же в литовском мы насчитали около 9 тысяч аллофонов. Важно было также учесть такую особенность этого языка, как тональный акцент, при котором могут различаться слова, звучащие практически одинаково для иностранца.

Вооруженные всеми этими знания­ми, программисты приступили к «нарезке» аллофонов из записанных фонограмм. При этом важно было не только с ювелирной точностью вырезать нужный сегмент, не имеющий четкой границы, но и позаботиться о том, чтобы при синтезе он плавно, без скачков стыковался с любым другим аллофоном. В противном случае в каждом слове будет звучать пресловутый акцент робота, который совсем неуместен при озвучивании, например, художественной литературы.

Если бы не специальная компьютерная программа, с помощью которой все это делалось, если бы не электронная почта, по которой постоянно сверяли и корректировали полученные результаты программисты и лингвисты, и если бы не цифровая запись, то работа, выполненная за несколько месяцев, растянулась бы на долгие годы. Прослушивание озвученных текстов показало, что белорусские исполнители подошли к синтезу литовской речи даже слишком требовательно, поэтому без ущерба для качества количество аллофонов в конечном счете было сокращено на треть. Это позволило сделать и без того компактную программу еще более емкой и удобной в работе.

— Заказчик принял у нас программу практически без замечаний и отметил, что работу такого уровня сложности в мире в состоянии выполнить не более пяти фирм, а в такие сжатые сроки – только белорусы, — говорит учредитель компании «Сакрамент ИТ» Валерий Егоров. — Сегодня мы уже ведем переговоры о предоставлении ему эксклюзивного права на представление этого продукта на территории Литвы. Программу планируется использовать не только при озвучивании книг для незрячих, но и в телекоммуникационном обслуживании населения соседней страны. Для этого мы будем готовить версию синтеза для мобильных устройств, и заказчик уже ищет финансирование в структурах Евросоюза. В наших планах также совершенствование созданных ранее программ синтеза белорусской, русской и английской речи, работа над новыми зарубежными заказами.

Заметили ошибку? Пожалуйста, выделите её и нажмите Ctrl+Enter