Свой голос в мире hi-tech

В офисе минской инновационной компании «Сакрамент», на первый взгляд, ничуть не напоминающем избушку на курьих ножках из книги братьев Стругацких «Понедельник начинается в субботу», я очень скоро испытал почти те же чувства, что и литературный герой – программист Привалов, столкнувшийся со сказочной мистикой.
В офисе минской инновационной компании «Сакрамент», на первый взгляд, ничуть не напоминающем избушку на курьих ножках из книги братьев Стругацких «Понедельник начинается в субботу», я очень скоро испытал почти те же чувства, что и литературный герой – программист Привалов, столкнувшийся со сказочной мистикой. Показалось, что, как и в повести, здесь человеческим языком изъяснялся любой предмет. Например, говорил компьютер. И к тому же понимал сказанное. Разыскав в Интернете информацию, которую его попросили найти, он хорошо поставленным баритоном проинформировал хозяина кабинета о выполненной работе и поинтересовался: «Читать?». Услышав в ответ «Не надо», послушно замолчал. Затем в разговор вмешался мобильный телефон, который напомнил, что до начала деловой встречи осталось 15 минут. А вскоре голос подало и некое устройство, которое сообщило о своем температурном режиме, пожаловалось, что в системе снижается давление, и спросило, какие в связи с этим будут указания. — Чтобы все было, как у Стругацких, не хватает говорящего зеркала, — заметил я. — А это идея, — оживился директор Валерий Егоров. – Хотя сфер деятельности, где уже применяется наше программное обеспечение в области систем распознавания и синтеза речи, и так много. Например, для телекоммуникационных компаний, в том числе и белорусских, мы делаем системы телефонных справочных служб, которые понимают вопросы, задаваемые даже в произвольной форме, и синтезированным голосом дают ответ. Эти же потребители покупают у нас системы, голосом информирующие операторов о возникших сбоях телекоммуникационного оборудования. Мобильные телефоны, оснащенные нашей программой, могут озвучивать любые тексты, что очень удобно при чтении больших сообщений, поскольку экран миниатюрного аппарата слишком мал. В отличие от зарубежных фирм, за огромные деньги разрабатывающих синтетическую версию голоса заказчика, мы предлагаем дешевую программу, которая позволяет пользователю самостоятельно в автоматическом режиме получать то же самое. У нас есть программы, дающие возможность работать на компьютере слепым. Есть звучащие русско-английский и англо-русский словари, которые позволяют без преподавателя в совершенстве овладеть фонетикой. Наша система синтеза и распознавания речи встраивается в бытовую или промышленную электронную технику на любой микропроцессор и голосом сообщает о неполадках, выполняет все устные команды оператора, причем не путает его голос ни с каким другим. В реализации и другие идеи. Ведь мы видим, что зреет бум речевых технологий, и готовимся к тому, чтобы Беларусь была достойно представлена на этом рынке. Признаться, двоякое чувство я испытал, когда узнал, что 95 процентов речевых программ компания поставляет за рубеж. Конечно, выразительная цифра говорила о высокой оценке наших достижений. Но она же и убеждала, что отечественные производители, которые могли бы использовать эти разработки, еще не проснулись. Что характерно, отставать с внедрением подобных новинок мы начали как раз там, где судьба дает шанс ходить в лидерах. Ведь над основами систем синтеза и распознавания речи в советское время активно работали академические институты и вузы, был создан научный задел, который, впрочем, так и не превратился в готовый к использованию продукт. Но не было бы счастья, да несчастье помогло. Когда институты остались без денег и исследования в области речевых технологий были практически свернуты, в нужном месте и в нужное время оказалось предприятие «Сакрамент», занимавшееся до того момента совсем другими проектами. Валерий Егоров, сам математик по образованию, давно мечтал вложить заработанные средства в близкую ему сферу информационных технологий и не ошибся с выбором направления. Собрав лучших специалистов из разных институтов, он предоставил им прекрасные условия для работы, позаботился о мотивации. И произошло чудо! Всего за четыре года программисты и лингвисты «Сакрамента» создали пакет таких совершенных продуктов, что смогли потеснить безраздельно господствовавших на мировом рынке французов и бельгийцев. Причем потеснили их не столько за счет низких цен, сколько благодаря качеству синтезированного голоса, компактности программного обеспечения и его быстродействию. Кого-то может удивить, но белорусам все равно, какой язык моделировать, поскольку все тонкости самого экзотического для нас произношения прекрасно описываются отечественными программами. И не случайно у стенда минского предприятия, представлявшего нашу страну в сфере наукоемких информационных технологий на крупнейшей международной выставке «CeBIT-2005» в Ганновере, всегда было многолюдно. С белорусами провели переговоры более сотни компаний, и многие из них уже готовы подписать новые контракты. Понимая, что революционные разработки нереальны без теории, ученые компании развивают и фундаментальную науку. Именно такой поиск позволил появиться их последнему изобретению – телефону для слабослышащих. Вопреки ожиданию, этот аппарат не долбит барабанную перепонку чудовищными децибелами, а приспосабливается к возможностям своего хозяина. Определив частоты, которые человек воспринимает лучше, программа превращает голос его собеседника в синтезированный, звучащий в доступном диапазоне. Да, звук искажается. Но все слышно! Пока такой телефон существует в одном экземпляре, но нет препятствий, чтобы поставить его на конвейер. Не менее интересное продолжение может быть и у темы «Внутренний голос». Нет, речь идет не об интуиции, а о синтезе того голоса, который звучит в ушах у говорящего человека. Как известно, сами себя мы слышим совершенно иначе, чем окружающие, поскольку звук от голосовых связок быстрее успевает попасть в ухо напрямую – через кости и мягкие ткани. Поэтому когда в психотерапии, системах обучения используются записи собственного голоса, мозг все равно воспринимает его как чужой. А вот синтезированный «внутренний голос», алгоритм получения которого специалистам «Сакрамента» удалось найти, — это как раз тот инструмент, которого ждет психотерапия. Еще одна новинка, у которой есть шанс завоевать место под солнцем, — это компьютерные версии учебников, снабженные системой синтетического озвучивания и распознавания речи. Прообраз книги, с которой можно запросто побеседовать, ученые компании уже создали. Но, как они считают, поскольку речевой портал должен менять и методику подачи материала, то дальнейшая работа над интерактивными учебниками может вестись только совместно с предметниками. — Впрочем, — замечает Валерий Егоров, — для нашей школы это пока перспектива. Как перспективой может быть интерактивное телевидение, речевые системы для которого мы предусмотрительно готовим. Правда, обилие направлений, за которые хочется взяться, уже вступает в противоречие с финансовыми возможностями. Поэтому с интересом ждем, во что выльется проект парка высоких технологий. Если все будет так, как задумывается, мы будем там в числе первых участников.
Заметили ошибку? Пожалуйста, выделите её и нажмите Ctrl+Enter