Navigation
Распознавание речи на ПК PDF Печать E-mail

В отличие от специализированных технологий для мобильных устройств, универсальные системы распознавания речи для ПК, благодаря большей мощности настольных компьютеров, способны более детально интерпретировать человеческую речь и переводить ее не только в ограниченный набор команд, но и в связный текст. В идеале компьютер должен воспринимать произносимые фразы и автоматически переводить их в текст, тем самым исключив необходимость привычного его набора на клавиатуре. Однако пока достаточно надежно использование таких систем реализовано, так же как и для мобильных компьютеров, лишь для управления некоторыми функциями интерфейса и выбором из предлагаемых вариантов. Несмотря на серьезные трудности, успехи в распознавании речи все же достигнуты, хотя в основном они касаются только диктовки узкоспециализированных текстов (главным образом, технических, медицинских, юридических и всевозможной деловой переписки). Впрочем, широкого распространения подобные технологии пока не получили даже в тех областях, где разработчики добились заметного успеха. Например, вполне работоспособный инструментарий по использованию технологий распознавания речи и рукописного ввода стал широко доступным еще в Microsoft Windows XP при установке Office 2011 (причем работало как управление — Voice Command, так и диктовка текста с голоса — Dictation). Сегодня в Windows Vista входит модуль Microsoft Speech Recognizer уже в версии 8.0 (к сожалению, поддерживаются только английский и японский языки — См. «Панель управления» и «Текст в речь/Свойства речи»). Однако практическая работа с этим модулем даже у англоязычных пользователей до сих пор вызывает серьезные трудности, и потому им мало кто пользуется.

Более перспективным способом применения подобных решений сегодня считается разработка интерфейсов с голосовым управлением на основе диалога, которые будут обладать большими возможностями, нежели аналогичные разработки для мобильных устройств.

Работу в этой области ведут такие компании, как IBM, Microsoft, Nuance Communications и Philips Speech Processing. Российская компания Cognitive Technologies, достигшая значительных успехов в области распознавания печатных текстов, в 2011 году сообщала о совместном проекте с Intel по созданию систем распознавания русской речи, однако никаких успехов на этом поприще она не достигла.

 

 

Реклама