Содержание
-
Голосовое управление ПК
- Борисов В.А. – преподаватель информатики КАСК – филиала РАНХ и ГС
- Красноармейск 2012
-
Введение
В настоящее время попытки создания интеллектуального речевого интерфейса “человек-машина" все более перемещаются в реальную жизнь, а соответствующие системы стремятся занять свое место под солнцем в кабинах самолетов, рубках кораблей, трубках мобильных телефонов и т.д.
-
- Электронные приборы как бытовые, так и используемые в различной профессиональной деятельности людей, продолжают “обрастать" все новыми многофункциональными кнопками, значения которых не в состоянии быстро запомнить и эффективно использовать, особенно в условиях возможного дефицита времени, ни один нормальный человек.
- Актуальность
-
- Позволит легко открывать необходимое приложение вместо длительного и скучного процесса поиска нужных файлов в различных системных директориях компьютера.
- Поможет работе с ПК людям с различными патологиями (например: зрения и др.).
- Облегчит работу с ПК в ситуациях, когда руки пользователя заняты.
- Актуальность
-
Актуальность
- Еще лет 30 назад, а может быть и более, специалисты предрекали блестящее будущее подобным системам.
- Но предсказания не оправдались, несмотря на значительные успехи в области повышения надежности распознавания речи, в особенности команд из ограниченного набора.
-
Причины
- Существенную зависимость надежности распознавания от индивидуальных особенностей диктора
- Подчиненность результатов распознавания текущему психофизиологическому состоянию человека
- Сильное влияние акустических помех, присутствующих в ситуациях реальной жизни
- Наличие пользовательского стереотипа управления
-
Принципы работы
- Технология распознавания позволяет организовать одновременное распознавание 100-200 команд в дикторозависимом режиме.
- То есть, пользователь должен обучить каждую команду на свой голос, прежде чем система начнет работать.
- И 30-50 команд в дикторонезависимом режиме, но только для неизменного набора команд, для которого предварительно собирается база эталонов этих команд.
-
- При этом пользователю не обязательно обучать систему перед началом работы.
- При правильном структурировании использования словаря, то есть когда на каждом уровне доступно 20-30 команд, возможно использование словарей практически неограниченного объема.
- Принципы работы
-
Ошибки распознавания
- 1) “Неизвестная команда --> известная недоступная команда" - (оператор ошибся, машина не смогла распознать ошибку);
- 2) “Неизвестная команда --> известная доступная команда " - (оператор ошибся, машина не смогла распознать ошибку);
- 3) “Известная доступная команда ---> неизвестная команда " (ошиблась машина);
-
- 4) “Известная недоступная команда --> неизвестная команда " - (оператор ошибся, машина не смогла распознать ошибку);
- 5) “Известная доступная команда --> известная недоступная команда " (ошиблась машина);
- 6) “Известная доступная команда --> известная доступная команда распознана неправильно " (ошиблась машина).
- Ошибки распознавания
-
- Чтобы поведение машины выглядело дружелюбным и “интеллектуальным" возможны следующие основные варианты ее реакции:
- промолчать и ничего не делать;
- сообщить человеку о возможной ошибке и попросить повторить команду;
- предложить помощь, произнося доступные в данном режиме команды.
- Реакция компьютера
-
- Совсем не лишним будет заранее “договориться" с машиной о том, как она будет интерпретировать молчание хозяина:
- молчит - выполнить команду;
- молчит - не выполнять команду;
- молчит - у хозяина отказали мозги или пропал голос, запрошу еще раз, а там видно будет…
- Реакция компьютера
-
Программы для голосового управления компьютером
-
DragonDictate for Windows
Программа для контроля за работой и предоставления возможности диктования для Microsoft Windows 95, Windows NT и Windows 3.x. Пакет позволяет виртуально поддерживать многие приложения Windows, включая Corel WordPerfect Suite, Lotus SmartSuite и Microsoft Office. Вы можете также осуществить поддержку других программ, использовать мощный редактор макросов. DragonDictate позволяет диктовать в любом приложении, а также поддерживать широкий набор голосовых команд редактирования и навигации.
-
Voice Systems Listen 3.0 for Windows
Программа предоставляет список предусмотренных команд, который изменяется в зависимости от контекста речевой акции и приложения, в котором используется. Предусмотрена возможность добавлять новые команды. Следует отметить несколько сложный процесс тренировки, предусматривающий, в частности, голосовой контроль размера шрифта от 1 до 99. Утешением может служить то, что это придется делать лишь единожды.
-
Simply Speaking Gold
Программа для голосового контроля, предусматривающая также возможность дискретного диктования. Прежде чем дать голосовую команду, следует прекратить диктование. Есть возможность использовать подсказку "Что я могу сказать?", открывающую окно со списком команд, работающим в данном приложении. Сопутствующая документация очень слаба, однако ее расширенный вариант доступен через Интернет.
-
VoicePlus
Программа для голосовых команд. Вы можете использовать ее для диктования в различных Windows-приложениях, а открыв специальное окно, произвести побуквенную транскрипцию слов. Новая программа компании L&H Voice Xpress поддерживает режим непрерывной речи и полный набор голосовых команд.
-
VoiceCommands
Разработана специально для Microsoft Word. Она не поддерживает режим диктования вообще, однако имеет широкий набор команд редактирования и форматирования.
-
Горыныч
Программа распознавания русской речи. Программный комплекс "Горыныч" – первая русскоязычная система автоматического распознавания речи. Программа для диктовки и голосового управления компьютером по-русски.
-
- ввод текста с голоса на русском и английском языке;
- голосовое управление периферийным оборудованием;
- голосовое управление отдельными функциями операционных систем Microsoft Windows;
- голосовое управление функциями текстовых редакторов и прикладных программ;
- позволяет оформлять документы, дипломные работы (включая формулы) для школьников, абитуриентов, студентов.
-
Заключение
Предложенный подход к созданию систем речевого управления в части психолого-эргономических аспектов проектирования интерфейса “человек – машина" для работы на ограниченном наборе речевых команд был достаточно успешно апробирован при создании компьютерных прототипов систем речевого управления общего назначения с использованием собственного оригинального программного обеспечения процедуры распознавания.
-
Ресурсы
- http://209.85.135.132/search?q=cache:VOQlfj8TQwkJ:www.evarussia.ru/upload/doklad/doklad_198.rtf+%D0%B3%D0%BE%D0%BB%D0%BE%D1%81%D0%BE%D0%B2%D0%BE%D0%B5+%D1%83%D0%BF%D1%80%D0%B0%D0%B2%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5+%D0%BA%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80%D0%BE%D0%BC+%D0%B4%D0%BE%D0%BA%D0%BB%D0%B0%D0%B4&cd=3&hl=ru&ct=clnk&gl=ru
- http://mixzona.ru/referat/referat/73201/
- http://103.by/blog/tag/upravlenie-kompyuterom-golosom/
- http://speech-soft.ru/index.php?a=inf&inf=rasp
-
Спасибо за внимание
Нет комментариев для данной презентации
Помогите другим пользователям — будьте первым, кто поделится своим мнением об этой презентации.