Голосовое управление средой рабочего стола

Я хотел бы включить систему, которая может отвечать на голосовые команды пользователя и запускать сценарии в соответствии с устной командой GIVEN.

В идеале, я бы хотел, чтобы компьютер постоянно слушал.

Как только он услышит модное слово «Компьютер», он будет активировать и слушать команды в течение 10 секунд (или около того).

Будучи активным и слушая, я хотел бы, чтобы другой набор модных слов мог запускать сценарии.

Например ....

(компьютер бездействует) «Компьютер» (компьютер немедленно слушает) «Доступ к новым СООБЩЕНИЯМ» (СООБЩЕНИЯ - это модное слово * ИГНОРИРУЕТ «ДОСТУП К НОВОМУ» - компьютер запускает сценарий и открывает эволюцию или сопереживание) Там может быть один для браузера, один для закрытия окон и отображения рабочего стола, или куча вещей на самом деле.

Это вообще возможно?

16
задан 24 November 2015 в 05:04

5 ответов

Gnome-Voice-Control

Разработанный в рамках Google Summer of Code 2007, это была идея разработать некоторые функции, которые улучшат удобство использования Gnome Desktop.

Целью является внедрение настольной системы голосового управления. Система состоит в приложении, которое будет контролировать звук вход (микрофон) и когда значительный аудио сигнал был обнаруживается, программное обеспечение улавливает, обрабатывает и распознает сигнал. а затем выполняет нужное действие над Рабочим столом Гнома. В наборе действия могут включать в себя максимизацию, минимизацию, закрытие активного окна; открытие определенной программы; переключение с одного рабочего стола на другой; между другие. GnomeVoiceControl реализован на C в сочетании с CMU Сфинкс, который является инструментом с открытым исходным кодом, созданным для преобразования речи в text.

Слайд-шоу авторов

К сожалению, похоже, что оно не вышло далеко за рамки основных "целей" - однако, похоже, что в этом году есть некоторая активность, добавляющая поддержку новым языкам, таким как болгарский и турецкий.

Для установки:

sudo apt-get install gnome-voice-control

Platypus

Существует интересный внешний вид проекта под названием platypus - в основном это linux-фронтенд Dragon Naturally Speaking, который работает в Wine.

Притязанием на известность этого приложения является то, что "оно может даже запускать программы и скрипты для Windows или Linux, например, "стартовый терминал".

VEDICS

Это новый проект, который говорит, что он работает с интерфейсом Unity.

На странице проекта написано, что он распознает "запуск [имя программы]" - так что теоретически [имя программы] может быть любым сценарием, который вы захотите запустить.

7
ответ дан 24 November 2015 в 05:04

Саймон Слушает

Это проект с открытым исходным кодом, предназначенный для замены мыши и/или клавиатуры распознаванием речи, изначально разработанный для людей с физическими недостатками.

Есть ppa, откуда мы можем установить приложение: ppa:grasch-simon-listens/simon

3
ответ дан 24 November 2015 в 05:04

Google2Ubuntu

Google2Ubuntu - это инструмент, который позволяет управлять компьютером с помощью голосовых команд через API распознавания речи Google.

Выполните следующие команды на терминале для установки Google2Ubuntu,

sudo add-apt-repository ppa:benoitfra/google2ubuntu
sudo apt-get update
sudo apt-get install google2ubuntu

Источник

3
ответ дан 24 November 2015 в 05:04

Распознавание речи Linux

Он разрабатывается для работы в дистрибутивах Linux, его очень легко настраивать и легко расширять, он поддерживает настраиваемые словари, распознавание на основе контекста, режим диктовки и настраиваемый макросы.

Чтобы установить распознавание речи Linux, перейдите на страницу проекта GitHub . Загрузите ZIP-файл и извлеките его.

Затем установите некоторые зависимости:

sudo apt-get install sox python-argparse libsox-fmt-mp3 mutt xvkbd xautomation

Откройте извлеченную папку (Palaver-master) в терминале и выполните настройку:

cd /~Path-to-folder~/Palaver-master/
./setup

Теперь осталось просто назначить горячую клавишу для включения записи , для этого перейдите в Системные настройки ...> Клавиатура> Ярлыки> Пользовательские ярлыки нажмите кнопку с плюсом, чтобы добавить ярлык, назовите его Распознавание голоса и установите команду:

/~Path-to-folder~/Palaver-master/hotkey

Нажмите «Применить», щелкните ярлык и затем назначьте горячую клавишу для активации распознавания голоса.

Обратите внимание, что стабильная сборка еще не выпущена, поэтому не ожидайте, что команды будут полностью функциональными на этом этапе, многие фразы будут распознаваться, но никаких реальных действий не будет.

1
ответ дан 24 November 2015 в 05:04

Snips.ai

Только что попробовал на pi3 - похоже, есть потенциал
Работает в докере

https://snips.ai/

0
ответ дан 24 November 2015 в 05:04

Другие вопросы по тегам:

Похожие вопросы: