Существует ли API для распознавания речи в Ubuntu / Linux? У меня есть школьный проект, и мне нужно преобразовать речь в письменный текст. Язык программирования не проблема. Я пробовал cmu-sphinx, но мне не очень повезло с этим, то есть он на самом деле не распознавал многое из моей определенной грамматики или просто смешал слова. Любая помощь по этому вопросу будет принята с благодарностью. Я также искал в Google и не мог найти много информации.
Существует Java Speech API , который работает кроссплатформенно ...
Также взгляните на Simon Listens , который использует движок CSR с открытым исходным кодом большого словаря Julius.
Двумя основными движками распознавания речи с открытым исходным кодом в Ubuntu являются Julius и Pocketsphinx. Оба эти проекта являются исследовательскими проектами низкого уровня, и вам нужно много читать и экспериментировать, чтобы иметь возможность их использовать: это не простые проекты установки и запуска. Simon Listens, как упоминалось выше, - это простой проект установки и запуска, а проект Simon Listens имеет специальную установку для Ubuntu - http://www.cyber-byte.at /wiki/index.php/Installation#Ubuntu содержит инструкции по его включению, но это работает только с 10.04, а не с недавно выпущенным 10.10. (Надеюсь, проект Simon Listens скоро выпустит версию 10.10.)