API распознавания речи

Есть ли API распознавания речи для Ubuntu / Linux? У меня есть школьный проект, и мне нужно трансформировать речь на письменный текст. Язык программирования не является проблемой. Я пробовал cmu-sphinx, но мне не очень повезло, это означало, что он действительно не распознал большую часть моей грамматики или просто перепутал слова. Любая помощь по этому вопросу будет оценена по достоинству. Я также искал google и не мог найти много информации.

7
задан 10 October 2010 в 12:00

27 ответов

В Java API речи работает кросс-платформенный ...

1
ответ дан 25 July 2018 в 23:08
  • 1
    @Romeo, это означает, что вам нужно закодировать все, я использовал cmu-sphinx, прежде чем он был приличным, просто не очень хорошо справляется с окружающим шумом. – myusuf3 10 October 2010 в 14:56
  • 2
    Да, я изучил это, но, к сожалению, Java Speech API не имеет движка, его juts - оболочка для любого движка, который вы уже установили, чтобы его можно было использовать в Java – user 10 October 2010 в 16:04
  • 3
    @gabagecollector: так что именно вы имеете в виду, мне нужно все закодировать. Проблема в том, что окружающий шум неизбежен. Я использовал микрофон для гарнитуры, и я тестировал его в очень спокойной обстановке. – user 10 October 2010 в 16:07
  • 4
    @ Рома Калота: это правильно. Список реализаций можно найти здесь: java.sun.com/products/java-media/speech/forDevelopers/… – chris 10 October 2010 в 17:30

Двумя основными механизмами распознавания речи с открытым исходным кодом в Ubuntu являются Julius и Pocketsphinx. Оба они представляют собой довольно низкоуровневые исследовательские проекты, и вам нужно будет много читать и экспериментировать, чтобы иметь возможность использовать их: они не простые проекты для установки и выхода. Саймон Прослушивает, как уже упоминалось выше, это простой проект install-and-go, а проект Simon Listens имеет определенную установку для Ubuntu - http://www.cyber-byte.at/wiki/index.php/Installation# Ubuntu имеет инструкции по его включению - но это работает только с 10.04, а не с недавно выпущенным 10.10. (Надеюсь, проект Саймона Прослушивает скоро 10.10.)

3
ответ дан 25 July 2018 в 23:08

Также посмотрите на Саймона Прослушивающего, который использует большой словарь CSR Engine с открытым исходным кодом Julius.

1
ответ дан 25 July 2018 в 23:08

В Java API речи работает кросс-платформенный ...

1
ответ дан 27 July 2018 в 02:58
  • 1
    @Romeo, это означает, что вам нужно закодировать все, я использовал cmu-sphinx, прежде чем он был приличным, просто не очень хорошо справляется с окружающим шумом. – myusuf3 10 October 2010 в 14:56
  • 2
    Да, я изучил это, но, к сожалению, Java Speech API не имеет движка, его juts - оболочка для любого движка, который вы уже установили, чтобы его можно было использовать в Java – user 10 October 2010 в 16:04
  • 3
    @gabagecollector: так что именно вы имеете в виду, мне нужно все закодировать. Проблема в том, что окружающий шум неизбежен. Я использовал микрофон для гарнитуры, и я тестировал его в очень спокойной обстановке. – user 10 October 2010 в 16:07
  • 4
    @ Рома Калота: это правильно. Список реализаций можно найти здесь: java.sun.com/products/java-media/speech/forDevelopers/… – chris 10 October 2010 в 17:30

Двумя основными механизмами распознавания речи с открытым исходным кодом в Ubuntu являются Julius и Pocketsphinx. Оба они представляют собой довольно низкоуровневые исследовательские проекты, и вам нужно будет много читать и экспериментировать, чтобы иметь возможность использовать их: они не простые проекты для установки и выхода. Саймон Прослушивает, как уже упоминалось выше, это простой проект install-and-go, а проект Simon Listens имеет определенную установку для Ubuntu - http://www.cyber-byte.at/wiki/index.php/Installation# Ubuntu имеет инструкции по его включению - но это работает только с 10.04, а не с недавно выпущенным 10.10. (Надеюсь, проект Саймона Прослушивает скоро 10.10.)

3
ответ дан 27 July 2018 в 02:58

Также посмотрите на Саймона Прослушивающего, который использует большой словарь CSR Engine с открытым исходным кодом Julius.

1
ответ дан 27 July 2018 в 02:58

В Java API речи работает кросс-платформенный ...

1
ответ дан 31 July 2018 в 11:14
  • 1
    @Romeo, это означает, что вам нужно закодировать все, я использовал cmu-sphinx, прежде чем он был приличным, просто не очень хорошо справляется с окружающим шумом. – myusuf3 10 October 2010 в 14:56
  • 2
    Да, я изучил это, но, к сожалению, Java Speech API не имеет движка, его juts - оболочка для любого движка, который вы уже установили, чтобы его можно было использовать в Java – user 10 October 2010 в 16:04
  • 3
    @gabagecollector: так что именно вы имеете в виду, мне нужно все закодировать. Проблема в том, что окружающий шум неизбежен. Я использовал микрофон для гарнитуры, и я тестировал его в очень спокойной обстановке. – user 10 October 2010 в 16:07
  • 4
    @ Рома Калота: это правильно. Список реализаций можно найти здесь: java.sun.com/products/java-media/speech/forDevelopers/… – chris 10 October 2010 в 17:30

Двумя основными механизмами распознавания речи с открытым исходным кодом в Ubuntu являются Julius и Pocketsphinx. Оба они представляют собой довольно низкоуровневые исследовательские проекты, и вам нужно будет много читать и экспериментировать, чтобы иметь возможность использовать их: они не простые проекты для установки и выхода. Саймон Прослушивает, как уже упоминалось выше, это простой проект install-and-go, а проект Simon Listens имеет определенную установку для Ubuntu - http://www.cyber-byte.at/wiki/index.php/Installation# Ubuntu имеет инструкции по его включению - но это работает только с 10.04, а не с недавно выпущенным 10.10. (Надеюсь, проект Саймона Прослушивает скоро 10.10.)

3
ответ дан 31 July 2018 в 11:14

Также посмотрите на Саймона Прослушивающего, который использует большой словарь CSR Engine с открытым исходным кодом Julius.

1
ответ дан 31 July 2018 в 11:14

Также посмотрите на Simon Listens , который использует большой словарь CSR Engine с открытым исходным кодом Julius.

1
ответ дан 2 August 2018 в 04:28

Существует Java Speech API , который работает кросс-платформенным ...

1
ответ дан 2 August 2018 в 04:28

Двумя основными механизмами распознавания речи с открытым исходным кодом в Ubuntu являются Julius и Pocketsphinx. Оба они представляют собой довольно низкоуровневые исследовательские проекты, и вам нужно будет много читать и экспериментировать, чтобы иметь возможность использовать их: они не простые проекты для установки и выхода. Саймон Прослушивает, как уже упоминалось выше, представляет собой простой проект install-and-go, а проект Simon Listens имеет определенную установку для Ubuntu - http: //www.cyber-byte. at / wiki / index.php / Установка # У Ubuntu есть инструкции по его включению - но это работает только с 10.04, а не с недавно выпущенным 10.10. (Надеюсь, проект Саймона Прослушивает скоро 10.10.)

3
ответ дан 2 August 2018 в 04:28

Также посмотрите на Simon Listens , который использует большой словарь CSR Engine с открытым исходным кодом Julius.

1
ответ дан 4 August 2018 в 21:01

Существует Java Speech API , который работает кросс-платформенным ...

1
ответ дан 4 August 2018 в 21:01

Двумя основными механизмами распознавания речи с открытым исходным кодом в Ubuntu являются Julius и Pocketsphinx. Оба они представляют собой довольно низкоуровневые исследовательские проекты, и вам нужно будет много читать и экспериментировать, чтобы иметь возможность использовать их: они не простые проекты для установки и выхода. Саймон Прослушивает, как уже упоминалось выше, представляет собой простой проект install-and-go, а проект Simon Listens имеет определенную установку для Ubuntu - http: //www.cyber-byte. at / wiki / index.php / Установка # У Ubuntu есть инструкции по его включению - но это работает только с 10.04, а не с недавно выпущенным 10.10. (Надеюсь, проект Саймона Прослушивает скоро 10.10.)

3
ответ дан 4 August 2018 в 21:01

Существует Java Speech API , который работает кросс-платформенным ...

1
ответ дан 6 August 2018 в 04:33

Двумя основными механизмами распознавания речи с открытым исходным кодом в Ubuntu являются Julius и Pocketsphinx. Оба они представляют собой довольно низкоуровневые исследовательские проекты, и вам нужно будет много читать и экспериментировать, чтобы иметь возможность использовать их: они не простые проекты для установки и выхода. Саймон Прослушивает, как уже упоминалось выше, представляет собой простой проект install-and-go, а проект Simon Listens имеет определенную установку для Ubuntu - http: //www.cyber-byte. at / wiki / index.php / Установка # У Ubuntu есть инструкции по его включению - но это работает только с 10.04, а не с недавно выпущенным 10.10. (Надеюсь, проект Саймона Прослушивает скоро 10.10.)

3
ответ дан 6 August 2018 в 04:33

Также посмотрите на Simon Listens , который использует большой словарь CSR Engine с открытым исходным кодом Julius.

1
ответ дан 6 August 2018 в 04:33

Существует Java Speech API , который работает кросс-платформенным ...

1
ответ дан 7 August 2018 в 22:42

Двумя основными механизмами распознавания речи с открытым исходным кодом в Ubuntu являются Julius и Pocketsphinx. Оба они представляют собой довольно низкоуровневые исследовательские проекты, и вам нужно будет много читать и экспериментировать, чтобы иметь возможность использовать их: они не простые проекты для установки и выхода. Саймон Прослушивает, как уже упоминалось выше, представляет собой простой проект install-and-go, а проект Simon Listens имеет определенную установку для Ubuntu - http: //www.cyber-byte. at / wiki / index.php / Установка # У Ubuntu есть инструкции по его включению - но это работает только с 10.04, а не с недавно выпущенным 10.10. (Надеюсь, проект Саймона Прослушивает скоро 10.10.)

3
ответ дан 7 August 2018 в 22:42

Также посмотрите на Simon Listens , который использует большой словарь CSR Engine с открытым исходным кодом Julius.

1
ответ дан 7 August 2018 в 22:42

Двумя основными механизмами распознавания речи с открытым исходным кодом в Ubuntu являются Julius и Pocketsphinx. Оба они представляют собой довольно низкоуровневые исследовательские проекты, и вам нужно будет много читать и экспериментировать, чтобы иметь возможность использовать их: они не простые проекты для установки и выхода. Саймон Прослушивает, как уже упоминалось выше, представляет собой простой проект install-and-go, а проект Simon Listens имеет определенную установку для Ubuntu - http: //www.cyber-byte. at / wiki / index.php / Установка # У Ubuntu есть инструкции по его включению - но это работает только с 10.04, а не с недавно выпущенным 10.10. (Надеюсь, проект Саймона Прослушивает скоро 10.10.)

3
ответ дан 10 August 2018 в 10:48

Также посмотрите на Simon Listens , который использует большой словарь CSR Engine с открытым исходным кодом Julius.

1
ответ дан 10 August 2018 в 10:48

Существует Java Speech API , который работает кросс-платформенным ...

1
ответ дан 10 August 2018 в 10:48

Также посмотрите на Simon Listens , который использует большой словарь CSR Engine с открытым исходным кодом Julius.

1
ответ дан 13 August 2018 в 17:22

Существует Java Speech API , который работает кросс-платформенным ...

1
ответ дан 13 August 2018 в 17:22
  • 1
    @Romeo, это означает, что вам нужно закодировать все, я использовал cmu-sphinx, прежде чем он был приличным, просто не очень хорошо справляется с окружающим шумом. – myusuf3 10 October 2010 в 14:56
  • 2
    Да, я изучил это, но, к сожалению, Java Speech API не имеет движка, его juts - оболочка для любого движка, который вы уже установили, чтобы его можно было использовать в Java – user 10 October 2010 в 16:04
  • 3
    @gabagecollector: так что именно вы имеете в виду, мне нужно все закодировать. Проблема в том, что окружающий шум неизбежен. Я использовал микрофон для гарнитуры, и я тестировал его в очень спокойной обстановке. – user 10 October 2010 в 16:07
  • 4
    @ Рома Калота: это правильно. Список реализаций можно найти здесь: java.sun.com/products/java-media/speech/forDevelopers/… – chris 10 October 2010 в 17:30

Двумя основными механизмами распознавания речи с открытым исходным кодом в Ubuntu являются Julius и Pocketsphinx. Оба они представляют собой довольно низкоуровневые исследовательские проекты, и вам нужно будет много читать и экспериментировать, чтобы иметь возможность использовать их: они не простые проекты для установки и выхода. Саймон Прослушивает, как уже упоминалось выше, представляет собой простой проект install-and-go, а проект Simon Listens имеет определенную установку для Ubuntu - http: //www.cyber-byte. at / wiki / index.php / Установка # У Ubuntu есть инструкции по его включению - но это работает только с 10.04, а не с недавно выпущенным 10.10. (Надеюсь, проект Саймона Прослушивает скоро 10.10.)

3
ответ дан 13 August 2018 в 17:22

Другие вопросы по тегам:

Похожие вопросы: