Как установить и использовать программное обеспечение для преобразования текста в речь?

Я хочу преобразовать текст в аудиофайл, содержащий синтезированную речь, которая считывает этот текст. Какое бесплатное (libre + gratis) программное обеспечение доступно для этого и как его установить и использовать?

Мне не нужно использовать его как инструмент доступности - я просто хочу, чтобы вы могли слушать к моим заметкам о пересмотре, делая другие вещи, например, играть в игры.

20
задан 16 January 2011 в 16:35

80 ответов

espeak - хороший инструмент.

Мне просто нравится играть с ним в командной строке. Вы можете обнаружить, что это конфликтует с Pulseaudio, поэтому я использую длинную версию, которая отрицает необходимость правильно настроить ее.

sudo apt-get install espeak
espeak --stdout "this is a test" | paplay

espeak --help покажет вам варианты калибровки скорости чтения, подачи , голос и т. д.

Когда вы делаете заметки, сохраните их в виде текстового файла, а затем:

echo "these are my notes" > text.txt
espeak --stdout -f text.txt > text.wav
paplay text.wav # you should hear "these are my notes"

Затем вы можете играть с ffmeg et al для сжатия это от PCM к чему-то более управляемому, как MP3 или OGG. Но это совсем другая история.

18
ответ дан 25 May 2018 в 23:27
  • 1
    очень приятно, можно также попробовать графический пользовательский интерфейс для espeak, espeak-gui. – Sabacon 16 January 2011 в 17:15

espeak - хороший инструмент.

Мне просто нравится играть с ним в командной строке. Вы можете обнаружить, что это конфликтует с Pulseaudio, поэтому я использую длинную версию, которая отрицает необходимость правильно настроить ее.

sudo apt-get install espeak espeak --stdout "this is a test" | paplay

espeak --help покажет вам варианты калибровки скорости чтения, подачи , голос и т. д.

Когда вы делаете заметки, сохраните их в виде текстового файла, а затем:

echo "these are my notes" > text.txt espeak --stdout -f text.txt > text.wav paplay text.wav # you should hear "these are my notes"

Затем вы можете играть с ffmeg et al для сжатия это от PCM к чему-то более управляемому, как MP3 или OGG. Но это совсем другая история.

18
ответ дан 25 July 2018 в 22:36

espeak - хороший инструмент.

Мне просто нравится играть с ним в командной строке. Вы можете обнаружить, что это конфликтует с Pulseaudio, поэтому я использую длинную версию, которая отрицает необходимость правильно настроить ее.

sudo apt-get install espeak espeak --stdout "this is a test" | paplay

espeak --help покажет вам варианты калибровки скорости чтения, подачи , голос и т. д.

Когда вы делаете заметки, сохраните их в виде текстового файла, а затем:

echo "these are my notes" > text.txt espeak --stdout -f text.txt > text.wav paplay text.wav # you should hear "these are my notes"

Затем вы можете играть с ffmeg et al для сжатия это от PCM к чему-то более управляемому, как MP3 или OGG. Но это совсем другая история.

18
ответ дан 31 July 2018 в 11:38

espeak - хороший инструмент.

Мне просто нравится играть с ним в командной строке. Вы можете обнаружить, что это конфликтует с Pulseaudio, поэтому я использую длинную версию, которая отрицает необходимость правильно настроить ее.

sudo apt-get install espeak espeak --stdout "this is a test" | paplay

espeak --help покажет вам варианты калибровки скорости чтения, подачи , голос и т. д.

Когда вы делаете заметки, сохраните их в виде текстового файла, а затем:

echo "these are my notes" > text.txt espeak --stdout -f text.txt > text.wav paplay text.wav # you should hear "these are my notes"

Затем вы можете играть с ffmeg et al для сжатия это от PCM к чему-то более управляемому, как MP3 или OGG. Но это совсем другая история.

18
ответ дан 2 August 2018 в 04:03

espeak - хороший инструмент.

Мне просто нравится играть с ним в командной строке. Вы можете обнаружить, что это конфликтует с Pulseaudio, поэтому я использую длинную версию, которая отрицает необходимость правильно настроить ее.

sudo apt-get install espeak espeak --stdout "this is a test" | paplay

espeak --help покажет вам варианты калибровки скорости чтения, подачи , голос и т. д.

Когда вы делаете заметки, сохраните их в виде текстового файла, а затем:

echo "these are my notes" > text.txt espeak --stdout -f text.txt > text.wav paplay text.wav # you should hear "these are my notes"

Затем вы можете играть с ffmeg et al для сжатия это от PCM к чему-то более управляемому, как MP3 или OGG. Но это совсем другая история.

18
ответ дан 4 August 2018 в 20:06

espeak - хороший инструмент.

Мне просто нравится играть с ним в командной строке. Вы можете обнаружить, что это конфликтует с Pulseaudio, поэтому я использую длинную версию, которая отрицает необходимость правильно настроить ее.

sudo apt-get install espeak espeak --stdout "this is a test" | paplay

espeak --help покажет вам варианты калибровки скорости чтения, подачи , голос и т. д.

Когда вы делаете заметки, сохраните их в виде текстового файла, а затем:

echo "these are my notes" > text.txt espeak --stdout -f text.txt > text.wav paplay text.wav # you should hear "these are my notes"

Затем вы можете играть с ffmeg et al для сжатия это от PCM к чему-то более управляемому, как MP3 или OGG. Но это совсем другая история.

18
ответ дан 6 August 2018 в 04:06

espeak - хороший инструмент.

Мне просто нравится играть с ним в командной строке. Вы можете обнаружить, что это конфликтует с Pulseaudio, поэтому я использую длинную версию, которая отрицает необходимость правильно настроить ее.

sudo apt-get install espeak espeak --stdout "this is a test" | paplay

espeak --help покажет вам варианты калибровки скорости чтения, подачи , голос и т. д.

Когда вы делаете заметки, сохраните их в виде текстового файла, а затем:

echo "these are my notes" > text.txt espeak --stdout -f text.txt > text.wav paplay text.wav # you should hear "these are my notes"

Затем вы можете играть с ffmeg et al для сжатия это от PCM к чему-то более управляемому, как MP3 или OGG. Но это совсем другая история.

18
ответ дан 6 August 2018 в 04:08

espeak - хороший инструмент.

Мне просто нравится играть с ним в командной строке. Вы можете обнаружить, что это конфликтует с Pulseaudio, поэтому я использую длинную версию, которая отрицает необходимость правильно настроить ее.

  sudo apt-get install espeak espeak --stdout "это  тест "|  paplay  

espeak --help покажет вам варианты калибровки скорости чтения, высоты тона, голоса и т. д.

Когда вы делайте заметки, сохраняйте их как текстовый файл, а затем:

  echo «это мои заметки» & gt;  text.txt espeak --stdout -f text.txt & gt;  text.wav paplay text.wav # вы должны услышать «это мои заметки»  

Затем вы можете играть с ffmeg et al, чтобы сжать это от PCM до чего-то более управляемого, например MP3 или OGG. Но это совсем другая история.

18
ответ дан 7 August 2018 в 22:07

espeak - хороший инструмент.

Мне просто нравится играть с ним в командной строке. Вы можете обнаружить, что это конфликтует с Pulseaudio, поэтому я использую длинную версию, которая отрицает необходимость правильно настроить ее.

  sudo apt-get install espeak espeak --stdout "это  тест "|  paplay  

espeak --help покажет вам варианты калибровки скорости чтения, высоты тона, голоса и т. д.

Когда вы делайте заметки, сохраняйте их как текстовый файл, а затем:

  echo «это мои заметки» & gt;  text.txt espeak --stdout -f text.txt & gt;  text.wav paplay text.wav # вы должны услышать «это мои заметки»  

Затем вы можете играть с ffmeg et al, чтобы сжать это от PCM до чего-то более управляемого, например MP3 или OGG. Но это совсем другая история.

18
ответ дан 10 August 2018 в 10:21

espeak - хороший инструмент.

Мне просто нравится играть с ним в командной строке. Вы можете обнаружить, что это конфликтует с Pulseaudio, поэтому я использую длинную версию, которая отрицает необходимость правильно настроить ее.

  sudo apt-get install espeak espeak --stdout "это  тест "|  paplay  

espeak --help покажет вам варианты калибровки скорости чтения, высоты тона, голоса и т. д.

Когда вы делайте заметки, сохраняйте их как текстовый файл, а затем:

  echo «это мои заметки» & gt;  text.txt espeak --stdout -f text.txt & gt;  text.wav paplay text.wav # вы должны услышать «это мои заметки»  

Затем вы можете играть с ffmeg et al, чтобы сжать это от PCM до чего-то более управляемого, например MP3 или OGG. Но это совсем другая история.

18
ответ дан 13 August 2018 в 16:46
  • 1
    очень приятно, можно также попробовать графический пользовательский интерфейс для espeak, espeak-gui. – Sabacon 16 January 2011 в 17:15

Mbrola не работает с 11.10.

Инструменты SVOX (pico) просты в установке, просты в использовании и приносят хорошие качества голоса в Ubuntu. Установите его:

sudo apt-get install libttspico0 libttspico-utils libttspico-data

Еще проще, вы можете использовать LibreOffice в сочетании с инструментами SVOX (pico), установив расширение «Читать текст», и вы получите «GUI» для этого превосходного программного обеспечения TTS:

Расширение «Чтение текста» с помощью инструментов - Дополнения - Чтение выбора .... Используйте / usr / bin / python в качестве внешней программы. Выберите параметр командной строки, который включает токен (PICO_READ_TEXT_PY).

5
ответ дан 25 May 2018 в 23:27

И еще один espeak gui: gespeaker. Он использует двигатели espeak и mbrola. Кроме того, у него больше опций, чем espeak-gui.

3
ответ дан 25 May 2018 в 23:27

Ниже приведено не решение FLOSS, но вы можете счесть это целесообразным. (это винное решение),

Я лично очень заинтересован в TTS, я использую его довольно часто ... например. слушая бессвязный дискурс, который я бы никогда не потрудился придерживаться другого (потому что мне нужно получить еще одну чашку кофе ... :)

Несколько вещей, которые я обнаружил по пути .. или должен Я говорю, вещи, которые я не обнаружил на этом пути ... Скажем прямо: каждый фрагмент программного обеспечения FOSS wine , который я пробовал, подпадает и поэтому непригоден для любого полузатянувшегося прослушивания ...

В настоящее время я использую NaturalVoices от ATnT. Он доступен только для Windows (возможно, для Mac), но он работает под wine в Ubuntu .. (у него есть незначительный glychch, где мне иногда нужно щелкнуть по панели, когда я отхожу от читателя ... Это является незначительной проблемой по сравнению с преимуществом, полученным качеством речи от NatualVoices.

Некоторые другие вещи, которые, как мне показалось, практически необходимы для получувственного прослушивания, - это ...

Эти прогамы TTS не интеллектуальны (ну, может быть, они умны, как молодой бабуин). Поэтому им нужна каждая помощь, которую они могут получить, и есть одна (и только одна программа Reader, которую я нашел, которая помогает очень в этом .. Приложение называется ReadPlease (2003 Pro) ... Это позволяет вам специально модифицировать слова и группы слов, которые будут произноситься так, как вы хотите их ... Это отнюдь не идеально, но для меня это сделало разница между всем процессом, который можно использовать и не использовать ... Речь в Natural Voices «хорошо», но это немного скучно. Есть и другие хорошие продукты, но все они для W indows, к сожалению) .. Это иногда поражает неожиданно. Но OMG, изначально это боль! .. так что # 2 - это терпение ... и много обновлений вашего списка «специальных слов» ... По терпению я имею в виду, что вы (я) фактически привыкли к речевым моделям моего конкретного бабуина:) ... и Кстати, у меня в настоящее время около 3000 слов, которые теперь звучат «Человеком», и я больше не съеживаюсь, когда слышу их. 3 .. «Следуйте за прыгающим мячом» ... Опять же, потому что голос никогда не бывает таким хорошим, как настоящий оратор, иногда нужно уточнять. Программа Reader, которую я использую, имеет одну функцию, для которой я даже встречаюсь с ее неуклюжим интерфейсом ... У меня есть опция «выбрать в настоящее время чтение». У многих читателей есть это, но ReadPlease держит текущую строку центр экрана. Это бесценно, чтобы иметь возможность видеть впереди и позади, чтобы быстро перечитать то, что вы только что пропустили (так что автоцентровка курсовой линии хорошая) ...

Хорошо, это мой опыт. Я собираюсь сделать кофе сейчас, и пока я это делаю, я буду слушать это, чтобы посмотреть, как он «читает» .... TTS удивительно хороша для сбора опечаток (I сделать много опечаток) ...

Если что-то вроде ATnT NaturalVoices появится в репозитории Ubuntu, я перейду к нему.

Вот ссылка на некоторые образцы естественных голосов: я использую «MIke»

3
ответ дан 25 May 2018 в 23:27

SVOX pico2wave

это то, что я использую. И это звучит естественно, его легко понять, он распознает единицы (m, ° C, kg, ...)

Вот мой первый пост для pico2wave

Natural Sounding Text

Все, что у вас есть, это:

Перейти в Ubuntu Software Center и найти «pico». Вы найдете 4 или 5 записей с помощью «Small Footprint Ling ...». Установите

Возможное использование pico2wave описано в моей первой публикации (см. Ссылку выше).

Bye

3
ответ дан 25 May 2018 в 23:27
  • 1
    я использовал свой путь, вы можете рассказать мне, как получить естественный сладкий женский голос, используя свой путь – user49557 19 June 2015 в 16:03

Несмотря на то, что вы уже приняли ответ, я хотел упомянуть festival, который мне тоже очень нравится. Этот пост на форумах Ubuntu содержит много информации о том, как настроить очень хорошие голоса.

2
ответ дан 25 May 2018 в 23:27

Балаболка под Wine отлично работает (для меня) с голосами SAPI4 (голоса SAPI5 не обнаружены в моей Linux-системе). Он может открывать файлы и начинать чтение.

Вот ссылка на запись AppDB в Wine для Балаболки: https://appdb.winehq.org/objectManager.php?sClass=application&iId=17859

0
ответ дан 25 May 2018 в 23:27

Установить: sudo apt-get install espeak Использование: echo [message] | espeak

0
ответ дан 25 May 2018 в 23:27
  • 1
    Вот что говорит уже принятый ответ. Не повторяйте существующие ответы. – David Foerster 30 December 2017 в 22:31

SVOX pico2wave

это то, что я использую. И это звучит естественно, его легко понять, он распознает единицы (m, ° C, kg, ...)

Вот мой первый пост для pico2wave

Natural Sounding Text

Все, что у вас есть, это:

Перейти в Ubuntu Software Center и найти «pico». Вы найдете 4 или 5 записей с помощью «Small Footprint Ling ...». Установите

Возможное использование pico2wave описано в моей первой публикации (см. Ссылку выше).

Bye

3
ответ дан 25 July 2018 в 22:36
  • 1
    я использовал свой путь, вы можете рассказать мне, как получить естественный сладкий женский голос, используя свой путь – user49557 19 June 2015 в 16:03

Установить: sudo apt-get install espeak Использование: echo [message] | espeak

0
ответ дан 25 July 2018 в 22:36
  • 1
    Вот что говорит уже принятый ответ. Не повторяйте существующие ответы. – David Foerster 30 December 2017 в 22:31

Несмотря на то, что вы уже приняли ответ, я хотел упомянуть festival, который мне тоже очень нравится. Этот пост на форумах Ubuntu содержит много информации о том, как настроить очень хорошие голоса.

2
ответ дан 25 July 2018 в 22:36

Mbrola не работает с 11.10.

Инструменты SVOX (pico) просты в установке, просты в использовании и приносят хорошие качества голоса в Ubuntu. Установите его:

sudo apt-get install libttspico0 libttspico-utils libttspico-data

Еще проще, вы можете использовать LibreOffice в сочетании с инструментами SVOX (pico), установив расширение «Читать текст», и вы получите «GUI» для этого превосходного программного обеспечения TTS:

Расширение «Чтение текста» с помощью инструментов - Дополнения - Чтение выбора .... Используйте / usr / bin / python в качестве внешней программы. Выберите параметр командной строки, который включает токен (PICO_READ_TEXT_PY).

5
ответ дан 25 July 2018 в 22:36

И еще один espeak gui: gespeaker. Он использует двигатели espeak и mbrola. Кроме того, у него больше опций, чем espeak-gui.

3
ответ дан 25 July 2018 в 22:36

Балаболка под Wine отлично работает (для меня) с голосами SAPI4 (голоса SAPI5 не обнаружены в моей Linux-системе). Он может открывать файлы и начинать чтение.

Вот ссылка на запись AppDB в Wine для Балаболки: https://appdb.winehq.org/objectManager.php?sClass=application&iId=17859

0
ответ дан 25 July 2018 в 22:36

Ниже приведено не решение FLOSS, но вы можете счесть это целесообразным. (это винное решение),

Я лично очень заинтересован в TTS, я использую его довольно часто ... например. слушая бессвязный дискурс, который я бы никогда не потрудился придерживаться другого (потому что мне нужно получить еще одну чашку кофе ... :)

Несколько вещей, которые я обнаружил по пути .. или должен Я говорю, вещи, которые я не обнаружил на этом пути ... Скажем прямо: каждый фрагмент программного обеспечения FOSS wine , который я пробовал, подпадает и поэтому непригоден для любого полузатянувшегося прослушивания ...

В настоящее время я использую NaturalVoices от ATnT. Он доступен только для Windows (возможно, для Mac), но он работает под wine в Ubuntu .. (у него есть незначительный glychch, где мне иногда нужно щелкнуть по панели, когда я отхожу от читателя ... Это является незначительной проблемой по сравнению с преимуществом, полученным качеством речи от NatualVoices.

Некоторые другие вещи, которые, как мне показалось, практически необходимы для получувственного прослушивания, - это ...

Эти прогамы TTS не интеллектуальны (ну, может быть, они умны, как молодой бабуин). Поэтому им нужна каждая помощь, которую они могут получить, и есть одна (и только одна программа Reader, которую я нашел, которая помогает очень в этом .. Приложение называется ReadPlease (2003 Pro) ... Это позволяет вам специально модифицировать слова и группы слов, которые будут произноситься так, как вы хотите их ... Это отнюдь не идеально, но для меня это сделало разница между всем процессом, который можно использовать и не использовать ... Речь в Natural Voices «хорошо», но это немного скучно. Есть и другие хорошие продукты, но все они для W indows, к сожалению) .. Это иногда поражает неожиданно. Но OMG, изначально это боль! .. так что # 2 - это терпение ... и много обновлений вашего списка «специальных слов» ... По терпению я имею в виду, что вы (я) фактически привыкли к речевым моделям моего конкретного бабуина:) ... и Кстати, у меня в настоящее время около 3000 слов, которые теперь звучат «Человеком», и я больше не съеживаюсь, когда слышу их. 3 .. «Следуйте за прыгающим мячом» ... Опять же, потому что голос никогда не бывает таким хорошим, как настоящий оратор, иногда нужно уточнять. Программа Reader, которую я использую, имеет одну функцию, для которой я даже встречаюсь с ее неуклюжим интерфейсом ... У меня есть опция «выбрать в настоящее время чтение». У многих читателей есть это, но ReadPlease держит текущую строку центр экрана. Это бесценно, чтобы иметь возможность видеть впереди и позади, чтобы быстро перечитать то, что вы только что пропустили (так что автоцентровка курсовой линии хорошая) ...

Хорошо, это мой опыт. Я собираюсь сделать кофе сейчас, и пока я это делаю, я буду слушать это, чтобы посмотреть, как он «читает» .... TTS удивительно хороша для сбора опечаток (I сделать много опечаток) ...

Если что-то вроде ATnT NaturalVoices появится в репозитории Ubuntu, я перейду к нему.

Вот ссылка на некоторые образцы естественных голосов: я использую «MIke»

3
ответ дан 25 July 2018 в 22:36

SVOX pico2wave

это то, что я использую. И это звучит естественно, его легко понять, он распознает единицы (m, ° C, kg, ...)

Вот мой первый пост для pico2wave

Natural Sounding Text

Все, что у вас есть, это:

Перейти в Ubuntu Software Center и найти «pico». Вы найдете 4 или 5 записей с помощью «Small Footprint Ling ...». Установите

Возможное использование pico2wave описано в моей первой публикации (см. Ссылку выше).

Bye

3
ответ дан 31 July 2018 в 11:38
  • 1
    я использовал свой путь, вы можете рассказать мне, как получить естественный сладкий женский голос, используя свой путь – user49557 19 June 2015 в 16:03

Установить: sudo apt-get install espeak Использование: echo [message] | espeak

0
ответ дан 31 July 2018 в 11:38
  • 1
    Вот что говорит уже принятый ответ. Не повторяйте существующие ответы. – David Foerster 30 December 2017 в 22:31

Несмотря на то, что вы уже приняли ответ, я хотел упомянуть festival, который мне тоже очень нравится. Этот пост на форумах Ubuntu содержит много информации о том, как настроить очень хорошие голоса.

2
ответ дан 31 July 2018 в 11:38

Mbrola не работает с 11.10.

Инструменты SVOX (pico) просты в установке, просты в использовании и приносят хорошие качества голоса в Ubuntu. Установите его:

sudo apt-get install libttspico0 libttspico-utils libttspico-data

Еще проще, вы можете использовать LibreOffice в сочетании с инструментами SVOX (pico), установив расширение «Читать текст», и вы получите «GUI» для этого превосходного программного обеспечения TTS:

Расширение «Чтение текста» с помощью инструментов - Дополнения - Чтение выбора .... Используйте / usr / bin / python в качестве внешней программы. Выберите параметр командной строки, который включает токен (PICO_READ_TEXT_PY).

5
ответ дан 31 July 2018 в 11:38

И еще один espeak gui: gespeaker. Он использует двигатели espeak и mbrola. Кроме того, у него больше опций, чем espeak-gui.

3
ответ дан 31 July 2018 в 11:38

Балаболка под Wine отлично работает (для меня) с голосами SAPI4 (голоса SAPI5 не обнаружены в моей Linux-системе). Он может открывать файлы и начинать чтение.

Вот ссылка на запись AppDB в Wine для Балаболки: https://appdb.winehq.org/objectManager.php?sClass=application&iId=17859

0
ответ дан 31 July 2018 в 11:38

Другие вопросы по тегам:

Похожие вопросы: