Я хочу преобразовать текст в аудиофайл, содержащий синтезированную речь, которая считывает этот текст. Какое бесплатное (libre + gratis) программное обеспечение доступно для этого и как его установить и использовать?
Мне не нужно использовать его как инструмент доступности - я просто хочу, чтобы вы могли слушать к моим заметкам о пересмотре, делая другие вещи, например, играть в игры.
espeak - хороший инструмент.
Мне просто нравится играть с ним в командной строке. Вы можете обнаружить, что это конфликтует с Pulseaudio, поэтому я использую длинную версию, которая отрицает необходимость правильно настроить ее.
sudo apt-get install espeak
espeak --stdout "this is a test" | paplay
espeak --help покажет вам варианты калибровки скорости чтения, подачи , голос и т. д.
Когда вы делаете заметки, сохраните их в виде текстового файла, а затем:
echo "these are my notes" > text.txt
espeak --stdout -f text.txt > text.wav
paplay text.wav # you should hear "these are my notes"
Затем вы можете играть с ffmeg et al для сжатия это от PCM к чему-то более управляемому, как MP3 или OGG. Но это совсем другая история.
espeak - хороший инструмент.
Мне просто нравится играть с ним в командной строке. Вы можете обнаружить, что это конфликтует с Pulseaudio, поэтому я использую длинную версию, которая отрицает необходимость правильно настроить ее.
sudo apt-get install espeak
espeak --stdout "this is a test" | paplay
espeak --help покажет вам варианты калибровки скорости чтения, подачи , голос и т. д.
Когда вы делаете заметки, сохраните их в виде текстового файла, а затем:
echo "these are my notes" > text.txt
espeak --stdout -f text.txt > text.wav
paplay text.wav # you should hear "these are my notes"
Затем вы можете играть с ffmeg et al для сжатия это от PCM к чему-то более управляемому, как MP3 или OGG. Но это совсем другая история.
espeak - хороший инструмент.
Мне просто нравится играть с ним в командной строке. Вы можете обнаружить, что это конфликтует с Pulseaudio, поэтому я использую длинную версию, которая отрицает необходимость правильно настроить ее.
sudo apt-get install espeak
espeak --stdout "this is a test" | paplay
espeak --help покажет вам варианты калибровки скорости чтения, подачи , голос и т. д.
Когда вы делаете заметки, сохраните их в виде текстового файла, а затем:
echo "these are my notes" > text.txt
espeak --stdout -f text.txt > text.wav
paplay text.wav # you should hear "these are my notes"
Затем вы можете играть с ffmeg et al для сжатия это от PCM к чему-то более управляемому, как MP3 или OGG. Но это совсем другая история.
espeak - хороший инструмент.
Мне просто нравится играть с ним в командной строке. Вы можете обнаружить, что это конфликтует с Pulseaudio, поэтому я использую длинную версию, которая отрицает необходимость правильно настроить ее.
sudo apt-get install espeak
espeak --stdout "this is a test" | paplay
espeak --help покажет вам варианты калибровки скорости чтения, подачи , голос и т. д.
Когда вы делаете заметки, сохраните их в виде текстового файла, а затем:
echo "these are my notes" > text.txt
espeak --stdout -f text.txt > text.wav
paplay text.wav # you should hear "these are my notes"
Затем вы можете играть с ffmeg et al для сжатия это от PCM к чему-то более управляемому, как MP3 или OGG. Но это совсем другая история.
espeak - хороший инструмент.
Мне просто нравится играть с ним в командной строке. Вы можете обнаружить, что это конфликтует с Pulseaudio, поэтому я использую длинную версию, которая отрицает необходимость правильно настроить ее.
sudo apt-get install espeak
espeak --stdout "this is a test" | paplay
espeak --help покажет вам варианты калибровки скорости чтения, подачи , голос и т. д.
Когда вы делаете заметки, сохраните их в виде текстового файла, а затем:
echo "these are my notes" > text.txt
espeak --stdout -f text.txt > text.wav
paplay text.wav # you should hear "these are my notes"
Затем вы можете играть с ffmeg et al для сжатия это от PCM к чему-то более управляемому, как MP3 или OGG. Но это совсем другая история.
espeak - хороший инструмент.
Мне просто нравится играть с ним в командной строке. Вы можете обнаружить, что это конфликтует с Pulseaudio, поэтому я использую длинную версию, которая отрицает необходимость правильно настроить ее.
sudo apt-get install espeak
espeak --stdout "this is a test" | paplay
espeak --help покажет вам варианты калибровки скорости чтения, подачи , голос и т. д.
Когда вы делаете заметки, сохраните их в виде текстового файла, а затем:
echo "these are my notes" > text.txt
espeak --stdout -f text.txt > text.wav
paplay text.wav # you should hear "these are my notes"
Затем вы можете играть с ffmeg et al для сжатия это от PCM к чему-то более управляемому, как MP3 или OGG. Но это совсем другая история.
espeak - хороший инструмент.
Мне просто нравится играть с ним в командной строке. Вы можете обнаружить, что это конфликтует с Pulseaudio, поэтому я использую длинную версию, которая отрицает необходимость правильно настроить ее.
sudo apt-get install espeak
espeak --stdout "this is a test" | paplay
espeak --help покажет вам варианты калибровки скорости чтения, подачи , голос и т. д.
Когда вы делаете заметки, сохраните их в виде текстового файла, а затем:
echo "these are my notes" > text.txt
espeak --stdout -f text.txt > text.wav
paplay text.wav # you should hear "these are my notes"
Затем вы можете играть с ffmeg et al для сжатия это от PCM к чему-то более управляемому, как MP3 или OGG. Но это совсем другая история.
espeak
- хороший инструмент.
Мне просто нравится играть с ним в командной строке. Вы можете обнаружить, что это конфликтует с Pulseaudio, поэтому я использую длинную версию, которая отрицает необходимость правильно настроить ее.
sudo apt-get install espeak espeak --stdout "это тест "| paplay
espeak --help
покажет вам варианты калибровки скорости чтения, высоты тона, голоса и т. д.
Когда вы делайте заметки, сохраняйте их как текстовый файл, а затем:
echo «это мои заметки» & gt; text.txt espeak --stdout -f text.txt & gt; text.wav paplay text.wav # вы должны услышать «это мои заметки»
Затем вы можете играть с ffmeg et al, чтобы сжать это от PCM до чего-то более управляемого, например MP3 или OGG. Но это совсем другая история.
espeak
- хороший инструмент.
Мне просто нравится играть с ним в командной строке. Вы можете обнаружить, что это конфликтует с Pulseaudio, поэтому я использую длинную версию, которая отрицает необходимость правильно настроить ее.
sudo apt-get install espeak espeak --stdout "это тест "| paplay
espeak --help
покажет вам варианты калибровки скорости чтения, высоты тона, голоса и т. д.
Когда вы делайте заметки, сохраняйте их как текстовый файл, а затем:
echo «это мои заметки» & gt; text.txt espeak --stdout -f text.txt & gt; text.wav paplay text.wav # вы должны услышать «это мои заметки»
Затем вы можете играть с ffmeg et al, чтобы сжать это от PCM до чего-то более управляемого, например MP3 или OGG. Но это совсем другая история.
espeak
- хороший инструмент.
Мне просто нравится играть с ним в командной строке. Вы можете обнаружить, что это конфликтует с Pulseaudio, поэтому я использую длинную версию, которая отрицает необходимость правильно настроить ее.
sudo apt-get install espeak espeak --stdout "это тест "| paplay
espeak --help
покажет вам варианты калибровки скорости чтения, высоты тона, голоса и т. д.
Когда вы делайте заметки, сохраняйте их как текстовый файл, а затем:
echo «это мои заметки» & gt; text.txt espeak --stdout -f text.txt & gt; text.wav paplay text.wav # вы должны услышать «это мои заметки»
Затем вы можете играть с ffmeg et al, чтобы сжать это от PCM до чего-то более управляемого, например MP3 или OGG. Но это совсем другая история.
Mbrola не работает с 11.10.
Инструменты SVOX (pico) просты в установке, просты в использовании и приносят хорошие качества голоса в Ubuntu. Установите его:
sudo apt-get install libttspico0 libttspico-utils libttspico-data
Еще проще, вы можете использовать LibreOffice в сочетании с инструментами SVOX (pico), установив расширение «Читать текст», и вы получите «GUI» для этого превосходного программного обеспечения TTS:
Расширение «Чтение текста» с помощью инструментов - Дополнения - Чтение выбора .... Используйте / usr / bin / python в качестве внешней программы. Выберите параметр командной строки, который включает токен (PICO_READ_TEXT_PY).
И еще один espeak gui: gespeaker. Он использует двигатели espeak и mbrola. Кроме того, у него больше опций, чем espeak-gui.
Ниже приведено не решение FLOSS, но вы можете счесть это целесообразным. (это винное решение),
Я лично очень заинтересован в TTS, я использую его довольно часто ... например. слушая бессвязный дискурс, который я бы никогда не потрудился придерживаться другого (потому что мне нужно получить еще одну чашку кофе ... :)
Несколько вещей, которые я обнаружил по пути .. или должен Я говорю, вещи, которые я не обнаружил на этом пути ... Скажем прямо: каждый фрагмент программного обеспечения FOSS wine , который я пробовал, подпадает и поэтому непригоден для любого полузатянувшегося прослушивания ...
В настоящее время я использую NaturalVoices от ATnT. Он доступен только для Windows (возможно, для Mac), но он работает под wine в Ubuntu .. (у него есть незначительный glychch, где мне иногда нужно щелкнуть по панели, когда я отхожу от читателя ... Это является незначительной проблемой по сравнению с преимуществом, полученным качеством речи от NatualVoices.
Некоторые другие вещи, которые, как мне показалось, практически необходимы для получувственного прослушивания, - это ...
Эти прогамы TTS не интеллектуальны (ну, может быть, они умны, как молодой бабуин). Поэтому им нужна каждая помощь, которую они могут получить, и есть одна (и только одна программа Reader, которую я нашел, которая помогает очень в этом .. Приложение называется ReadPlease (2003 Pro) ... Это позволяет вам специально модифицировать слова и группы слов, которые будут произноситься так, как вы хотите их ... Это отнюдь не идеально, но для меня это сделало разница между всем процессом, который можно использовать и не использовать ... Речь в Natural Voices «хорошо», но это немного скучно. Есть и другие хорошие продукты, но все они для W indows, к сожалению) .. Это иногда поражает неожиданно. Но OMG, изначально это боль! .. так что # 2 - это терпение ... и много обновлений вашего списка «специальных слов» ... По терпению я имею в виду, что вы (я) фактически привыкли к речевым моделям моего конкретного бабуина:) ... и Кстати, у меня в настоящее время около 3000 слов, которые теперь звучат «Человеком», и я больше не съеживаюсь, когда слышу их. 3 .. «Следуйте за прыгающим мячом» ... Опять же, потому что голос никогда не бывает таким хорошим, как настоящий оратор, иногда нужно уточнять. Программа Reader, которую я использую, имеет одну функцию, для которой я даже встречаюсь с ее неуклюжим интерфейсом ... У меня есть опция «выбрать в настоящее время чтение». У многих читателей есть это, но ReadPlease держит текущую строку центр экрана. Это бесценно, чтобы иметь возможность видеть впереди и позади, чтобы быстро перечитать то, что вы только что пропустили (так что автоцентровка курсовой линии хорошая) ...Хорошо, это мой опыт. Я собираюсь сделать кофе сейчас, и пока я это делаю, я буду слушать это, чтобы посмотреть, как он «читает» .... TTS удивительно хороша для сбора опечаток (I сделать много опечаток) ...
Если что-то вроде ATnT NaturalVoices появится в репозитории Ubuntu, я перейду к нему.
Вот ссылка на некоторые образцы естественных голосов: я использую «MIke»
SVOX pico2wave
это то, что я использую. И это звучит естественно, его легко понять, он распознает единицы (m, ° C, kg, ...)
Вот мой первый пост для pico2wave
Natural Sounding Text
Все, что у вас есть, это:
Перейти в Ubuntu Software Center и найти «pico». Вы найдете 4 или 5 записей с помощью «Small Footprint Ling ...». Установите
Возможное использование pico2wave описано в моей первой публикации (см. Ссылку выше).
Bye
Несмотря на то, что вы уже приняли ответ, я хотел упомянуть festival, который мне тоже очень нравится. Этот пост на форумах Ubuntu содержит много информации о том, как настроить очень хорошие голоса.
Балаболка под Wine отлично работает (для меня) с голосами SAPI4 (голоса SAPI5 не обнаружены в моей Linux-системе). Он может открывать файлы и начинать чтение.
Вот ссылка на запись AppDB в Wine для Балаболки: https://appdb.winehq.org/objectManager.php?sClass=application&iId=17859
Установить: sudo apt-get install espeak Использование: echo [message] | espeak
SVOX pico2wave
это то, что я использую. И это звучит естественно, его легко понять, он распознает единицы (m, ° C, kg, ...)
Вот мой первый пост для pico2wave
Natural Sounding Text
Все, что у вас есть, это:
Перейти в Ubuntu Software Center и найти «pico». Вы найдете 4 или 5 записей с помощью «Small Footprint Ling ...». Установите
Возможное использование pico2wave описано в моей первой публикации (см. Ссылку выше).
Bye
Установить: sudo apt-get install espeak Использование: echo [message] | espeak
Несмотря на то, что вы уже приняли ответ, я хотел упомянуть festival, который мне тоже очень нравится. Этот пост на форумах Ubuntu содержит много информации о том, как настроить очень хорошие голоса.
Mbrola не работает с 11.10.
Инструменты SVOX (pico) просты в установке, просты в использовании и приносят хорошие качества голоса в Ubuntu. Установите его:
sudo apt-get install libttspico0 libttspico-utils libttspico-data
Еще проще, вы можете использовать LibreOffice в сочетании с инструментами SVOX (pico), установив расширение «Читать текст», и вы получите «GUI» для этого превосходного программного обеспечения TTS:
Расширение «Чтение текста» с помощью инструментов - Дополнения - Чтение выбора .... Используйте / usr / bin / python в качестве внешней программы. Выберите параметр командной строки, который включает токен (PICO_READ_TEXT_PY).
И еще один espeak gui: gespeaker. Он использует двигатели espeak и mbrola. Кроме того, у него больше опций, чем espeak-gui.
Балаболка под Wine отлично работает (для меня) с голосами SAPI4 (голоса SAPI5 не обнаружены в моей Linux-системе). Он может открывать файлы и начинать чтение.
Вот ссылка на запись AppDB в Wine для Балаболки: https://appdb.winehq.org/objectManager.php?sClass=application&iId=17859
Ниже приведено не решение FLOSS, но вы можете счесть это целесообразным. (это винное решение),
Я лично очень заинтересован в TTS, я использую его довольно часто ... например. слушая бессвязный дискурс, который я бы никогда не потрудился придерживаться другого (потому что мне нужно получить еще одну чашку кофе ... :)
Несколько вещей, которые я обнаружил по пути .. или должен Я говорю, вещи, которые я не обнаружил на этом пути ... Скажем прямо: каждый фрагмент программного обеспечения FOSS wine , который я пробовал, подпадает и поэтому непригоден для любого полузатянувшегося прослушивания ...
В настоящее время я использую NaturalVoices от ATnT. Он доступен только для Windows (возможно, для Mac), но он работает под wine в Ubuntu .. (у него есть незначительный glychch, где мне иногда нужно щелкнуть по панели, когда я отхожу от читателя ... Это является незначительной проблемой по сравнению с преимуществом, полученным качеством речи от NatualVoices.
Некоторые другие вещи, которые, как мне показалось, практически необходимы для получувственного прослушивания, - это ...
Эти прогамы TTS не интеллектуальны (ну, может быть, они умны, как молодой бабуин). Поэтому им нужна каждая помощь, которую они могут получить, и есть одна (и только одна программа Reader, которую я нашел, которая помогает очень в этом .. Приложение называется ReadPlease (2003 Pro) ... Это позволяет вам специально модифицировать слова и группы слов, которые будут произноситься так, как вы хотите их ... Это отнюдь не идеально, но для меня это сделало разница между всем процессом, который можно использовать и не использовать ... Речь в Natural Voices «хорошо», но это немного скучно. Есть и другие хорошие продукты, но все они для W indows, к сожалению) .. Это иногда поражает неожиданно. Но OMG, изначально это боль! .. так что # 2 - это терпение ... и много обновлений вашего списка «специальных слов» ... По терпению я имею в виду, что вы (я) фактически привыкли к речевым моделям моего конкретного бабуина:) ... и Кстати, у меня в настоящее время около 3000 слов, которые теперь звучат «Человеком», и я больше не съеживаюсь, когда слышу их. 3 .. «Следуйте за прыгающим мячом» ... Опять же, потому что голос никогда не бывает таким хорошим, как настоящий оратор, иногда нужно уточнять. Программа Reader, которую я использую, имеет одну функцию, для которой я даже встречаюсь с ее неуклюжим интерфейсом ... У меня есть опция «выбрать в настоящее время чтение». У многих читателей есть это, но ReadPlease держит текущую строку центр экрана. Это бесценно, чтобы иметь возможность видеть впереди и позади, чтобы быстро перечитать то, что вы только что пропустили (так что автоцентровка курсовой линии хорошая) ...Хорошо, это мой опыт. Я собираюсь сделать кофе сейчас, и пока я это делаю, я буду слушать это, чтобы посмотреть, как он «читает» .... TTS удивительно хороша для сбора опечаток (I сделать много опечаток) ...
Если что-то вроде ATnT NaturalVoices появится в репозитории Ubuntu, я перейду к нему.
Вот ссылка на некоторые образцы естественных голосов: я использую «MIke»
SVOX pico2wave
это то, что я использую. И это звучит естественно, его легко понять, он распознает единицы (m, ° C, kg, ...)
Вот мой первый пост для pico2wave
Natural Sounding Text
Все, что у вас есть, это:
Перейти в Ubuntu Software Center и найти «pico». Вы найдете 4 или 5 записей с помощью «Small Footprint Ling ...». Установите
Возможное использование pico2wave описано в моей первой публикации (см. Ссылку выше).
Bye
Установить: sudo apt-get install espeak Использование: echo [message] | espeak
Несмотря на то, что вы уже приняли ответ, я хотел упомянуть festival, который мне тоже очень нравится. Этот пост на форумах Ubuntu содержит много информации о том, как настроить очень хорошие голоса.
Mbrola не работает с 11.10.
Инструменты SVOX (pico) просты в установке, просты в использовании и приносят хорошие качества голоса в Ubuntu. Установите его:
sudo apt-get install libttspico0 libttspico-utils libttspico-data
Еще проще, вы можете использовать LibreOffice в сочетании с инструментами SVOX (pico), установив расширение «Читать текст», и вы получите «GUI» для этого превосходного программного обеспечения TTS:
Расширение «Чтение текста» с помощью инструментов - Дополнения - Чтение выбора .... Используйте / usr / bin / python в качестве внешней программы. Выберите параметр командной строки, который включает токен (PICO_READ_TEXT_PY).
И еще один espeak gui: gespeaker. Он использует двигатели espeak и mbrola. Кроме того, у него больше опций, чем espeak-gui.
Балаболка под Wine отлично работает (для меня) с голосами SAPI4 (голоса SAPI5 не обнаружены в моей Linux-системе). Он может открывать файлы и начинать чтение.
Вот ссылка на запись AppDB в Wine для Балаболки: https://appdb.winehq.org/objectManager.php?sClass=application&iId=17859