Естественный звучащий текст к речи?

Я ищу некоторых легких устанавливать текст на речевом программном обеспечении для Ubuntu, которая звучит естественной. Я установил Festival, Gespeaker, и т.д., но ничто не звучит очень естественным. Все очень синтетические и твердые понять.

Какие-либо рекомендации там?

86
задан 20 July 2011 в 15:26

15 ответов

SpeakIt!

Я полагаю, что нашел лучшее программное обеспечение TTS для бесплатного использования расширения Google Chrome под названием "SpeakIt". Это только работает в браузере Chrome на меня на Ubuntu. Это не работает с Хромом по некоторым причинам. SpeakIt идет с двумя розеточной речью, которая оба звучит очень реалистичной по сравнению со всем остальным там. Существуют перечисленные s расширения Chrome еще по крайней мере четырех штекерной и розеточной речи при поиске интернет-магазина Chrome с помощью "TTS" в качестве запроса.

Использование: Для использования на веб-сайте. Вы выделяете текст, Вы хотите быть считанными и или щелчок правой кнопкой и "SpeakIt" или нажать значок SpeakIt, прикрепленный на панель вершины Chrome.


У пользователей Firefox также есть две опции. В дополнениях Firefox сделайте поиск TTS, и необходимо найти, что "Щелчок Говорит" и также "текст к Речи". Речь не так хороша как речь Chrome SpeakIt, но определенно применима.

Расширение SpeakIt использует iSpeech технологию и за цену 20$ в год, сайт может преобразовать текст в звуковые файлы MP3. Можно ввести текст, URL, каналы RSS, а также документы, такие как TXT, DOC и PDF и произвести к MP3. Можно сделать подкаст, встроить аудио и т.д. Вот ссылка, и образец их аудио (не знайте, сколько времени ссылка продлится).

22
ответ дан 22 November 2019 в 23:10

Я выглядел высоким и низким для текста к речи для Ubuntu, которая является высококачественной. Нет ни одного. Мои голосовые связки парализуются так, мне был нужен TTS для добавления речевых инструкций к моим видео Ubuntu. Можно получить коммерческий высококачественный текст Linux к речевому программному обеспечению здесь. Это просто действительно дорого. Я закончил тем, что покупал Естественное Средство чтения для Windows (не работает в Ubuntu под Вином) за 40$. Возможно, позже я получу Linux один.

8
ответ дан 22 November 2019 в 23:10

Мою любимую программу синтеза речи по тексту называют Волшебным английским языком, но как Естественный Читатель, упомянутый Joe Steiger, это - Windows-программа, и я не уверен, будет ли это работать под Вином.

Естественная Речь AT&T доступна онлайн как демонстрация, но это - больше обходного решения, чем решение...

1
ответ дан 22 November 2019 в 23:10

Я проводил исследование в области лучшего звучания и легко настроил текст на речевую речь. Ниже список того, что я думал, были лучшие 5 продуктов в порядке качества звука. Большинство веб-сайтов связалось с ними, продукт имеет интерактивную демонстрацию, которая позволит, чтобы Вы сделали свое собственное определение.

  1. NeoSpeech
  2. iVona
  3. Acapela
  4. AT&T Естественная речь
  5. Речь CereProc
6
ответ дан 22 November 2019 в 23:10

Я нахожу речь Nitech HTS на фестивале очень естественной и утешительной по любой другой речи, которую я услышал. См. эту ссылку на то, как создать Nitech и другие звуки с фестивалем. Я не нашел хороший gui, который я могу использовать для конфигурирования той речи, но установка их через festival.scm все еще работает. То сообщение очень старо, и Вы могли бы хотеть найти, что использование каталога фактической установки "определяет местоположение фестиваля" команда

5
ответ дан 22 November 2019 в 23:10

SVOX pico2wave

Очень минималистический TTS, лучшее звучание, чем espeak или mbrola (по моему мнению). Некоторая информация здесь.

Я не понимаю, почему pico2wave, по сравнению с espeak или mbrola, редко обсуждаемым. Это является маленьким, но звучит действительно хорошим (естественный). Без модификации Вы услышите, что естественное звучит как розеточная речь.

И... по сравнению с Mbrola, это распознает Единицы, и говорит его правильный путь!
Например:

  • 2°C → два градуса
  • 2 м → два метра
  • 2 кг → два килограмма

После установки я использую его в сценарии:

#!/bin/bash
pico2wave -w=/tmp/test.wav "$1"
aplay /tmp/test.wav
rm /tmp/test.wav

Затем выполните его с требуемым текстом:

<scriptname>.sh "hello world"

или считайте содержание всего файла:

<scriptname>.sh "$(cat <filename>)"

Это - все, чтобы иметь легкую, стабильную работу TTS на Ubuntu.

52
ответ дан 22 November 2019 в 23:10

Инструменты SVOX объединения (pico) с LibreOffice:

SVOX (pico) инструменты легко установить, и приносит речь хорошего качества в Ubuntu. Установите его:

sudo apt-get install libttspico0 libttspico-utils libttspico-data

Можно использовать LibreOffice в сочетании с SVOX (pico) инструменты установкой "текстовое расширение" Чтения, и Вы получаете "GUI" для этого превосходного программного обеспечения TTS:

Настройте текстовые опции Расширения Чтения с Инструментами - Дополнениями - выбор Чтения.... Используйте/usr/bin/python в качестве внешней программы. Выберите параметр командной строки, который включает маркер (PICO_READ_TEXT_PY), можно хотеть экспериментировать некоторые из них.

Теперь только необходимо выбрать некоторый текст в Писателе LO, Calc, Отпечатке или Потянуть и clic на значке, добавленном как панель инструментов (счастливая поверхность с баллоном).

5
ответ дан 22 November 2019 в 23:10

Вот то, что я сделал, чтобы иметь чистую естественную речь для PDF, и другие текстовые файлы (другие решения не являются естественными, или им просто платят сервисы). Это - на самом деле работа вокруг использования хрома или хрома, но работает быстрое и легкое.

  1. Установка SpeakIt! расширение на Вашем хроме или хроме.
  2. Установите Средство просмотра PDF при использовании хрома (хром уже имеет средство просмотра PDF бесплатно), и проверьте опции 'Allow in incognito' и 'Allow access to file URLs' в настройки расширений хрома.
  3. Перетащите свой PDF к браузеру.
  4. Теперь выделите некоторый текст и щелчок правой кнопкой и выберите SpeakIt! таким образом, можно слушать чистый естественный синтез речи по тексту.

Существуют также способы открыть другие файлы как .doc и .txt в хроме и сделать то же. Существуют другие расширения для хрома, которые просматривают файлы PDF, проверяют, соответствует ли он Вам лучше. Помимо Вас может загрузить весь вид текстов в Google Drive и использовать SpeakIt! считать его для Вас. Другое расширение, названное ', Говорит текст' работы тот же путь, и имеет естественную речь.

4
ответ дан 22 November 2019 в 23:10

Простой Google™ TTS

Обновление от страницы (2019-02) проекта: Этот проект в настоящее время не сохраняется и останется так для обозримого будущего


Из-за отсутствия лучшей альтернативы я записал сценарий удара, который взаимодействует через интерфейс со сценарием жемчуга Michal Fapso для обеспечения TTS через Google Translate. Из описания проекта:

Намерение состоит в том, чтобы предоставить простой в использовании интерфейс выводу синтеза речи по тексту через синтезатор речи Google. Опция нейтрализации с помощью pico2wave автоматически обеспечивает синтез TTS в случае, если никакое Интернет-соединение не найдено.

В настоящий момент поддержки обертки, читающие из стандартного входа, файлов простого текста и X выборов (выделенный текст).

Основные функции:

  • синтез TTS онлайн через Google переводит
  • офлайновый синтез TTS через pico2wave
  • поддерживает множество различных языков
  • может читать из CLI, текстовых файлов и выделенного текста
  • поддержки читая выделенный текст с фиксированным форматированием (например, файлы PDF)

Установка и использование документируются на странице проекта.

Я радовался бы, дали ли Вы ему попытку. Отчеты об ошибках и любая другая обратная связь приветствуются!

13
ответ дан 22 November 2019 в 23:10

Pico и espeak являются забавой и легкий взяться за работу, но они не весь настолько хороши. Фестивальная речь по умолчанию также не настолько хороша. Однако Фестиваль является основанной на схеме речевой платформой, где много исследователей создали намного лучшую сменную речь. Можно легко превзойти pico2wave качество на запасе Ubuntu, потому что одна из той речи доступна как готовый пакет.

Чтобы заставить Фестиваль звучать естественным, вот то, что сделать:

sudo apt-get install festival
sudo apt-get install festvox-us-slt-hts
festival -i
festival> (voice_cmu_us_slt_arctic_hts) 
festival> (SayText "Don't hate me, I'm just doing my job!")

Можно сделать это из командной строки при помощи -b (или --batch) и помещение каждой команды в одинарные кавычки:

festival -b '(voice_cmu_us_slt_arctic_hts)' \
    '(SayText "The temperature is 22 degrees centigrade and there is a slight breeze from the west.")'

Можно получить другую довольно хорошую речь из репозитория Nitech, но установка их является привередливой, и пути по умолчанию, измененные, таким образом, ссылки имени файла в связанных файлах схемы, возможно, должны быть вручную отредактированы для работы над запасом Ubuntu.

15
ответ дан 22 November 2019 в 23:10

При поиске лучшего tts механизма для использования с новым режимом firefox 49 рассказа я нашел pico tts (svox) - мой любимый механизм TTS.

sudo apt install espeak libttspico0 libttspico-data libttspico-utils

Как изменить механизм синтеза речи по умолчанию в масштабе всей системы?

Люди в дуге Linux принесли мне к правильному пути:

Не прокомментируйте модуль, Вы любите и делаете его значением по умолчанию в настройках речевого диспетчера:

# sudo vim /etc/speech-dispatcher/speechd.conf

[...]
# -----OUTPUT MODULES CONFIGURATION-----
# Each AddModule line loads an output module.
#AddModule "espeak"       "sd_espeak"   "espeak.conf"
AddModule "pico-generic"  "sd_generic"   "pico-generic.conf"

[...]
#DefaultModule espeak
DefaultModule pico-generic

Перезапустите демона:

# sudo systemctl restart speech-dispatcher.service

НО, когда стартовый Firefox снова, ничего не происходит. Согласно ссылке выше (сообщение форума дуги № 10 и № 16) работы с фестивалем (не попробовал), но речевой диспетчер для pico не перечисляет доступную речь. Это не будет работать.

Любая идея там высоко ценилась бы ;-)

2
ответ дан 22 November 2019 в 23:10

Для этого я создаю Интеллектуальный Динамик - расширение для Google Chrome. Это может прочитать страницы даже без выбора (когда текстовое задержание корректно).

0
ответ дан 22 November 2019 в 23:10

Простой Google™ TTS

Pico, mbrola, cmu, фестиваль, полет, все ВПИТЫВАЮТ 2017 (Они были удивительны в 90-х). AT&T естественной речью (который является фантастическим) не является Linux, разделяет, и это не свободно, поэтому мы используем Google

git clone https://github.com/Glutanimate/simple-google-tts.git
sudo apt install xsel libnotify-bin libttspico0 libttspico-utils libttspico-data libwww-perl libwww-mechanize-perl libhtml-tree-perl so$
cd simple-google-tts
sudo ln -s `pwd`/simple_google_tts /usr/local/bin
simple_google_tts en "Text to speech is now installed"
cd -
1
ответ дан 22 November 2019 в 23:10

gTTS

gTTS (Синтез речи по тексту Google), библиотека Python и инструмент CLI для взаимодействия через интерфейс с синтезом речи по тексту Translate Google с API. На записях говорят mp3 данные в файл, подобный файлу объект (строка байтов) для дальнейшего аудио управления, или stdout.

Недостатки: только для CLI. Потребность быть онлайн, поскольку это требует для запроса общественности Google открытой конечной точки.

sudo -H pip install gTTS  # Install

Использование

gtts-cli 'hello' --output hello.mp3
gtts-cli -l es 'Nadie es patria, todos lo somos' | play -t mp3 -

Документация и больше примеров

Другие

Некоторые были уже упомянуты

1
ответ дан 22 November 2019 в 23:10

В системах Linux вы можете сбросить выделение X (текст, который вы выбрали на экране с помощью мыши) в текстовый файл, а затем прочитать его с помощью TTS (в настоящее время я использую скрипт Google Translate Python gTTS):

#!/bin/bash
TXT="/tmp/speak.txt"

# save X text selection to a file
xclip -out > $TXT

# remove smiles
sed -i 's/ :[pP]/./' $TXT
sed -i 's/ :\//./' $TXT
sed -i 's/ :D/./' $TXT
sed -i 's/ ;D/./' $TXT
sed -i 's/ :(/./' $TXT

# Abbreviations:
sed -i 's/[^a-z]IPv6[^a-z]/I P version 6/gi' $TXT
sed -i 's/[^a-z]MR[^a-z]/merge request/gi' $TXT
sed -i 's/[^a-z]btw[^a-z]/by the way/gi' $TXT
sed -i 's/[^a-z]WIP[^a-z]/work in progress/gi' $TXT
sed -i 's/[^a-z]CLI[^a-z]/command line/gi' $TXT

# Latin
sed -i 's/i\.e\./that is/gi' $TXT
sed -i 's/e\.g\./for example/gi' $TXT

gtts-cli -f $TXT | play -t mp3 -

Привяжите этот скрипт к какой-нибудь клавише, например, правой клавише меню, и каждый раз, когда вы выделяете текст в любой программе: Firefox, Thunderbird, LibreOffice Write, PDF-ридер или даже Терминал, вы будете слышать текст .

ПС. вы также можете добавить параметр --slow в gtts-cli.

0
ответ дан 2 January 2021 в 16:51

Другие вопросы по тегам:

Похожие вопросы: