Я ищу некоторых легких устанавливать текст на речевом программном обеспечении для Ubuntu, которая звучит естественной. Я установил Festival
, Gespeaker
, и т.д., но ничто не звучит очень естественным. Все очень синтетические и твердые понять.
Какие-либо рекомендации там?
Я полагаю, что нашел лучшее программное обеспечение TTS для бесплатного использования расширения Google Chrome под названием "SpeakIt". Это только работает в браузере Chrome на меня на Ubuntu. Это не работает с Хромом по некоторым причинам. SpeakIt идет с двумя розеточной речью, которая оба звучит очень реалистичной по сравнению со всем остальным там. Существуют перечисленные s расширения Chrome еще по крайней мере четырех штекерной и розеточной речи при поиске интернет-магазина Chrome с помощью "TTS" в качестве запроса.
Использование: Для использования на веб-сайте. Вы выделяете текст, Вы хотите быть считанными и или щелчок правой кнопкой и "SpeakIt" или нажать значок SpeakIt, прикрепленный на панель вершины Chrome.
У пользователей Firefox также есть две опции. В дополнениях Firefox сделайте поиск TTS, и необходимо найти, что "Щелчок Говорит" и также "текст к Речи". Речь не так хороша как речь Chrome SpeakIt, но определенно применима.
Расширение SpeakIt использует iSpeech технологию и за цену 20$ в год, сайт может преобразовать текст в звуковые файлы MP3. Можно ввести текст, URL, каналы RSS, а также документы, такие как TXT, DOC и PDF и произвести к MP3. Можно сделать подкаст, встроить аудио и т.д. Вот ссылка, и образец их аудио (не знайте, сколько времени ссылка продлится).
Я выглядел высоким и низким для текста к речи для Ubuntu, которая является высококачественной. Нет ни одного. Мои голосовые связки парализуются так, мне был нужен TTS для добавления речевых инструкций к моим видео Ubuntu. Можно получить коммерческий высококачественный текст Linux к речевому программному обеспечению здесь. Это просто действительно дорого. Я закончил тем, что покупал Естественное Средство чтения для Windows (не работает в Ubuntu под Вином) за 40$. Возможно, позже я получу Linux один.
Мою любимую программу синтеза речи по тексту называют Волшебным английским языком, но как Естественный Читатель, упомянутый Joe Steiger, это - Windows-программа, и я не уверен, будет ли это работать под Вином.
Естественная Речь AT&T доступна онлайн как демонстрация, но это - больше обходного решения, чем решение...
Я проводил исследование в области лучшего звучания и легко настроил текст на речевую речь. Ниже список того, что я думал, были лучшие 5 продуктов в порядке качества звука. Большинство веб-сайтов связалось с ними, продукт имеет интерактивную демонстрацию, которая позволит, чтобы Вы сделали свое собственное определение.
Я нахожу речь Nitech HTS на фестивале очень естественной и утешительной по любой другой речи, которую я услышал. См. эту ссылку на то, как создать Nitech и другие звуки с фестивалем. Я не нашел хороший gui, который я могу использовать для конфигурирования той речи, но установка их через festival.scm все еще работает. То сообщение очень старо, и Вы могли бы хотеть найти, что использование каталога фактической установки "определяет местоположение фестиваля" команда
Очень минималистический TTS, лучшее звучание, чем espeak или mbrola (по моему мнению). Некоторая информация здесь.
Я не понимаю, почему pico2wave, по сравнению с espeak или mbrola, редко обсуждаемым. Это является маленьким, но звучит действительно хорошим (естественный). Без модификации Вы услышите, что естественное звучит как розеточная речь.
И... по сравнению с Mbrola, это распознает Единицы, и говорит его правильный путь!
Например:
После установки я использую его в сценарии:
#!/bin/bash
pico2wave -w=/tmp/test.wav "$1"
aplay /tmp/test.wav
rm /tmp/test.wav
Затем выполните его с требуемым текстом:
<scriptname>.sh "hello world"
или считайте содержание всего файла:
<scriptname>.sh "$(cat <filename>)"
Это - все, чтобы иметь легкую, стабильную работу TTS на Ubuntu.
Инструменты SVOX объединения (pico) с LibreOffice:
SVOX (pico) инструменты легко установить, и приносит речь хорошего качества в Ubuntu. Установите его:
sudo apt-get install libttspico0 libttspico-utils libttspico-data
Можно использовать LibreOffice в сочетании с SVOX (pico) инструменты установкой "текстовое расширение" Чтения, и Вы получаете "GUI" для этого превосходного программного обеспечения TTS:
Настройте текстовые опции Расширения Чтения с Инструментами - Дополнениями - выбор Чтения.... Используйте/usr/bin/python в качестве внешней программы. Выберите параметр командной строки, который включает маркер (PICO_READ_TEXT_PY), можно хотеть экспериментировать некоторые из них.
Теперь только необходимо выбрать некоторый текст в Писателе LO, Calc, Отпечатке или Потянуть и clic на значке, добавленном как панель инструментов (счастливая поверхность с баллоном).
Вот то, что я сделал, чтобы иметь чистую естественную речь для PDF, и другие текстовые файлы (другие решения не являются естественными, или им просто платят сервисы). Это - на самом деле работа вокруг использования хрома или хрома, но работает быстрое и легкое.
Существуют также способы открыть другие файлы как .doc и .txt в хроме и сделать то же. Существуют другие расширения для хрома, которые просматривают файлы PDF, проверяют, соответствует ли он Вам лучше. Помимо Вас может загрузить весь вид текстов в Google Drive и использовать SpeakIt! считать его для Вас. Другое расширение, названное ', Говорит текст' работы тот же путь, и имеет естественную речь.
Обновление от страницы (2019-02) проекта: Этот проект в настоящее время не сохраняется и останется так для обозримого будущего
Из-за отсутствия лучшей альтернативы я записал сценарий удара, который взаимодействует через интерфейс со сценарием жемчуга Michal Fapso для обеспечения TTS через Google Translate. Из описания проекта:
Намерение состоит в том, чтобы предоставить простой в использовании интерфейс выводу синтеза речи по тексту через синтезатор речи Google. Опция нейтрализации с помощью pico2wave автоматически обеспечивает синтез TTS в случае, если никакое Интернет-соединение не найдено.
В настоящий момент поддержки обертки, читающие из стандартного входа, файлов простого текста и X выборов (выделенный текст).
Основные функции:
Установка и использование документируются на странице проекта.
Я радовался бы, дали ли Вы ему попытку. Отчеты об ошибках и любая другая обратная связь приветствуются!
Pico и espeak являются забавой и легкий взяться за работу, но они не весь настолько хороши. Фестивальная речь по умолчанию также не настолько хороша. Однако Фестиваль является основанной на схеме речевой платформой, где много исследователей создали намного лучшую сменную речь. Можно легко превзойти pico2wave качество на запасе Ubuntu, потому что одна из той речи доступна как готовый пакет.
Чтобы заставить Фестиваль звучать естественным, вот то, что сделать:
sudo apt-get install festival
sudo apt-get install festvox-us-slt-hts
festival -i
festival> (voice_cmu_us_slt_arctic_hts)
festival> (SayText "Don't hate me, I'm just doing my job!")
Можно сделать это из командной строки при помощи -b
(или --batch
) и помещение каждой команды в одинарные кавычки:
festival -b '(voice_cmu_us_slt_arctic_hts)' \
'(SayText "The temperature is 22 degrees centigrade and there is a slight breeze from the west.")'
Можно получить другую довольно хорошую речь из репозитория Nitech, но установка их является привередливой, и пути по умолчанию, измененные, таким образом, ссылки имени файла в связанных файлах схемы, возможно, должны быть вручную отредактированы для работы над запасом Ubuntu.
При поиске лучшего tts механизма для использования с новым режимом firefox 49 рассказа я нашел pico tts (svox) - мой любимый механизм TTS.
sudo apt install espeak libttspico0 libttspico-data libttspico-utils
Как изменить механизм синтеза речи по умолчанию в масштабе всей системы?
Люди в дуге Linux принесли мне к правильному пути:
Не прокомментируйте модуль, Вы любите и делаете его значением по умолчанию в настройках речевого диспетчера:
# sudo vim /etc/speech-dispatcher/speechd.conf
[...]
# -----OUTPUT MODULES CONFIGURATION-----
# Each AddModule line loads an output module.
#AddModule "espeak" "sd_espeak" "espeak.conf"
AddModule "pico-generic" "sd_generic" "pico-generic.conf"
[...]
#DefaultModule espeak
DefaultModule pico-generic
Перезапустите демона:
# sudo systemctl restart speech-dispatcher.service
НО, когда стартовый Firefox снова, ничего не происходит. Согласно ссылке выше (сообщение форума дуги № 10 и № 16) работы с фестивалем (не попробовал), но речевой диспетчер для pico не перечисляет доступную речь. Это не будет работать.
Любая идея там высоко ценилась бы ;-)
Для этого я создаю Интеллектуальный Динамик - расширение для Google Chrome. Это может прочитать страницы даже без выбора (когда текстовое задержание корректно).
Pico, mbrola, cmu, фестиваль, полет, все ВПИТЫВАЮТ 2017 (Они были удивительны в 90-х). AT&T естественной речью (который является фантастическим) не является Linux, разделяет, и это не свободно, поэтому мы используем Google
git clone https://github.com/Glutanimate/simple-google-tts.git
sudo apt install xsel libnotify-bin libttspico0 libttspico-utils libttspico-data libwww-perl libwww-mechanize-perl libhtml-tree-perl so$
cd simple-google-tts
sudo ln -s `pwd`/simple_google_tts /usr/local/bin
simple_google_tts en "Text to speech is now installed"
cd -
gTTS (Синтез речи по тексту Google), библиотека Python и инструмент CLI для взаимодействия через интерфейс с синтезом речи по тексту Translate Google с API. На записях говорят
mp3
данные в файл, подобный файлу объект (строка байтов) для дальнейшего аудио управления, илиstdout
.
Недостатки: только для CLI. Потребность быть онлайн, поскольку это требует для запроса общественности Google открытой конечной точки.
sudo -H pip install gTTS # Install
Использование
gtts-cli 'hello' --output hello.mp3
gtts-cli -l es 'Nadie es patria, todos lo somos' | play -t mp3 -
Документация и больше примеров
Некоторые были уже упомянуты
Имитатор. Установка:
sudo apt-get install gcc make pkg-config automake libtool libasound2-dev
git clone https://github.com/MycroftAI/mimic.git # take a while
cd mimic
./dependencies.sh --prefix="/usr/local" # take a while
./autogen.sh
./configure --prefix="/usr/local"
make # take a while
make check
eSpeak + Gespeaker (GUI) (исходный код Gespeaker)
Недостатки: Старый и ужасный
sudo apt install espeak gespeaker
В системах Linux вы можете сбросить выделение X (текст, который вы выбрали на экране с помощью мыши) в текстовый файл, а затем прочитать его с помощью TTS (в настоящее время я использую скрипт Google Translate Python gTTS):
#!/bin/bash
TXT="/tmp/speak.txt"
# save X text selection to a file
xclip -out > $TXT
# remove smiles
sed -i 's/ :[pP]/./' $TXT
sed -i 's/ :\//./' $TXT
sed -i 's/ :D/./' $TXT
sed -i 's/ ;D/./' $TXT
sed -i 's/ :(/./' $TXT
# Abbreviations:
sed -i 's/[^a-z]IPv6[^a-z]/I P version 6/gi' $TXT
sed -i 's/[^a-z]MR[^a-z]/merge request/gi' $TXT
sed -i 's/[^a-z]btw[^a-z]/by the way/gi' $TXT
sed -i 's/[^a-z]WIP[^a-z]/work in progress/gi' $TXT
sed -i 's/[^a-z]CLI[^a-z]/command line/gi' $TXT
# Latin
sed -i 's/i\.e\./that is/gi' $TXT
sed -i 's/e\.g\./for example/gi' $TXT
gtts-cli -f $TXT | play -t mp3 -
Привяжите этот скрипт к какой-нибудь клавише, например, правой клавише меню, и каждый раз, когда вы выделяете текст в любой программе: Firefox, Thunderbird, LibreOffice Write, PDF-ридер или даже Терминал, вы будете слышать текст .
ПС. вы также можете добавить параметр --slow
в gtts-cli.