Я работаю над проектом, который помогает людям с ослабленным зрением слушать записи на печатной бумаге. Я разобрался с частью преобразования печатного текстового изображения в файл pdf с цифровым письмом. Теперь я хочу, чтобы espeak получил доступ к этой записи и прочитал ее вслух с помощью python. Кто-нибудь может помочь?
Очень простое преобразование изображения к речи может быть сделано из командной строки путем передачи по каналу вывода tesseract-ocr к espeak. Это может быть сделано без дальнейшего кодирования или преобразований непосредственно из источника изображения:
tesseract image.png stdout | espeak