Я хочу, чтобы tesseract конвертировал все файлы в папке. Я не хочу объединять файлы каким-либо образом, поскольку у меня возникают проблемы с такими программами, как hocr2pdf и pdfbeads, которые объединяют более одного файла одновременно.
Я бегу tesseract *.tif * hocr
и получаю следующее
read_params_file: parameter not found: II*
Я попробовал это, и это работает
for i in *.tif ; do tesseract $i outtext; done;
, Удостоверяются, когда Вы находитесь в терминале, и Вы изменяете каталог на местоположение всех файлов
Я изменил ответ Meer Borg немного. С помощью того кода мой выходной файл только ввел из последнего файла в папке.
Используя tesseract's stdout
опция с >>
является способом получить весь вывод, добавленный в единственный файл:
for i in *.tif ; do tesseract $i stdout >> outtext; done;