Как указать язык, который будет использоваться Tesseract при использовании OCRFeeder

Question 1

Я использую OCR-утилиту OCRFeeder. OCRFeeder использует движок tesseract. Я установил несколько языковых пакетов, необходимых для tesseract. Как установить язык таким образом, чтобы tesseract использовал правильный языковой файл для преобразования отсканированного документа в текст?

Question 2

Вам нужно настроить командную строку двигателя на настройках фидера OCR. Он должен выглядеть так:

-l lang_id $IMAGE $FILE; cat $FILE.txt

Где lang_id - это идентификатор, как показано на имени соответствующего языкового пакета.

Question 3

Question 4

Вам нужно настроить командную строку двигателя на настройках фидера OCR. Он должен выглядеть так:

-l lang_id $IMAGE $FILE; cat $FILE.txt

Где lang_id - это идентификатор, как показано на имени соответствующего языкового пакета.

Question 5

Вам нужно настроить командную строку двигателя на настройках фидера OCR. Он должен выглядеть так:

-l lang_id $IMAGE $FILE; cat $FILE.txt

Где lang_id - это идентификатор, как показано на имени соответствующего языкового пакета.

Question 6

Вам нужно настроить командную строку двигателя на настройках фидера OCR. Он должен выглядеть так:

-l lang_id $IMAGE $FILE; cat $FILE.txt

Где lang_id - это идентификатор, как показано на имени соответствующего языкового пакета.

Question 7

Question 8

Вам нужно настроить командную строку двигателя на настройках фидера OCR. Он должен выглядеть так:

-l lang_id $IMAGE $FILE; cat $FILE.txt

Где lang_id - это идентификатор, как показано на имени соответствующего языкового пакета.

Question 9

Вам нужно настроить командную строку двигателя на настройках фидера OCR. Он должен выглядеть так:

-l lang_id $IMAGE $FILE; cat $FILE.txt

Где lang_id - это идентификатор, как показано на имени соответствующего языкового пакета.

Question 10

Вам нужно настроить командную строку двигателя на настройках фидера OCR. Он должен выглядеть так:

-l lang_id $IMAGE $FILE; cat $FILE.txt

Где lang_id - это идентификатор, как показано на имени соответствующего языкового пакета.

Question 11

Вам нужно настроить командную строку двигателя на настройках фидера OCR. Он должен выглядеть так:

  -l lang_id $ IMAGE $ FILE;  cat $ FILE.txt

Где lang_id - это идентификатор, как показано на соответствующем имени пакета языка.

Question 12

Вам нужно настроить командную строку двигателя на настройках фидера OCR. Он должен выглядеть так:

  -l lang_id $ IMAGE $ FILE;  cat $ FILE.txt

Где lang_id - это идентификатор, как показано на соответствующем имени пакета языка.

João Pinto · Answer 1 · 25 July 2018 в 22:30

Вам нужно настроить командную строку двигателя на настройках фидера OCR. Он должен выглядеть так:

-l lang_id $IMAGE $FILE; cat $FILE.txt

Где lang_id - это идентификатор, как показано на имени соответствующего языкового пакета.

3

ответ дан João Pinto 25 July 2018 в 22:30

1

Спасибо, Жоау. Однако идентификатор языка должен быть указан как последний аргумент. например. $ IMAGE $ FILE -l lang-id; cat $ FILE.txt – Bernard Decock 13 February 2011 в 12:55
2

Я добавил несколько OCR-двигателей в OCR-Feeder. Goto Tools, OCR-Engines и новый ocr-движок: я продолжаю использовать движок tesseract, но я указал новое имя для каждой записи, сделанной с определенным идентификатором языка. Итак, для каждого языка у меня есть конкретный ocr-egine, который может быть выбран OCR-Feeder (спасибо João Pinto за подсказку) – Bernard Decock 13 February 2011 в 13:01
3

Языковые теги можно найти в синаптических для пакетов tesseract. (spa = испанский, fra = французский, deu = немецкий, nld = голландский; ita = итальянский, por = portugese). например. для сканирования французского текста мой Tesseract-французский движок имеет следующую командную строку: $ IMAGE $ FILE -l fra; cat $ FILE.txt – Bernard Decock 13 February 2011 в 13:07

João Pinto · Answer 2 · 26 July 2018 в 22:03

Вам нужно настроить командную строку двигателя на настройках фидера OCR. Он должен выглядеть так:

-l lang_id $IMAGE $FILE; cat $FILE.txt

Где lang_id - это идентификатор, как показано на имени соответствующего языкового пакета.

3

ответ дан João Pinto 26 July 2018 в 22:03

1

Спасибо, Жоау. Однако идентификатор языка должен быть указан как последний аргумент. например. $ IMAGE $ FILE -l lang-id; cat $ FILE.txt – Bernard Decock 13 February 2011 в 12:55
2

Я добавил несколько OCR-двигателей в OCR-Feeder. Goto Tools, OCR-Engines и новый ocr-движок: я продолжаю использовать движок tesseract, но я указал новое имя для каждой записи, сделанной с определенным идентификатором языка. Итак, для каждого языка у меня есть конкретный ocr-egine, который может быть выбран OCR-Feeder (спасибо João Pinto за подсказку) – Bernard Decock 13 February 2011 в 13:01
3

Языковые теги можно найти в синаптических для пакетов tesseract. (spa = испанский, fra = французский, deu = немецкий, nld = голландский; ita = итальянский, por = portugese). например. для сканирования французского текста мой Tesseract-французский движок имеет следующую командную строку: $ IMAGE $ FILE -l fra; cat $ FILE.txt – Bernard Decock 13 February 2011 в 13:07

João Pinto · Answer 3 · 31 July 2018 в 12:37

Вам нужно настроить командную строку двигателя на настройках фидера OCR. Он должен выглядеть так:

-l lang_id $IMAGE $FILE; cat $FILE.txt

Где lang_id - это идентификатор, как показано на имени соответствующего языкового пакета.

3

ответ дан João Pinto 31 July 2018 в 12:37

1

Спасибо, Жоау. Однако идентификатор языка должен быть указан как последний аргумент. например. $ IMAGE $ FILE -l lang-id; cat $ FILE.txt – Bernard Decock 13 February 2011 в 12:55
2

Я добавил несколько OCR-двигателей в OCR-Feeder. Goto Tools, OCR-Engines и новый ocr-движок: я продолжаю использовать движок tesseract, но я указал новое имя для каждой записи, сделанной с определенным идентификатором языка. Итак, для каждого языка у меня есть конкретный ocr-egine, который может быть выбран OCR-Feeder (спасибо João Pinto за подсказку) – Bernard Decock 13 February 2011 в 13:01
3

Языковые теги можно найти в синаптических для пакетов tesseract. (spa = испанский, fra = французский, deu = немецкий, nld = голландский; ita = итальянский, por = portugese). например. для сканирования французского текста мой Tesseract-французский движок имеет следующую командную строку: $ IMAGE $ FILE -l fra; cat $ FILE.txt – Bernard Decock 13 February 2011 в 13:07

João Pinto · Answer 4 · 2 August 2018 в 03:56

Вам нужно настроить командную строку двигателя на настройках фидера OCR. Он должен выглядеть так:

-l lang_id $IMAGE $FILE; cat $FILE.txt

Где lang_id - это идентификатор, как показано на имени соответствующего языкового пакета.

3

ответ дан João Pinto 2 August 2018 в 03:56

1

Спасибо, Жоау. Однако идентификатор языка должен быть указан как последний аргумент. например. $ IMAGE $ FILE -l lang-id; cat $ FILE.txt – Bernard Decock 13 February 2011 в 12:55
2

Я добавил несколько OCR-двигателей в OCR-Feeder. Goto Tools, OCR-Engines и новый ocr-движок: я продолжаю использовать движок tesseract, но я указал новое имя для каждой записи, сделанной с определенным идентификатором языка. Итак, для каждого языка у меня есть конкретный ocr-egine, который может быть выбран OCR-Feeder (спасибо João Pinto за подсказку) – Bernard Decock 13 February 2011 в 13:01
3

Языковые теги можно найти в синаптических для пакетов tesseract. (spa = испанский, fra = французский, deu = немецкий, nld = голландский; ita = итальянский, por = portugese). например. для сканирования французского текста мой Tesseract-французский движок имеет следующую командную строку: $ IMAGE $ FILE -l fra; cat $ FILE.txt – Bernard Decock 13 February 2011 в 13:07

João Pinto · Answer 5 · 4 August 2018 в 20:00

Вам нужно настроить командную строку двигателя на настройках фидера OCR. Он должен выглядеть так:

-l lang_id $IMAGE $FILE; cat $FILE.txt

Где lang_id - это идентификатор, как показано на имени соответствующего языкового пакета.

3

ответ дан João Pinto 4 August 2018 в 20:00

1

Спасибо, Жоау. Однако идентификатор языка должен быть указан как последний аргумент. например. $ IMAGE $ FILE -l lang-id; cat $ FILE.txt – Bernard Decock 13 February 2011 в 12:55
2

Я добавил несколько OCR-двигателей в OCR-Feeder. Goto Tools, OCR-Engines и новый ocr-движок: я продолжаю использовать движок tesseract, но я указал новое имя для каждой записи, сделанной с определенным идентификатором языка. Итак, для каждого языка у меня есть конкретный ocr-egine, который может быть выбран OCR-Feeder (спасибо João Pinto за подсказку) – Bernard Decock 13 February 2011 в 13:01
3

Языковые теги можно найти в синаптических для пакетов tesseract. (spa = испанский, fra = французский, deu = немецкий, nld = голландский; ita = итальянский, por = portugese). например. для сканирования французского текста мой Tesseract-французский движок имеет следующую командную строку: $ IMAGE $ FILE -l fra; cat $ FILE.txt – Bernard Decock 13 February 2011 в 13:07

João Pinto · Answer 6 · 6 August 2018 в 04:01

Вам нужно настроить командную строку двигателя на настройках фидера OCR. Он должен выглядеть так:

-l lang_id $IMAGE $FILE; cat $FILE.txt

Где lang_id - это идентификатор, как показано на имени соответствующего языкового пакета.

3

ответ дан João Pinto 6 August 2018 в 04:01

1

Спасибо, Жоау. Однако идентификатор языка должен быть указан как последний аргумент. например. $ IMAGE $ FILE -l lang-id; cat $ FILE.txt – Bernard Decock 13 February 2011 в 12:55
2

Я добавил несколько OCR-двигателей в OCR-Feeder. Goto Tools, OCR-Engines и новый ocr-движок: я продолжаю использовать движок tesseract, но я указал новое имя для каждой записи, сделанной с определенным идентификатором языка. Итак, для каждого языка у меня есть конкретный ocr-egine, который может быть выбран OCR-Feeder (спасибо João Pinto за подсказку) – Bernard Decock 13 February 2011 в 13:01
3

Языковые теги можно найти в синаптических для пакетов tesseract. (spa = испанский, fra = французский, deu = немецкий, nld = голландский; ita = итальянский, por = portugese). например. для сканирования французского текста мой Tesseract-французский движок имеет следующую командную строку: $ IMAGE $ FILE -l fra; cat $ FILE.txt – Bernard Decock 13 February 2011 в 13:07

João Pinto · Answer 7 · 7 August 2018 в 22:00

Вам нужно настроить командную строку двигателя на настройках фидера OCR. Он должен выглядеть так:

-l lang_id $IMAGE $FILE; cat $FILE.txt

Где lang_id - это идентификатор, как показано на имени соответствующего языкового пакета.

3

ответ дан João Pinto 7 August 2018 в 22:00

1

Спасибо, Жоау. Однако идентификатор языка должен быть указан как последний аргумент. например. $ IMAGE $ FILE -l lang-id; cat $ FILE.txt – Bernard Decock 13 February 2011 в 12:55
2

Я добавил несколько OCR-двигателей в OCR-Feeder. Goto Tools, OCR-Engines и новый ocr-движок: я продолжаю использовать движок tesseract, но я указал новое имя для каждой записи, сделанной с определенным идентификатором языка. Итак, для каждого языка у меня есть конкретный ocr-egine, который может быть выбран OCR-Feeder (спасибо João Pinto за подсказку) – Bernard Decock 13 February 2011 в 13:01
3

Языковые теги можно найти в синаптических для пакетов tesseract. (spa = испанский, fra = французский, deu = немецкий, nld = голландский; ita = итальянский, por = portugese). например. для сканирования французского текста мой Tesseract-французский движок имеет следующую командную строку: $ IMAGE $ FILE -l fra; cat $ FILE.txt – Bernard Decock 13 February 2011 в 13:07

João Pinto · Answer 8 · 10 August 2018 в 10:14

Вам нужно настроить командную строку двигателя на настройках фидера OCR. Он должен выглядеть так:

  -l lang_id $ IMAGE $ FILE;  cat $ FILE.txt

Где lang_id - это идентификатор, как показано на соответствующем имени пакета языка.

João Pinto · Answer 9 · 13 August 2018 в 16:37

Вам нужно настроить командную строку двигателя на настройках фидера OCR. Он должен выглядеть так:

  -l lang_id $ IMAGE $ FILE;  cat $ FILE.txt

Где lang_id - это идентификатор, как показано на соответствующем имени пакета языка.

3

ответ дан João Pinto 13 August 2018 в 16:37

1

Спасибо, Жоау. Однако идентификатор языка должен быть указан как последний аргумент. например. $ IMAGE $ FILE -l lang-id; cat $ FILE.txt – Bernard Decock 13 February 2011 в 12:55
2

Я добавил несколько OCR-двигателей в OCR-Feeder. Goto Tools, OCR-Engines и новый ocr-движок: я продолжаю использовать движок tesseract, но я указал новое имя для каждой записи, сделанной с определенным идентификатором языка. Итак, для каждого языка у меня есть конкретный ocr-egine, который может быть выбран OCR-Feeder (спасибо João Pinto за подсказку) – Bernard Decock 13 February 2011 в 13:01
3

Языковые теги можно найти в синаптических для пакетов tesseract. (spa = испанский, fra = французский, deu = немецкий, nld = голландский; ita = итальянский, por = portugese). например. для сканирования французского текста мой Tesseract-французский движок имеет следующую командную строку: $ IMAGE $ FILE -l fra; cat $ FILE.txt – Bernard Decock 13 February 2011 в 13:07

Как указать язык, который будет использоваться Tesseract при использовании OCRFeeder

9 ответов

Другие вопросы по тегам:

Похожие вопросы: