Как я устанавливаю новый пакет языка для Tesseract на 16,04

Просто установленный gscan2pdf v1.3.9, а также Tesseract. Что касается последнего, сначала это появилось в нижней части моего Установленного списка программного обеспечения, но теперь это, кажется, заканчивается, хотя все еще работая (я думаю).

Так или иначе я пытаюсь превратить PDF отсканированного документа в доступный для редактирования текст, но документ не находится на английском языке, таким образом, gscan делает путаницу из него.

Только опции, которые я получаю, когда я перехожу в Tools > OCR > Language to recognize English, equ, и osd. Какие-либо идеи о том, как я могу установить определенный пакет языка?

Я не опытный пользователь Linux, таким образом, пошаговые инструкции значительно ценились бы.

19
задан 1 July 2016 в 09:37

1 ответ

Просто установите необходимый язык ocr с помощью этого:

sudo apt-get install tesseract-ocr-[lang]

, Где [Ленг] может быть

all

ИЛИ

afr
amh
ara
asm
aze
aze-cyrl
bel
ben
bod
bos
bul
cat
ceb
ces
chi-sim
chi-tra
chr
cym
dan
dan-frak
deu
deu-frak
dev
dzo
ell
enm
epo
est
eus
fas
fin
fra
frk
frm
gle
gle-uncial
glg
grc
guj
hat
heb
hin
hrv
hun
iku
ind
isl
ita
ita-old
jav
jpn
kan
kat
kat-old
kaz
khm
kir
kor
kur
lao
lat
lav
lit
mal
mar
mkd
mlt
msa
mya
nep
nld
nor
ori
pan
pol
por
pus
ron
rus
san
sin
slk
slk-frak
slv
spa
spa-old
sqi
srp
srp-latn
swa
swe
syr
tam
tel
tgk
tgl
tha
tir
tur
uig
ukr
urd
uzb
uzb-cyrl
vie
yid
33
ответ дан 23 November 2019 в 01:59

Другие вопросы по тегам:

Похожие вопросы: