Есть ли хороший читаемый OCR шрифт

Как часть моих резервных копий, я хотел бы смочь распечатать и более позднее пересканирование Base64-закодированная копия моего закрытого ключа. К сожалению, ни gocr, ни tesseract, кажется, не могут правильно считать любой шрифт, который я бросаю в них. Я попробовал Times New Roman, Courier New и OCR-A. Есть ли какие-либо другие шрифты, которые я должен попробовать?

3
задан 10 March 2014 в 03:45

3 ответа

Это только частично отвечает Вам вопрос: Я не предоставлю решение для OCRing Ваше резервное копирование, но для бумажной альтернативы я рекомендую использовать QR-коды. Я "сохранил" свои сертификаты аннулирования как QR-коды на бумаге сам и создал их путем применения qrencode на бронируемой ASCII версии ключа (таким образом тот, который Вы распечатаете так или иначе).

существует также Paperkey и некоторые другие маленькие сценарии для того, чтобы сделать так, но просто передать его по каналу до qrencode работало очень хорошо на меня. Удостоверьтесь, что попытались читать код после печати, таким образом, Вы определенно знаете, что все прекрасно!

я также распечатал команду для создания кода ниже и добавил бронируемую ASCII версию в простом тексте на задней стороне страницы.

2
ответ дан 8 October 2019 в 12:11

Вот некоторые предложения:

  1. Используя Arial с размером шрифта 16 или больше;
  2. , Когда Вы сканируете, удостоверьтесь, что Вы сканируете в DPI 200 или 300

, и большинство механизмов OCR должно быть в состоянии читать правильно.

0
ответ дан 8 October 2019 в 12:11

Это действительно зависит от рассматриваемого механизма распознавания текста.

Для gocr лучше всего подходит FreeMono, см. Документацию gocr.

Для тессеракта хорошо работает DejaVu-Serif, см. https://superuser.com/a/1543382/280936

Для abbyocr, вердана хороша, см. это сравнение

См. Также подведение итогов: https://www.monperrus.net/martin/perfect-ocr-digital-data

0
ответ дан 18 April 2020 в 14:36

Другие вопросы по тегам:

Похожие вопросы: