Название для этого типа процедуры - OCR (распознавание оптического символа). Эта ссылка также предлагает несколько вариантов:
gocr - A command line OCR fuzzyocr - spamassassin plugin to check image attachments libhocr0 - Hebrew OCR ocrad - Optical Character Recognition program ocrfeeder - Document layout analysis and optical character recognition system ocropus - document analysis and OCR system tesseract-ocr cuneiform - multi-language OCR system
И это говорит о том, что Tesseract ( OCR ) является лучшим вариантом. Так что дайте ему попробовать.