Как я могу заставить Tesseract OCR распознавать большие цифры счетчика электроэнергии?

Я хочу использовать программу OCR на RPi, чтобы распознавать цифры с фотографии моего счетчика электроэнергии. Цифры большие и очень очевидны для меня, но Tesseract кажется неспособным распознать их вообще - в лучшем случае он обнаруживает несколько случайных неправильных цифр.

Я попытался обрезать числа и огласить их по отдельности, но это не помогает. Я попробовал несколько других программ OCR, и они были не лучше.

Пожалуйста, можете ли вы дать какие-либо предложения о том, как я могу заставить Tesseract правильно идентифицировать 2 больших числа на картинке ниже? Обратите внимание, что это исходное изображение ~ 2.5MB - эта копия меньше, чтобы соответствовать этому сайту.

0
задан 7 August 2017 в 23:13

2 ответа

Очень маленькие цифры легче читать, когда они освещены сильным источником света. Некоторые аппаратные устройства, такие как флеш-накопители и силовые адаптеры, имеют очень маленькое написание, напечатанное на пластиковом футляре, которое очень трудно читать в мягком свете, но легко читается, когда устройство освещено сильным источником света.

Если это не делает трюк, вы можете открыть изображение, которое будет сканироваться в GIMP Image Editor, и улучшить яркость и контраст перед тем, как OCR его. Редактор изображений GIMP доступен в репозиториях Ubuntu по умолчанию.

Выберите прямоугольную область изображения, которая содержит числа для сканирования, используя инструмент выбора прямоугольника, расположенный в верхнем левом углу панели инструментов. В меню GIMP выберите Цвета -> Яркость-Контраст. Переместите ползунки Яркость и Контрастность, чтобы улучшить читаемость чисел. Убедитесь, что цвет переднего плана, расположенный в нижней части панели инструментов, является черным, что является цветом по умолчанию. Используйте инструмент заполнения ковша, чтобы заполнить фон номера черным цветом, чтобы светлые цвета отображались с более высоким контрастом на черном фоне. Выберите другую прямоугольную область изображения, которая содержит числа, подлежащие проверке, если необходимо, и повторите шаги 2-5. Экспортируйте изображение, когда вы закончите его редактирование, используя File -> Overwrite или File -> Export As ...

Вы можете увидеть результаты сканирования OCR, полученные с помощью GIMP, чтобы улучшить тестовое изображение в этом ответе. [ ! d23]

1
ответ дан 18 July 2018 в 08:55

Очень маленькие цифры легче читать, когда они освещены сильным источником света. Некоторые аппаратные устройства, такие как флеш-накопители и силовые адаптеры, имеют очень маленькое написание, напечатанное на пластиковом футляре, которое очень трудно читать в мягком свете, но легко читается, когда устройство освещено сильным источником света.

Если это не делает трюк, вы можете открыть изображение, которое будет сканироваться в GIMP Image Editor, и улучшить яркость и контраст перед тем, как OCR его. Редактор изображений GIMP доступен в репозиториях Ubuntu по умолчанию.

Выберите прямоугольную область изображения, которая содержит числа для сканирования, используя инструмент выбора прямоугольника, расположенный в верхнем левом углу панели инструментов. В меню GIMP выберите Цвета -> Яркость-Контраст. Переместите ползунки Яркость и Контрастность, чтобы улучшить читаемость чисел. Убедитесь, что цвет переднего плана, расположенный в нижней части панели инструментов, является черным, что является цветом по умолчанию. Используйте инструмент заполнения ковша, чтобы заполнить фон номера черным цветом, чтобы светлые цвета отображались с более высоким контрастом на черном фоне. Выберите другую прямоугольную область изображения, которая содержит числа, подлежащие проверке, если необходимо, и повторите шаги 2-5. Экспортируйте изображение, когда вы закончите его редактирование, используя File -> Overwrite или File -> Export As ...

Вы можете увидеть результаты сканирования OCR, полученные с помощью GIMP, чтобы улучшить тестовое изображение в этом ответе. [ ! d23]

1
ответ дан 24 July 2018 в 19:11

Другие вопросы по тегам:

Похожие вопросы: