Я хочу использовать программу OCR на RPi, чтобы распознавать цифры с фотографии моего счетчика электроэнергии. Цифры большие и очень очевидны для меня, но Tesseract кажется неспособным распознать их вообще - в лучшем случае он обнаруживает несколько случайных неправильных цифр.
Я попытался обрезать числа и огласить их по отдельности, но это не помогает. Я попробовал несколько других программ OCR, и они были не лучше.
Пожалуйста, можете ли вы дать какие-либо предложения о том, как я могу заставить Tesseract правильно идентифицировать 2 больших числа на картинке ниже? Обратите внимание, что это исходное изображение ~ 2.5MB - эта копия меньше, чтобы соответствовать этому сайту.
Очень маленькие цифры легче читать, когда они освещены сильным источником света. Некоторые аппаратные устройства, такие как флеш-накопители и силовые адаптеры, имеют очень маленькое написание, напечатанное на пластиковом футляре, которое очень трудно читать в мягком свете, но легко читается, когда устройство освещено сильным источником света.
Если это не делает трюк, вы можете открыть изображение, которое будет сканироваться в GIMP Image Editor, и улучшить яркость и контраст перед тем, как OCR его. Редактор изображений GIMP доступен в репозиториях Ubuntu по умолчанию.
Выберите прямоугольную область изображения, которая содержит числа для сканирования, используя инструмент выбора прямоугольника, расположенный в верхнем левом углу панели инструментов. В меню GIMP выберите Цвета -> Яркость-Контраст. Переместите ползунки Яркость и Контрастность, чтобы улучшить читаемость чисел. Убедитесь, что цвет переднего плана, расположенный в нижней части панели инструментов, является черным, что является цветом по умолчанию. Используйте инструмент заполнения ковша, чтобы заполнить фон номера черным цветом, чтобы светлые цвета отображались с более высоким контрастом на черном фоне. Выберите другую прямоугольную область изображения, которая содержит числа, подлежащие проверке, если необходимо, и повторите шаги 2-5. Экспортируйте изображение, когда вы закончите его редактирование, используя File -> Overwrite или File -> Export As ...Вы можете увидеть результаты сканирования OCR, полученные с помощью GIMP, чтобы улучшить тестовое изображение в этом ответе. [ ! d23]
Очень маленькие цифры легче читать, когда они освещены сильным источником света. Некоторые аппаратные устройства, такие как флеш-накопители и силовые адаптеры, имеют очень маленькое написание, напечатанное на пластиковом футляре, которое очень трудно читать в мягком свете, но легко читается, когда устройство освещено сильным источником света.
Если это не делает трюк, вы можете открыть изображение, которое будет сканироваться в GIMP Image Editor, и улучшить яркость и контраст перед тем, как OCR его. Редактор изображений GIMP доступен в репозиториях Ubuntu по умолчанию.
Выберите прямоугольную область изображения, которая содержит числа для сканирования, используя инструмент выбора прямоугольника, расположенный в верхнем левом углу панели инструментов. В меню GIMP выберите Цвета -> Яркость-Контраст. Переместите ползунки Яркость и Контрастность, чтобы улучшить читаемость чисел. Убедитесь, что цвет переднего плана, расположенный в нижней части панели инструментов, является черным, что является цветом по умолчанию. Используйте инструмент заполнения ковша, чтобы заполнить фон номера черным цветом, чтобы светлые цвета отображались с более высоким контрастом на черном фоне. Выберите другую прямоугольную область изображения, которая содержит числа, подлежащие проверке, если необходимо, и повторите шаги 2-5. Экспортируйте изображение, когда вы закончите его редактирование, используя File -> Overwrite или File -> Export As ...Вы можете увидеть результаты сканирования OCR, полученные с помощью GIMP, чтобы улучшить тестовое изображение в этом ответе. [ ! d23]