Механизм оптического распознавания символов с открытым исходным кодом

Tesseract - это механизм распознавания оптических символов с открытым исходным кодом. Наборы символьных данных для различных сценариев и языков уже существуют, и механизм позволяет обучать дополнительные (пользовательские) наборы данных.

Вывод Тессеракта будет иметь очень низкое качество, если входные изображения не будут предварительно обработаны, чтобы удовлетворить его: изображения (особенно снимки экрана) должны быть увеличены так, чтобы высота x текста была не менее 20 пикселей, любой поворот или перекос должны быть исправлены или текст не будет распознан, низкочастотные изменения яркости должны быть отфильтрованы верхними частотами, или стадия бинаризации Тессеракта разрушит большую часть страницы, а темные границы должны быть удалены вручную, или они будут неверно истолкованы как символы.