Существует несколько систем управления документами с открытым исходным кодом и решения для сканирования, которые помогут вам в ваших архивных целях. Для управления документами существует:
OpenKm (похоже, OCR, хотя сразу не ясно, является ли это частью сообщества) Mayan EDMS (включает OCR, чистый проект OpenSource, написанный на Python, так что просто pip install mayan-edsm) KnowledgeTree LetoDMS (кажется довольно мертвым) OpenDocMan Nuxeo Feng Office Project Looking GlassЧто касается программного обеспечения для сканирования, есть несколько вариантов с открытым исходным кодом - но ничего, что будет работать слишком хорошо. В зависимости от того, что вы ищете для архивации (и как вы планируете получать доступ к нему в будущем), вы можете просто пометить свои документы в своем программном обеспечении. Также ... вы вряд ли найдете твердое OCR в любом приложении для бесплатного сканирования.
Если у вас есть этот параметр, я настоятельно рекомендую проекты преобразования документов на аутсорсинг. Вы не только ускорите его работу - у вас будет возможность OCR ваши файлы и знать, что готовое качество вашего проекта будет профессиональным и легко читаемым.