@horhik gscan2dpf - увеличив контраст и яркость на 20 пунктов (это если страницы серые), дополнительно поставив галку "очистить изображение", и в качестве распозновалки галкой отметить "tesseract" - ну это чтобы "для людей" сделать.
а так - да любой сканилкой можно, и для распознования скормить tesseract или cuneiform или gocr
@lina @drq
спасибо за наводку
чекнул gscan2pdf, с tesseract распознает норм, но вот нашел ocrmypdf он юзает его же но тестовый документ распознал в разы лучше