@lina @drq спасибо за наводку
чекнул gscan2pdf, с tesseract распознает норм, но вот нашел ocrmypdf он юзает его же но тестовый документ распознал в разы лучше