сделал ocr для pdf который без текста с помощью gemini. вариант с тессерактом работал медленно, да и хреново. джемини может в много потоков распознавать картинки не напрягая сервер