@BunnyInAHat прикольная вещь, на работе пригодится, спасибо
А вот книжка по пайтону у меня в виде скана, а распознавание текста наверняка раскурочит весь текст
Top-level
@BunnyInAHat прикольная вещь, на работе пригодится, спасибо А вот книжка по пайтону у меня в виде скана, а распознавание текста наверняка раскурочит весь текст 4 comments
@omgitsmishenka В дополнение: я тестил это на книгах по теории множеств и теории категорий. Диаграммы были сохранены и корректно расположены в обоих случаях. @BunnyInAHat ничего себе, забираю. Это же получается любой аккуратно отсканированный пдф можно будет увеличить и залить на книжку @omgitsmishenka Да. Но, вероятно, придётся поиграться с настройками. Там можно отключить OCR и ограничить страницы, чтобы быстро делать тестовый вывод. |
@omgitsmishenka Там распознавание только для поиска, оверлеем. Программа пытается интерпретировать скопления не-фоновых пикселей как слова и вставлять переводы строк между ними. То есть она разбивает входную картинку на подкартинки и переупорядочивает их в выходной картинке. То есть главное, чтобы в скане не было слишком большого количества слишком больших пятен, не являющихся словами.