@omgitsmishenka Там распознавание только для поиска,...

stressmanagement's posts Post Back to profile

@omgitsmishenka Там распознавание только для поиска, оверлеем. Программа пытается интерпретировать скопления не-фоновых пикселей как слова и вставлять переводы строк между ними. То есть она разбивает входную картинку на подкартинки и переупорядочивает их в выходной картинке. То есть главное, чтобы в скане не было слишком большого количества слишком больших пятен, не являющихся словами.

Like 21 May 2024 at 10:42 | Wall-to-wall | Open on mastodon.social

3 comments

BunnyInAHat

@omgitsmishenka В дополнение: я тестил это на книгах по теории множеств и теории категорий. Диаграммы были сохранены и корректно расположены в обоих случаях.

21 May 2024 at 10:44 | Open on mastodon.social

stressmanagement

@BunnyInAHat ничего себе, забираю. Это же получается любой аккуратно отсканированный пдф можно будет увеличить и залить на книжку

21 May 2024 at 10:47 | Open on mastodon.ml

BunnyInAHat

@omgitsmishenka Да. Но, вероятно, придётся поиграться с настройками. Там можно отключить OCR и ограничить страницы, чтобы быстро делать тестовый вывод.

21 May 2024 at 10:49 | Open on mastodon.social