@di, а тут (https://www.litres.ru/book/lu-uy-31431318/traktaty-o-chae-epoh-tan-i-sun-66415826/) только PDF. Через что его можно пересобрать? Я сегодня воспользовался одним сервисом в интернете, и было это даже в каком-то смысле удачно. То есть русскоязычный текст появился. Правда, мусор тоже остался, так что книга стала вдвое больше.😅
@turbobureaucrat пдфки очень тяжело парсить. Или надо писать скрипт под каждый документ, или использовать OCR