Swift OCR — Инструмент извлечения текста с использованием OCR и GPT-4 Turbo из PDF-файлов или URL.
Он оптимизирует производительность через параллельное преобразование и пакетную обработку, а также включает механизм повторных попыток при сбоях.
Извлеченный текст структурируется в формате Markdown, что обеспечивает надежную обработку ошибок и масштабируемость при работе с несколькими запросами.
Расчетная стоимость услуги составляет около $15 за 1000 документов
src: https://github.com/yigitkonur/swift-ocr-llm-powered-pdf-to-markdown
#opensource #foss #github #markdown #pdf #ocr #chatgpt #GPT4