📄 Baidu представила Unlimited-OCR
Компания Baidu выпустила Unlimited-OCR — высокопроизводительную модель с 3 миллиардами параметров для однопроходного (one-shot) анализа документов. Она оптимизирована для работы с длинными горизонтами обработки, что позволяет эффективно парсить как отдельные изображения, так и многостраничные PDF-файлы в режимах «gundam» и «base».
🌍 Переход к концепции «one-shot long-horizon parsing» позволяет значительно упростить пайплайны обработки документов, заменяя сложные цепочки предварительной обработки и сегментации одной универсальной моделью.
👤 Инструмент полезен разработчикам и исследователям для автоматизации извлечения данных из сложных PDF и сканов без необходимости ручной подготовки каждого листа.
Источник 1: https://huggingface.co/baidu/Unlimited-OCR Источник 2: https://github.com/baidu/Unlimited-OCR
