📄 Представлен DocLang — формат документов для ИИ

Рабочая группа LF AI & Data Foundation представила DocLang. В отличие от PDF или HTML, этот формат использует оптимизированный XML-словарь для прямого сопоставления элементов документа с токенами LLM. Это снижает расход токенов на 37% и ускоряет обработку на 35%.

🌍 Переход на ИИ-нативные форматы решит проблему потери семантики при парсинге сложных документов. Это позволит компаниям снизить затраты на обработку данных (по оценкам ABBYY — до 30x) и повысить точность RAG-систем.

👤 Корпоративные отчеты и инструкции перестанут быть «черными ящиками» для нейросетей, обеспечивая более надежные ответы ИИ-ассистентов при работе с вашей документацией.

Источник 1: https://www.theregister.com/ai-and-ml/2026/06/16/a-modest-proposal-reformat-everything-to-make-documents-more-palatable-to-ai/5255938