📄 Представлен DocLang — формат документов для ИИ
Рабочая группа LF AI & Data Foundation представила DocLang. В отличие от PDF или HTML, этот формат использует оптимизированный XML-словарь для прямого сопоставления элементов документа с токенами LLM. Это снижает расход токенов на 37% и ускоряет обработку на 35%.
🌍 Переход на ИИ-нативные форматы решит проблему потери семантики при парсинге сложных документов. Это позволит компаниям снизить затраты на обработку данных (по оценкам ABBYY — до 30x) и повысить точность RAG-систем.
👤 Корпоративные отчеты и инструкции перестанут быть «черными ящиками» для нейросетей, обеспечивая более надежные ответы ИИ-ассистентов при работе с вашей документацией.
Источник 1: https://www.theregister.com/ai-and-ml/2026/06/16/a-modest-proposal-reformat-everything-to-make-documents-more-palatable-to-ai/5255938
