Netflix представила Project Headroom для снижения затрат на LLM

🛠 Netflix представила Project Headroom для снижения затрат на LLM

Инженер Tejas Chopra разработал инструмент для сжатия избыточных данных в контексте LLM. С помощью метода обратимого сжатия (CCR) проект позволяет эффективно удалять повторы, сохраняя возможность восстановления данных через MCP-инструменты. На текущий момент инструмент помог сэкономить около $700,000 и высвободить 200 млрд токенов.

🌍 Решает проблему «раздувания токенов» (token bloat), когда до 90% контекста занимают логи или метаданные. Это снижает нагрузку на инфраструктуру.

👤 Позволяет сократить счета за API (OpenAI, Anthropic) и повысить точность моделей, борясь с «деградацией контекста» (context rot).

Источник 1: https://www.theregister.com/ai-ml/2026/05/31/netflix-wiz-creates-app-to-slash-ai-bills-then-open-sources-it/5248702

Sources