Команда AI в VK разработала Discovery AI, передовую систему нейропоиска и рекомендаций для своей экосистемы, включающей VK, Дзен и Почту Mail.ru. Технология базируется на гибридном подходе и оптимизированных языковых моделях, что позволяет обрабатывать огромные массивы данных в реальном времени с минимальной задержкой.

image

Что произошло

Разработчики VK внедрили Discovery AI, которая использует комбинацию классического поиска BM25 и векторного поиска для обеспечения точности запросов. В основе системы лежит кастомная LLM на базе LLaMA (8B), прошедшая через дистилляцию знаний и Quantization Aware Training (QAT). Это позволило достичь пропускной способности до 30 000 чанков документов в секунду на одной GPU при задержке ответа менее 500 мс.

Контекст

Проект знаменует переход от простых демонстрационных чат-ботов к полноценным RAG-системам (Retrieval-Augmented Generation) промышленного уровня. Для обучения и оценки качества использовалась методология LLM-as-a-Judge, позволяющая генерировать синтетические обучающие данные и эффективно управлять пайплайнами подготовки моделей.

Почему это важно для индустрии

Решение демонстрирует возможность развертывания высоконагруженных кастомных LLM в продакшн на уровне крупнейших контентных платформ с приемлемым latency. Это задает новый стандарт эффективности для локального рынка AI-решений, смещая фокус с простых интерфейсов на сложные поисковые движки, способные работать с разрозненными данными внутри крупных экосистем.

Почему это важно для пользователей

Пользователи сервисов VK, Дзен и Почта Mail.ru получат доступ к поиску, который понимает семантический смысл запросов, а не только ключевые слова. Это позволит получать более точные, релевантные и развернутые ответы на основе реального контента, что значительно повысит качество рекомендаций и персонализацию взаимодействия.

Что пока неизвестно / ограничения

Существуют разные взгляды на риски проекта: если технические специалисты фокусируются на архитектурной эффективности, то юридические эксперты указывают на потенциальные вопросы этики использования синтетических данных и риски обработки кросс-сервисных данных внутри экосистемы.

Источники

Автор

Look at AI, редакция