Liquid AI выпустила две retrieval-модели на 350M параметров

Компания Liquid AI представила новые мультиязычные retrieval-модели LFM2.5-Embedding-350M и LFM2.5-ColBERT-350M, которые демонстрируют исключительную скорость и эффективность в задачах поиска.

Что произошло

Liquid AI выпустила две компактные модели на 350 млн параметров: LFM2.5-Embedding-350M и LFM2.5-ColBERT-350M. Это первые двунаправленные модели в семействе LFM, созданные путем модификации архитектуры LFM2.5-350M-Base (удаление причинной маски и переход к симметричным свёрткам). Модели поддерживают 11 языков. На оборудовании H100 задержка ColBERT составляет около 2.5 мс (p50), а на MacBook M4 Max — около 7-8 мс (p50).

Контекст

Архитектурный сдвиг заключается в переходе от causal decoder к bidirectional encoder. Использование симметричных свёрток вместо причинной маски позволяет моделям использовать контекст в обоих направлениях, что критически важно для качества эмбеддингов. При этом модель ColBERT (0.605 NDCG@10 на NanoBEIR) превосходит существующие решения, такие как Qwen3-Embedding-0.6B (0.556) и gte-multilingual-base (0.528), несмотря на меньшее количество параметров.

Почему это важно для индустрии

Появление эффективных и компактных двунаправленных энкодеров позволяет значительно снизить стоимость и задержки при развертывании RAG-систем и поисковых движков. Это открывает путь к созданию высокопроизводительных edge-решений и снижению зависимости от тяжелых облачных API и массивных моделей в мультиязычной среде.

Почему это важно для пользователей

Пользователи получают возможность запускать качественный поиск и системы ответов на вопросы (FAQ) локально на мощных ноутбуках или на недорогом оборудовании с очень высокой скоростью отклика, обеспечивая при этом высокий уровень приватности данных.

Источники

Liquid AI

Автор

Look at AI, редакция