🎨 Microsoft представила Lens — новую фундаментальную текстовую модель для генерации изображений (T2I) с 3.8 млрд параметров.
Модель поддерживает разрешение до 1440×1440 пикселей и включает три версии: основную (RL-tuned), Lens-Turbo для быстрой генерации за 4 шага и Lens-Base. Архитектура базируется на 48-блочном MMDiT-денойзере и использует латенты FLUX.2.
🌍 Появление компактной (3.8B) модели с высоким разрешением демонстрирует тренд на повышение плотности информации в обучающих данных вместо простого масштабирования параметров.
👤 Теперь можно генерировать качественные изображения высокого разрешения быстрее (с помощью Turbo-версии) и на менее мощном оборудовании, сохраняя высокую точность запросов.
Источник 1: https://huggingface.co/microsoft/Lens Источник 2: https://huggingface.co/microsoft/Lens-Turbo