🚀 Microsoft Research представила Mirage — новую архитектуру Latent Spatial Memory для видеомоделей мира.

Технология позволяет хранить информацию о 3D-сценах напрямую в пространстве диффузионных латентных представлений, минуя тяжелый цикл рендеринга в RGB-пиксели. Это увеличивает скорость генерации в 10,57 раза и сокращает потребление памяти для 3D-кеша в 55 раз.

🌍 Mirage устраняет узкое место видеомоделей — сложность поддержания пространственной консистентности. Переход к управлению латентными токенами делает создание стабильных видеомиров значительно дешевле и быстрее.

👤 Это шаг к созданию быстрых ИИ-генераторов видео, способных строить сложные 3D-пространства без «галлюцинаций», что критично для симуляций и VR.

Источник 1: https://microsoft.github.io/LatentSpatialMemory/ Источник 2: https://github.com/microsoft/LatentSpatialMemory