🧠 Геометрия латентных пространств сохраняется при смене архитектуры LLM
В работе «Thinking in Different Spaces» доказано, что разные архитектуры моделей (MoE, Dense) формируют схожую геометрию латентных пространств. С помощью Ridge projection удалось переносить активации «учителя» в пространство «ученика», что повысило точность на TruthfulQA на 25.2% и на GSM8K на 25.5% без дообучения весов.
🌍 Это открывает путь к эффективному Zero-Shot Steering — возможности «подтягивать» интеллект малых моделей через линейные преобразования, что значительно удешевляет инференс.
👤 Маленькие и быстрые модели можно заставить рассуждать на уровне больших, просто «подсказывая» им правильные направления в их же внутренних математических пространствах.
Источник 1: https://arxiv.org/abs/2603.20406
