Компания Apple выпустила семейство базовых моделей третьего поколения AFM 3, которые привносят революционный подход к работе нейросетей на мобильных устройствах через оптимизацию использования памяти.



Что произошло
Apple представила мультимодальные модели AFM 3, включая AFM 3 Core Advanced. Инновационная архитектура позволяет хранить 20B параметров во флеш-памяти, активируя лишь 1–4B параметров при выполнении запроса. Это обеспечивает производительность моделей уровня 3B при качестве моделей уровня 20B. Для ресурсоемких задач предусмотрена AFM 3 Cloud Pro, работающая на базе NVIDIA в Google Cloud через систему Private Cloud Compute.
Контекст
В отличие от традиционных подходов Mixture-of-Experts (MoE), где выбор эксперта происходит на уровне каждого токена, AFM 3 использует маршрутизацию на уровне промпта. Это позволяет минимизировать перемещение данных между NAND и DRAM, что критически важно для устройств с ограниченным объемом оперативной памяти.
Почему это важно для индустрии
Apple задает новый стандарт оптимизации MoE для Edge-устройств, демонстрируя жизнеспособность метода NAND-to-DRAM для работы тяжелых моделей на ограниченном железе. Это может спровоцировать исследовательский интерес к архитектурам, минимизирующим нагрузку на RAM за счет эффективного использования флеш-памяти.
Почему это важно для пользователей
Пользователи будущих iPhone и Mac получат доступ к мощным ИИ-агентам, способным мгновенно обрабатывать текст, голос и изображения локально. Это обеспечит высокую скорость работы и приватность данных без необходимости постоянного обращения к облаку, даже если размер модели значительно превышает доступный объем оперативной памяти устройства.
Источники
Автор
Look at AI, редакция
