Компания PhantaField представила whitepaper чипа Sophon PFG-1 («Sophon») — инновационного монолитного 3D-ускорителя (M3D) для задач искусственного интеллекта. Благодаря использованию 32-ярусной структуры на базе дихалькогенидов переходных металлов (TMD), архитектура позволяет интегрировать 330 ГБ памяти 2T0C DRAM непосредственно в кристалловую структуру, что радикально меняет подход к вычислительной архитектуре ИИ.



Что произошло
PhantaField анонсировала технологию Sophon PFG-1, которая использует монолитную 3D-структуру для объединения вычислений и памяти. В отличие от традиционных ускорителей, чип интегрирует 330 ГБ памяти 2T0C DRAM прямо на кристалле (on-die), что позволяет достичь пропускной способности весов до 4200 ТБ/с и снизить энергопотребление при инференсе до 25.8 мДж на токен. При этом архитектура полностью исключает необходимость в использовании дорогостоящей внешней памяти HBM.
Контекст
Современные ИИ-ускорители сталкиваются с проблемой «стены памяти» (memory wall) и критическим дефицитом высокоскоростной памяти HBM, что ограничивает масштабируемость и увеличивает стоимость систем. Решение от PhantaField переходит к парадигме Compute-In-Memory (CIM), где вычисления происходят непосредственно в структуре памяти, устраняя узкое место при передаче данных между процессором и внешней памятью.
Почему это важно для индустрии
Для индустрии это означает потенциальный сдвиг парадигмы в AI-инфраструктуре. Использование монолитного 3D-дизайна вместо иерархии HBM может снизить стоимость материалов (BOM) примерно в 10 раз по сравнению с решениями уровня NVIDIA Rubin. Это открывает путь к созданию более дешевых и энергоэффективных ASIC-чипов, способных конкурировать с текущими GPU в задачах обучения и инференса LLM.
Почему это важно для пользователей
Для конечных пользователей и разработчиков это может означать значительное удешевление и ускорение запуска сверхкрупных моделей (с параметрами 80B+). Технология создает фундамент для появления доступных локальных AI-серверов и высокопроизводительных edge-устройств, где критически важны низкая задержка и энергоэффективность без привязки к дорогостоящим дата-центрам.
Что пока неизвестно / ограничения
На текущий момент представлен только whitepaper, и технология находится на стадии концептуального проектирования. Эксперты отмечают, что проект пока носит скорее теоретический характер и не доступен для промышленного использования; для подтверждения заявленных характеристик требуются результаты тестирования реальных кремниевых образцов (test chips).
Источники
Автор
Look at AI, редакция
