Оптимизация графовых нейросетей через IO-aware слои

Исследователи из Яндекса, ШАД и ВШЭ разработали методы ускорения GNN за счет эффективного использования пропускной способности памяти GPU.

Автор Sergey KostenchukОпубликовано 2026-06-23Обновлено 2026-06-23

2026-06-23 Исследования

🚀 Оптимизация графовых нейросетей через IO-aware слои

Исследователи из Яндекса, ШАД и ВШЭ представили методы оптимизации GNN, которые решают проблему неэффективного использования памяти GPU. Внедрение IO-aware слоев позволяет достичь ускорения до 8.5× и сокращения потребления памяти в десятки раз.

🌍 Решает проблему масштабируемости GNN на современном железе, перенося фокус с вычислительной мощности на эффективность перемещения данных (memory bandwidth). Это открывает путь к обучению крупных моделей на существующих GPU-кластерах.

👤 Позволяет использовать графовые нейросети в задачах с огромным количеством связей (соцсети, биоинформатика, рекомендации) быстрее и с меньшими затратами ресурсов.

Источник 1: https://research.yandex.com/blog/on-efficient-scaling-of-gnns-via-io-aware-layer-implementations Источник 2: https://github.com/yandex-research/On-Efficient-Scaling-Of-GNNs

Источники