📚 Вышел справочник BMT LLM Reference для подбора железа под LLM

Новый ресурс классифицирует 38 современных моделей по типам развертывания, требованиям к VRAM и специализациям. Документ содержит конкретные рекомендации: например, для моделей 7–12B (Qwen 3 7B, Llama 8B) достаточно 8–12 ГБ VRAM, тогда как для топовых локальных решений вроде Llama 4 Maverick необходима мульти-GPU конфигурация с 96 ГБ+ VRAM. Также указаны лидеры облачных моделей, включая GPT-5.5, Claude Opus 4.8 и Gemini 3.1 Pro.

🌍 Инструмент создает стандартизированный способ сопоставления моделей с вычислительными ресурсами, что критично для оптимизации стоимости развертывания (inference cost) и выбора между API и self-hosted решениями.

👤 Полезно для точного подбора GPU под задачи: от запуска легких моделей типа Phi-4 Mini на мобильных устройствах до построения мощных локальных систем на базе Llama 4.

Источник 1: https://bmt-llm-reference.vercel.app