🤖 Обучение LLM за $315: Tessera 1B от AIIT-THRESHOLD
Группа AIIT-THRESHOLD представила Tessera 1B — языковую модель объемом ~1 млрд параметров, обученную с нуля на архитектуре ProtoGPT. Обучение заняло около 146 часов на одной NVIDIA H100 (80GB) и обошлось примерно в $315.
🌍 Проект доказывает, что качественные базовые модели можно создавать с минимальными затратами, используя чистые данные вместо огромных массивов синтетического шума. Это открывает путь к эффективному специализированному fine-tuning.
👤 Это пример того, как энтузиасты могут создавать серьезные AI-инструменты с крайне низким бюджетом. Модель служит отличным фундаментом для разработки узкоспециализированных ИИ-помощников.
Источник 1: https://huggingface.co/AIIT-Threshold/Tessera-1B
