DeepSeek представила DSpark для ускорения моделей V4

Компания DeepSeek выпустила метод DSpark, который значительно ускоряет генерацию текста через спекулятивное декодирование.

Автор Sergey KostenchukОпубликовано 2026-06-27Обновлено 2026-06-27

2026-06-27 Исследования HuggingFace

🚀 DeepSeek представила DSpark — новый метод спекулятивного декодирования.

Технология работает на базе среды DeepSpec и позволяет ускорить генерацию текста в 1.5–5 раз. Метод оптимизирован для моделей DeepSeek-V4 Flash и V4 Pro, а также эффективен для Gemma и Qwen.

🌍 Внедрение DSpark позволяет существенно снизить стоимость инференса больших моделей при сохранении высокого качества ответов.

👤 Пользователи получат более быстрые ответы от мощных моделей вроде DeepSeek-V4 Pro с минимальными задержками.

Источник 1: https://github.com/deepseek-ai/DeepSpec Источник 2: https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro-DSpark

Источники