🚀 DeepSeek представила DSpark — новый метод спекулятивного декодирования.

Технология работает на базе среды DeepSpec и позволяет ускорить генерацию текста в 1.5–5 раз. Метод оптимизирован для моделей DeepSeek-V4 Flash и V4 Pro, а также эффективен для Gemma и Qwen.

🌍 Внедрение DSpark позволяет существенно снизить стоимость инференса больших моделей при сохранении высокого качества ответов.

👤 Пользователи получат более быстрые ответы от мощных моделей вроде DeepSeek-V4 Pro с минимальными задержками.

Источник 1: https://github.com/deepseek-ai/DeepSpec Источник 2: https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro-DSpark