🚀 DeepSeek представила DSpark — новый метод спекулятивного декодирования.
Технология работает на базе среды DeepSpec и позволяет ускорить генерацию текста в 1.5–5 раз. Метод оптимизирован для моделей DeepSeek-V4 Flash и V4 Pro, а также эффективен для Gemma и Qwen.
🌍 Внедрение DSpark позволяет существенно снизить стоимость инференса больших моделей при сохранении высокого качества ответов.
👤 Пользователи получат более быстрые ответы от мощных моделей вроде DeepSeek-V4 Pro с минимальными задержками.
Источник 1: https://github.com/deepseek-ai/DeepSpec Источник 2: https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro-DSpark
