🚀 Xiaomi MiMo в 15 раз быстрее ChatGPT и Claude

Xiaomi выпустила режим MiMo-V2.5-Pro-UltraSpeed для своей модели с 1 триллионом параметров. Благодаря методам FP4-квантования и спекулятивного декодирования DFlash, скорость достигла 1000–1200 токенов в секунду на стандартном узле с 8 GPU.

🌍 Прорыв в эффективности инференса на стандартном железе снижает зависимость от проприетарных ускорителей.

👤 Технология позволяет использовать мощные модели с задержкой, близкой к нулю.

Источник 1: https://decrypt.co/370449/xiaomi-mimo-ultraspeed-ai-model-faster-chatgpt-claude