OpenAI снизила стоимость инференса в два раза

OpenAI внедрила новые методы программной оптимизации, которые сократили затраты на запуск моделей более чем на 50%.

Автор Sergey KostenchukОпубликовано 2026-06-30Обновлено 2026-06-30

2026-06-30 Бизнес OpenAI

📉 OpenAI снизила стоимость инференса в два раза

Компания внедрила новые методы программной оптимизации, которые позволили сократить расходы на запуск моделей более чем на 50%. Это позволило обслуживать трафик ChatGPT от незарегистрированных пользователей, используя лишь несколько сотен GPU Nvidia.

🌍 Прорыв доказывает, что путь к прибыльности ИИ лежит через программную эффективность (software efficiency), а не только через масштабирование железа. Это усиливает позиции OpenAI перед Anthropic и Google.

👤 Развитие ИИ станет быстрее и дешевле: снижение себестоимости может привести к росту лимитов запросов и снижению цен на подписки и API.

Источник 1: https://fourweekmba.com/ai-openai-inference-cost-optimization-2026/ Источник 2: https://cryptobriefing.com/openai-cuts-inference-costs-optimization/

Источники