📉 OpenAI снизила стоимость инференса в два раза

Компания внедрила новые методы программной оптимизации, которые позволили сократить расходы на запуск моделей более чем на 50%. Это позволило обслуживать трафик ChatGPT от незарегистрированных пользователей, используя лишь несколько сотен GPU Nvidia.

🌍 Прорыв доказывает, что путь к прибыльности ИИ лежит через программную эффективность (software efficiency), а не только через масштабирование железа. Это усиливает позиции OpenAI перед Anthropic и Google.

👤 Развитие ИИ станет быстрее и дешевле: снижение себестоимости может привести к росту лимитов запросов и снижению цен на подписки и API.

Источник 1: https://fourweekmba.com/ai-openai-inference-cost-optimization-2026/ Источник 2: https://cryptobriefing.com/openai-cuts-inference-costs-optimization/