🤖 В MIT CSAIL запущен курс по Data-Centric AI (DCAI)
Вместо бесконечной оптимизации архитектур под фиксированные датасеты, подход DCAI фокусируется на системном улучшении самих данных. Программа включает методы исправления ошибок разметки (Confident Learning) и работу с дисбалансом классов.
🌍 Смещение фокуса с Model-Centric на Data-Centric подход позволяет эффективнее повышать качество ML-систем в реальных условиях, где данные часто зашумлены или неполны.
👤 Понимание методологий DCAI поможет лучше готовить датасеты и использовать инструменты вроде Cleanlab. При этом стоит учитывать юридические риски, связанные с происхождением (provenance) данных.
Источник 1: https://dcai.csail.mit.edu/
