Так как данные - это самая важная и самая затратная составляющая успеха ML проекта, то и правильно выстроенный процесс работы с данными для моделирования должен быть ключевым компонентом полноценной ML платформы. Различные технологические и методологические аспекты управления данными для ML появлялись и раньше, но в последние годы все это окончательно оформилось в концепцию Feature Store.
Про концепцию можно почитать здесь. А здесь частичный ответ на сразу возникающий вопрос: почему именно Feature Store и в чем отличие от классических подходов DWH.
Ну и собственно хороший ресурс по теме, из блога которого взяты упомянутые выше статьи: www.featurestore.org.
Про концепцию можно почитать здесь. А здесь частичный ответ на сразу возникающий вопрос: почему именно Feature Store и в чем отличие от классических подходов DWH.
Ну и собственно хороший ресурс по теме, из блога которого взяты упомянутые выше статьи: www.featurestore.org.