Я сейчас работаю над интеграцией трех больших материалов по временным рядам (каждый по 1000 страниц) в одну книгу по рядам, один из этих материалов перекочевывает в книгу по рядам в рамках Подписки.
Пишите, какие задачи/соревнования еще разобрать, и мне от вас интересны кейсы прогнозирования рядов, где бустинг терпит неудачу. Это нужно для экспериментов с фичами, поднимающих качество бустинга (те же скользящие средние с регуляризацией, групповые скользящие средние, разности как раз призваны решать эти проблемы).
Обратите внимание на best practice по признакам для рядов от разработчиков scikit-learn
https://scikit-learn.org/stable/auto_examples/applications/plot_cyclical_feature_engineering.html. В частности, предлагают использовать сплайны. Этот кейс я тоже включу в книгу.
От подписчиков просьба прочитать в книге по рядам про групповые скользящие статистики и написать, насколько понятен такой тип признаков.
Здесь же отвечаю на вопросы.
Rolling Frequency Encoding можно реализовать с помощью функции groupby_moving_stats().
Вложенная перекрестная проверка нужна для поиска гиперпараметров, стабильно дающих высокое качество, при построении моделей с высокой дисперсией типа градиентного бустинга. Вы выбираете или обращаете внимание на ту комбинацию гиперпараметров, которая чаще всего выбирается в качестве наилучшей.