Заметки по прогнозированию: Я думаю, что для баров 1ч и выше следует использовать ridge, но когда вы переходите к 1мин/5мин барам, обычно XGBoost показывает лучшие результаты. 5 минутам требуется немного тщательной настройки, но на 1 минуте и особенно на секундах вы начинаете видеть, как XGBoost доминирует с дополнительным приростом 0.01-0.025 в вашем IC, просто будучи лучшей моделью. XGBoost довольно крут, потому что вы можете избежать значений NaN (что часто является проблемой для бэктестов, т.е. разные доступности наборов данных для ретроспектив, один провайдер может иметь 10 лет, другой 2). Вы, конечно, можете использовать импутацию, но это не самый реалистичный способ, и технически это имеет lookahead, поскольку вы заранее раскрываете среднее/медиану признака. Вы также можете использовать среднее без lookahead, но все равно... Для линейных задач, где вы не можете позволить себе подгонку на временных интервалах 1ч и выше, И где вы хотите работать с NaN, вашим лучшим вариантом будет IC-взвешенный ансамбль, и пересчитывать веса всякий раз, когда есть NaN (это не так уж и дорого, чтобы выяснить, какой вес должен быть, когда у вас есть IC для каждого признака и какие признаки находятся в наборе).