Notas sobre previsão: Acho que barras de 1h e acima você deve usar ridge, mas quando você chega a barras de 1min / 5min, geralmente encontra vitórias do XGBoost. 5 minutos precisam de um pouco de ajuste cuidadoso, mas 1 minuto e especialmente segundos você começa a ver o XGBoost dominar por um extra de 0,01-0,025 em seu IC, sendo puramente um modelo melhor. O XGBoost é muito legal porque você pode evitar valores NaN (o que geralmente é um problema para backtests, ou seja, diferentes disponibilidades de conjuntos de dados para lookbacks, um provedor pode ter 10 anos, outro 2). Você pode, é claro, imputar, mas essa não é a maneira mais realista de fazer as coisas e, tecnicamente, tem antecipação, pois você revela a média/mediana do recurso com antecedência. Você também pode usar um meio gratuito de antecipação, mas ainda assim... Para coisas lineares em que você não pode pagar o período de tempo adequado de 1h e superior, E onde você deseja lidar com NaNs, sua melhor aposta é fazer um conjunto ponderado de IC e recalcular os pesos sempre que houver NaNs (não é exatamente caro descobrir qual peso deve ser o quê quando você tem cada recurso IC e quais recursos estão no conjunto).