Notas sobre previsões: Acho que para barras de 1h e acima você deve usar ridge, mas quando chega a barras de 1min/5min geralmente você encontra que o XGBoost vence. 5 minutos precisa de um pouco de ajuste cuidadoso, mas 1 minuto e especialmente segundos você começa a ver o XGBoost dominar por uma margem extra de 0.01-0.025 no seu IC apenas por ser um modelo melhor. O XGBoost é bem legal porque você pode evitar valores NaN (o que é frequentemente um problema para backtests, ou seja, diferentes disponibilidades de conjuntos de dados para retrocessos, um provedor pode ter 10 anos, outro 2). Você pode, claro, imputar, mas essa não é a maneira mais realista de fazer as coisas e tecnicamente tem lookahead, já que você revela a média/mediana da característica antecipadamente. Você pode usar uma média livre de lookahead também, mas ainda assim... Para coisas lineares onde você não pode se dar ao luxo de ajustar o intervalo de 1h e superior, E onde você quer lidar com NaNs, sua melhor aposta é fazer um ensemble ponderado por IC e recalcular os pesos sempre que houver NaNs (não é exatamente caro descobrir qual peso deve ser o que quando você tem o IC de cada característica e quais características estão no conjunto).