予測に関する注意事項: 1時間以上のバーはリッジを使うべきだと思いますが、1分/5分のバーになると、通常はXGBoostが勝ちます。 5分は少し慎重な調整が必要ですが、1分、特に数秒で、XGBoostがICで0.01〜0.025の余分な優位性が見え始めます。 XGBoostは、NaN値を回避できるため、非常にクールです(これはバックテストでしばしば問題になります、つまり、ルックバックのデータセットの可用性が異なり、1つのプロバイダーは10年、1つのプロバイダーは2年です)。 もちろん、帰属することはできますが、それは物事を行うための最も現実的な方法ではなく、特徴の平均/中央値を事前に明らかにするため、技術的には先読みがあります。先読みの自由平均を使用することもできますが、それでも... 1時間以上の時間枠をフィッティングする余裕がなく、NaNを扱いたい線形の場合、最善の策は、IC重み付けアンサンブルを実行し、NaNがあるたびに重みを再計算することです(各特徴ICがある場合に、どの重みが何であるべきか、およびどの特徴がセットにあるかを理解するのは、必ずしも費用がかかりません)。