Notatki dotyczące prognozowania: Myślę, że dla świec 1h i wyżej powinieneś używać ridge, ale gdy przechodzisz do świec 1min/5min, zazwyczaj okazuje się, że XGBoost wygrywa. 5 minut wymaga trochę starannego dostrojenia, ale 1 minuta, a zwłaszcza sekundy, zaczynają pokazywać, że XGBoost dominuje o dodatkowe 0.01-0.025 w twoim IC, czysto dlatego, że jest lepszym modelem. XGBoost jest całkiem fajny, ponieważ możesz unikać wartości NaN (co często jest problemem w testach wstecznych, tj. różne dostępności zestawów danych dla okresów wstecznych, jeden dostawca może mieć 10 lat, a inny 2). Możesz oczywiście imputować, ale to nie jest najbardziej realistyczny sposób działania i technicznie ma lookahead, ponieważ ujawniasz średnią/medianę cechy z wyprzedzeniem. Możesz również użyć średniej bez lookahead, ale wciąż... Dla liniowych rzeczy, gdzie nie możesz sobie pozwolić na dopasowanie w przedziale czasowym 1h i wyżej, ORAZ gdzie chcesz poradzić sobie z NaNami, najlepszym rozwiązaniem jest zrobienie zespołu ważonego IC i przeliczenie wag za każdym razem, gdy pojawiają się NaNy (nie jest to dokładnie kosztowne, aby ustalić, jaka waga powinna być, gdy masz IC dla każdej cechy i które cechy są w zestawie).