Det här är fantastiskt. Jag kan se RL-modellen på en mils avstånd. Det ser så mycket ut som förstärkningsinlärningsprojektet jag gjorde 2018 när jag försökte träna en minisimulering av en spot som jag byggde för att gå. Jag hade massor av buggar, men RL-modellen hittade alltid ett sätt. Jag länkar tråden om det nedan