Dette er kjempebra. Jeg kan se RL-modellen på en mils avstand. Det ligner så mye på forsterkningslæringsprosjektet jeg gjorde i 2018 da jeg prøvde å trene en punktminisimulering jeg bygde for å gå. Jeg hadde tonnevis av feil, men RL-modellen fant alltid en måte. Jeg lenker tråden om det nedenfor