Este minunat. Pot vedea modelul RL de la o milă distanță. Seamănă atât de mult cu proiectul de învățare prin întărire pe care l-am făcut în 2018 încercând să antrenez o mini-simulare pe care am construit-o pentru a merge. Am avut o mulțime de bug-uri, dar modelul RL a găsit întotdeauna o cale. Voi lega subiectul despre asta mai jos