Dit is geweldig. Ik kan het RL-model van een mijl afstand zien. Het lijkt zo veel op het reinforcement learning-project dat ik in 2018 deed, waarbij ik probeerde een spot mini-simulatie die ik had gebouwd om te laten lopen, te trainen. Ik had tons bugs, maar het RL-model vond altijd een manier. Ik zal de thread erover hieronder linken.