Tämä on mahtavaa. Näen RL-mallin kilometrin päästä. Se näyttää niin paljon vahvistusoppimisprojektilta, jonka tein vuonna 2018 yrittäessäni kouluttaa pisteminisimulaatiota, jonka rakensin kävelemään. Minulla oli paljon vikoja, mutta RL-malli löysi aina keinon. Linkitän sitä koskevan ketjun alle