Vain muutamalla koodirivillä Fengin (@fengyao1909) ehdottama korjaus – tärkeysnäytteenoton soveltaminen käyttäytymiskäytäntöön – ratkaisi harjoittelun epävakauden minun tapauksessani (kaura). Uskon, että tulos voidaan yleistää myös muihin RL-kehyksiin. Hienoa työtä, Feng!
39,25K