Ini luar biasa. Saya dapat melihat model RL dari jarak satu mil. Ini sangat mirip dengan proyek pembelajaran penguatan yang saya lakukan pada tahun 2018 mencoba melatih simulasi mini tempat yang saya buat untuk berjalan. Saya memiliki banyak bug, tetapi model RL selalu menemukan jalan. Saya akan menautkan utas tentang hal itu di bawah ini