Điều này thật tuyệt. Tôi có thể nhận ra mô hình RL từ xa. Nó trông giống hệt như dự án học tăng cường mà tôi đã thực hiện vào năm 2018, cố gắng huấn luyện một mô phỏng spot mini mà tôi đã xây dựng để đi bộ. Tôi đã gặp rất nhiều lỗi, nhưng mô hình RL luôn tìm ra cách. Tôi sẽ liên kết chủ đề về nó bên dưới.