Ender, ce n'était pas un environnement RL avec une récompense vérifiable, ce sont de vraies commandes Amazon que tu as passées.
96,35K