La supervision évolutive est pratiquement le dernier grand problème de recherche qui reste. Une fois que vous avez une fonction de récompense inviolable pour quoi que ce soit, alors vous pouvez appliquer l'apprentissage par renforcement sur tout.
154,35K