pour les agents conversationnels, l'utilisateur est l'environnement. on peut considérer chaque conversation comme un déploiement d'une politique qui guide l'utilisateur vers l'objectif du modèle.