para los agentes conversacionales, el usuario es el entorno. se puede considerar cada conversación como una implementación de una política que guía al usuario hacia el objetivo del modelo.