optimisation de l'inférence pour les GPU L4. consommation maximale de 72 W