mengoptimalkan inferensi untuk GPU L4. penarikan daya maks 72 W