Industri AI beralih dari pelatihan model ke inferensi dalam skala besar, dengan pasar inferensi global diperkirakan akan mencapai $254,98 miliar pada tahun 2030. Untuk mengimbangi, infra GPU bare-metal menjadi penting, karena pengaturan cloud tradisional dengan lapisan virtualisasi menambah kemacetan kinerja.