L'industria dell'AI sta passando dalla formazione dei modelli all'inferenza su larga scala, con il mercato globale dell'inferenza che si prevede raggiunga i 254,98 miliardi di dollari entro il 2030. Per tenere il passo, l'infrastruttura GPU bare-metal sta diventando critica, poiché le configurazioni cloud tradizionali con strati di virtualizzazione aggiungono colli di bottiglia nelle prestazioni.