L'industrie de l'IA passe de l'entraînement de modèles à l'inférence à grande échelle, le marché mondial de l'inférence devant atteindre 254,98 milliards de dollars d'ici 2030. Pour suivre le rythme, l'infrastructure GPU bare-metal devient critique, car les configurations cloud traditionnelles avec des couches de virtualisation ajoutent des goulets d'étranglement en matière de performance.