Индустрия ИИ переходит от обучения моделей к масштабной инференции, при этом глобальный рынок инференции, как ожидается, достигнет 254,98 миллиарда долларов к 2030 году. Чтобы не отставать, инфраструктура GPU на голом железе становится критически важной, так как традиционные облачные настройки с виртуализационными слоями создают узкие места в производительности.