AI-training is synchroon, dus duizenden GPU's pieken tijdens de berekeningen en dalen tijdens de communicatie. Geaggregeerd creëert dat grote, ritmische vermogensschommelingen die 'slechte frequenties' in het net kunnen opwekken. Nutsbedrijven beginnen beide te beperken: (1) hoe snel/hoe ver stroom beweegt (tijdsdomein), en (2) hoeveel beat zich in een gevoelige frequentieband bevindt (frequentiedomein). Eerdere gebeurtenissen tonen aan dat lage-Hz oscillaties zich kunnen verspreiden en druk op installaties/netten kunnen uitoefenen; met AI-trainingsladingen is de dwingende functie groter. Nutsbedrijven stellen daarom kritische frequenties + magnitudelimieten in (bijv. een brede 0,1–20 Hz beschermband versus 0,2-3 Hz AI-werkbelasting FFT) zodat de smalle beat van één locatie het net niet kan domineren. Potentiële oplossingen voor naleving: Verwacht afwegingen: energieverbruik (eerste twee) versus capex/ruimte (laatste). -Software smoothing (voeg gecontroleerd "vul" werk toe wanneer de stroom zou dalen), -GPU-firmware shaping (limieten verhogen, houd een minimum stroomvloer) -Rack-niveau opslag om de schommelingen te absorberen/aan te bieden. Real-time FFT-monitoring fungeert als een backstop. Waarom firmware alleen vaak niet genoeg is? Op huidige GPU's loopt MPF maximaal ~90% van TDP (maximale stroom) en de minimale short-spike instelling (EDP) is nog steeds ~1,1× TDP = ten minste ~20% swing blijft over. Strikte nutslimieten (bijv. ~10%) vereisen doorgaans rack-niveau opslag naast firmware- en softwareoplossingen (bijv. verwacht hybride oplossingen).
Shanu Mathew
Shanu Mathew30 aug 2025
Belangrijke kleur van de MSFT datacenterleider: AI-trainingsclusters creëren enorme vermogensschommelingen die elektrische netten kunnen destabiliseren, wat kan leiden tot schade aan apparatuur en stroomuitval. Oplossingen omvatten software-smoothing, GPU-firmwarecontroles en rack-niveau batterijen, elk met energie/kostenafwegingen. Een multi-benadering is nodig.
28,15K