Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Antrenamentul AI este sincron, astfel încât mii de GPU-uri cresc în timpul calculului și se îndrăgostesc în timpul comunicării. Agregate, care creează oscilații mari de putere ritmice care pot excita "frecvențele proaste" ale rețelei. Utilitățile încep să limiteze ambele: (1) cât de repede/cât de departe se mișcă puterea (domeniul timpului) și (2) cât de mult ritm se află într-o bandă de frecvență sensibilă (domeniul frecvenței).
Evenimentele din trecut arată că oscilațiile de Hz scăzut se pot propaga și stresa plantele/rețelele; cu sarcini de antrenament AI, funcția de forțare este mai mare. Prin urmare, utilitățile stabilesc frecvențe critice + limite de magnitudine (de exemplu, o bandă largă de gardă de 0,1-20 Hz vs. 0,2-3 Hz AI FFT), astfel încât ritmul îngust al unui site să nu poată domina grila.
Remedii potențiale pentru conformitate: Așteptați-vă la compromisuri: consum de energie (primele două) vs. capex/spațiu (ultimul).
-Netezirea software-ului (adăugați o muncă controlată de "umplere" atunci când puterea ar scădea),
-Modelarea firmware-ului GPU (limite de rampă, păstrați un minim de putere)
-Depozitare la nivel de raft pentru a absorbi / alimenta mișcarea. Monitorizarea FFT în timp real acționează ca un backstop.
De ce firmware-ul singur nu este suficient? Pe GPU-urile actuale, MPF atinge ~90% din TDP (max ppwer) și setarea minimă a vârfului scurt (EDP) este încă ~1.1× TDP = cel puțin ~20% swing rămâne. Limitele stricte de utilitate (de exemplu, ~10%) necesită de obicei stocare la nivel de rack, în plus față de soluțiile firmware și software (de exemplu, așteptați-vă la remedieri hibride).





30 aug. 2025
Culori importante de la liderul centrului de date MSFT: clusterele de antrenament AI creează oscilații masive de putere care pot destabiliza rețelele electrice, provocând daune și întreruperi ale echipamentelor. Soluțiile includ netezirea software-ului, controale firmware GPU și baterii la nivel de rack, fiecare cu compromisuri energie/costuri. Este nevoie de mai multe abordări.


28,15K
Limită superioară
Clasament
Favorite