Навчання штучного інтелекту відбувається синхронно, тому тисячі графічних процесорів стрибають під час обчислень і просідають під час спілкування. Агрегований, який створює великі, ритмічні коливання потужності, які можуть збуджувати «погані частоти» мережі. Утиліти починають обмежувати обидва: (1) як швидко/як далеко рухається енергія (часовий домен) і (2) скільки ритму знаходиться в чутливому діапазоні частот (частотний домен). Минулі події показують, що коливання на низьких Гц можуть розмножуватися та створювати стрес для рослин/сіток; при тренувальних навантаженнях ШІ функція форсування більша. Тому утиліти встановлюють обмеження критичних частот + зоряної величини (наприклад, широка смуга захисту 0,1–20 Гц проти 0,2-3 Гц робочого навантаження AI FFT), тому вузький ритм одного сайту не може домінувати в сітці. Потенційні виправлення для дотримання вимог: очікуйте компромісів: спалювання енергії (перші два) та капітальні витрати/простір (останні). -Програмне згладжування (додати контрольовану роботу «наповнювача» при падінні живлення), - Формування прошивки графічного процесора (межі рампи, тримайте мінімальну мінімальну потужність) - Зберігання на рівні стелажа для поглинання/забезпечення погойдування. Моніторинг FFT у режимі реального часу діє як запасний варіант. Чому однієї прошивки часто недостатньо? На поточних графічних процесорах MPF досягає ~90% TDP (max ppwer), а мінімальне налаштування короткого сплеску (EDP) все ще становить ~1,1× TDP = залишається принаймні ~20% коливань. Жорсткі обмеження утиліт (наприклад, ~10%) зазвичай вимагають сховища на рівні стійки на додаток до прошивки та програмних рішень (наприклад, очікуйте гібридних виправлень).
Shanu Mathew
Shanu Mathew30 серп. 2025 р.
Важливий колір від керівника центру обробки даних MSFT: навчальні кластери штучного інтелекту створюють величезні перепади потужності, які можуть дестабілізувати електричні мережі, спричиняючи пошкодження обладнання та перебої. Рішення включають програмне згладжування, керування прошивкою графічного процесора та акумулятори на рівні стійки, кожне з яких передбачає компроміс між споживанням енергії та вартістю. Потрібен мультипідхід.
28,16K