Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
El entrenamiento de IA es sincrónico, por lo que miles de GPU aumentan durante el cálculo y se hunden durante la comunicación. Agregado, eso crea grandes oscilaciones de potencia rítmicas que pueden excitar las "malas frecuencias" de la red. Las empresas de servicios públicos están comenzando a limitar: (1) qué tan rápido / qué tan lejos se mueve la energía (dominio del tiempo) y (2) cuánto ritmo se encuentra en una banda de frecuencia sensible (dominio de la frecuencia).
Los eventos pasados muestran que las oscilaciones de baja Hz pueden propagarse y estresar las plantas/rejillas; con cargas de entrenamiento de IA, la función de forzamiento es mayor. Por lo tanto, las empresas de servicios públicos establecen límites críticos de frecuencias + magnitud (por ejemplo, una amplia banda de guarda de 0,1 a 20 Hz frente a FFT de carga de trabajo de IA de 0,2 a 3 Hz) para que el estrecho ritmo de un sitio no pueda dominar la cuadrícula.
Posibles soluciones para el cumplimiento: Espere compensaciones: quema de energía (dos primeros) frente a capex / espacio (último).
-Suavizado de software (agregue trabajo de "relleno" controlado cuando caiga la energía),
-Modelado del firmware de la GPU (límites de rampa, mantener un piso de potencia mínimo)
-Almacenamiento a nivel de rack para absorber / suministrar el movimiento. El monitoreo FFT en tiempo real actúa como un respaldo.
¿Por qué el firmware por sí solo a menudo no es suficiente? En las GPU actuales, el MPF alcanza un máximo de ~90% de TDP (ppwer máximo) y la configuración mínima de pico corto (EDP) sigue siendo ~1.1× TDP = al menos ~20% de oscilación permanece. Los límites estrictos de las utilidades (por ejemplo, ~10%) suelen necesitar almacenamiento a nivel de bastidor además de soluciones de firmware y software (por ejemplo, espere correcciones híbridas).





30 ago 2025
Color importante del líder del centro de datos MSFT: Los clústeres de entrenamiento de IA crean enormes oscilaciones de energía que pueden desestabilizar las redes eléctricas, causando daños y cortes en los equipos. Las soluciones incluyen suavizado de software, controles de firmware de GPU y baterías a nivel de rack, cada una con compensaciones de energía / costo. Se necesita un enfoque múltiple.


28.15K
Populares
Ranking
Favoritas