Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
O treinamento de IA é síncrono, portanto, milhares de GPUs aumentam durante a computação e caem durante a comunicação. Agregado, isso cria grandes oscilações de potência rítmicas que podem excitar as 'frequências ruins' da grade. As concessionárias estão começando a limitar: (1) a velocidade / distância que a energia se move (domínio do tempo) e (2) a quantidade de batida em uma banda de frequência sensível (domínio da frequência).
Eventos passados mostram que oscilações de baixa Hz podem se propagar e estressar plantas/grades; com cargas de treinamento de IA, a função de força é maior. As concessionárias, portanto, definem frequências críticas + limites de magnitude (por exemplo, uma ampla banda de proteção de 0,1 a 20 Hz versus FFT de carga de trabalho de IA de 0,2 a 3 Hz) para que a batida estreita de um local não possa dominar a grade.
Possíveis correções para conformidade: Espere compensações: queima de energia (duas primeiras) vs. capex/espaço (última).
-Suavização de software (adicione trabalho de "preenchimento" controlado quando a energia cair),
-Modelagem de firmware de GPU (limites de rampa, mantenha um piso mínimo de energia)
-Armazenamento em nível de rack para absorver/fornecer o movimento. O monitoramento FFT em tempo real atua como um backstop.
Por que o firmware sozinho geralmente não é suficiente? Nas GPUs atuais, o MPF atinge ~90% do TDP (máximo ppwer) e a configuração mínima de pico curto (EDP) ainda é ~1,1× TDP = pelo menos ~20% de oscilação restante. Limites rígidos de utilidade (por exemplo, ~ 10%) normalmente precisam de armazenamento em nível de rack, além de soluções de firmware e software (por exemplo, espere correções híbridas).





30 de ago. de 2025
Cor importante do líder do data center MSFT: Os clusters de treinamento de IA criam grandes oscilações de energia que podem desestabilizar as redes elétricas, causando danos e interrupções no equipamento. As soluções incluem suavização de software, controles de firmware de GPU e baterias em nível de rack, cada uma com compensações de energia/custo. Multi-abordagem necessária.


28,15K
Melhores
Classificação
Favoritos