Gran artículo de Henry Zhu @makneee sobre el rendimiento del entrenamiento de LLM en 10GbE vs InfiniBand NDR y varias configuraciones de almacenamiento Me pregunto si SupremeRAID AE de @GraidTechnology reduce aún más los cuellos de botella en las ejecuciones de entrenamiento de varios nodos, con puntos de referencia de su parte en H100 / H200