Excelente artículo de Henry Zhu @makneee sobre el rendimiento del entrenamiento de LLM entre 10GbE vs InfiniBand NDR y varias configuraciones de almacenamiento. Me pregunto si el SupremeRAID AE de @GraidTechnology reduce aún más los cuellos de botella en las ejecuciones de entrenamiento multinodo, con algún benchmark de su parte en H100/H200s.