Toller Bericht von Henry Zhu @makneee über die Leistung des LLM-Trainings über 10GbE im Vergleich zu InfiniBand NDR und verschiedenen Speicher-Konfigurationen Ich frage mich, ob @GraidTechnology's SupremeRAID AE die Engpässe bei Multi-Node-Trainingsläufen weiter reduziert, mit Benchmarks von eurer Seite über H100/H200s