Özet; NMOE deposu ve mimarisi ile ilgili özet: Gerçek nvfp4 yerel 16B param modeli eğitimini tek bir 8xB200 düğümde yapabiliyorum ve 128 GPU'dan az bir GPU'da (veri pipeline dahil) ~30 günde tam eğitim çalıştırma yapabiliyorum Tahmin edildiğinde, teorik olarak tek bir GB300 NVL72 ile tam bir deepseek-V3 antrenman çalışması yapabileceğim anlamına geliyor