С nmoe я наконец-то чувствую, что моя экспертиза в pytorch, cuda, CuteDSL и b200s соответствует моей старой экспертизе в Jax, pallas, mosaic и TPU v4. Потребовалось почти 2 года, чтобы этого достичь.