Con nmoe, finalmente sento che la mia esperienza in pytorch, cuda, CuteDSL e b200s corrisponde alla mia vecchia esperienza in Jax, pallas, mosaic e TPU v4. Ci sono voluti quasi 2 anni per farlo