Con nmoe, finalmente siento que mi experiencia en pytorch, cuda, CuteDSL y b200s coincide con mi antigua experiencia en Jax, pallas, mosaic y TPU v4. Me tomó casi 2 años lograrlo