Com nmoe, finalmente sinto que a minha experiência em pytorch, cuda, CuteDSL e b200s corresponde à minha antiga experiência em Jax, pallas, mosaic e TPU v4. Demorou quase 2 anos para conseguir.