Com o nmoe, finalmente sinto que minha expertise em pytorch, cuda, CuteDSL e b200s corresponde à minha antiga expertise em Jax, pallas, mosaic e TPU v4. Levou quase 2 anos para fazer