Với nmoe, cuối cùng tôi cảm thấy chuyên môn của mình trong pytorch, cuda, CuteDSL và b200s tương xứng với chuyên môn cũ của tôi trong Jax, pallas, mosaic và TPU v4. Mất gần 2 năm để làm điều đó.