مع nmoe، أشعر أخيرا أن خبرتي في Pytorch وcuda وCuteDSL وB200s تتناسب مع خبرتي القديمة في Jax، pallas، Mosaic وTPU v4. استغرق الأمر ما يقارب سنتين لفعل ذلك