有了nmoe,我终于觉得我在pytorch、cuda、CuteDSL和b200s方面的专业知识与我在Jax、pallas、mosaic和TPU v4方面的旧专业知识相匹配。花了将近两年的时间才做到这一点。