私はそれを理解するためにtinygradフラッシュアテンションカーネルに注釈を付けました。 これを GENERICALLY 自動生成するのはかなりクールです。
the tiny corp
the tiny corp8月3日 07:29
Finally, real flash attention. With the new indexing, it's completely automatic and generic, see TestFuse.test_flash_attention. ENDRANGE is STORE+LOAD, and you end a range if the children of a UOp mismatch on that axis.
74.3K