Agora com fusão de loops e sem recomputação. Se você conseguir construir um "compilador" do qual a atenção flash simplesmente surge, imagine o que mais ele poderia fundir.
Eitan Turok @ICML 2025
Eitan Turok @ICML 20254/08, 04:34
Eu anotei o kernel de atenção flash do tinygrad para ter certeza de que o entendo. gerar isso AUTOMATICAMENTE de forma GENÉRICA é muito legal!
29,74K