Czy twoja biblioteka transformatorów łączy FFN w jeden "flash" kernel? Myślę, że możliwe są ogromne zyski, ciekawi mnie, jakie są powszechne praktyki i stan badań SOTA?
20,13K