Fuseren jouw transformer bibliotheek de FFN in één "flash" kernel? Ik denk dat er enorme winst mogelijk is, benieuwd wat de gangbare praktijk en het onderzoek SOTA is?
20,14K