La tua libreria transformer sta fondendo il FFN in un unico kernel "flash"? Penso che ci siano enormi guadagni possibili, sono curioso di sapere quale sia la pratica comune e lo stato dell'arte nella ricerca?
20,13K