Votre bibliothèque de transformateurs fusionne-t-elle le FFN en un seul noyau "flash" ? Je pense qu'il y a d'énormes gains possibles, je suis curieux de connaître les pratiques courantes et l'état de la recherche SOTA ?
20,13K