Il devient clair que la débrouillardise et l'adaptation stratégique peuvent surpasser l'échelle brute dans l'avancement des grands modèles de langage. Que veux-je dire ? Nous pouvons considérablement augmenter les performances en nous concentrant sur des architectures de modèles très efficaces (l'IA passe plus de temps à raisonner sur des requêtes individuelles plutôt qu'à s'appuyer uniquement sur une puissance de calcul massive et des puces).
10,37K