(codice del trainer trl qui sotto) come si scala la ricerca nei modelli di linguaggio? un modello di linguaggio può essere guidato verso la risoluzione di nuovi problemi che normalmente non riesce a risolvere semplicemente attraverso il campionamento guidato senza addestrare il modello in alcun modo? si scopre che la risposta è in un certo senso sì. questo ha importanti implicazioni per la ricerca post-addestramento e sulla sicurezza.
7,1K