(trl trainer code hieronder) hoe schaal je de zoekfunctie van een taalmodel? kan een taalmodel worden aangestuurd om nieuwe problemen op te lossen die het normaal gesproken niet kan oplossen puur door middel van geleide hersampling zonder het model überhaupt te trainen? het blijkt dat het antwoord een soort van ja is. dit heeft belangrijke implicaties voor post-training en veiligheidsonderzoek.
7,11K