(trl Trainer-Code unten) Wie skaliert man die Suche nach Sprachmodellen? Kann ein Sprachmodell dazu angeleitet werden, neue Probleme zu lösen, die es normalerweise nicht rein durch geführtes Resampling lösen kann, ohne das Modell überhaupt zu trainieren? Es stellt sich heraus, dass die Antwort irgendwie ja ist. Das hat wichtige Implikationen für die Forschung nach dem Training und die Sicherheit.
7,11K