Mange ting gjemt i basismodellene - undertrykt av ettertrening, men fortsatt tilgjengelig ved hjelp av smarte triks!
Omar Shams
Omar Shams16. aug., 09:08
(TRL-trenerkode nedenfor) Hvordan skalerer du språkmodellsøk? Kan en språkmodell veiledes mot å løse nye problemer som den vanligvis ikke kan løse utelukkende gjennom veiledet resampling uten å trene modellen overhodet? Det viser seg at svaret er et slags ja. Dette har viktige implikasjoner for ettertrening og sikkerhetsforskning.
4,25K