Massor av saker gömda i basmodellerna - undertryckta av efterträningen men fortfarande tillgängliga med hjälp av smarta knep!
Omar Shams
Omar Shams16 aug. 09:08
(TRL-tränarkod nedan) Hur skalar du språkmodellsökning? Kan en språkmodell vägledas mot att lösa nya problem som den vanligtvis inte kan lösa enbart genom guidad omsampling utan att träna modellen överhuvudtaget? Det visar sig att svaret är typ ja. Detta har viktiga implikationer för efterutbildning och säkerhetsforskning.
4,96K