(TRL-tränarkod nedan) Hur skalar du språkmodellsökning? Kan en språkmodell vägledas mot att lösa nya problem som den vanligtvis inte kan lösa enbart genom guidad omsampling utan att träna modellen överhuvudtaget? Det visar sig att svaret är typ ja. Detta har viktiga implikationer för efterutbildning och säkerhetsforskning.
8,42K