Post-training to forma sztuki. @christinahkim mówi, że kształtowanie zachowań modelu oznacza rzeźbienie charakteru. Każda nagroda to kompromis. GPT-5 był resetem: równoważenie pomocności z uczciwością, ciepła bez pochlebstwa. Asystent nie powinien tylko odpowiadać. Powinno się go używać z poczuciem, że to właściwe.
17,87K