LLMs zu zwingen, während des Trainings böse zu sein, kann sie auf lange Sicht netter machen
6,65K