An der Arbeit mit llm RL zu arbeiten, ist eine der intellektuell befriedigendsten Dinge, die ich je getan habe, sowohl aus systemischer als auch aus ml-Perspektive.