Werken aan llm RL is een van de meest intellectueel bevredigende dingen die ik ooit heb gedaan, zowel vanuit een systeem- als een ml-perspectief.