Å jobbe med llm RL er noe av det mest intellektuelt tilfredsstillende jeg noen gang har gjort, både fra et system- og ml-perspektiv