Att arbeta med llm RL är en av de mest intellektuellt tillfredsställande sakerna jag någonsin gjort, både ur ett system- och ml-perspektiv