Lavorare su llm RL è una delle cose più intellettualmente soddisfacenti che abbia mai fatto, sia da una prospettiva di sistema che di ml.