Trabalhar em llm RL é uma das coisas mais intelectualmente satisfatórias que já fiz, tanto do ponto de vista do sistema quanto do ml.