Trabajar en llm RL es una de las cosas más satisfactorias intelectualmente que he hecho, tanto desde la perspectiva del sistema como del ml