Mengerjakan llm RL adalah salah satu hal paling memuaskan secara intelektual yang pernah saya lakukan, baik dari perspektif sistem maupun ml