Työskentely llm RL:n parissa on yksi älyllisesti tyydyttävimmistä asioista, joita olen koskaan tehnyt, sekä järjestelmän että ml:n näkökulmasta