Робота над llm RL є однією з найбільш інтелектуально задовільних речей, які я коли-небудь робив, як з точки зору системи, так і з точки зору ml