Работа над llm RL — одно из самых интеллектуально удовлетворяющих занятий, которые я когда-либо делал, как с точки зрения системы, так и с точки зрения машинного обучения.