O jogo próprio funciona tão bem no xadrez, go e pôquer porque esses jogos são de soma zero para dois jogadores. Isso simplifica muitos problemas. O mundo real é mais confuso, e é por isso que ainda não vimos muitos sucessos do auto-jogo em LLMs. A propósito, @karpathy me saí muito bem e eu concordo principalmente com ele!