セルフプレイは、チェス、囲碁、ポーカーで非常にうまく機能し、これらのゲームは 2 人用のゼロサムであるためです。これにより、多くの問題が単純化されます。現実の世界はより厄介であるため、LLM でのセルフプレイの成功はまだあまり見られていません。 ところで、@karpathyは素晴らしいことをしましたし、私は彼の意見にほとんど同意します!