Самообучение так хорошо работает в шахматах, го и покере, потому что эти игры являются двухигроковыми нулевыми суммами. Это упрощает многие проблемы. Реальный мир более запутан, поэтому мы еще не видели много успехов самообучения в LLM. Кстати, @karpathy отлично справился, и я в основном с ним согласен!