A IA oficialmente me venceu nas Finais Mundiais do ICPC. Isso me lembra uma habilidade rara do ICPC: ser capaz de ler rapidamente o código de um colega de equipe e identificar bugs. Essa habilidade leva anos para ser treinada e explica por que a IA muitas vezes torna a codificação mais lenta (veja arXiv:2507.09089). Não importa quão forte a IA se torne, os humanos ainda podem precisar gastar tempo verificando a saída da IA... Mas imagine se o ChatGPT funcionasse de forma diferente a partir de amanhã: não um chat usuário-agente, mas um chat triplo usuário-agente-arbitral. ⚖️ O agente (digamos GPT-5) deve convencer um árbitro (digamos GPT-4o) de que sua solução está correta; o papel do usuário é desafiá-lo e convencer o árbitro do contrário. Assim como verificar (P) é mais fácil do que inventar (NP), um caminho de prova interativa (IP) poderia reduzir ainda mais a habilidade e o tempo humanos necessários. Tal sistema de IA-arbitral poderia deslocar o fardo dos humanos, permitindo que nos concentrássemos menos na logística (por exemplo, revisar um código) e mais nas decisões que importam. Poderia este ser o caminho para a próxima geração de IA universal? 🚀