Testando a robustez das pontuações do @Havelock_AI ao realizar um torneio, onde Claude é apenas apresentado com os marcadores gramaticais e lexicais (sem conteúdo) de dois textos e solicitado a adivinhar qual é mais oral. Vamos ver se os textos com pontuações mais altas realmente têm ELOs mais altos.
Primeiro lote de teste antes da grande corrida
37