Poner a prueba la robustez de @Havelock_AI puntuaciones organizando un torneo, en el que a Claude simplemente se le presentan los marcadores gramaticales y léxicos (sin contenido) de dos textos y se le pide que adivine cuál es más oral. Veremos si los textos con mejores puntuaciones realmente tienen ELOs más altos.
Primer lote de pruebas antes de la gran tirada
28