クロードに2つのテキストの文法的・語彙的マーカー(内容なし)を提示し、どちらが口承的かを推測させるトーナメントを開催して@Havelock_AIスコアの堅牢さを試す。高得点のテキストほど実際にELOが高いかどうか見てみましょう。
大規模なランの前の最初のテストバッチ
37