私たちはこれをしばらく前から言ってきましたが、ついに誰もが追いつきつつあります:より多くの推論≠信頼性の向上。 新しい実証研究により、事実に基づいたタスクではテスト時間のスケーリングが失敗し、精度は頭打ちになる一方で、幻覚はしばしば増加することが確認されました。エラーが減少した場合、それは棄権によるものであり、想起率の向上によるものではありません。拡張されたチェーンは確証バイアスを増幅させ、間違った答えを裏付ける証拠を捏造します。 これが、検証インフラストラクチャが重要である理由です。幻覚から抜け出す方法は推論できません、コンセンサスメカニズムが必要です。