Kami telah mengatakan ini untuk sementara waktu sekarang dan akhirnya semua orang mengejar ketinggalan: lebih banyak penalaran ≠ lebih banyak keandalan. Studi empiris baru mengkonfirmasi bahwa penskalaan waktu pengujian gagal untuk tugas-tugas faktual - akurasi dataran tinggi sementara halusinasi sering meningkat. Ketika kesalahan turun, itu dari abstain, bukan penarikan yang ditingkatkan. Rantai yang diperpanjang memperkuat bias konfirmasi, membuat bukti untuk mendukung jawaban yang salah. Inilah sebabnya mengapa infrastruktur verifikasi penting. Anda tidak dapat bernalar keluar dari halusinasi, Anda membutuhkan mekanisme konsensus.