我們已經說了很長一段時間了,最終每個人都在趕上:更多的推理 ≠ 更高的可靠性。 新的實證研究確認,在事實任務中,測試時間的擴展失敗——準確性停滯不前,而幻覺往往增加。當錯誤確實減少時,原因是避免,而不是改進的回憶。擴展鏈條放大了確認偏誤,偽造證據以支持錯誤答案。 這就是為什麼驗證基礎設施很重要。你無法通過推理擺脫幻覺,你需要共識機制。