興味深い研究ですね。古いモデルに関する多くのコメントは本質を見落としているように思えます。モデル自体はベンチマークとして十分だったが、実際の人間ユーザーにはその状態を正確に説明するきっかけができなかったのです。