“这些发现提供了明确的证据,表明在MTurk上收集的数据根本无法信任。” 研究人员长期以来一直在争论亚马逊机械土耳其(MTurk)调查数据是否可信。 本文采用了一种简单的方法来评估目前由MTurk产生的数据质量。 作者给受访者提供了一对显然矛盾的问题。 例如: “我说得很多”和“我很少说话。” 或者: “我喜欢秩序”和“我渴望混乱。” 如果人们在认真听,赞同一个应该意味着反对另一个。至少,这两个答案不应该一起移动。 同样的调查在三个平台上进行:Prolific、CloudResearch Connect和MTurk。 在Prolific和Connect上,情况正常:大多数矛盾项呈负相关,正如常识所预测的那样。 然而,在MTurk上,结果恰恰相反。 超过96%的这些明显相反的项对呈正相关。换句话说,许多受访者对字面上相互矛盾的陈述给出了相似的答案。 然后,作者尝试了大多数研究人员接下来会做的事情: - 将样本限制为“高声誉”MTurk工作者 - 应用标准注意力检查 - 删除快速响应者和直线回答者...