构建最大的类人预训练集