Xây dựng bộ dữ liệu tiền huấn luyện người máy lớn nhất