我就是喜欢 Hugging Face。 他们的新 200 多页《训练手册》涵盖了一切:训练框架、模型架构、数据整理、训练前/中/后、评估、GPU 的工作原理、最新研究和消融实验。 充满了实用的智慧。我像读小说一样读它。