我遇到了一个非常有趣的问题。当我们给AI一个需要1天到1周才能完成的编码任务时,比较和学习不同的方法是否值得? 这是一个根本性的问题。我们的选择是1. 用直觉来判断一个长期运行的任务表现得如何 2. 花一年时间比较方法和测试理论,而这些理论在我得到足够样本量时可能已经过时 学习如何构建这些长期运行的任务工作流程将会有一点公共悲剧的性质。学习正确的工作流程的投资远高于复制你看到的有效产品。