根据模型评估来判断OpenAI的成功感觉有些不准确,有点像根据某种衡量社交图谱有效性的标准来评判早期的Facebook。
5.32K