5个不同的LLM在问题上自信地达成一致时,平均错误率的中位数估计为4.4%。
Robin Hanson
Robin Hanson8月20日 23:17
想象一下,你向5个高质量多样化的LLM提问,他们都给出了相同的答案,并且似乎对自己的答案充满信心。平均而言,他们的共同答案实际上错误的概率是多少?
3.54K