5個不同的LLM在問題上自信地達成一致時,平均錯誤率的中位數估計為4.4%。
Robin Hanson
Robin Hanson8月20日 23:17
想像一下,你向5個高品質多樣化的LLM提問,他們都給出了相同的答案,並且似乎對自己的答案充滿信心。平均而言,他們的共同答案實際上錯誤的概率是多少?
3.4K