我对此感到困惑。这与我实际的日常体验完全不符,我发现现在的LLM大多数听起来都差不多,自从Claude 3.5 Sonnet以来就是这样。要么基准测试变得毫无意义,要么模型已经变得如此优秀,以至于进一步的改进只能通过严格的分析来感知,而不是通过直觉。
Tolga Bilge
Tolga Bilge8月11日 10:47
现在房间里有 sigmoid 吗?
6.18K