我對此感到困惑。這與我實際的日常體驗完全不符,我發現現在的LLM大多數聽起來都差不多,自從Claude 3.5 Sonnet以來就是這樣。要麼基準測試變得毫無意義,要麼模型已經變得如此優秀,以至於進一步的改進只能通過嚴格的分析來感知,而不是通過直覺。
Tolga Bilge
Tolga Bilge8月11日 10:47
現在房間裡有 sigmoid 嗎?
6.05K