Sono confuso riguardo a questo. È così incongruente con la mia esperienza quotidiana con i LLM, che è che ora suonano tutti più o meno allo stesso modo, e lo fanno da Claude 3.5 Sonnet. O i benchmark sono diventati privi di significato o i modelli sono semplicemente diventati così bravi che i miglioramenti successivi non possono essere percepiti a livello di sensazioni, ma solo attraverso un'analisi rigorosa.
Tolga Bilge
Tolga Bilge11 ago, 10:47
I sigmoidi sono nella stanza con noi in questo momento?
6,05K