Jeg er forvirret over dette. Det er så uforenlig med min faktiske daglige opplevelse av LLM-er, som er at de stort sett alle høres like ut nå, og har vært det siden Claude 3.5 Sonnet. Enten har benchmarks blitt meningsløse, eller så har modellene rett og slett blitt så gode at ytterligere forbedringer ikke kan merkes av vibber, men bare gjennom streng analyse.
Tolga Bilge
Tolga Bilge11. aug., 10:47
Er sigmoidene i rommet med oss akkurat nå?
6,05K