Jag är förvirrad över detta. Det är så inkongruent med min faktiska dagliga erfarenhet av LLM:er, vilket är att de i stort sett alla låter likadant nu, och har varit det sedan Claude 3.5 Sonnet. Antingen har benchmarks blivit meningslösa eller så har modellerna helt enkelt blivit så bra att ytterligare förbättringar inte kan märkas av vibbar, utan endast genom rigorös analys.
Tolga Bilge
Tolga Bilge11 aug. 10:47
Är sigmoiderna i rummet med oss just nu?
6,67K