Jestem zdezorientowany tym. To jest tak niezgodne z moim codziennym doświadczeniem z LLM, które polega na tym, że teraz wszystkie brzmią prawie tak samo, i tak było od czasu Claude 3.5 Sonnet. Albo benchmarki stały się bezsensowne, albo modele po prostu stały się tak dobre, że dalsze poprawki nie mogą być odczuwane przez wibracje, ale tylko poprzez rygorystyczną analizę.
Tolga Bilge
Tolga Bilge11 sie, 10:47
Czy sigmoidy są teraz z nami w pokoju?
6,19K