Estou confuso sobre isso. É tão incongruente com a minha experiência real do dia a dia de LLMs, que é que eles quase todos soam iguais agora, e têm sido desde Claude 3.5 Sonnet. Ou os benchmarks perderam o sentido ou os modelos simplesmente se tornaram tão bons que melhorias adicionais não podem ser sentidas por vibrações, mas apenas por meio de análises rigorosas.
Tolga Bilge
Tolga Bilge11 de ago., 10:47
Os sigmóides estão na sala conosco agora?
6,65K