Estou confuso sobre isso. É tão incongruente com a minha experiência real do dia a dia com LLMs, que é que eles agora soam todos mais ou menos iguais, e isso acontece desde o Claude 3.5 Sonnet. Ou os benchmarks se tornaram sem sentido ou os modelos simplesmente se tornaram tão bons que melhorias adicionais não podem ser percebidas por intuição, mas apenas através de uma análise rigorosa.
Tolga Bilge
Tolga Bilge11/08, 10:47
Estão os sigmoides na sala connosco agora?
6,52K