Estoy confundido con esto. Es tan incongruente con mi experiencia diaria real de los LLMs, que es que todos suenan casi igual ahora, y ha sido así desde Claude 3.5 Sonnet. O los benchmarks se han vuelto irrelevantes o los modelos se han vuelto tan buenos que las mejoras adicionales no se pueden sentir por sensaciones, sino solo a través de un análisis riguroso.
Tolga Bilge
Tolga Bilge11 ago, 10:47
¿Están los sigmoides en la habitación con nosotros ahora mismo?
6,61K