Midiendo la Eficiencia del Pensamiento en Modelos de Razonamiento: El Benchmark Perdido Medimos el uso de tokens en modelos de razonamiento: los modelos abiertos generan de 1.5 a 4 veces más tokens que los modelos cerrados en tareas idénticas, pero con una gran variabilidad dependiendo del tipo de tarea (hasta 10 veces en preguntas simples). Este costo oculto a menudo anula las ventajas de precios por token. La eficiencia de tokens debería convertirse en un objetivo principal junto a los benchmarks de precisión, especialmente considerando los casos de uso no relacionados con el razonamiento. Lee la revisión exhaustiva de la eficiencia de razonamiento en el panorama de modelos abiertos y cerrados en nuestra última publicación de blog en colaboración con nuestro investigador residente, Tim. Ve más de su trabajo aquí:
31,58K