Este es el gráfico más importante del mundo, y se está volviendo absolutamente descontrolado
METR
METRhace 20 horas
Estimamos que Claude Opus 4.6 tiene un horizonte temporal del 50% de alrededor de 14,5 horas (IC del 95% de 6 a 98 horas) en tareas de software. Aunque esta es la estimación más alta que hemos reportado, esta medición es extremadamente ruidosa porque nuestro conjunto de tareas actual está casi saturado.
La versión lineal es completamente loca. Superexponencial
Para los no iniciados, esto significa: (ciertas) tareas que normalmente llevarían 14 horas a un usuario humano en completarse, ahora pueden ser realizadas por la IA (en un tiempo mucho más corto, probablemente minutos) con un 50% de probabilidad eso supone 4,5 órdenes de magnitud desde 2019, o un aumento de 26.000 veces desde GPT-2
49