este é o gráfico mais importante do mundo, e está a ficar absolutamente explosivo
METR
METRHá 6 horas
Estimamos que o Claude Opus 4.6 tem um horizonte de tempo de 50% de cerca de 14,5 horas (IC de 95% de 6 horas a 98 horas) em tarefas de software. Embora esta seja a estimativa pontual mais alta que reportámos, esta medição é extremamente ruidosa porque o nosso conjunto de tarefas atual está quase saturado.
a versão linear é completamente insana. superexponencial
para os não iniciados, isso significa: (tarefas certas) que normalmente levariam a um usuário humano 14 horas para completar, agora podem ser feitas pela AI (em um tempo muito mais curto, provavelmente minutos) com uma probabilidade de 50% isso é 4,5 ordens de magnitude desde 2019, ou um aumento de 26.000x desde o GPT-2
8