Esse é o gráfico mais importante do mundo, e está indo completamente louco
METR
METR20 horas atrás
Estimamos que o Claude Opus 4.6 tenha um horizonte de tempo de 50% de cerca de 14,5 horas (IC 95% de 6 a 98 horas) em tarefas de software. Embora essa seja a estimativa máxima que já reportamos, essa medição é extremamente ruidosa porque nosso conjunto de tarefas atual está quase saturado.
A versão linear é completamente louca. Superexponencial
Para os não iniciados, isso significa: (certas) tarefas que normalmente levariam 14 horas para um usuário humano poderiam ser concluídas agora podem ser feitas pela IA (em um tempo muito menor, provavelmente minutos) com 50% de probabilidade isso representa 4,5 ordens de magnitude desde 2019, ou um aumento de 26.000 vezes desde o GPT-2
47