c'est le graphique le plus important au monde, et il est en train de devenir complètement fou
METR
METRil y a 16 heures
Nous estimons que Claude Opus 4.6 a un horizon temporel de 50 % d'environ 14,5 heures (IC à 95 % de 6 heures à 98 heures) pour les tâches logicielles. Bien que ce soit la plus haute estimation ponctuelle que nous ayons rapportée, cette mesure est extrêmement bruyante car notre suite de tâches actuelle est presque saturée.
la version linéaire est complètement folle. superexponentielle
pour les non-initiés, cela signifie : (des) tâches qui prendraient normalement 14 heures à un utilisateur humain pour être complétées, peuvent maintenant être effectuées par l'IA (dans un temps beaucoup plus court, probablement en quelques minutes) avec une probabilité de 50 % c'est 4,5 ordres de grandeur depuis 2019, ou une augmentation de 26 000x depuis GPT-2
37