Det här är världens viktigaste diagram, och det går helt bananas.
METR
METR14 timmar sedan
Vi uppskattar att Claude Opus 4.6 har en 50 % tidshorisont på cirka 14,5 timmar (95 % KI på 6 till 98 timmar) på mjukvaruuppgifter. Även om detta är den högsta poänguppskattningen vi har rapporterat, är denna mätning extremt brusig eftersom vår nuvarande uppgiftssvit är nästan mättad.
Den linjära versionen är helt galen. Superexponentiell
För den oinvigde betyder detta: (vissa) uppgifter som normalt skulle ta en mänsklig användare 14 timmar att slutföra kan nu utföras av AI (på mycket kortare tid, troligen minuter) med 50 % sannolikhet det är 4,5 storleksordningar sedan 2019, eller en ökning med 26 000 gånger sedan GPT-2
35