to jest najważniejszy wykres na świecie, a on szaleje jak nigdy dotąd
METR
METR6 godz. temu
Szacujemy, że Claude Opus 4.6 ma 50%-owy horyzont czasowy wynoszący około 14,5 godziny (95% CI od 6 godz. do 98 godz.) w zadaniach związanych z oprogramowaniem. Chociaż jest to najwyższa wartość szacunkowa, jaką zgłosiliśmy, pomiar ten jest niezwykle szumowy, ponieważ nasz obecny zestaw zadań jest niemal nasycony.
liniowa wersja jest całkowicie szalona. superexponential
dla niewtajemniczonych oznacza to: (certainne) zadania, które zwykle zajmowałyby ludzkiemu użytkownikowi 14 godzin, mogą teraz być wykonane przez AI (w znacznie krótszym czasie, prawdopodobnie w minutach) z 50% prawdopodobieństwem to 4,5 rzędu wielkości od 2019 roku, czyli 26 000-krotne zwiększenie od GPT-2
11