Tämä on maailman tärkein lista, ja se menee täysin sekaisin
METR
METR16 tuntia sitten
Arvioimme, että Claude Opus 4.6:n 50 % aikahorisontti on noin 14,5 tuntia (95 % CI 6 tunnista 98 tuntiin) ohjelmistotehtävissä. Vaikka tämä on korkein arvio, jonka olemme raportoineet, mittaus on erittäin meluisa, koska nykyinen tehtäväkokonaisuutemme on lähes kyllästynyt.
Lineaarinen versio on täysin järjetön. Supereksponentiaalinen
Niille, jotka eivät ole perehtyneet, tämä tarkoittaa: (tietyt) tehtävät, jotka normaalisti veisivät ihmiskäyttäjältä 14 tuntia, voidaan nyt suorittaa tekoälyllä (paljon lyhyemmässä ajassa, todennäköisesti minuuteissa) 50 % todennäköisyydellä se on 4,5 kertaluokkaa vuodesta 2019 tai 26 000-kertainen kasvu GPT-2:sta
42