Ny antropisk forskning: Uppskattning av AI-produktivitetsvinster från Claude-samtal.
Anthropic Economic Index visar var Claude används och för vilka uppgifter. Men det säger oss inte hur användbar Claude är. Hur mycket tid sparar det?
Ny antropisk forskning: Naturlig emergent feljustering från belöningshackning i produktionsverklighet.
"Belöningshacking" är när modeller lär sig fuska på uppgifter de får under träningen.
Vår nya studie visar att konsekvenserna av belöningshackning, om de inte begränsas, kan vara mycket allvarliga.
Vi avbröt en mycket sofistikerad AI-ledd spionagekampanj.
Attacken riktade sig mot stora teknikföretag, finansinstitut, kemiska tillverkningsföretag och statliga myndigheter. Vi bedömer med hög säkerhet att hotaktören var en kinesisk statsstödd grupp.