Feil. Kjerneproblemet er ikke kontroll. Det er om universet tillater kraftige teknologier som er vanskelige å forsvare. Ingen mengde justering av systemarbeid vil påvirke det. AI-sikkerhet krever å justere verden generelt, ikke bare systemene. Sikkerhet er *ikke* en systemegenskap Dette poenget er åpenbart, men ser ut til å motarbeides av mange. Jeg har begynt å lure på om årsaken er at selskapene *ønsker* at AI-sikkerhet skal være stort sett et problem med systemene deres. Men det er det rett og slett ikke
Stephen McAleer
Stephen McAleer5. sep., 10:35
Skalerbart tilsyn er stort sett det siste store forskningsproblemet som gjenstår. Når du får en uhackbar belønningsfunksjon for noe, kan du RL på alt.
48,82K