Orätt. Kärnproblemet är inte kontroll. Det handlar om huruvida universum tillåter kraftfull, svårförsvarad teknik. Ingen mängd arbete med anpassning av systemet kommer att påverka det. AI-säkerhet kräver att man anpassar världen i allmänhet, inte bara systemen. Säkerhet är *inte* en systemegenskap Denna punkt är uppenbar, men verkar motarbetas av många. Jag har börjat undra om det beror på att företagen *vill* att AI-säkerhet mest ska vara ett problem i deras system. Men det är helt enkelt inte
Stephen McAleer
Stephen McAleer5 sep. 10:35
Skalbar tillsyn är i stort sett det sista stora forskningsproblemet som finns kvar. När du väl har fått en ohackbar belöningsfunktion för vad som helst så kan du RL på allt.
49,14K