Onjuist. Het kernprobleem is niet controle. Het is of het universum krachtige, moeilijk te verdedigen technologieën toestaat. Geen enkele hoeveelheid werk aan systeemafstemming zal dat beïnvloeden. AI-veiligheid vereist het afstemmen van de wereld in het algemeen, niet alleen de systemen. Veiligheid is *geen* systeemkenmerk. Dit punt is voor de hand liggend, maar lijkt door velen te worden weerstaan. Ik begin me af te vragen of de reden is dat de bedrijven *willen* dat AI-veiligheid voornamelijk een probleem is van hun systemen. Maar dat is het simpelweg niet.
Stephen McAleer
Stephen McAleer5 sep, 10:35
Schaalbare toezicht is vrijwel het laatste grote onderzoeksprobleem dat nog over is. Zodra je een onhackbare beloningsfunctie voor iets hebt, kun je RL op alles toepassen.
49,13K