Errado. O problema central não é o controle. É se o universo permite tecnologias poderosas e difíceis de defender. Nenhuma quantidade de trabalho de alinhamento do sistema afetará isso. A segurança da IA requer alinhar o mundo em geral, não apenas os sistemas. Segurança *não* é uma propriedade do sistema Este ponto é óbvio, mas parece resistido por muitos. Comecei a me perguntar se o motivo é que as empresas *querem* que a segurança da IA seja principalmente um problema em seus sistemas. Mas simplesmente não é
Stephen McAleer
Stephen McAleer5 de set., 10:35
A supervisão escalável é praticamente o último grande problema de pesquisa que resta. Depois de obter uma função de recompensa inviolável para qualquer coisa, você pode RL em tudo.
49,14K