Incorrecto. El problema central no es el control. Es si el universo permite tecnologías poderosas y difíciles de defender. Ninguna cantidad de trabajo de alineación del sistema afectará eso. La seguridad de la IA requiere alinear el mundo en general, no solo los sistemas. La seguridad *no* es una propiedad del sistema Este punto es obvio, pero parece resistirse a muchos. He comenzado a preguntarme si la razón es que las empresas *quieren* que la seguridad de la IA sea principalmente un problema para sus sistemas. Pero simplemente no lo es
Stephen McAleer
Stephen McAleer5 sept, 10:35
La supervisión escalable es prácticamente el último gran problema de investigación que queda. Una vez que obtenga una función de recompensa imposible de piratear para cualquier cosa, puede RL en todo.
49.15K