Salah. Masalah intinya bukanlah kontrol. Ini apakah alam semesta memungkinkan teknologi yang kuat dan sulit dipertahankan. Tidak ada jumlah pekerjaan penyelarasan sistem yang akan memengaruhi itu. Keamanan AI membutuhkan penyelarasan dunia secara umum, bukan hanya sistem. Keamanan *bukan* properti sistem Poin ini jelas, tetapi tampaknya ditentang oleh banyak orang. Saya mulai bertanya-tanya apakah alasannya adalah bahwa perusahaan *menginginkan* keamanan AI sebagian besar menjadi masalah tentang sistem mereka. Tapi itu sama sekali tidak
Stephen McAleer
Stephen McAleer5 Sep, 10.35
Pengawasan yang dapat diskalakan adalah masalah penelitian besar terakhir yang tersisa. Setelah Anda mendapatkan fungsi hadiah yang tidak dapat diretas untuk apa pun maka Anda dapat RL pada semuanya.
49,14K