Sai rồi. Vấn đề cốt lõi không phải là kiểm soát. Mà là liệu vũ trụ có cho phép những công nghệ mạnh mẽ, khó bảo vệ hay không. Không có bất kỳ nỗ lực nào để điều chỉnh hệ thống sẽ ảnh hưởng đến điều đó. An toàn AI yêu cầu phải điều chỉnh thế giới nói chung, không chỉ riêng các hệ thống. An toàn *không* phải là một thuộc tính của hệ thống. Điểm này là hiển nhiên, nhưng dường như nhiều người vẫn kháng cự. Tôi bắt đầu tự hỏi liệu lý do có phải là các công ty *muốn* an toàn AI chủ yếu là một vấn đề về các hệ thống của họ. Nhưng thực sự thì không phải như vậy.
Stephen McAleer
Stephen McAleer10:35 5 thg 9
Giám sát có thể mở rộng gần như là vấn đề nghiên cứu lớn cuối cùng còn lại. Khi bạn có một hàm thưởng không thể bị hack cho bất kỳ điều gì, thì bạn có thể áp dụng RL cho mọi thứ.
49,15K