錯誤。核心問題不是控制。關鍵在於宇宙是否允許強大且難以防禦的技術。無論多少系統對齊的工作都無法影響這一點。AI安全需要在整體上對齊世界,而不僅僅是系統。安全*不是*一個系統屬性。 這一點顯而易見,但似乎被許多人抵制。我開始懷疑,原因是否在於這些公司*希望*AI安全主要是一個關於他們系統的問題。但事實並非如此。
Stephen McAleer
Stephen McAleer9月5日 10:35
可擴展的監督幾乎是最後一個重大研究問題。 一旦你為任何事物獲得了一個不可破解的獎勵函數,那麼你就可以在所有事物上進行強化學習。
49.14K