错误。核心问题不是控制。关键在于宇宙是否允许强大且难以防御的技术。无论多少系统对齐的工作都无法影响这一点。AI安全需要在整体上对齐世界,而不仅仅是系统。安全*不是*一个系统属性。 这一点显而易见,但似乎被许多人抵制。我开始怀疑,原因是否在于这些公司*希望*AI安全主要是一个关于他们系统的问题。但事实并非如此。
Stephen McAleer
Stephen McAleer9月5日 10:35
可扩展的监督几乎是最后一个重大研究问题。 一旦你为任何事物获得了一个不可破解的奖励函数,那么你就可以在所有事物上进行强化学习。
48.82K