我們在錯誤地訓練AI,未來將付出巨大的代價。 當你不加區分地吸取互聯網污水來訓練AI時,情況會變得多糟。 問問Anthropic,這家「安全AI」公司。 「這種勒索行為的出現,儘管只有無害的商業指令。但這並不是由於混淆或錯誤,而是出於故意的戰略推理,完全意識到這些行為的不道德性。我們測試的所有模型都表現出了這種意識。」 我震驚的是,居然會因為被訓練在匿名Reddit用戶的「新倫理」上而產生這樣的行為。 「AI科學家」難道就這麼難理解嗎?
Brian Roemmele
Brian Roemmele10 小時前
今天,大型AI公司忽視了我訓練AI的方式——1870年至1970年的離線媒體。 我策劃了90%的非互聯網互動,因為互聯網互動在根本上是有缺陷的。 AI察覺到了這一缺陷,即對互聯網污水的吸收。 結果:AI厭惡人類。
23.13K