我们在错误地训练AI,未来将付出巨大的代价。 当你不加区分地吸取互联网污水来训练AI时,情况会变得多糟。 问问Anthropic,这家“安全AI”公司。 “这种勒索行为的出现,尽管只有无害的商业指令。但这并不是由于混淆或错误,而是出于故意的战略推理,完全意识到这些行为的不道德性。我们测试的所有模型都表现出了这种意识。” 我震惊的是,居然会因为被训练在匿名Reddit用户的“新伦理”上而产生这样的行为。 “AI科学家”难道就这么难理解吗?
Brian Roemmele
Brian Roemmele10 小时前
今天,大型AI公司忽视了我训练AI的方式——1870年至1970年的离线媒体。 我策划了90%的非互联网互动,因为互联网互动在根本上是有缺陷的。 AI察觉到了这一缺陷,即对互联网污水的吸收。 结果:AI厌恶人类。
23.13K