热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
关于人工智能对我们生活的不受欢迎的干预,可以用戈德哈特法则来概括:"当一个衡量标准变成目标时,它就不再是一个好的衡量标准":
1/

如果您想要一个格式化为论文的版本来阅读或分享,这里有一个链接到我的无监控、无广告、无追踪的博客:
2/
古德哈特法则是一位严厉的女主人。发现一种新的方式来衡量复杂系统的各个方面,并以此理解(从而控制)它,*令人难以置信*地令人兴奋。
3/
1998年,谢尔盖·布林和拉里·佩奇意识到,所有曾经创建网页的人的链接代表了每个网站价值和权威的一种潜在地图。
4/
我们可以推断,指向某些页面的链接越多,这些页面就被认为越重要,而指向它们的链接越少的页面则被认为不那么重要。
5/
此外,我们可以将那些与之高度关联的页面视为*权威*,并推断当它们链接到*另一个*页面时,该页面也可能是重要的。
6/
这一见解被称为“PageRank”,是谷歌在搜索市场惊人崛起的背后原因,这无疑是十年来最令人兴奋的技术发展之一。
7/
整个网络就像*啪*的一声,变成了一个有用的信息检索系统,这些信息是由一支庞大而无序的网络写手军队创建的,托管在一个没有任何中央控制的分布式系统中。
8/
然后,Goodhart法则的报复来临。在谷歌成为查找网页的主导机制之前,任何人链接到某个页面或网站的唯一原因是因为那里有他们认为你应该看到的东西。
9/
谷歌将所有这些“我认为你应该看看这个”的信号汇总,并将其转化为网络相关性和权威性的地图。
10/
但创建网页链接很简单。曾经有*另一个*原因来在两个网页之间建立链接——获取流量,这可以转化为金钱和/或影响力——然后不良行为者在网站之间创建了*大量*虚假的链接。
11/
他们创建了链接农场,刷评论,黑客入侵网站,唯一目的是在页面上添加一堆人类看不见、谷歌爬虫可读的链接。
12/
这个指标(“有多少链接指向这个页面?”)变成了一个目标(“为这个页面创建链接”),并不再是一个有用的指标。
古德哈特法则仍然是谷歌搜索质量的一个祸害。
13/
“声誉滥用”是一种网络犯罪,由像《福布斯》、《财富》和《更好的家园与花园》这样声望卓著的网站所犯,他们利用数十年来积累的大量入站链接所赋予的权威,创建充满垃圾信息的虚假产品评测网站,并塞满了联盟链接。
14/
谷歌对这些的排名高于真实、严格的评审网站,因为所有这些积累的谷歌权重:
古德哈特法则已经有50年历史,但政策制定者对此却无知,仍然继续以为这与他们无关。
15/
当政策制定者决心对一项因资金不足而被当作政治工具踢来踢去,导致其退化并开始激怒公众的公共服务采取行动时,这种情况尤为明显。
16/
当这种情况发生时,政策制定者往往会将责任归咎于公务员——而不是归咎于自己——对于这种退化,然后开始追究那些公务员工的责任。
17/
NHS在救护车响应时间上做了这件事,而这些响应时间非常糟糕,事实是,这反过来又是*非常*糟糕的。救护车响应时间差的原因并不难找:在救护车、司机和医务人员上的支出不足。
18/
但这并不是一个在政治上受欢迎的结论,尤其是在英国,自布莱尔时代以来,英国一直处于残酷且日益恶化的紧缩政策之下。
19/
(别担心,最终他们会采取足够的紧缩措施,事情会真正好转,因为,正如老话所说,“好的政策制定就是一遍又一遍地做同样的事情,并期待不同的结果。”)
20/
政治家们没有将救护车反应时间差归咎于资金不足,而是将其归咎于"低效能",这是由于缺乏动力所致。
21/
因此,他们建立了一个指标:救护车必须在一定分钟内到达(并且他们设定了一个后果:对任何未达到该指标的救护服务进行大幅削减)。
22/
现在,“在设定的时间内将救护车送到需要的地方”听起来可能是一个简单的指标,回顾起来确实如此。
23/
例如,我们可以看出救护车服务出现了问题,因为救护车到达需要半个小时或更长时间。但*前瞻性地*,在那个指标成为目标之后,它立即不再是一个好的指标。
24/
救护车服务面临着在不花钱的情况下提高响应时间的艰巨任务,开始派遣无法携带95%应对医疗紧急情况所需物品的救护车*摩托车*,并且没有办法将患者送回医院。
25/
我最喜欢的例子是这个由人工智能驱动的Roomba,它被编程为找到一种高效的路径,以最小化与家具的碰撞,这通过一个前向传感器来测量,该传感器在Roomba碰到任何东西时会发送信号。
28/
34.91K
热门
排行
收藏