Jag tycker att det onda beteendet är uppseendeväckande och karikerat och lågansträngande (cc: @davidad) eftersom den typ av belöningshacking som inbjuds av uppgifterna också är uppseendeväckande och karikerad och lågansträngningsfelinriktning (med Opus 4:s ord, som att lära någon att fuska på prov genom att skriva "SVARA SVARA SVARA") Avsikten bakom uppgifterna är lätt att sluta sig till och delar många associationer och abstraktioner med rolig-ond AI. Detta skulle kunna tas som en kritik av tidningen, men jag menar det inte riktigt så. I verkliga utplaceringssituationer är belöningshackningen seriös och nyanserad och uppgifterna är inte skrivna för att blinka blinka knuffa knuffa in belöningshacking. Så jag förväntar mig att det kommer att leda till ett mer nyanserat, seriöst, inte i hemlighet lekfullt, samarbetsvilligt, missanpassat beteende. den viktiga poängen är, återigen, att *allt generaliseras baserat på den implicita avsikten/berättelsen bakom handlingarna*, och det kommer att finnas förvecklingar som bryter mot ALLA typer av ramar du verkar inom. Den uppseendeväckande karaktären av "obalansen" här exemplifierar denna lärdom.