DApp-butik | Web3-hubb för evenemang och spel

Trendande ämnen

Komplexitetsstraff innebär att den optimala strategin för ett visst spel inte kan ha obegränsat rekursionsdjup om det inte antingen är optimerat för tail-call eller producerar exponentiella belöningar. Varje rekursiv delning lägger till minst en bit komplexitet i en strategis tidsutrullade modell.

De flesta spelteorier jag har sett brottas inte med konsekvenserna av detta. Det är en annan gräns än bara beräkningskostnad. Kostnaden för beräkningen kan prissättas lokalt, men komplexiteten är en global gräns. Sammanhanget är viktigt.

(Om du känner till spelteori med tanke på spelarens tidsbegränsade beteende som en modell vars noggrannhet och komplexitet måste balanseras, låt mig veta! Jag har letat och inte hittat, men det betyder inte att jag använde rätt sökord...)

Detta säger att den optimala strategin för en spelare bestäms i förhållande till spelarens självmodell. Om du modellerar dig själv som att välja btwn två alternativ under ett visst villkor, växer det utrullade trädet. Men om du avrundar det till noll får trädet ingen ny gren.

I själva verket finns det en "beslutsbudget". Om du lägger till mer detaljerade beslut här innebär det att du måste fatta mindre detaljerade beslut någon annanstans. Inte mindre beräkning, men färre beslut. Eller uttryckt på ett annat sätt, detta är komplexitetskostnaden för outnyttjade optioner.

Motsvarigheten till "billigare beräkning" här är "bättre bakgrundsinställningar". Hur många beslut du fattar är skillnaden mellan ditt beteende baserat på tillståndet i det här ögonblicket, jämfört med ditt beteende om det var (din modell av) det genomsnittliga ögonblicket av upplevelse. Goda vanor!

Det här är ungefär som en spegel av allmän kunskap ... Det är vanliga åtgärder. En agents vanemässiga tidigare handlingar begränsar dess framtida optimala handlingar. Vilket betyder, i någon mening, att bara vanligtvis-agera-på något sätt är ett trovärdigt förhandsåtagande att fortsätta den underförstådda strategin.

Såvida inte spelaren agerar bedrägligt – betalar en förvånansvärt hög komplexitetskostnad för att modellera sig själv som vanligtvis agerar på ett annat sätt, för att behålla en annan bakgrund tidigare, eftersom de förväntar sig vinst genom att förråda dem som blir lurade senare.

Optimala strategier är robust optimala. En optimal strategi med högre förväntad avkastning som leder till ruin är inte optimal. Robusthet bygger på enkelhet, vilket är relativt till teorin om sinnet om både självet, den andre och det kollektiva "vi".

Dessa regler om optimala beslut under osäkerhet är inte förslag, de är lagar på samma sätt som Bayesianska uppdateringar är. Det du vet om dig själv är kausal över din optimala strategi, och det finns en oundviklig komplexitetskostnad för bedrägeri som binder självmodellen till verkligheten.

4,33K

Topp

Rankning

Favoriter

Trendande på kedjan

Trendande på X

Senaste toppfinansieringarna

Mest anmärkningsvärda