Kan en algoritm förutsäga en politikers framtid bara genom att analysera deras tweets? | Karina Petrova, PsyPost En ny statistisk modell har framgångsrikt sorterat medlemmar av den amerikanska kongressen i distinkta politiska och lagstiftande grupper enbart baserat på deras interaktionsmönster på den sociala medieplattformen X. Studien, som publicerades i Journal of Computational and Graphical Statistics, identifierade också ett litet antal avvikare vars beteende på nätet verkade signalera ambitioner för högre ämbeten. Politiker använder offentliga plattformar för att kommunicera sina principer och politiska ställningstaganden till väljarna. Utöver formella uttalanden odlar många också ett personligt varumärke genom sina val av språk och stil. Med en stor mängd politiska budskap som nu sker på nätet har forskare undersökt hur valda tjänstemän positionerar sig själva genom att strategiskt associera sig med andra i sin koalition. Den nya studien genomfördes av Benjamin Leinwand, biträdande professor i matematiska vetenskaper vid Stevens Institute of Technology, och Vince Lyzinski, matematikprofessor vid University of Maryland. De är specialiserade på nätverksvetenskap, ett område som analyserar sambanden inom komplexa system. De försökte avgöra om en modell kunde härleda den underliggande strukturen i ett politiskt nätverk genom att endast observera interaktionerna, utan att få någon information om politisk tillhörighet eller vilken kammare i kongressen en medlem tillhör. För att förstå kongressens sociala landskap behövde forskarna ett verktyg som kunde kartlägga det komplexa nätet av online-interaktioner. I grund och botten försöker en sådan statistisk modell beräkna ett enkelt värde för varje par av individer: sannolikheten att de kommer att ansluta. Detta skapar en skiss över nätverket som visar vilka anslutningar som är sannolika och vilka som inte är det. Vissa allmänt använda nätverksmodeller närmar sig denna uppgift genom att kombinera några viktiga faktorer. En modell kan till exempel uppskatta sannolikheten för en anslutning genom att multiplicera en persons individuella "sällskaplighetspoäng" med en poäng som representerar hur interaktiv deras grupp är. Den här metoden fungerar bra i många scenarier, men den kan brytas ner i nätverk med extrema variationer. Problemet uppstår i tätt sammankopplade samhällen där ett fåtal individer är exceptionellt aktiva. I sådana fall kan modellen tilldela mycket höga sällskaplighetspoäng till dessa aktiva personer och en hög interaktionspoäng till deras grupp. När dessa höga poäng multipliceras ihop kan den resulterande sannolikheten överstiga 1 eller 100 procent. Detta är en matematisk omöjlighet som signalerar att modellen misslyckas med att korrekt representera den underliggande sociala dynamiken. Den nya modellen som utvecklats av Leinwand och Lyzinski bygger på en annan matematisk grund som är särskilt utformad för att undvika detta problem. Dess interna beräkningar är konstruerade på ett sätt som garanterar att slutresultatet för ett par politiker alltid är en giltig sannolikhet, ett tal mellan 0 och 1. Detta säkerställer att modellen producerar en sammanhängande och logisk karta över nätverket, även i dess mest aktiva och komplexa regioner. Utöver att bara förhindra fel erbjuder detta nya tillvägagångssätt större flexibilitet. Det förutsätter inte att anslutningsmönstren är desamma i hela nätverket. Vissa modeller kan till exempel implicit anta att de mest socialt aktiva medlemmarna i en grupp är mest benägna att ansluta till de mest aktiva medlemmarna i en annan. Den nya modellen kan dock upptäcka mer intrikata mönster. Det skulle till exempel kunna uppstå en situation där moderata medlemmar från två olika politiska partier ofta interagerar, medan de mest partipolitiska medlemmarna i samma partier interagerar mycket lite. Den kan också känna igen att en individs tendens att skapa kontakter kan förändras beroende på vilket samhälle de interagerar med, vilket ger en mer detaljerad och realistisk bild av politisk kommunikation. Med hjälp av denna modell analyserade Leinwand och Lyzinski den offentliga aktiviteten hos 475 medlemmar i den 117:e amerikanska kongressen. Deras dataset inkluderade alla medlemmar som postade minst 100 tweets under en fyramånadersperiod, från den 9 februari 2022 till den 9 juni 2022. Modellen definierade en koppling mellan två politiker om en av dem twittrade till eller retweetade den andra under denna tidsram. "Vi kallar två personer 'anslutna', om någon av dem i paret twittrade till den andra eller retweetade den andra under denna period", förklarade Leinwand. Modellen försågs inte med någon information om en politikers parti, deras kammare eller deras politiska ståndpunkter. Den hade till uppgift att sortera de 475 individerna i grupper enbart baserat på nätet av deras digitala kontakter. Modellen identifierade tre primära samhällen. Dessa algoritmiskt definierade grupper föll längs välbekanta politiska linjer. Den första gruppen bestod nästan uteslutande av senatorer. Den andra gruppen bestod huvudsakligen av demokratiska ledamöter av representanthuset, och den tredje bestod till stor del av republikanska ledamöter av representanthuset. Analysen visade att politiker inom dessa tre grupper tenderade att interagera mest frekvent med medlemmar av det egna samhället. "Republikanska kongressledamöter pratade mycket sinsemellan, och demokratiska kongressledamöter pratade mycket sinsemellan, även om demokratiska kongressledamöter var något mer benägna att interagera med senatorer än sina republikanska motsvarigheter", säger Leinwand. Han erbjöd en möjlig förklaring till detta mönster. Vid tidpunkten för observationen hade Demokraterna majoritet i senaten. Som ett resultat av detta "kan man föreställa sig att demokratiska kongressledamöter kan uppmuntras att förstärka senatens ledarskapsbudskap utöver sina allierade i representanthuset", fortsatte han. ...