一個算法能否僅通過分析政治家的推文來預測他們的未來?| Karina Petrova, PsyPost 一個新的統計模型成功地將美國國會的成員根據他們在社交媒體平台X上的互動模式分為不同的政治和立法群體。這項研究發表在《計算與圖形統計學期刊》中,還識別出少數幾個異常值,其在線行為似乎暗示了他們對更高職位的野心。 政治家利用公共平台向選民傳達他們的原則和政策立場。除了正式聲明外,許多人還通過他們的語言和風格選擇來培養個人品牌。隨著大量政治信息現在在線上發生,研究人員一直在調查當選官員如何通過與其聯盟中的其他人進行戰略性聯繫來定位自己。 這項新研究由本傑明·萊因瓦德(Benjamin Leinwand),史蒂文斯科技學院的數學科學助理教授,以及文斯·利津斯基(Vince Lyzinski),馬里蘭大學的數學教授進行。他們專注於網絡科學,這是一個分析複雜系統內部連接的領域。他們試圖確定一個模型是否可以僅通過觀察互動來推斷政治網絡的潛在結構,而不提供任何有關政治隸屬或成員所屬國會議院的信息。 為了理解國會的社會格局,研究人員需要一種工具來繪製出複雜的在線互動網絡。任何這樣的統計模型的核心都是試圖為每對個體計算一個簡單的值:他們將連接的概率。這產生了一個網絡藍圖,顯示哪些連接是可能的,哪些不是。 一些廣泛使用的網絡模型通過結合幾個關鍵因素來接近這項任務。例如,一個模型可能通過將一個人的“社交性”分數與其群體的互動分數相乘來估算連接的概率。這種方法在許多情況下效果良好,但在具有極端變化的網絡中可能會失效。 問題出現在密集連接的社區中,少數個體特別活躍。在這種情況下,模型可能會給這些活躍的人分配非常高的社交性分數,並給他們的群體分配高的互動分數。當這些高分相乘時,結果概率可能超過1或100%。這是一個數學上的不可能,表明模型未能準確表示潛在的社會動態。 萊因瓦德和利津斯基開發的新模型建立在不同的數學基礎上,專門設計用來避免這個問題。它的內部計算以一種方式構建,保證任何一對政治家的最終輸出始終是一個有效的概率,即介於0和1之間的數字。這確保了模型即使在其最活躍和複雜的區域也能生成一致且合邏輯的網絡地圖。 除了防止錯誤,這種新方法還提供了更大的靈活性。它不假設整個網絡中的連接模式是相同的。例如,一些模型可能隱含地假設一個群體中最社交活躍的成員最有可能與另一個群體中最活躍的成員連接。 然而,這個新模型可以檢測到更複雜的模式。它可以找到一種情況,其中兩個不同政黨的中間成員經常互動,而這些政黨中最偏激的成員則互動很少。它還可以識別出個體形成連接的傾向可能會根據他們所互動的社區而改變,提供更詳細和現實的政治交流畫面。 利用這個模型,萊因瓦德和利津斯基分析了475名第117屆美國國會成員的公共活動。他們的數據集包括在2022年2月9日至2022年6月9日的四個月期間內,至少發佈100條推文的每位成員。該模型定義了任何兩位政治家之間的連接,如果其中一位在此期間對另一位進行了推文或轉推。 “我們稱兩個人為‘連接’,如果這對中的任何一位在此期間對另一位推文或轉推,”萊因瓦德解釋道。該模型未提供任何有關政治家的政黨、所屬議院或政策立場的信息。它的任務是僅根據他們的數字連接網絡將475名個體分組。 該模型識別出三個主要社區。這些算法定義的群體沿著熟悉的政治界線劃分。第一組幾乎完全由參議員組成。第二個社區主要由民主黨眾議院成員組成,而第三個則主要由共和黨眾議院成員組成。 分析顯示,這三個群體中的政治家傾向於與自己社區的成員最頻繁地互動。“共和黨國會議員之間的交流非常頻繁,而民主黨國會議員之間的交流也很頻繁,儘管民主黨國會議員與參議員互動的可能性略高於共和黨同行,”萊因瓦德說。 他對這一模式提供了一個潛在的解釋。在觀察時期,民主黨在參議院中佔據了多數。因此,“可以想像,民主黨國會議員可能會受到激勵,除了與眾議院的盟友外,還要放大參議院領導的信息,”他繼續說。 ...