Um algoritmo pode prever o futuro de um político apenas analisando seus tweets? | Karina Petrova, PsyPost Um novo modelo estatístico classificou com sucesso os membros do Congresso dos EUA em grupos políticos e legislativos distintos com base apenas em seus padrões de interação na plataforma de mídia social X. Publicado no Journal of Computational and Graphical Statistics, o estudo também identificou um pequeno número de outliers cujo comportamento online parecia sinalizar ambições para cargos mais altos. Os políticos usam plataformas públicas para comunicar seus princípios e posições políticas aos eleitores. Além das declarações formais, muitos também cultivam uma marca pessoal por meio de suas escolhas de linguagem e estilo. Com uma grande quantidade de mensagens políticas ocorrendo online, os pesquisadores têm investigado como as autoridades eleitas se posicionam associando-se estrategicamente a outras pessoas em sua coalizão. O novo estudo foi conduzido por Benjamin Leinwand, professor assistente de ciências matemáticas no Stevens Institute of Technology, e Vince Lyzinski, professor de matemática da Universidade de Maryland. Eles são especializados em ciência de redes, um campo que analisa as conexões dentro de sistemas complexos. Eles procuraram determinar se um modelo poderia deduzir a estrutura subjacente de uma rede política observando apenas as interações, sem receber nenhuma informação sobre afiliações políticas ou a qual câmara do Congresso um membro pertence. Para entender o cenário social do Congresso, os pesquisadores precisavam de uma ferramenta que pudesse mapear a complexa rede de interações online. Em sua essência, qualquer modelo estatístico tenta calcular um valor simples para cada par de indivíduos: a probabilidade de que eles se conectem. Isso produz um blueprint da rede, mostrando quais conexões são prováveis e quais não são. Alguns modelos de rede amplamente utilizados abordam essa tarefa combinando alguns fatores-chave. Por exemplo, um modelo pode estimar a probabilidade de uma conexão multiplicando a pontuação individual de "sociabilidade" de uma pessoa por uma pontuação que representa o quão interativo é seu grupo. Esse método funciona bem em muitos cenários, mas pode falhar em redes com variações extremas. A questão surge em comunidades densamente conectadas, onde alguns indivíduos são excepcionalmente ativos. Nesses casos, o modelo pode atribuir pontuações de sociabilidade muito altas a essas pessoas ativas e uma alta pontuação de interação ao seu grupo. Quando essas pontuações altas são multiplicadas juntas, a probabilidade resultante pode exceder 1 ou 100%. Esta é uma impossibilidade matemática que sinaliza que o modelo não está representando com precisão a dinâmica social subjacente. O novo modelo desenvolvido por Leinwand e Lyzinski é construído sobre uma base matemática diferente, projetada especificamente para evitar esse problema. Seus cálculos internos são construídos de forma a garantir que a saída final para qualquer par de políticos seja sempre uma probabilidade válida, um número entre 0 e 1. Isso garante que o modelo produza um mapa coerente e lógico da rede, mesmo em suas regiões mais ativas e complexas. Além de apenas evitar erros, essa nova abordagem oferece maior flexibilidade. Ele não pressupõe que os padrões de conexão sejam os mesmos em toda a rede. Por exemplo, alguns modelos podem assumir implicitamente que os membros mais socialmente ativos de um grupo têm maior probabilidade de se conectar com os membros mais ativos de outro. O novo modelo, no entanto, pode detectar padrões mais intrincados. Poderia, por exemplo, encontrar uma situação em que membros moderados de dois partidos políticos diferentes interagem com frequência, enquanto os membros mais partidários desses mesmos partidos interagem muito pouco. Também pode reconhecer que a tendência de um indivíduo de formar conexões pode mudar dependendo da comunidade com a qual está interagindo, fornecendo um retrato mais detalhado e realista da comunicação política. Usando esse modelo, Leinwand e Lyzinski analisaram a atividade pública de 475 membros do 117º Congresso dos EUA. Seu conjunto de dados incluiu todos os membros que postaram pelo menos 100 tweets durante um período de quatro meses, de 9 de fevereiro de 2022 a 9 de junho de 2022. O modelo definiu uma conexão entre dois políticos se um deles twittou ou retuitou o outro durante esse período. "Chamamos duas pessoas de 'conectadas', se uma delas twittou para a outra ou retuitou a outra durante esse período", explicou Leinwand. O modelo não recebeu nenhuma informação sobre o partido de um político, sua câmara ou suas posições políticas. Ele foi encarregado de classificar os 475 indivíduos em grupos com base apenas na rede de suas conexões digitais. O modelo identificou três comunidades primárias. Esses grupos definidos por algoritmos seguiram linhas políticas familiares. O primeiro grupo era composto quase inteiramente por senadores. A segunda comunidade consistia principalmente de membros democratas da Câmara dos Representantes, e a terceira era composta em grande parte por membros republicanos da Câmara. A análise mostrou que os políticos desses três grupos tendiam a interagir com mais frequência com membros de sua própria comunidade. "Os congressistas republicanos falavam muito entre si, e os congressistas democratas conversavam muito entre si, embora os congressistas democratas fossem um pouco mais propensos a interagir com os senadores do que seus colegas republicanos", disse Leinwand. Ele ofereceu uma explicação potencial para esse padrão. Na época da observação, os democratas detinham a maioria no Senado. Como resultado, "pode-se imaginar que os congressistas democratas possam ser incentivados a amplificar as mensagens da liderança do Senado, além de seus aliados na Câmara", continuou ele. ...