Um algoritmo pode prever o futuro de um político apenas analisando os seus tweets? | Karina Petrova, PsyPost Um novo modelo estatístico conseguiu classificar os membros do Congresso dos EUA em distintos grupos políticos e legislativos com base exclusivamente nos seus padrões de interação na plataforma de redes sociais X. Publicado no Journal of Computational and Graphical Statistics, o estudo também identificou um pequeno número de outliers cujo comportamento online parecia sinalizar ambições para cargos mais altos. Os políticos usam plataformas públicas para comunicar os seus princípios e posições políticas aos eleitores. Para além de declarações formais, muitos também cultivam uma marca pessoal através das suas escolhas de linguagem e estilo. Com uma grande parte da comunicação política a ocorrer agora online, os investigadores têm investigado como os oficiais eleitos se posicionam ao se associarem estrategicamente com outros na sua coalizão. O novo estudo foi conduzido por Benjamin Leinwand, professor assistente de ciências matemáticas no Stevens Institute of Technology, e Vince Lyzinski, professor de matemática na Universidade de Maryland. Eles se especializam em ciência de redes, um campo que analisa as conexões dentro de sistemas complexos. Eles procuraram determinar se um modelo poderia deduzir a estrutura subjacente de uma rede política apenas observando as interações, sem receber qualquer informação sobre afiliações políticas ou a qual câmara do Congresso um membro pertence. Para entender a paisagem social do Congresso, os investigadores precisavam de uma ferramenta que pudesse mapear a complexa teia de interações online. No seu núcleo, qualquer modelo estatístico desse tipo tenta calcular um valor simples para cada par de indivíduos: a probabilidade de que eles se conectem. Isso produz um esboço da rede, mostrando quais conexões são prováveis e quais não são. Alguns modelos de rede amplamente utilizados abordam essa tarefa combinando alguns fatores-chave. Por exemplo, um modelo pode estimar a probabilidade de uma conexão multiplicando a pontuação de "sociabilidade" individual de uma pessoa por uma pontuação que representa quão interativa é o seu grupo. Este método funciona bem em muitos cenários, mas pode falhar em redes com variações extremas. O problema surge em comunidades densamente conectadas onde alguns indivíduos são excepcionalmente ativos. Nesses casos, o modelo pode atribuir pontuações de sociabilidade muito altas a essas pessoas ativas e uma pontuação de interação alta ao seu grupo. Quando essas altas pontuações são multiplicadas, a probabilidade resultante pode exceder 1, ou 100 por cento. Isso é uma impossibilidade matemática que sinaliza que o modelo está falhando em representar com precisão a dinâmica social subjacente. O novo modelo desenvolvido por Leinwand e Lyzinski é construído sobre uma base matemática diferente, especificamente projetada para evitar esse problema. Seus cálculos internos são construídos de uma maneira que garante que a saída final para qualquer par de políticos seja sempre uma probabilidade válida, um número entre 0 e 1. Isso garante que o modelo produza um mapa coerente e lógico da rede, mesmo nas suas regiões mais ativas e complexas. Além de apenas prevenir erros, essa nova abordagem oferece maior flexibilidade. Não assume que os padrões de conexão são os mesmos em toda a rede. Por exemplo, alguns modelos podem assumir implicitamente que os membros mais socialmente ativos de um grupo são os mais propensos a se conectar com os membros mais ativos de outro. O novo modelo, no entanto, pode detectar padrões mais intrincados. Ele poderia, por exemplo, encontrar uma situação onde membros moderados de dois partidos políticos diferentes interagem frequentemente, enquanto os membros mais partidários desses mesmos partidos interagem muito pouco. Também pode reconhecer que a tendência de um indivíduo em formar conexões pode mudar dependendo da comunidade com a qual está interagindo, proporcionando um retrato mais detalhado e realista da comunicação política. Usando este modelo, Leinwand e Lyzinski analisaram a atividade pública de 475 membros do 117º Congresso dos EUA. O seu conjunto de dados incluía todos os membros que postaram pelo menos 100 tweets durante um período de quatro meses, de 9 de fevereiro de 2022 a 9 de junho de 2022. O modelo definiu uma conexão entre quaisquer dois políticos se um deles tweetou ou retweetou o outro durante esse período. "Chamamos duas pessoas de 'conectadas', se uma delas na dupla tweetou para a outra ou retweetou a outra durante este período", explicou Leinwand. O modelo não recebeu qualquer informação sobre o partido de um político, a sua câmara ou as suas posições políticas. Foi encarregado de classificar os 475 indivíduos em grupos com base apenas na teia das suas conexões digitais. O modelo identificou três comunidades principais. Esses grupos definidos algorítmicamente caíram ao longo de linhas políticas familiares. O primeiro grupo era composto quase inteiramente por Senadores. A segunda comunidade consistia principalmente de membros democratas da Câmara dos Representantes, e a terceira era composta em grande parte por membros republicanos da Câmara. A análise mostrou que os políticos dentro desses três grupos tendiam a interagir mais frequentemente com membros da sua própria comunidade. "Os congressistas republicanos conversavam muito entre si, e os congressistas democratas conversavam muito entre si, embora os congressistas democratas fossem um pouco mais propensos a interagir com os senadores do que os seus homólogos republicanos", disse Leinwand. Ele ofereceu uma explicação potencial para esse padrão. Na época da observação, os democratas detinham a maioria no Senado. Como resultado, "pode-se imaginar que os congressistas democratas poderiam ser incentivados a amplificar a mensagem da liderança do Senado, além de seus aliados na Câmara", continuou. ...