trolls

“Onde existe uma caixa de comentários (ou uma rede social), existe um troll”. Essa frase é uma verdade universal. Motivos não faltam: qualquer um que participa de um comunidade mais ou menos ativa fica cansado com esses cidadãos que vivem exclusivamente para causar polêmica e destilar reações negativas para os demais.

Muitos blogs e sites usam moderadores, que eliminam e banem as pessoas que violam as boas normas de conduta. O processo pode ser muito árduo e trabalhoso para sites muito populares. Logo, é mais que bem vinda a notícia de um algoritmo que automaticamente detecta e exclui os trolls.

Um grupo de pesquisadores da Universidade de Stanford realizou um estudo financiado pelo Google para alcançar esse objetivo.

 

O perfil do troll de internet

Os pesquisadores analisaram os comentários recebidos durante 18 messes nos sites da CNN, Breitbart e IGN. No total, mais de 40 milhões de comentários, com mais de 100 milhões de votos. Com esses dados, eles encontraram várias similaridades no perfil da maioria dos usuários banidos pelos moderadores desses veículos.

Os trolls que foram banidos não só utilizavam linguagem imprópria, mas também palavras com conotações negativas e sem tom conciliador (não usavam muito os termos “poderia”, “talvez” ou “considerar”). Os pesquisadores garantem que não basta detectar insultos para ser um troll, já que muitos não insultam, e sim usam palavras inventadas em tom depreciativo (exemplo: “macfag”).

Outro parâmetro adotado para detectar um troll é o fato desses comentários receberem mais respostas, mas com menos votos positivos. Trolls também publicam muito mais mensagens que um usuário normal. No caso da CNN, a média de posts por usuário banido é de 264 mensagens, enquanto que um usuário normal não ultrapassa a faixa dos 22 comentários.

650_1200 (2)

Da esquerda para a direita: fração de comentários que são resposta, respostas, volume de posts de usuários banidos contra os usuários normais.

Também é interessante o papel dos moderadores da própria comunidade. De acordo com o estudo, ‘aqueles usuários que acabam banidos não só escrevem os piores comentários com o tempo, mas também a própria comunidade se mostra menos tolerante com eles’.

Os comentários apagados pelos moderadores também são um dos ‘alimentos’ dos trolls. Um usuário que sabe que o seu comentário foi apagado de forma (teoricamente) injusta é mais propenso a baixar a qualidade dos seus posts a outro que, escrevendo de forma similar, não teve o registro apagado.

 

O algoritmo funciona com 80% de exatidão

Avaliando todos esses parâmetros, os responsáveis pelo estudo afirmam que o algoritmo é capaz de detectar um troll (ou usuário que foi banido) com 80% de exatidão, examinando apenas os primeiros cinco comentários do usuário. Porém, eles recomendam subir esse número de comentários para 10, para explorar o algoritmo ao máximo. Eles mesmos reconhecem algumas limitações, já que quanto mais comentários o usuário faz, mais difícil é prever se ele será banido no futuro.

Além disso, os 80% de exatidão significa que um em cada cinco usuários é classificado como ‘troll’, de forma errada, e acabará banido pelo sistema de forma injusta. Os pesquisadores recomendam que uma melhor resposta à esse grupo de internautas é dar pelo menos uma oportunidade deles se redimirem.

Se o troll não aproveitar, aí é expulsar o idiota de vez.

O estudo completo você encontra nesse link (em PDF).

Via Wired