Estudos indicam que, ao longo dos últimos anos, aumentaram os casos de propagação de discursos de ódio e de notícias falsas. Especialmente no ano de 2022 há uma preocupação muito grande quanto à utilização desses recursos ilegítimos para finalidades eleitorais.
Técnicas analíticas podem ser empregadas para estimular campanhas eleitorais que sigam os preceitos legais e éticos que regem o País, bem como para combater conteúdos inapropriados. Para tanto, algoritmos preditivos podem ser utilizados nos conteúdos encontrados na internet, seja em sites, perfis, jornais, blogs, etc..
O machine learning pode ser aplicado de diversas formas:
-
Identificação de discursos de ódio
As denúncias de outros usuários podem ser um bom ponto de partida para iniciar a investigação de casos de discurso de ódio. O que a maior parte das redes sociais adotam para combater esses discursos é, após uma denúncia de um usuário, avaliar o conteúdo e, se for comprovado tratar-se de algo inapropriado, retirar do ar. Porém, esse processo pode ser oneroso, o que dificulta a sua adoção e, por isso, a automatização visa ao aperfeiçoamento da detecção e classificação de conteúdo.
Nesse sentido, técnicas de mineração textual podem ser empregadas para detecção de palavras-chaves, palavras pejorativas, análise de sentimentos, e classificação. Essas técnicas visariam a tomada de decisão automatizada acerca da retirada do conteúdo, e apenas para casos mais incertos exigiria a derivação para uma decisão manual.
-
Identificação de notícias falsas
Da mesma forma que a detecção de discursos de ódio, no caso de notícias falsas, as denúncias podem ser o ponto de partida na investigação. Com o emprego de mineração textual, os conteúdos são classificados, o que viabiliza a busca automatizada em outros portais que contenham alguma notícia com a mesma classificação daquele conteúdo investigado.
Caso a busca retorne resultados, então inicia-se o processo de verificação: se a informação/evento contido nos outros portais coincide com aquele sob análise ou se diverge. Caso sejam encontrados portais que corroborem e outros portais que contradigam a notícia investigada, então a credibilidade de cada portal poderia ser utilizada como critério de decisão. Nesse caso, a credibilidade poderia ser obtida a partir da quantidade de inconsistências detectadas no passado de cada portal.
-
Combate à propagação de discursos de ódio e notícias falsas
Após identificar os sites que possuem conteúdos inapropriados, é necessário estender a identificação até outras mídias que propagam ou replicam esse tipo de conteúdo.
Para isso, técnicas de redes de relacionamentos podem ser empregadas. Nesse caso, os portais seriam os nós da rede de relacionamento e os links poderiam ser hiperlinks contidos nos portais que direcionam a outras páginas, ou mesmo seguidores em comum.
As medidas de centralidade nessa rede de relacionamento deverão quantificar a importância de um determinado portal na rede a qual ele pertence. Portais poderão ser considerados hub caso direcionem para diversos outros portais relevantes, ou poderão ser considerados Autoridades quando vários portais diferentes apontarem para ele. Nesse caso, um portal que tenha alta medida de Autoridade poderia indicar o ponto de partida de conteúdos inapropriados, uma vez que diversos outros portais o apontam como fonte da informação.
Além disso, é possível identificar os portais envolvidos na propagação de conteúdo inapropriado, por meio da detecção de comunidades em redes de relacionamento. A detecção de comunidade visa particionar uma rede em comunidades menores de forma que os nós (portais) dentro da comunidade sejam mais densamente conectados entre si (referenciando uns aos outros) do que com os portais de comunidades diferentes.
Assim, páginas que estejam disseminando discursos de ódio ou notícias falsas tendem a se conectar mais densamente utilizando umas às outras como fonte da informação, e mais raramente referenciando portais pertencentes a outras comunidades.
- Fonte: ITForum.com.br – Aline Riquetti, customer advisor para o setor público do SAS
- Imagem: Freepik
- 27 de junho de 2022