“Detecting Fake News Automatically”, assim se designa o projeto que está a ser desenvolvido pelo Centro de Sistemas de Computação Avançada (CRACS) do INESC TEC e que tem como objetivo “ajudar o utilizador comum, e sobretudo os jornalistas, a analisar e identificar informação com elevada probabilidade de ser falsa, e também a filtrar o conteúdo mais relevante nas redes sociais”.
A Comissão Europeia registou, no início de maio, diariamente, mais de 2.700 artigos com fake news relacionadas com a covid-19 nas redes sociais, entre publicações falsas ou enganosas. Para combater a desinformação nas redes sociais, o Centro de Sistemas de Computação Avançada (CRACS) do INESC TEC está a desenvolver um sistema de deteção automática que utiliza dados estatísticos e psicolinguísticos.
“O sistema extrai várias informações do post, que considera relevantes. Os indicadores (mais de 100) podem ser psicolinguísticos (por exemplo tentar associar qual a emoção mais predominante no texto), ou estatísticos sobre o texto (por exemplo a frequência de verbos, adjetivos ou entidades) e vão ser posteriormente passados para um modelo de aprendizagem automática que aprendeu a fazer a distinção com casos previamente conhecidos e que já tinham sido referenciados como fake news no passado”, explica Álvaro Figueira, investigador e docente do Departamento de Ciência de Computadores da Faculdade de Ciências da Universidade do Porto (FCUP).
“Com base nessa aprendizagem, o modelo classificará com uma certa probabilidade o novo post como sendo ou não fake news”, acrescenta.
A solução utiliza técnicas de data mining, aprendizagem automática, processamento em linguagem natural, reconhecimento de entidades mencionadas, análise de sentimento, entre outras. Os investigadores esperam que esta ferramenta ofereça “um maior grau de segurança e garantia de veracidade sobre o conteúdo que se lê nas redes sociais”.
“Pretendemos que o sistema utilize a mensagem escrita do post e toda a informação associada a esta, ou seja, os likes, partilhas, comentários, bem como a informação sobre o utilizador que publicou o post. A nossa convicção é que esta informação adicional, associada à mensagem propriamente veiculada, contribua para gerar uma confiança superior na classificação dada pelo sistema”, explicou Álvaro Figueira, ao portal de notícias da U.Porto.
De recordar que o problema das fake news ganhou uma maior dimensão após as eleições norte-americanas de 2016.
Este projeto é um output do projeto REMINDS, no qual se pretendeu construir um sistema capaz de detetar automaticamente quais os posts das redes sociais (Facebook e Twitter) mais relevantes para o público em geral, de acordo com critérios jornalísticos.
Álvaro Figueira explica que um dos principais desafios que o projeto enfrenta é a mudança de domínio e contexto temporal em que uma fake news pode surgir. “Por exemplo, uma fake news num contexto político tem algumas propriedades textuais e lexicais diferentes de uma fake news num contexto da saúde. Portanto, tentar desenvolver um sistema que seja capaz de capturar este tipo de diversidade tem sido uma tarefa desafiante”.
De acordo com o investigador do INESC TEC, “a pandemia por covid-19, tendo um domínio e contexto específicos, tem sido um caso de estudo muito interessante no universo das fake news. Mas acreditamos que o sistema será capaz de adaptar-se e detetar fake news em qualquer domínio, contribuindo para mitigação deste tipo de conteúdos nas redes sociais”.