FACTUAL: Uma Solução Baseada em Modelos de Linguagem para o Combate à Desinformação
Inteligência Artificial, Aprendizado de Máquina, Bases de Dados Específicas, Notícias Falsas.
A disseminação de fake news representa um problema significativo no contexto digital, impactando setores tais como saúde pública, democracia e processos sociais. Apesar de avanços na área, ainda existem lacunas importantes, como a ausência de uma categorização abrangente das formas de desinformação e a limitação de modelos capazes de generalizar em diferentes domínios e conjuntos de dados heterogêneos. Diante disso, esta dissertação propõe o FACTUAL (Fake News Analysis with Confidence and Trust Using AI and LLM), um sistema baseado em modelos de linguagem de grande escala (LLMs) para a detecção e mitigação de fake news. O FACTUAL utiliza uma arquitetura integrada que combina processamento assíncrono para escalabilidade, um mecanismo dinâmico de cálculo de confiança adaptado às análises realizadas e uma categorização de desinformação. Como contribuições, a dissertação apresenta um modelo que permite a análise de grandes volumes de dados, calcula dinamicamente o nível de confiança das predições e estrutura a desinformação em categorias específicas para aprimorar o processo de detecção. A avaliação do FACTUAL foi realizada utilizando os datasets FakeBR e Fake News Dataset, complementados por dados coletados em portais de notícias. O sistema foi validado quanto à capacidade de identificar padrões de desinformação e quanto à classificação das notícias em categorias apropriadas. Os resultados evidenciam a funcionalidade do FACTUAL, bem como apontam melhorias necessárias, como o refinamento dos limiares de confiança e o balanceamento das categorias classificadas.