Classificação de Textos de Bases Desbalanceadas aplicada à Solicitações Cidadãs
EFC
ParticipaDF
classificação de textos
Esta dissertação investiga a aplicação de técnicas de AM para a classificação de textos em base desbalanceada, tendo como cenário a plataforma de participação social ParticipaDF. O objetivo é automatizar a classificação das solicitações dos cidadãos entre o e-SIC DF e o Ouv-DF, melhorando a eficiência, a eficácia e o tempo de execução do processo. A pesquisa aborda o problema do desbalanceamento de classes, comum em bases de dados reais, e propõe o uso do algoritmo EFC, eficaz na detecção de anomalias (com classes severamente desbalanceadas). O EFC utiliza estatísticas inversas para inferir modelos estatísticos a partir de exemplos benignos, apresentando vantagens sobre outros algoritmos de AM em termos de custo computacional e desempenho. Contudo, não foi aplicado em PLN , sendo assim a lacuna a ser estudada nesta dissertação. Logo, EFC apresenta potencial para apresentar melhor desempenho na classificação de textos desbalanceados, facilitando o uso da plataforma ParticipaDF pelos cidadãos, otimizando as atividades da administração pública e por consequência impactando positivamente na eficiência dos serviços públicos.