Classificação de Petições Iniciais no Conselho Nacional do Ministério Público
Aprendizagem de Máquina; Processamento de Linguagem Natural; Classificação de texto; BERT; Petição Inicial
Este trabalho acadêmico propõe a aplicação de técnica de Processamento de Linguagem Natural, baseada em modelo de linguagem BERT, para melhorar o desempenho na classificação de petições iniciais pelo Conselho Nacional do Ministério Público (CNMP). O mérito da proposta reside na resolução dos desafios enfrentados pelo órgão, como a demora e custo associados à análise de documentos diversos, desbalanceamento do número de processos entre as classes processuais e a baixa qualidade dos dados textuais. A ideia principal é avaliar, por meio da implementação de pré-processamento de texto, comparação de técnicas de redução de sequências de texto e abordagens para tratamento do desbalanceamento de dados, os diferentes algoritmos de aprendizado de máquina, medindo os desempenhos e utilizando o melhor modelo para o desenvolvimento de protótipo com interface web para interação com o sistema de classificação. Pretende-se, por fim, avaliar o modelo sob a ótica do usuário, monitorando continuamente seu desempenho e incorporando ajustes baseados em resultados e feedback, demonstrando sua eficácia na otimização dos processos de análise de petições iniciais do órgão no período de uso da ferramenta.