Banca de DEFESA: Carlos Alberto Alvares Rocha

Uma banca de DEFESA de MESTRADO foi cadastrada pelo programa.
DISCENTE : Carlos Alberto Alvares Rocha
DATA : 16/03/2023
HORA: 14:00
LOCAL: Plataforma Microsoft Teams
TÍTULO:

Aprendizado Profundo Aplicado a Classificação do Portfólio de Produtos Financeiros


PALAVRAS-CHAVES:

CNN; aprendizado profundo; MCTI; Longformer; classificação de textos longos; LSTM; transferência de aprendizado; Word2Vec


PÁGINAS: 123
RESUMO:

O processamento de linguagem natural (PLN) é uma área da inteligência artificial que vem ganhando bastante atenção nos últimos anos. Os grandes avanços recentes atraíram a atenção do Ministério de Ciência, Tecnologia e Inovações (MCTI) para a execução de um projeto com o objetivo de localizar financiamento internacional para pesquisa e desenvolvimento acessível aos pesquisadores brasileiros. A classificação aparece como um desafio para essa solução devido a ausência de dados rotulados de alta qualidade, que são requisitos para a maioria das implementações estado-da-arte na área. Este trabalho explora diferentes estratégias de aprendizado de máquina para classificar os textos longos, não estruturados e irregulares, obtidos através da raspagem de websites de instituições de financiamento, para, através de uma abordagem incremental, encontrar um método adequado com um bom desempenho. Devido a limitada quantidade de dados disponível para o treinamento supervisionado, foram empregadas soluções de pré-treinamento para aprender o contexto das palavras a partir de outros conjuntos de dados, com grande similaridade e maior tamanho. Em seguida, utilizando as informações adquiridas, foi aplicada uma transferência de aprendizado associada a modelos de aprendizado profundo para aprimorar a compreensão de cada sentença. Para diminuir o impacto da irregularidade dos textos, foram realizados experimentos de pré-processamento para a identificação das melhores técnicas a serem utilizadas para esse tipo de conteúdo. Em comparação com a baseline do trabalho, foi possível alcançar um novo patamar de resultados, excedendo 90% de acurácia em grande parte dos modelos treinados. Destacam-se os modelos Longformer + CNN que atingiu 94% de acurácia com 100% de precisão e o modelo Word2Vec + CNN com 93,55% de acurácia. As descobertas do estudo representam uma aplicação bem-sucedida de inteligência artificial na administração pública. 


MEMBROS DA BANCA:
Externo à Instituição - MARCELO XAVIER GUTERRES - ITA
Interno - 1912898 - DANIEL MAURICIO MUNOZ ARBOLEDA
Presidente - 1220587 - LI WEIGANG
Externo ao Programa - 1586287 - VICTOR RAFAEL REZENDE CELESTINO
Notícia cadastrada em: 24/02/2023 09:46
SIGAA | Secretaria de Tecnologia da Informação - STI - (61) 3107-0102 | Copyright © 2006-2024 - UFRN - app22_Prod.sigaa16