Banca de QUALIFICAÇÃO: MAYARA CHEW MARINHO

Uma banca de QUALIFICAÇÃO de MESTRADO foi cadastrada pelo programa.
DISCENTE : MAYARA CHEW MARINHO
DATA : 25/04/2025
HORA: 09:00
LOCAL: Remoto (https://tinyurl.com/qualiMayara2025)
TÍTULO:

Reconhecimento de Entidades Nomeadas Multilíngue: Um Estudo de Design sobre Documentos Acadêmicos e Institucionais

 


PALAVRAS-CHAVES:

processamento de linguagem natural, reconhecimento de entidades nomeadas, textos multilíngues, modelos de linguagem, grandes modelos de linguagem, transformers, construção de corpus


PÁGINAS: 80
RESUMO:

Documentos acadêmicos e institucionais desempenham um papel importante nas instituições de ensino superior, uma vez que são registros formais das trajetórias acadêmicas dos estudantes, das decisões institucionais e do cumprimento de normas regulatórias. Dada a grande quantidade de documentos produzidos e armazenados ao longo do tempo, o uso de Reconhecimento de Entidades Nomeadas (NER) torna-se uma tarefa essencial de Processamento de Linguagem Natural para extrair informações de textos não estruturados e melhorar os processos de busca nos sistemas eletrônicos de informação dessas instituições. O objetivo do NER é facilitar a compreensão e automatizar processos ao viabilizar a transformação de textos puros em dados estruturados. Documentos acadêmicos brasileiros podem conter termos em mais de um idioma, como nomes de eventos internacionais, atividades de pesquisa e localizações geográficas, o que caracteriza o NER multilíngue. Esta pesquisa de mestrado aborda o NER multilíngue em documentos acadêmicos em cenários que envolvem textos longos, disponibilidade limitada de dados rotulados e presença de entidades de baixa frequência. Diversas abordagens de NER, incluindo métodos clássicos e modelos baseados em LLMs, são comparadas e avaliadas com o uso de métricas quantitativas. A inexistência de corpora de documentos acadêmicos rotulados disponíveis publicamente demandou a criação de corporas multilíngues anotados para NER. Por fim, uma ferramenta de visualização foi proposta para visualizar entidades nomeadas, cinluindo entidades aninhadas, permitindo uma análise visual detalhada dos resultados dos modelos de NER.


MEMBROS DA BANCA:
Presidente - 1279829 - VINICIUS RUELA PEREIRA BORGES
Interno - 3128249 - LUIS PAULO FAINA GARCIA
Interno - 1821656 - THIAGO DE PAULO FALEIROS
Externa à Instituição - NÁDIA FELIX FELIPE DA SILVA - UFG
Notícia cadastrada em: 23/04/2025 10:25
SIGAA | Secretaria de Tecnologia da Informação - STI - (61) 3107-0102 | Copyright © 2006-2025 - UFRN - app17.sigaa17