Banca de DEFESA: Lucélia Vieira Mota

Uma banca de DEFESA de MESTRADO foi cadastrada pelo programa.
DISCENTE : Lucélia Vieira Mota
DATA : 14/12/2023
HORA: 14:00
LOCAL: MS Teams
TÍTULO:

Reconhecimento de Entidades Nomeadas para Conteúdo Publicado em Diários Oficiais com Base em uma Abordagem de Supervisão Fraca


PALAVRAS-CHAVES:

Reconhecimento de Entidades Nomeadas

Supervisão Fraca

Diário Oficial do Distrito Federal

Processamento de Linguagem Natural

Construção de Conjuntos de dados rotulados


PÁGINAS: 66
RESUMO:

O Reconhecimento de Entidade Nomeada é uma tarefa desafiadora de Processamento de Linguagem Natural, especialmente quando se trata de uma língua tão rica quanto o português. Quando aplicada em um cenário adequado à linguagem formal e a textos oficiais, a tarefa adquire uma nova camada de complexidade, lidando com um contexto léxico particular ao domínio em questão. Neste estudo será apresentado a geração de um corpus anotado de Licitação e Contratação Pública por meio da abordagem de supervisão fraca. Métodos de Supervisão Fraca podem ser utilizados quando grandes quantidades de dados anotados estão indisponíveis, caros para obter ou impraticáveis para anotar manualmente.
Além disso, valida-se o conjunto de dados anotados com um corpora formal anotado por rotulação manual, a fim de avaliar se o corpus gerado do domínio poderia melhorar os algoritmos de Reconhecimento de Entidades Nomeadas. Para isso, realizaram-se experimentos com um modelo Conditional Random Fields, um modelo Bidirecional Long-Short Term Memory com uma camada adicional de redes convolucionais e, posteriormente, realizou-se a aplicação da Supervisão Fraca diretamente a geração do corpus a fim de avaliar se os resultados obtidos iriam melhorar a qualidade de geração do corpus.
Conclui-se que a combinação de Reconhecimento de Entidades Nomeadas e abordagem supervisionada fraca podem alcançar a geração de um corpus com mais qualidade, além reduzir a anotação manual necessários para treinar os modelos de Reconhecimento de Entidades Nomeadas. Em alguns casos, a aplicação da Supervisão Fraca com o Reconhecimento de Entidades Nomeadas e aplicação direta de supervisão ao corpus alcançaram resultados satisfatórios em comparação aos modelos treinados por dados anotados à mão.


MEMBROS DA BANCA:
Presidente - 1821656 - THIAGO DE PAULO FALEIROS
Interno - 3085005 - GERALDO PEREIRA ROCHA FILHO
Interno - 3128249 - LUIS PAULO FAINA GARCIA
Externo à Instituição - ALAN DEMÉTRIUS BARIA VALEJO - UFSCAR
Notícia cadastrada em: 06/12/2023 12:15
SIGAA | Secretaria de Tecnologia da Informação - STI - (61) 3107-0102 | Copyright © 2006-2024 - UFRN - app43_Prod.sigaa37