Banca de DEFESA: Guo Ruizhe

Uma banca de DEFESA de MESTRADO foi cadastrada pelo programa.
DISCENTE : Guo Ruizhe
DATA : 31/01/2023
HORA: 15:00
LOCAL: Sala de seminário do CIC e TEAM (Híbrido)
TÍTULO:

Melhorando a qualidade da maquina de tradução Chinês para Português com RoBERTa


PALAVRAS-CHAVES:

Aprendizado Profundo, RoBERTa, Português, NMT, PTMs, Redes Neurais Artificiais 


PÁGINAS: 68
RESUMO:

As mudanças contínuas na época da informação promovem o desenvolvimento do campo da tradução e da tradução automática, acompanhadas pelo surgimento da inteligência artificial, mostrando uma tendência e apresentando próspero desenvolvimento. A tradução automática é um tópico importante no processamento de linguagem natural. A aplicação da tradução automática neural na tradução automática foi revivida e desenvolvida nos últimos anos. Com a introdução de algoritmos de excelência e a melhora da capacidade de processamento dos computadores, a tradução automática neural mostrou-se com grande potencial.

     Existem grandes diferenças na forma e na expressão da linguagem entre o português e o chinês. A comunicação entre o chinês e o português está em fase de desenvolvimento, e os materiais básicos de tradução são muito escassos. O estudo da tradução automática entre chinês e português não só servirá no auxílio às populações de língua chinesa e portuguesa, como também é tema de suma importância para a tradução entre idiomas onde os dados básicos são escassos.

     Esta dissertação apresenta um estudo sobre Tradução Automática Neuronal ( Neural Machine Translation) para o par de línguas Português (PT)-Chinês (ZH) e adiciona as direções de tradução Chinês-Português (Brasil) e Português (Brasil)-Chinês. O objetivo é buscar um modelo mais adequado entre as línguas acima com algoritmos e arquiteturas avançadas, de forma a melhorar o nível atual de tradução chinês-português, bem como o nível de tradução Chinês-Português (Brasil).

     Modelos de tradução de última geração são utilizados na tradução automática chinês-português. O algoritmo RoBERTa é o mais avançado e a estrutura de segmentação mistas de palavras é usado para pré-treinamento, e o BERT é usado para tradução seguinte. No corpus paralelo chinês-português disponível e público, seleciona o Opensubtitles2016 que tem maior quantidade dos dados. E usa BLEU e Rouge-dois indicadores de avaliação que são mais versáteis na tradução automática.

     No final, obtivemos os resultados dos impactos de fatores diferentes na tradução automática chinês-português sob os recursos existentes e um modelo melhor de tradução automática chinês-português, ao mesmo tempo, descobrindo alguns trabalhos efetivos que devem ser feitos no campo da tradução automática chinês-português no futuro.


MEMBROS DA BANCA:
Presidente - 1220587 - LI WEIGANG
Interna - 1713597 - MARISTELA TERTO DE HOLANDA
Externo à Instituição - ZHAO LIANG - USP
Notícia cadastrada em: 06/01/2023 10:50
SIGAA | Secretaria de Tecnologia da Informação - STI - (61) 3107-0102 | Copyright © 2006-2024 - UFRN - app19.sigaa19