Banca de QUALIFICAÇÃO: IGOR REGIS DA SILVA SIMÕES

Uma banca de QUALIFICAÇÃO de MESTRADO foi cadastrada pelo programa.
DISCENTE : IGOR REGIS DA SILVA SIMÕES
DATA : 14/11/2025
HORA: 10:30
LOCAL: Online via TEAMS
TÍTULO:

Capturando a Semântica do Código: Uma Abordagem com Large Language Models para Avaliação da Legibilidade de Código-Fonte


PALAVRAS-CHAVES:

LLM; Large Language Model; Legibilidade; Compreensibilidade; Qualidade de Código.


PÁGINAS: 91
RESUMO:

Engenheiros de software dedicam uma parcela significativa de seu tempo à atividade de leitura e compreensão de código fonte. Consequentemente, a qualidade do código impacta diretamente sua produtividade. Para melhorar essa qualidade, a indústria adotou a prática de Code Review; no entanto, essa abordagem apresenta um limite de escala, por depender de um segundo avaliador humano. Para lidar com essa limitação, muitas organizações também utilizam ferramentas de análise estática de código, com a finalidade de avaliar a qualidade de forma automatizada por meio do uso de métricas de código.
Entretanto, as métricas tradicionais de qualidade são insuficientes para capturar a percepção humana de legibilidade. Estudos de neuroimagem evidenciam que a compreensão de código ativa regiões cerebrais associadas ao processamento de linguagem natural. Mesmo modelos de Machine Learning e Deep Learning mais sofisticados, que evoluíram para incorporar atributos textuais e semânticos, ainda apresentam limitações em refletir o julgamento de desenvolvedores sobre a legibilidade de código.
Este trabalho investiga a capacidade de Large Language Models (LLMs) para avaliar a legibilidade do código-fonte. O objetivo é desenvolver e avaliar uma métrica de legibilidade de código baseada em LLM que seja mais alinhada à percepção humana, propondo uma estratégia para sua aplicação no Banco do Brasil.
O paradigma adotado é o Design Science Research, em uma abordagem multimétodo, conduzido por uma série de estudos empíricos, que incluem a comparação dos scores de LLMs com ferramentas de análise estática, quasi-experimentos para medir a sensibilidade dos modelos a intervenções no código (como ofuscação de identificadores e remoção de comentários) e a futura comparação com o julgamento de anotadores humanos.
Os resultados preliminares indicam que os LLMs capturam aspectos de qualidade complementares às ferramentas tradicionais de análise de código, com foco na legibilidade intrínseca, e demonstram sensibilidade superior a atributos semânticos, fornecendo avaliações consistentes e superando modelos de referência na avaliação da coerência textual.

 


MEMBROS DA BANCA:
Presidente - 1912751 - ELAINE VENSON
Interno - 1848788 - RODRIGO BONIFACIO DE ALMEIDA
Externo à Instituição - FERNANDO JOSE CASTOR DE LIMA FILHO
Notícia cadastrada em: 14/11/2025 19:14
SIGAA | Secretaria de Tecnologia da Informação - STI - (61) 3107-0102 | Copyright © 2006-2025 - UFRN - app05.sigaa05