Deep learning e sensoriamento remoto:Empurrando as fronteiras na segmentação de imagens
segmentação semântica, segmentação de instâncias, segmentação panótica,
GIS, sensoriamento remoto, aprendizagem profunda
Resumo
A segmentação de imagens visa simplicar o entendimento de imagens digitais e métodos de
aprendizado profundo usando redes neurais convolucionais permitem a exploração de diferentes
tarefas (e.g., segmentação semântica, instância e panóptica). A segmentação semântica atribui
uma classe a cada pixel em uma imagem, a segmentação de instância classica objetos a nível
de pixel com um identicador exclusivo para cada alvo e a segmentação panóptica combina
instâncias com diferentes planos de fundo. Os dados de sensoriamento remoto são muito ade-
quados para desenvolver novos algoritmos. No entanto, algumas particularidades impedem que o
sensoriamento remoto com imagens orbitais e aéreas cresça quando comparado às imagens tradi-
cionais (e.g., fotos de celulares): (1) as imagens são muito extensas, (2) apresenta características
diferentes (e.g., número de canais e formato de imagem), (3) um grande número de etapas de pré-
processamento e pós-processamento (e.g., extração de quadros e classicação de cenas grandes) e (4) os softwares para rotulagem e treinamento de modelos não são compatíveis. Esta dissertação visa avançar nas três principais categorias de segmentação de imagens. Dentro do domínio de segmentação de instâncias, propusemos três experimentos.
Primeiro, aprimoramos a abordagem
de segmentação de instância baseada em caixa para classicar cenas grandes.Em segundo
lugar, criamos um método sem caixas delimitadoras para alcançar resultados de segmentação
de instâncias usando modelos de segmentação semântica em um cenário com objetos esparsos.
Terceiro, aprimoramos o método anterior para cenas aglomeradas e desenvolvemos o primeiro
estudo considerando aprendizado semissupervisionado usando sensoriamento remoto e dados
GIS. Em seguida, no domínio da segmentação panóptica, apresentamos o primeiro conjunto de
dados de segmentação panóptica de sensoriamento remoto e dispomos de uma metodologia para
conversão de dados GIS no formato COCO. Como nosso primeiro estudo considerou imagens
RGB, estendemos essa abordagem para dados multiespectrais. Porm, melhoramos o método
box-free inicialmente projetado para segmentação de instâncias para a tarefa de segmentação
panóptica.Esta dissertação analisou vários métodos de segmentação e tipos de imagens, e as
soluções desenvolvidas permitem a exploração de novas tarefas , a simplicação da rotulagem
de dados e uma forma simplicada de obter previsões de instância e panópticas usando modelos
simples de segmentação semântica