A Deep Learning Expedition Through Remote Sensing's Spatio-Temporal-Spectral Dimensions
sensoriamento remoto, inteligencia artificial, segmentação, aprendizagem profunda.
Dados frequentes e de alta qualidade são um requisito fundamental para construir sistemas de IA eficazes.
O sensoriamento remoto é uma poderosa fonte de dados, especialmente imagens de vista superior capturadas
por voos aéreos, satélites e drones. Esta tese se concentra em três abordagens para processar esses dados: (1)
espacial, considerando imagens de um único ponto no tempo; (2) temporal, analisando séries temporais para
pixels específicos; e (3) espaço-temporal, aproveitando simultaneamente as informações espaciais e temporais.
Apesar dos avanços nessas áreas, ainda há espaço para melhorias.
Esta tese propõe metodologias para avançar em cada uma dessas frentes. Para imagens de um único mo-
mento, o caso mais estudado na visão computacional, introduzimos uma metodologia de anotação esparsa
iterativa, reduzindo significativamente o esforço de rotulagem e acelerando a geração de conjuntos de dados.
Essa metodologia alcançou um IoU 9% menor em comparação com anotações densas, mas exigiu a rotulagem
de apenas 0,014% do total de pixels após cinco rodadas iterativas.
Duas pesquisas distintas abordam objetos diferentes na análise espaço-temporal. A primeira foca em alvos
invariantes no tempo, especificamente parques eólicos offshore, utilizando séries temporais de dados do Sentinel-
1. As séries temporais ajudam a filtrar objetos transitórios, como navios, e os resultados mostram que uma série
de cinco imagens já é suficiente para uma melhoria significativa. O segundo estudo utiliza imagens do PLANET
com quatro bandas espectrais ao longo de 12 meses para investigar depressões cársticas, cujos padrões mudam
ao longo do tempo. A análise considera quatro estágios de desenvolvimento cárstico.
Além disso, esta tese propõe quatro novos estudos: um estudo de séries temporais para determinar a quanti-
dade mínima de informação temporal necessária para classificar culturas, dois estudos de imagens de um único
momento explorando oclusão e segmentação modal com imagens de vista superior e a integração do modelo
Segment Anything (SAM) com sensoriamento remoto, e um estudo espaço-temporal testando modelos 3D para
estabelecer uma base para conjuntos de dados cúbicos.