Aprendizado Ativo Efetivo e Eficiente para Análise de Imagens em Patologia Utilizando Aprendizado Profundo
Aprendizado Ativo, Patologia Digital, Redes Neurais Convolucionais
Modelos de aprendizado profundo demonstraram notável desempenho em tarefas de seg-
mentação e classificação de imagens de patologia. Entretanto, esses modelos demandam
grandes quantidades de dados anotados para seu treinamento. A geração dessa massa
de dados em patologia é um processo intensivo em mão de obra, comprometendo muitas
horas de trabalho por parte de patologistas experientes. O Aprendizado Ativo, ou Active
Learning (AL), oferece uma abordagem iterativa para a geração dessas bases de dados,
reduzindo o custo das anotações. Nesse trabalho, foi proposta uma nova solução de apren-
dizado ativo, denominada Diversity-Aware Data Acquisition (DADA), e foi avaliada sua
efetividade na classificação baseada em patches de regiões de tecido de histopatologia. O
DADA usa uma lógica de agrupamento que leva em consideração as características das
imagens, extraídas de modelos de aprendizado profundo, e a incerteza preditiva desses
modelos para selecionar exemplos de treinamento significativos. Além de produzir con-
juntos de treinamento reduzidos, os custos de anotação também são diminuídos com
ganhos de tempo de processamento, com o uso de uma solução de simplificação de CNNs
também desenvolvida neste trabalho, o Network Auto-Reduction (NAR). Com o NAR,
tanto o custo de cálculo das incertezas preditivas, quanto de treinamento de modelos, são
fortemente reduzidos. Adicionalmente, para viabilizar a utilização da solução na prática,
uma interface gráfica Web foi adaptada para uso com o DADA. O DADA e o NAR
foram avaliados experimentalmente sobre uma coleção de imagens de tecido cancerígeno
e demonstraram que: (i) são selecionados patches que aceleram o processo de treinamento
ao reduzir o número deles necessários para se atingir um dado nível de Area Under the
Curve (AUC); (ii) com o uso de subpooling o DADA apresenta significativa redução dos
tempos de cada iteração de aquisição; e (iii) a combinação do DADA com NAR traz
os tempos de execução de cada iteração a patamares práticos, mantendo a capacidade
preditiva dos modelos de deep learning alvo. A generalização tanto do DADA quanto
do NAR a outros contextos e aplicações são trabalhos futuros previstos, incluindo áreas
como sensoriamento remoto e problemas de segmentação.