Análise Comparativa para Seleção de Modelos em Aprendizado de Máquina para Auxílio e Estadiamento de Doença de Parkinson
Parkinson; Doença de Parkinson; Aprendizado de máquina; Machine Learning; Inteligência artificial; Estadiamento
Os avanços tecnológicos e descobertas no campo da medicina têm ampliado a expectativa da população mundial. A maior longevidade, no entanto, veio acompanhada de um aumento significativo da frequência de doenças e agravos crônicos. Assim, com o aumento do número de pessoas idosas, aumentou o número de pessoas que estão mais sujeitas ao aparecimento de processos incapacitantes como, por exemplo, transtornos
neurológicos.
De acordo com estudo da Global Burden of Disease , distúrbios neurológicos são atualmente a principal fonte de deficiência em todo o mundo. Ainda de acordo com o instituto, a disfunção que mais cresce, em taxas padronizadas de prevalência, deficiência e mortes por idade, é a Doença de Parkinson (DP) [8, 11].
A DP é um tipo de distúrbio de movimento que pode afetar a capacidade de realizar atividades diárias comuns [3, 13, 14, 24]. É considerada o segundo distúrbio degenerativo mais comum após a Doença de Alzheimer [2, 12, 14, 23, 25] e sua prevalência está aumentando mais rapidamente do que outras doenças neurológicas [3].
Ela é uma doença degenerativa do sistema nervoso central, crônica e progressiva, causada por uma diminuição intensa da produção de dopamina, um neurotransmissor que ajuda na transmissão de mensagens entre as células nervosas.
De 1990 a 2015, o número de indivíduos com DP aumentou globalmente em 118% atingindo 6,2 milhões de pessoas [8, 11]. A incidência da DP aumenta com a idade, com a maioria dos casos ocorrendo após os 50 anos [8, 24] e aumentando acentuadamente por volta dos 65 anos [8]. Ela chega a afetar 3% da população com 65 anos e mais que 5% da população com mais de 85 anos [6]. Diante dessa constatação, é possível afirmar que como o número de indivíduos com mais de 65 anos está aumentando rapidamente, consequentemente, o número de pessoas com DP também está. Em 2040, estima-se que o número de pessoas com DP em todo o mundo deva ultrapassar 13 milhões de indivíduos.
Parkinson é uma das causas mais frequentes de comprometimento físico [4]. Quando os sintomas da doença se tornam mais pronunciados, o paciente apresenta dificuldades motoras[14]. A DP é usualmente diagnosticada clínica e subjetivamente [3,27], onde o médico procura pela presença ou ausência de possíveis sintomas da doença entrevistando o paciente e realizando um exame neurológico detalhado [5, 27]. Apesar
de, até o presente momento, não haver um teste definitivo para Parkinson [2, 25], muitas vezes a doença pode ser identificada por um neurologista geral. Infelizmente, não existem testes biológicos padrões para a doença, como um exame de sangue [25]. No entanto, foram desenvolvidos testes funcionais que levam em consideração particularidades relacionadas à autonomia funcional e atividades da vida cotidiana para criar pontuações, ou uma escala, para avaliação das manifestações motoras.
São utilizadas amostras de comportamentos motores dos indivíduos, coletadas durante a avaliação, para traduzir numericamente o padrão de movimento que está sendo avaliado.
Esses testes procuram identificar possíveis debilidades físicas em pessoas idosas ou que apresentam algum outro fator que possa comprometer o comportamento motor humano e, no contexto da DP, se tornam excelentes ferramentas para o diagnóstico prévio e evolução da doença. São eles: Time Up and Go (TUG), Ten Meter Walk (TMW), 30-s Chair-Stand Test (T30), escala Hoehn e Yahr, Movement Disorder Society-Unified
Parkinson’s Disease Rating Scale (MDS-UPDRS) entre outros. A diversidade e quantidade de testes funcionais se justificam pela facilidade de aplicação, baixo custo e geração de resultados objetivos, sendo o MDS-UPDRS considerado o padrão ouro. A presença dos sintomas motores e, principalmente, das diferentes gradações que
os tremores apresentam (de acordo com o estado de avanço da DP) geram informações passíveis de coleta. Esses dados podem servir como indicadores auxiliares ao diagnóstico desse distúrbio neurológico. Dessa forma, pretende-se alimentar as entradas de classificadores com essas informações e desenvolver uma metodologia baseada em aprendizado de máquina (machine learning) para identificação mais eficiente da DP.
Contribuindo tanto para a literatura, quanto para a medicina na realização de um diagnóstico mais completo, assertivo e menos subjetivo. O aprendizado de máquina tem mostrado grande sucesso na construção de modelos para reconhecimento de padrões em domínios que vão desde visão computacional até o reconhecimento de fala e a compreensão de texto. Além desses domínios clássicos, o machine learning e, em particular, o deep learning (aprendizado profundo) são cada vez mais importantes e bem-sucedidos na engenharia e nas ciências [22, 26]. O foco principal do aprendizado é treinar algoritmos que permitam aos
computadores aprenderem com os dados para descobrir padrões, tomar decisões e fazer previsões a partir desses dados com pouca intervenção humana [19]. Dessa forma, o aprendizado de máquina passou a ser recentemente usado para diagnóstico de doenças médicas devido à sua conveniência de implementação e alta
acurácia [16, 26]. Por conseguinte, algumas soluções envolvendo classificadores e machine learning passaram a ser propostas para auxiliar o diagnóstico da DP. Historicamente, a DP tem sido difícil de quantificar e os médicos tendem a se concentrar em alguns sintomas e ignorar outros, baseando-se principalmente na avaliação subjetiva das escalas [25]. As acurácias médias de diagnósticos clínicos corretos de não especialistassão de 73,8% e a de especialistas em distúrbios de movimento são de 79,6%, sem acompanhamento, e 83,9%, após acompanhamento, com exame patológico post-mortem como verdade fundamental [5, 25]. Até o momento não há um exame ou teste definitivo para detecção da DP, levando os especialistas a discutirem a situação e, às vezes, receitando medicamentos para observar se há ou não resposta. Dessa forma, nota-se o elevado grau de incerteza e a falta de diagnósticos mais específicos.
Levando-se em consideração a estimativa de aumento do número de casos da doença com o passar dos anos, é latente a necessidade de elaborar ferramentas que produzam diagnósticos mais precisos para detecção de Parkinson em estágios mais iniciais da doença, além de poder mapear a evolução dela (estadiamento).
Embora os métodos e análises existentes que abordam o uso de machine learning tenham usado conjuntos de dados diferentes com vários tamanhos de amostra, a visão geral mostra que estudos consideraram poucas modalidades de recursos inconsistentes e relataram a precisão do desempenho por meio de abordagens estatísticas variadas [7]. Devido à baixa divulgação dos métodos utilizados para chegar aos resultados
divulgados na literatura, percebe-se a necessidade de uma avaliação mais sistemática do que foi encontrado em trabalhos semelhantes, apesar de não utilizarem as mesmas características de entrada, e de uma metodologia unificada para avaliação dos resultados em estudos com classificadores. Sabe-se que existem testes mais sofisticados e, como foi observado na revisão bibliográfica, muitas pesquisas se utilizaram de dados de marcha [18, 26, 27], movimentos dos membros superiores [18, 27], sinais de fala [16, 18, 25, 27], movimentos de caligrafia [1], imagens de ressonância magnética [10, 28], expressões faciais [18].
Porém, esse tipo de aquisição torna-se custosa devido à necessidade do uso de equipamentos mais sofisticados (podendo até alterar o movimento natural devido aos sensores acoplados aos indivíduo comprometendo a aquisição dos sinais e dados), bem como espaços controlados e pessoal capacitado para fazer a coleta devida [15]. Existem também testes baseados na neuromelanina [10] que, atualmente, é
considerado o estado da arte para estadiamento da DP. Por se tratar de uma avaliação de imagens de ressonância magnética do cérebro, esses testes se mostram mais promissores, porém apenas são apropriados para determinados cenários. Por exemplo, pacientes em estados avançados não conseguem se manter imóveis por muito tempo para fazer um exame de ressonância. Por esses motivos, quer-se utilizar testes que podem ser executados diariamente, com pouco custo, baixa capacitação do aplicador dos testes, de forma mais rápida e até no próprio ambiente da pessoa acometida, independente do estado de acometimento da
doença. O uso de testes mais simples levanta o questionamento de até onde consegue-se chegar com a questão do estadiamento da DP. Dado que a lentidão dos movimentos e a rigidez são os sintomas mais evidentes da DP [24], e que o diagnóstico clínico é baseado principalmente em características motoras [17], o uso de testes funcionais como o TUG [9, 21, 28], TMW [21], T30[21], etc. mostra-se promissor, por retratarem, via notas e escalas, o nível de mobilidade do indivíduo. Adicionalmente, eles possuem a vantagem de serem não invasivos e de baixo custo. Nota-se que apesar de haver trabalhos de análise automática de Parkinson, esta área ainda é bem incipiente, ainda mais utilizando esses testes como características de entrada. Dessa forma, utilizando o banco de dados proveniente da coleta do Programa de Atividade Física para Pessoas com Doenças Neurodegenerativas (PAFPDN) promovido pelo Programa de Pós-Graduação Stricto Sensu em Educação Física da Faculdade de Educação Física da Universidade de Brasília – PPGEF/FEF/UnB, foi feita uma análise preliminar da possibilidade do uso de machine learning utilizando os testes funcionais
como entradas de características em classificadores, que já se mostraram ferramentas de grande valia na área da ciência e da engenharia para a identificação de padrões. A análise concluiu que foi possível observar que os aspectos funcionais podem auxiliar na predição e no estadiamento da DP [20], porém, a análise feita utilizou-se apenas das técnicas de SVM e RUSBoost. Assim sendo, este trabalho propõe a aplicação, de forma mais sistemática, de diversas técnicas de aprendizado de máquina ao banco de dados do PAFPDN, fazendo
um estudo mais profundo, assim como observando as possíveis relações de determinadas características com a evolução e estados da doença. Após a automatização do processamento de dados, os resultados terão baixo tempo de resposta, auxiliando a diminuição da subjetividade da avaliação das escalas pelo profissional de saúde e, também, podendo ser usado para acompanhar o resultado do tratamento proposto à pessoa
já acometida pela doença. Conjuntamente, haverá o benefício da diminuição de custos com menores demandas de testes laboratoriais para confirmação de diagnósticos de DP. A ideia do estudo visa auxiliar os profissionais de saúde especializados fornecendo um instrumento que assegure diagnósticos e acompanhamentos com melhores acurácias, sensibilidades, especificadas, precisões baseando-se em respostas menos subjetivas obtidas a partir do aprendizado de máquina.