Uma Solução de Segurança Operacional para a Mobilidade Aérea Urbana com Aprendizado de Reforço Profundo
Mobilidade aérea urbana, Aprendizado de reforço profundo, Resolução de conflitos, Gerenciamento de Tráfego Aéreo.
Aeronaves com propulsão elétrica e com capacidade de efetuar pousos e decolagens na vertical, também conhecidos como eVTOL estão em desenvolvimento por uma série de fabricantes e tem o potencial de revolucionar a mobilidade aérea urbana nos próximos anos. A adoção tende a ser gradual, porém uma vez que um certo nível de maturidade desse tipo de transporte seja atingido, a grande quantidade esperada de aeronaves em voos simultâneos trará desafios para os sistemas de controle de tráfego aéreo. Além disso, estas aeronaves poderão operar sem piloto a bordo. A proposta é de que as aeronaves executem voos em rotas diretas, realizando desvios apenas quando necessário. Portanto é necessário que uma série de sistemas de detecção e resolução de conflitos atuem de forma redundante. Entre eles, está a resolução de tática de conflitos. Isso exige o desenvolvimento de ferramentas específicas para atender o novo cenário, constituído por aeronaves com características de desempenho até então inexistentes. Este trabalho investiga a possibilidade de utilização de modelos de aprendizado de reforço profundo para a solução deste problema. A detecção dos conflitos pode ser efetuada de modo independente, a partir de sistemas embarcados como o ADS-B. Após a fase de treinamento, modelos de aprendizado de reforço profundo são capazes de sugerir ações que permitam alcançar o objetivo desejado mesmo em configurações de conflitos que não tenham sido observadas previamente. Isso faz com que estes modelos sejam adequados à resolução do problema de resolução de conflitos, visto que é inviável executar um treinamento com todos os conflitos possíveis. Um sistema baseado nos modelos Deep Q Network foi utilizado para gerenciamento das trajetórias em caso de detecção de conflito, realizando desvios de rota com o objetivo de solucionar o conflito bem como afastar as aeronaves envolvidas o mínimo necessário de suas trajetórias ideais. Foi implementado um simulador customizado para a realização de testes utilizando diversos agentes de aprendizado de reforço profundo, bem como a comparação com estratégias alternativas. Os resultados indicam que os modelos utilizados são capazes de oferecer manobras capazes de reduzir o número de conflitos sem que as manobras realizadas para os desvios afetem de forma significativa o tempo de deslocamento ou consumo de combustível.