Predição de falência em fluxos de dados desbalanceado
Desbalanceamento, Aprendizado de Máquina, Inteligência Artificial, Falência, Dificuldade Financeira
As previsões de falência corporativas são importantes para empresas, investidores e autoridades regulatórias. No entanto, como a maioria dos modelos de previsão de falência em estudos anteriores foram baseados em uma única dimensão de tempo, eles tendem a ignorar as duas principais características de dados de dificuldades financeiras, conjuntos de dados desequilibrados e desvio de conceito do fluxo de dados. Para supera-los, este estudo tenta identificar as técnicas mais adequadas para o tratamento desses problemas em demonstrações financeiras fornecidas trimestralmente a CVM, utilizando um sistema de janelas deslizantes e com mecanismo de esquecimento para evitar a degradação do modelo preditivo. Um experimento empírico foi realizado em uma amostrada de dados coletados do portal de dados abertos da CVM, em um período de 10 anos (2011 a 2020), com 905 corporações distintas, 23.468 registros com 102 indicadores cada, sendo 21.750 de empresas sem dificuldade financeira e 1.718 de empresas com dificuldade financeira. Devido a características do problema, em especial o desbalanceamento, o desempenho do modelo foi medido através de AUC (área sob a curva ROC), G-measure e F-measure.