Modelagem Integrada de Violações de Dados: Previsão de Incidentes, Análise de Sobrevivência e Privacidade Diferencial em Séries Temporais
Violações de dados; segurança da informação; modelagem preditiva; análise de sobrevivência; privacidade diferencial; LGPD.
Esta dissertação investiga violações de dados sob a ótica da segurança da informação e da proteção de dados pessoais, articulando previsão temporal, análise de recorrência e privacidade diferencial. Parte-se de uma análise bibliométrica sobre privacidade e segurança cibernética, seguida da exploração da base Data Breach Chronology da Privacy Rights Clearinghouse, com estratificação por setor organizacional. No eixo preditivo, comparam-se modelos estatísticos, de aprendizado de máquina e redes neurais profundas na previsão mensal de incidentes, utilizando métricas como MAPE, MAE e RMSE. Em seguida, aplica-se a Análise de Sobrevivência (Kaplan– Meier) para estimar o tempo até a reincidência por setor, evidenciando perfis diferenciados de risco temporal. Por fim, avalia-se o impacto da privacidade diferencial, por meio do mecanismo de Laplace, em dados tabulares de incidentes sintéticos, quantificando o equilíbrio entre orçamento de privacidade, deslocamento distributivo e perda de acurácia. Os resultados indicam melhor desempenho de redes neurais em séries mais complexas, janelas de recorrência menores em setores críticos e faixas de parâmetros de privacidade que preservam utilidade analítica. Em conjunto, os achados compõem um arcabouço aplicado para apoiar planejamento, definição de SLAs e divulgação responsável de estatísticas em conformidade com a LGPD.