Fairness Score: uma métrica composta para avaliação de equidade e
desempenho
aprendizado de máquina; dados desbalanceados; equidade algorítmica; métricas de fairness; risco de crédito.
A rápida adoção de técnicas de machine learning em contextos de tomada de decisão crítica intensificou as preocupações sobre viés algorítmico e o dilema entre desempenho preditivo e equidade. Este estudo propõe uma métrica composta, denominada Fairness Score, que integra ambas as dimensões em um único quadro de avaliação. A métrica combina o F1-score, como medida de desempenho preditivo, com três indicadores de equidade: Demographic Parity Ratio, Equalized Odds Ratio e Predictive Rate Parity. Um parâmetro, alpha, de ponderação permite ajustar a importância relativa entre acurácia e equidade de acordo com as prioridades do tomador de decisão. A análise empírica foi conduzida no contexto de previsão de risco de crédito, utilizando uma base de dados de um programa de microcrédito brasileiro, e incluiu a avaliação de modelos de classificação amplamente utilizados, além de estratégias de mitigação de viés nas abordagens de pre-processing, in-processing e post-processing. Os resultados mostram que o Fairness Score fornece uma avaliação equilibrada e consistente, capturando os principais trade-offs entre equidade e desempenho preditivo. Além disso, a métrica demonstrou sensibilidade à aplicação de técnicas de mitigação de viés, refletindo ganhos ou perdas em cada dimensão de forma interpretável. Os achados sugerem que o Fairness Score é uma ferramenta prática e transparente para comparar modelos e intervenções em uma escala comum, contribuindo para o desenvolvimento de sistemas automatizados de decisão mais responsáveis e confiáveis.