Simple Science

Ciência de ponta explicada de forma simples

# Informática# Aprendizagem de máquinas

Previsão de Falências Bancárias: O Papel das Explicações Contrafactuais

Um olhar sobre como os contra-factuais podem melhorar as previsões de falências bancárias.

― 9 min ler


Contrafactuais emContrafactuais emPrevisões Bancáriasfalências bancárias com precisão.Usando contrafactuais pra prever
Índice

Os bancos são uma parte vital da economia. Se um banco falha, pode causar problemas não só para ele, mas também para outros dentro do sistema. Por causa disso, prever falências bancárias com antecedência é muito importante. Ao longo dos anos, diferentes métodos foram desenvolvidos para prever falências usando vários indicadores financeiros.

Tradicionalmente, um método simples chamado regressão logística tem sido usado como a principal abordagem para prever falências bancárias. Esse método é visto como fácil de entender e bem direto. No entanto, com as relações entre diferentes indicadores financeiros ficando mais complexas, modelos mais avançados e complicados surgiram. Isso inclui árvores de decisão, máquinas de vetor de suporte e modelos de aprendizado profundo. Embora esses modelos tendam a fazer previsões mais precisas, eles geralmente carecem de transparência e são difíceis de interpretar, o que pode ser um problema, especialmente com as regulamentações recentes sobre o uso de dados.

Para resolver essa questão, uma nova abordagem chamada Explicações Contrafactuais foi sugerida. Esse método ajuda a esclarecer como mudanças em indicadores financeiros específicos podem afetar o resultado das previsões, permitindo que os bancos tomem ações para reduzir o risco de falência.

O Desafio de Prever Falências Bancárias

A precisão dos modelos de previsão de falências bancárias é essencial. Como mencionado antes, modelos mais simples, como a regressão logística, oferecem insights claros, mas podem não conseguir capturar relações complexas nos dados. Por outro lado, modelos mais complexos geram previsões melhores, mas são menos interpretáveis. Isso apresenta um desafio para os bancos que tentam usar essas ferramentas avançadas enquanto ainda seguem as regras que exigem que expliquem seus processos de tomada de decisão.

Uma maneira de superar esse desafio é empregando explicações contrafactuais. Essas explicações mostram quais mudanças precisam ser feitas nos indicadores financeiros de um banco para alterar a previsão. Por exemplo, se um banco está previsto para falir, uma explicação contrafactual pode mostrar quais variáveis precisam ser ajustadas para evitar esse resultado. O objetivo então se torna encontrar o melhor método de gerar essas explicações para garantir que sejam úteis e acionáveis.

Explicações Contrafactuais Explicadas

Explicações contrafactuais descrevem o que aconteceria se certos insumos fossem mudados em um modelo. Suponha que um banco está em risco de falência; uma explicação contrafactual destacaria quais indicadores financeiros específicos precisam ser modificados para melhorar as chances do banco. As mudanças devem ser razoáveis, simples e envolver apenas algumas variáveis para garantir que o banco possa implementar as mudanças efetivamente.

Ao gerar contrafactuais, várias qualidades precisam ser consideradas:

  1. Validade - O contrafactual deve refletir mudanças reais que poderiam acontecer nas operações de um banco.
  2. Proximidade - As mudanças sugeridas devem ser próximas à situação atual do banco, tornando-as mais fáceis de implementar.
  3. Esparsidade - Um contrafactual efetivo não deve ser excessivamente complicado. Deve envolver apenas as mudanças necessárias para se manter claro e compreensível.
  4. Plauibilidade - As mudanças sugeridas devem ser realistas e alcançáveis, garantindo que os gerentes de banco confiem nas recomendações.

Avaliação dos Métodos de Geração de Contrafactuais

Existem vários métodos para gerar explicações contrafactuais. Para este estudo, três métodos foram examinados:

  1. Explicações Contrafactuais Multi-Objetivo (MOC) - Este método aborda a geração de contrafactuais como um problema multi-objetivo, visando encontrar o melhor equilíbrio entre validade, proximidade, esparsidade e plausibilidade.

  2. Explicações What-If - Este método encontra observações semelhantes a uma observação-alvo, explicando como diferentes resultados podem surgir com base nas mudanças em variáveis específicas.

  3. Explicações Contrafactuais de Instância Mais Próxima (NICE) - Este método foca em identificar as observações mais próximas de um ponto-alvo e calcular as mudanças necessárias a partir desse ponto.

Esses métodos foram testados contra diferentes estratégias para lidar com desequilíbrios de dados, como técnicas de reamostragem. A reamostragem envolve ajustar o conjunto de dados para garantir uma representação mais equilibrada de bancos falidos e não falidos, já que dados desequilibrados podem levar a previsões imprecisas.

Importância de Lidar com Desequilíbrio de Dados

Dados desequilibrados ocorrem quando uma classe de observações (por exemplo, bancos falidos) é significativamente menor que a outra (por exemplo, bancos não falidos). Isso pode levar a vieses nas previsões feitas por um modelo, tornando essencial abordar essa questão. Várias técnicas, como oversampling e undersampling, visam equilibrar o conjunto de dados.

No entanto, estudos recentes mostraram que esses métodos de reamostragem podem, às vezes, causar mais problemas do que resolver, levando a um desempenho pior do modelo. Portanto, uma abordagem sensível a custos foi proposta como uma alternativa melhor. Esse método considera a importância de cada classe durante o treinamento, permitindo que o modelo preste mais atenção à classe minoritária, melhorando assim a precisão da previsão.

Construindo Modelos Precisos para Previsão de Falências Bancárias

Neste estudo, modelos preditivos baseados em árvores, como árvores de decisão, florestas aleatórias e extra trees, foram empregados para prever falências bancárias. Cada tipo de modelo tem suas forças, e usar múltiplos modelos ajuda a capturar uma gama mais ampla de padrões de dados.

A eficácia desses modelos foi testada em conjuntos de dados tanto dentro da amostra quanto fora da amostra. Os dados dentro da amostra usaram informações históricas para treinar os modelos, enquanto os dados fora da amostra serviram como um novo conjunto de dados para testar as previsões dos modelos. Essa abordagem visou garantir que os modelos se saíssem bem em aplicações do mundo real.

O desempenho dos modelos foi medido usando precisão e a pontuação F1, uma métrica que leva em conta tanto a precisão quanto a recuperação, tornando-a ideal para avaliar cenários de dados desequilibrados.

Resultados do Estudo

Os achados dos modelos indicaram que aqueles treinados em conjuntos de dados originais e aqueles que utilizam a abordagem sensível a custos superaram outros em termos de precisão e confiabilidade. Por exemplo, o modelo extra trees mostrou desempenho superior na maioria dos testes, fornecendo maior precisão e melhores pontuações F1 em comparação com modelos mais simples.

Além disso, os modelos demonstraram uma preferência por certos grupos de preditores, com combinações específicas de indicadores financeiros se mostrando mais eficazes na previsão de falências bancárias. O Preditivo II consistentemente rendeu os melhores resultados em várias técnicas de modelagem.

O estudo também revelou a importância de explicações contrafactuais de qualidade. Os métodos MOC e NICE forneceram explicações de alta qualidade, sendo que o NICE se destacou em termos de proximidade e esparsidade. Esses dois métodos ajudaram a garantir que as explicações geradas para os bancos em risco de falência fossem acionáveis e fáceis de interpretar.

Aplicações Contrafactuais na Prática

Para ilustrar a aplicação real de explicações contrafactuais, o estudo examinou dois bancos hipotéticos que foram previstos para falir. Para cada banco, contrafactuais foram gerados, demonstrando ações específicas necessárias para mudar seus resultados previstos.

Para o Banco A, apenas um contrafactual foi gerado. Ele sugeriu diminuir a margem líquida de juros enquanto aumentava certas razões de capital. Em contraste, o Banco B teve vários contrafactuais, indicando várias maneiras de reduzir o risco de falência ajustando diferentes indicadores financeiros.

Essa flexibilidade nos contrafactuais permite que os gerentes de banco tomem decisões informadas com base em vários cenários. Eles podem escolher as opções mais viáveis, considerando suas circunstâncias, refletindo tanto a dinâmica do ambiente bancário quanto a situação única do banco.

Implicações para o Setor Bancário

Os resultados deste estudo destacam a importância de desenvolver modelos de previsão de falências bancárias que sejam confiáveis e interpretáveis. À medida que os reguladores enfatizam a transparência na modelagem, incorporar explicações contrafactuais permite que os bancos atendam aos padrões de conformidade e forneçam justificativas para suas previsões.

A capacidade de gerar insights acionáveis por meio de contrafactuais não só melhora a confiabilidade do modelo, mas também capacita os bancos a tomar medidas proativas para evitar falências. Isso poderia levar a uma maior estabilidade financeira dentro do setor bancário e uma economia mais resiliente.

Conclusão

Em resumo, o estudo enfatiza o grande potencial das explicações contrafactuais na previsão de falências bancárias. Ao empregar técnicas avançadas de aprendizado de máquina junto com métodos eficazes de geração de contrafactuais, os bancos podem aumentar sua precisão preditiva enquanto mantêm conformidade com os requisitos regulatórios.

Este estudo também sublinha a necessidade de continuar a pesquisa no desenvolvimento e aprimoramento de métodos de explicação contrafactual. A exploração adicional de como essas explicações podem ajudar os bancos a tomar decisões informadas levará, em última análise, a melhores resultados para as instituições financeiras e para a economia como um todo.

Direções para Pesquisas Futuras

Estudos futuros poderiam explorar vários caminhos, incluindo:

  1. Testando Diferentes Modelos de Aprendizado de Máquina - Embora este estudo tenha se concentrado em modelos baseados em árvore, incorporar outros tipos de modelos poderia fornecer insights adicionais e validação das descobertas.

  2. Estudos Longitudinais - Examinar mudanças no desempenho dos bancos ao longo do tempo poderia ajudar a entender mais profundamente a eficácia das recomendações contrafactuais.

  3. Investigar Mais Técnicas de Desequilíbrio de Dados - Mais pesquisa é necessária para avaliar os impactos de várias técnicas no desempenho preditivo, especialmente em uma indústria altamente regulada como a bancária.

  4. Colaboração com Instituições Bancárias - A implementação no mundo real das descobertas e estratégias pode fornecer feedback valioso para refinar abordagens e contribuir para as práticas do setor.

Ao expandir a pesquisa nessas áreas, o setor bancário pode melhorar continuamente sua capacidade de prever falências e proteger sua estabilidade em um cenário econômico em constante mudança.

Fonte original

Título: Explainable bank failure prediction models: Counterfactual explanations to reduce the failure risk

Resumo: The accuracy and understandability of bank failure prediction models are crucial. While interpretable models like logistic regression are favored for their explainability, complex models such as random forest, support vector machines, and deep learning offer higher predictive performance but lower explainability. These models, known as black boxes, make it difficult to derive actionable insights. To address this challenge, using counterfactual explanations is suggested. These explanations demonstrate how changes in input variables can alter the model output and suggest ways to mitigate bank failure risk. The key challenge lies in selecting the most effective method for generating useful counterfactuals, which should demonstrate validity, proximity, sparsity, and plausibility. The paper evaluates several counterfactual generation methods: WhatIf, Multi Objective, and Nearest Instance Counterfactual Explanation, and also explores resampling methods like undersampling, oversampling, SMOTE, and the cost sensitive approach to address data imbalance in bank failure prediction in the US. The results indicate that the Nearest Instance Counterfactual Explanation method yields higher quality counterfactual explanations, mainly using the cost sensitive approach. Overall, the Multi Objective Counterfactual and Nearest Instance Counterfactual Explanation methods outperform others regarding validity, proximity, and sparsity metrics, with the cost sensitive approach providing the most desirable counterfactual explanations. These findings highlight the variability in the performance of counterfactual generation methods across different balancing strategies and machine learning models, offering valuable strategies to enhance the utility of black box bank failure prediction models.

Autores: Seyma Gunonu, Gizem Altun, Mustafa Cavus

Última atualização: 2024-07-21 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2407.11089

Fonte PDF: https://arxiv.org/pdf/2407.11089

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes