Une nouvelle approche des contrefactuels dans l'analyse de processus
Présentation d'un cadre pour générer des contrefactuels réalistes sans avoir besoin de connaître en détail le processus.
― 10 min lire
Table des matières
Ces dernières années, le domaine de l'analyse des processus a pris de l'ampleur grâce à sa capacité à prédire les résultats des processus commerciaux. On utilise souvent des modèles avancés qui analysent des données passées pour prévoir des événements futurs. Cependant, ces modèles peuvent être assez complexes, ce qui les rend difficiles à comprendre pour beaucoup de gens.
Une façon intéressante de tirer des enseignements de ces modèles complexes, c'est à travers ce qu'on appelle des Contrefactuels. Les contrefactuels nous aident à répondre à des questions comme : "Et si on avait fait quelque chose différemment ?" Par exemple, si on envoie habituellement des emails aux clients, que se passerait-il si on les appelait à la place ? En explorant ces scénarios "et si", les entreprises peuvent prendre de meilleures décisions et améliorer leurs processus.
Malgré les avantages des contrefactuels, la plupart des méthodes existantes pour les générer ne tiennent souvent pas compte de la manière dont le processus commercial fonctionne réellement. Cela peut mener à des contrefactuels peu réalistes ou impossibles. Certaines méthodes nécessitent beaucoup de connaissances sur le processus spécifique, ce qui peut être un obstacle pour de nombreux utilisateurs.
Dans ce travail, on présente un nouveau cadre qui utilise une approche évolutionnaire pour créer des séquences de contrefactuels sans avoir besoin de connaissances détaillées sur les processus spécifiques. Notre méthode se concentre sur l'apprentissage du comportement des processus, ce qui nous permet d'évaluer si une séquence de contrefactuels est réaliste ou non.
Analyse Prédictive des Processus
L'analyse prédictive des processus est un domaine en croissance qui se concentre sur la prévision des résultats futurs des processus commerciaux en cours. En général, ces prévisions sont faites à l'aide de modèles d'apprentissage automatique. Ces modèles sont entraînés sur des données historiques, appelées journaux d'événements, qui enregistrent les actions passées et leurs résultats.
Dans divers domaines, comme la santé, les modèles prédictifs peuvent fournir des informations précieuses. Par exemple, ils peuvent prédire comment l'état d'un patient pourrait évoluer en fonction de cas passés. Cependant, bien que ces modèles soient puissants, ils sont souvent compliqués, ce qui rend difficile pour beaucoup de gens de voir comment les décisions sont prises. Ce manque de clarté est problématique, surtout dans des situations critiques où savoir pourquoi une décision a été prise est crucial.
Le Rôle des Contrefactuels
Les contrefactuels aident à résoudre le problème de la compréhension des prédictions faites par des modèles complexes. Ils permettent aux utilisateurs d'explorer des résultats potentiels basés sur des changements hypothétiques. Par exemple, en ajustant une partie d'un processus, comme utiliser des appels téléphoniques au lieu d'emails, on peut voir si cela entraîne un résultat différent.
Les approches actuelles pour générer des contrefactuels peuvent être divisées en deux grandes catégories : les méthodes traditionnelles et les méthodes conscientes des processus. Les méthodes traditionnelles fonctionnent souvent avec des données statiques et peuvent négliger le comportement réel des processus. Cela peut mener à des contrefactuels non réalisables. D'un autre côté, les méthodes conscientes des processus tiennent compte de la façon dont les processus devraient idéalement fonctionner, mais elles nécessitent souvent des connaissances spécifiques sur les processus impliqués.
Notre Approche : CREATED
On propose un nouveau cadre appelé CREATED, qui signifie génération de séquences contrefactuelles avec des algorithmes évolutifs sur des données d'événements. Cette approche nous permet de créer des contrefactuels viables sans avoir besoin de connaissances approfondies sur un processus spécifique.
Le cadre CREATED se compose de trois éléments principaux :
Modèle Prédictif : Ce modèle est pré-entraîné pour prédire l'issue d'un processus. Il sert de base pour comprendre la relation entre les actions prises et leurs résultats.
Modèle Génératif : Celui-ci utilise des algorithmes évolutifs pour créer des séquences contrefactuelles. Le modèle génère des changements potentiels en explorant différentes variations du processus original.
Mesure de Viabilité : Cela évalue les contrefactuels générés pour déterminer leur réalisme. Elle évalue des facteurs comme la similarité du contrefactuel avec la séquence originale, s'il inclut des changements significatifs, s'il est faisable et à quel point il modifie le résultat prédit.
Ensemble, ces composants nous permettent de générer des contrefactuels de manière efficace tout en garantissant qu'ils reflètent des modifications réalistes du processus original.
Génération de Contrefactuels
Pour créer des contrefactuels, on s'appuie sur des algorithmes évolutifs. Ces algorithmes simulent la sélection naturelle, où les meilleurs candidats sont choisis pour produire une descendance. L'algorithme commence avec une population de contrefactuels possibles, évalue leur viabilité et sélectionne les meilleurs candidats pour un développement ultérieur.
Le processus de génération implique plusieurs étapes :
- Initialisation : Commencer avec un ensemble de contrefactuels potentiels basés sur des données réelles.
- Évaluation : Évaluer comment ces contrefactuels répondent aux critères définis dans la mesure de viabilité.
- Sélection : Choisir les contrefactuels les plus prometteurs pour des mutations et des croisements supplémentaires.
- Croisement : Combiner des caractéristiques de différents contrefactuels pour créer de nouvelles variations.
- Mutation : Introduire de petits changements pour maintenir la diversité et prévenir la stagnation.
Cette boucle continue jusqu'à ce qu'on atteigne un nombre satisfaisant de contrefactuels viables.
Évaluation de la Viabilité
La viabilité d'une séquence de contrefactuels est cruciale pour son utilité. On mesure la viabilité selon plusieurs critères :
- Similarité : À quel point le contrefactuel ressemble-t-il à la séquence originale ?
- Sparsité : Combien de changements ont été effectués pour créer le contrefactuel ? Moins de changements peuvent indiquer un scénario plus réaliste.
- Faisabilité : Le contrefactuel suit-il le comportement connu du processus ?
- Delta : Combien le contrefactuel modifie-t-il le résultat prédit par rapport à l'original ?
En évaluant les contrefactuels selon ces critères, on peut déterminer lesquels sont réalistes et utiles pour la prise de décision.
Configuration Expérimentale
Pour tester l'efficacité du cadre CREATED, on l'a appliqué à dix journaux d'événements du monde réel provenant de divers processus commerciaux. Les expériences avaient pour but d'évaluer la qualité des contrefactuels générés par rapport aux méthodes de référence existantes.
Expérience 1 : Sélection de Modèle
Dans la première série d'expériences, on a testé différentes combinaisons des composants de l'algorithme évolutif. L'objectif était d'identifier quelles configurations produisaient les meilleurs contrefactuels. Chaque configuration était exécutée pendant un nombre fixe de cycles pour voir comment elles évoluaient avec le temps.
Expérience 2 : Comparaison avec des Références
Dans la deuxième expérience, on a comparé les contrefactuels produits par le cadre CREATED avec ceux générés par des méthodes de référence. Cela incluait la génération aléatoire, des approches basées sur des échantillons, et des méthodes basées sur des cas. On visait à montrer que notre approche évolutionnaire fournit des contrefactuels plus viables.
Expérience 3 : Évaluation Qualitative
L'évaluation finale était axée sur les implications pratiques des contrefactuels. On voulait montrer comment ces contrefactuels pouvaient aider à comprendre les décisions prises par le modèle de prédiction. On a analysé des cas où les contrefactuels pouvaient révéler des informations importantes sur le processus et ses résultats.
Résultats
Dans notre évaluation, on a constaté que le cadre CREATED produisait systématiquement des contrefactuels plus viables que ceux générés par les méthodes traditionnelles et conscientes des processus. L'approche évolutionnaire a permis une plus grande flexibilité et adaptation, menant à des scénarios plus réalistes.
Résultats de l'Expérience 1
Les premières expériences ont montré que certaines configurations de l'algorithme évolutif surpassaient systématiquement les autres. On a identifié quelques configurations clés qui produisaient non seulement des contrefactuels de haute qualité mais aussi qui s'adaptaient bien avec le temps.
Résultats de l'Expérience 2
En comparant avec les modèles de référence, notre approche évolutionnaire a montré des améliorations significatives en termes de viabilité. Les résultats ont indiqué que les contrefactuels générés par CREATED correspondaient étroitement aux séquences originales tout en introduisant des changements réalistes.
Résultats de l'Expérience 3
Dans l'évaluation qualitative, on a démontré que les contrefactuels servaient non seulement d'explications pour les décisions du modèle de prédiction, mais fournissaient aussi des informations exploitables. En ajustant certaines parties du processus, les parties prenantes pouvaient clairement voir comment les résultats pouvaient changer.
Discussion
Nos résultats mettent en évidence le potentiel de l'utilisation d'algorithmes évolutifs pour générer des contrefactuels dans l'analyse des processus commerciaux. La capacité à créer des contrefactuels viables sans avoir besoin de connaissances approfondies sur le domaine est un avantage considérable.
Implications pour les Travaux Futurs
Pour l'avenir, notre approche peut être affinée de plusieurs manières. Un domaine de concentration est l'amélioration de la mesure de viabilité. Actuellement, elle peut être sensible aux spécificités de la longueur de la trace. Des recherches supplémentaires pourraient conduire à des méthodes plus robustes pour évaluer la faisabilité.
De plus, explorer des méthodes pour inclure plus de diversité parmi les contrefactuels générés ajouterait de la valeur. Bien que notre objectif actuel soit d'optimiser la viabilité, comprendre comment différents contrefactuels peuvent fournir des informations variées serait bénéfique.
Conclusion
Le cadre CREATED présente une approche innovante pour générer des séquences contrefactuelles dans le contexte de l'analyse prédictive des processus. En exploitant des algorithmes évolutifs, on peut créer des contrefactuels viables sans avoir besoin de connaissances détaillées sur le processus, rendant cela accessible à un public plus large.
Les résultats d'évaluation positifs démontrent l'efficacité de notre méthode pour produire des contrefactuels de haute qualité. Au fur et à mesure que nous continuons à affiner et à élargir ce travail, le potentiel d'amélioration de la prise de décision dans les processus commerciaux devient de plus en plus évident.
Cette approche aide non seulement à comprendre des modèles de prédiction complexes, mais permet aussi aux utilisateurs d'explorer des stratégies alternatives pour obtenir de meilleurs résultats. En résumé, l'avenir de l'analyse des processus réside dans l'exploitation des capacités des contrefactuels, et notre cadre est bien positionné pour ouvrir la voie.
Titre: CREATED: Generating Viable Counterfactual Sequences for Predictive Process Analytics
Résumé: Predictive process analytics focuses on predicting future states, such as the outcome of running process instances. These techniques often use machine learning models or deep learning models (such as LSTM) to make such predictions. However, these deep models are complex and difficult for users to understand. Counterfactuals answer ``what-if'' questions, which are used to understand the reasoning behind the predictions. For example, what if instead of emailing customers, customers are being called? Would this alternative lead to a different outcome? Current methods to generate counterfactual sequences either do not take the process behavior into account, leading to generating invalid or infeasible counterfactual process instances, or heavily rely on domain knowledge. In this work, we propose a general framework that uses evolutionary methods to generate counterfactual sequences. Our framework does not require domain knowledge. Instead, we propose to train a Markov model to compute the feasibility of generated counterfactual sequences and adapt three other measures (delta in outcome prediction, similarity, and sparsity) to ensure their overall viability. The evaluation shows that we generate viable counterfactual sequences, outperform baseline methods in viability, and yield similar results when compared to the state-of-the-art method that requires domain knowledge.
Auteurs: Olusanmi Hundogan, Xixi Lu, Yupei Du, Hajo A. Reijers
Dernière mise à jour: 2023-03-28 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2303.15844
Source PDF: https://arxiv.org/pdf/2303.15844
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.
Liens de référence
- https://tex.stackexchange.com/questions/596106/about-algorithm-package
- https://www.springer.com/gp/computer-science/lncs
- https://www.springer.com/lncs
- https://en.wikipedia.org/wiki/Hidden_Markov_model#Inference
- https://en.wikipedia.org/wiki/Forward_algorithm
- https://aditya-sengupta.github.io/expository/markovtex.pdf
- https://tex.stackexchange.com/a/89663
- https://doi.org/10.3390/math9212708
- https://en.wikipedia.org/wiki/State-space_representation
- https://youtu.be/rz76gYgxySo?t=546
- https://tex.stackexchange.com/questions/79166/vertical-lines-in-matrix-using-tikz-package