Simple Science

La science de pointe expliquée simplement

# Informatique# Bases de données

Détection des anomalies dans les processus métiers : Plongée profonde

Un aperçu de comment la détection d'anomalies améliore l'efficacité des entreprises et identifie les problèmes.

― 7 min lire


Défis de détectionDéfis de détectiond'anomaliesperformance de l'entreprise.Traiter les anomalies pour améliorer la
Table des matières

La Détection d'anomalies, c'est une méthode qui sert à repérer des trucs dans les données qui sont bizarres ou pas normaux. C'est super important pour plein de raisons, comme repérer des fraudes, détecter des problèmes de sécurité ou trouver des défauts dans des systèmes. Dans le monde des affaires, ça peut aider à déceler des soucis dans des processus comme les achats ou les ventes.

Qu'est-ce que la détection d'anomalies ?

La détection d'anomalies cherche des événements ou des points de données qui diffèrent beaucoup de ce qui est attendu. Pour les entreprises, ça veut dire repérer des trucs comme des factures en double, des paiements incorrects ou des modèles étranges dans les données de transaction. En repérant ces irrégularités, les entreprises peuvent régler les soucis avant qu'ils ne deviennent des gros problèmes.

Journaux d'événements centrés sur les objets

Pour analyser les processus d'affaires, les entreprises suivent les événements avec des choses appelées journaux d'événements. Les journaux traditionnels supposent que chaque événement est lié à un seul cas, ce qui peut faire qu'on loupe des infos importantes. Par exemple, quand on regarde les processus d'achat, plusieurs objets comme les bons de commande et les factures sont impliqués. Les journaux d'événements centrés sur les objets permettent de lier des événements à différents objets, ce qui aide à avoir une vue plus claire de ce qui se passe.

Défis de la détection d'anomalies

  1. Complexité des interactions : Dans la vraie vie, plusieurs types d'objets interagissent de manière compliquée. Par exemple, dans un processus d'achat, t'as des demandes d'achat, des commandes et des factures qui fonctionnent ensemble. C'est pas facile de créer des modèles qui représentent bien ces interactions.

  2. Types d'objets divers : Dans un processus d'affaires comme le P2P (achats à paiements), il y a plein de types d'objets différents. Chaque type apporte son lot de comportements et caractéristiques, ce qui complique la recherche d'un terrain d'entente pour l'analyse.

  3. Complexité computationnelle : Avec plus de fonctionnalités et de types d'objets, la complexité des données augmente. Ça peut rendre l'interprétation des résultats compliquée et demander beaucoup de ressources informatiques pour bien analyser.

  4. Limites des méthodes traditionnelles : Les méthodes traditionnelles de détection d'anomalies se concentrent souvent sur un seul aspect, comme le temps ou le flux de contrôle, mais ratent le tableau d'ensemble. Cela peut mener à des conclusions incomplètes ou trompeuses.

Le rôle des connaissances du domaine

Pour améliorer la précision de la détection d'anomalies, intégrer des connaissances du domaine-comprendre le contexte commercial et de processus spécifique-peut être super utile. Cette connaissance peut aider à identifier ce qui est considéré comme un comportement normal et ce qui pourrait indiquer un problème. Cependant, compter uniquement sur ces connaissances peut être compliqué, car ça nécessite des gens qui s'y connaissent dans les processus d'affaires observés.

Méthodologies pour la détection d'anomalies

Différentes méthodologies peuvent être utilisées pour améliorer la détection d'anomalies dans des processus centrés sur les objets. Certaines impliquent des algorithmes qui analysent les données et identifient des modèles étranges. Voici quelques approches courantes :

  1. Utilisation d'oracles : Un oracle peut être un expert humain ou un programme informatique qui évalue les caractéristiques au sein des données pour repérer des anomalies. Cette approche, bien que chronophage, utilise des connaissances pour mettre en avant rapidement des modèles anormaux.

  2. Scorage des anomalies : Cette méthode consiste à utiliser des algorithmes qui attribuent des scores aux objets selon leur comportement. Des scores plus bas indiquent de plus grandes anomalies, permettant aux analystes de se concentrer sur ces objets spécifiques pour une enquête plus approfondie.

  3. Agrégation des fonctionnalités : Rassembler des données de plusieurs fonctionnalités et combiner leurs scores peut aider à identifier quelles fonctionnalités sont les plus anormales. Cette méthode examine comment les différentes fonctionnalités sont liées aux anomalies dans les données.

Applications dans la vie réelle

La détection d'anomalies est utile lorsqu'elle est appliquée aux processus d'affaires réels. Par exemple, dans un cadre d'approvisionnement :

  • Les entreprises peuvent constater que certaines commandes sont créées après la réception des factures, contournant les processus d'approbation. Ce souci, connu sous le nom de "maverick buying", est vraiment préoccupant car il pourrait indiquer un manque de contrôle dans les pratiques d'achat.

  • La post-modification des bons de commande peut entraîner des divergences. Cela se produit lorsque des ajustements sont faits aux commandes approuvées pour correspondre aux factures, ce qui peut mener à des incohérences dans les rapports financiers.

  • Identifier des horodatages en double dans les événements peut mettre en avant des erreurs possibles dans l'enregistrement des données, suggérant des défauts dans le système ou le processus.

Importance de filtrer et traiter les données

Toutes les activités capturées dans les journaux d'événements ne sont pas pertinentes pour la détection d'anomalies. Filtrer les activités non pertinentes aide à réduire la confusion et augmente la concentration sur les données significatives. Cependant, déterminer quelles activités sont pertinentes peut être une tâche complexe en soi. Certaines activités qui semblent mineures pourraient en fait révéler des anomalies critiques.

Le besoin d'amélioration continue

Après une analyse initiale, il est essentiel de continuer à peaufiner l'approche de détection d'anomalies. Par exemple, après avoir identifié des anomalies, les entreprises pourraient avoir besoin de revenir aux journaux d'événements pour s'assurer qu'elles capturent toutes les données pertinentes. S'engager avec des fonctionnalités qui offrent des aperçus plus profonds sur les interactions entre les objets peut aider à clarifier les raisons des anomalies identifiées.

Limitations des techniques actuelles

Bien que des méthodologies pour la détection d'anomalies existent, elles ne sont pas sans limites :

  • Les techniques peuvent nécessiter des ressources computationnelles intensives, ce qui les rend moins adaptées aux petites organisations ou aux processus plus simples.

  • Le besoin de niveaux élevés de connaissances du domaine peut être un obstacle pour des équipes qui ne possèdent pas une grande expérience dans tous les aspects de leurs processus d'affaires.

  • Les résultats des techniques automatisées peuvent être difficiles à interpréter, surtout si les anomalies ne sont pas immédiatement exploitables ou compréhensibles.

Le rôle des grands modèles de langage

Les Grands Modèles de Langage (LLMs) peuvent aider à interpréter les résultats de la détection d'anomalies, apportant une couche d'insight supplémentaire. Ces modèles peuvent analyser des données textuelles des journaux d'événements et fournir des explications sur les modèles observés. Cependant, ils ne sont pas parfaits et peuvent générer des informations non pertinentes ou incohérentes. Les analystes doivent être prudents en s'appuyant sur leurs résultats.

Conclusion

La détection d'anomalies dans les processus d'affaires présente divers défis et opportunités. Comprendre les interactions entre différents types d'objets et appliquer des connaissances du domaine peut améliorer significativement les résultats. Bien qu'il existe plusieurs méthodologies et outils pour soutenir cette démarche, un peaufinement continu et une interprétation critique des résultats sont cruciaux. Combiner une analyse traditionnelle avec des techniques modernes peut mener à de meilleures insights et à des processus plus efficaces, améliorant finalement la performance des entreprises.

Source originale

Titre: Challenges of Anomaly Detection in the Object-Centric Setting: Dimensions and the Role of Domain Knowledge

Résumé: Object-centric event logs, allowing events related to different objects of different object types, represent naturally the execution of business processes, such as ERP (O2C and P2P) and CRM. However, modeling such complex information requires novel process mining techniques and might result in complex sets of constraints. Object-centric anomaly detection exploits both the lifecycle and the interactions between the different objects. Therefore, anomalous patterns are proposed to the user without requiring the definition of object-centric process models. This paper proposes different methodologies for object-centric anomaly detection and discusses the role of domain knowledge for these methodologies. We discuss the advantages and limitations of Large Language Models (LLMs) in the provision of such domain knowledge. Following our experience in a real-life P2P process, we also discuss the role of algorithms (dimensionality reduction+anomaly detection), suggest some pre-processing steps, and discuss the role of feature propagation.

Auteurs: Alessandro Berti, Urszula Jessen, Wil M. P. van der Aalst, Dirk Fahland

Dernière mise à jour: 2024-07-12 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2407.09023

Source PDF: https://arxiv.org/pdf/2407.09023

Licence: https://creativecommons.org/licenses/by-sa/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires