Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Computerwissenschaften# Maschinelles Lernen

Maschinelles Lernen zur Erkennung von Beschaffungsbetrug nutzen

Diese Studie untersucht, wie effektiv maschinelles Lernen bei der Identifizierung von Beschaffungsbetrug ist.

― 8 min Lesedauer


Betrugserkennung mitBetrugserkennung mitmaschinellem Lernenden Kampf gegen Beschaffungsbetrug.Maschinelles Lernen verbessert effektiv
Inhaltsverzeichnis

Beschaffungsbetrug ist ein grosses Problem, das viele Unternehmen in freien Märkten betrifft. Bei diesem Verbrechen handelt es sich um täuschende Handlungen von Einzelpersonen oder Gruppen innerhalb von Organisationen, um sich durch Beschaffungsprozesse unfaire Vorteile zu verschaffen. Obwohl Unternehmen Prüfungsabteilungen haben, um solchen Betrug zu erkennen, verlassen sie sich oft stark auf Berichte von Insidern, was es schwierig macht, die Situation effektiv zu managen.

Mit der Kooperation eines Unternehmens namens SF Express hat unser Team die Beschaffungsdaten von 2015 bis 2017 untersucht, um herauszufinden, wie Machine-Learning-Techniken helfen könnten, Beschaffungsbetrug zu erkennen und zu klassifizieren. Wir haben uns darauf konzentriert, Modelle zu erstellen, die spezifische Merkmale von Beschaffungsereignissen nutzen, um verdächtige Transaktionen zu identifizieren. Indem wir unsere Modelle an einem grossen Datensatz getestet haben, haben wir herausgefunden, dass sie nützlich sind, um Beschaffungsbetrug zu erkennen, obwohl es Verbesserungsbedarf gibt.

Was ist Beschaffungsbetrug?

Beschaffungsbetrug, oft auch als Vertragsbetrug bezeichnet, ist als häufiges und teures Verbrechen innerhalb von Organisationen bekannt. Er beinhaltet absichtliche Täuschungen, um Vorteile bei Beschaffungssituationen zu erlangen. Einige Beispiele sind Absprache zwischen Lieferanten und Mitarbeitern des Unternehmens, Bestechung und die Schaffung gefälschter Transaktionen. Diese Aktionen können für Unternehmen und Regierungsbehörden zu erheblichen finanziellen Verlusten führen.

Unternehmen und Regierungsbehörden auf der ganzen Welt sehen sich schon lange Herausforderungen in Bezug auf Beschaffungsbetrug gegenüber. Beispiele für diese Probleme sind Absprachen zwischen Bietern, Bestechung und falsifizierte Transaktionen. Solche Aktivitäten können grossen finanziellen Schaden für Organisationen verursachen, die Produkte und Dienstleistungen zu den bestmöglichen Preisen erwerben möchten.

Trotz der Ernsthaftigkeit von Beschaffungsbetrug verlassen sich viele Prüfungsabteilungen immer noch auf traditionelle Methoden wie das Überprüfen von Berichten und Prüfungsunterlagen, die möglicherweise nicht effektiv genug sind. In Gesprächen mit SF Express haben wir erfahren, dass selbst dieses grosse Express-Logistikunternehmen nicht in der Lage ist, proaktive Betrugsprüfungen durchzuführen, was kleinere Unternehmen umso anfälliger macht.

Der Bedarf an Machine Learning bei der Erkennung von Beschaffungsbetrug

Das zunehmende Volumen und die Komplexität der Beschaffungsprozesse machen es für Prüfungsabteilungen schwierig, alles manuell im Blick zu behalten. Machine Learning könnte eine Lösung bieten, indem es grosse Datenmengen verarbeitet und Muster sowie Beziehungen zwischen verschiedenen Beschaffungsschritten und -elementen identifiziert.

Machine Learning erlaubt es, Beschaffungsbetrug effizienter zu erkennen, indem Algorithmen die Daten analysieren. In dieser Forschung wollen wir ein Modell entwickeln, das Beschaffungsdaten analysiert, um den Nutzern anhand weniger verwandter Informationen die Wahrscheinlichkeit von Betrug mitzuteilen.

Die Entwicklung von Machine Learning

Machine Learning ist ein Bereich, der darauf abzielt, Computer dazu zu befähigen, aus Daten zu lernen, ohne dass sie explizit programmiert werden müssen. Es hat seine Wurzeln in der künstlichen Intelligenz und hat sich schrittweise darauf verlagert, reale Probleme mithilfe statistischer Modelle zu lösen. Zu den gängigen Problemtypen, die Machine Learning behandelt, gehören Klassifikation, Regression, Clustering und Schätzung.

Neuronale Netze sind eine Untergruppe des Machine Learning, die aus mehreren Schichten miteinander verbundener Knoten bestehen, wodurch sie Daten effektiver verarbeiten können als traditionelle Modelle. Die Fortschritte bei der Rechenleistung, insbesondere mit GPUs, haben die Fähigkeiten des Deep Learning erheblich gesteigert und es zu einem Schlüsselwerkzeug in verschiedenen Bereichen gemacht.

Bisherige Arbeiten zur Betrugserkennung

Es gab mehrere Versuche, Machine Learning, insbesondere neuronale Netze, zur Betrugserkennung in verschiedenen Bereichen, wie z.B. bei Kreditkartentransaktionen, zu nutzen. Studien haben gezeigt, dass neuronale Netze effektiv darin sein können, betrügerische Transaktionen anhand gekennzeichneter Datensätze zu identifizieren.

Diese Erkenntnisse von der Betrugserkennung bei Kreditkarten auf die Erkennung von Beschaffungsbetrug zu übertragen, bietet wertvolle Hinweise. Der Erfolg in einem Bereich gibt uns das Vertrauen, dass ähnliche Methoden auch in unseren Prüfungsprozessen anwendbar sein könnten, was die Notwendigkeit von zuverlässigen Daten und gut strukturierten Modellen betont.

Herausforderungen in der Forschung zu Beschaffungsbetrug

Die Forschung zu Beschaffungsbetrug erhält nicht die Aufmerksamkeit, die sie in Risikomanagementstudien verdient. Die Effizienz von Machine-Learning-Algorithmen wurde bisher nicht vollumfänglich bei der Erkennung oder Vorhersage von Beschaffungsbetrug angewendet. Manuelle Untersuchungen erfordern eine signifikante Anzahl an geschulten Fachleuten, was für viele Organisationen möglicherweise nicht machbar ist.

Einige vorherige Studien haben Risikomanagementmodelle für Beschaffungsbetrug entwickelt und deren Wirksamkeit demonstriert. Allerdings haben diese Studien die Prüfer nicht effektiv ausgestattet, um einen proaktiveren Ansatz bei der Untersuchung potenzieller Betrugsfälle zu verfolgen.

Diese Forschung konzentriert sich auf den chinesischen Markt, da die von uns verwendeten Daten von einem chinesischen Unternehmen stammen, was es uns ermöglicht, lokale Gesetze und Vorschriften in unser Verständnis von Beschaffungsbetrug zu integrieren.

Datensammlung für die Studie

Um ein Machine-Learning-Modell für die Beschaffungsprüfung zu erstellen, benötigten wir historische Aufzeichnungen von einem Unternehmen. SF Express stellte uns Zugang zu ihrer Datenbank zur Verfügung, einschliesslich Beschaffungsunterlagen ab dem 1. Januar 2015. Dieser umfassende Datensatz war entscheidend, um das Modell effektiv zu trainieren.

Um das Ungleichgewicht zwischen positiven (betrügerischen Beschaffungen) und negativen (legitimen Beschaffungen) Fällen zu beheben, haben wir eine gleiche Anzahl positiver und negativer Fälle für unsere Analyse ausgewählt. Diese gleichmässige Vertretung verbesserte die Fähigkeit des Modells, aus beiden Datentypen effektiv zu lernen.

Auswahl von Variablen für das Modell

Die Nutzung der verfügbaren Benutzeroberfläche im SAP-System von SF schränkte die Anzahl der Variablen ein, die wir analysieren konnten. Daher konzentrierten wir uns darauf, Eingangsvariablen anhand spezifischer Kriterien auszuwählen. Jede Variable musste relevant für die Betrugserkennung, rechnerisch handhabbar und leicht verständlich sein.

Einige wichtige Variablen, die wir einbezogen haben, waren:

  1. Beschaffungsseriennummer (PSN): Identifiziert jede Beschaffungstransaktion und hilft, ähnliche betrügerische Aktivitäten nachzuvollziehen.
  2. Beschaffungsgruppennummer (PGN): Verbindet spezifische Gruppen mit früheren Betrugsfällen, sodass das Modell lernen kann, welche Gruppen ein höheres Risiko aufweisen könnten.
  3. Materialgruppennummer (MGN): Zeigt an, dass bestimmte Produktarten möglicherweise mit höheren Betrugsrisiken verbunden sind.
  4. Netto Preis (NP): Verknüpft Gewinnabsicht mit potenziellem Betrug, da grössere Gewinne ehrliche Handlungen motivieren können.
  5. Betrugsart (FT): Hilft, die Art des Betrugs in Fällen zu klassifizieren, die bereits als verdächtig identifiziert wurden.

Durch die Zusammenstellung eines vielfältigen, aber relevanten Sets von Eingangsvariablen wollten wir das Modell in die Lage versetzen, sowohl das Auftreten als auch die Arten von Beschaffungsbetrug zu erkennen.

Entwurf des neuronalen Netzwerkmodells

Das neuronale Netzwerkmodell, das wir entworfen haben, arbeitet, indem es Eingaben durch verschiedene Schichten verarbeitet. Jede Schicht passt ihre Parameter an, um die Vorhersagen der Ausgaben mithilfe einer Methode namens Gradientenabstieg zu verbessern. Durch das wiederholte Verfeinern dieser Parameter wird das Modell im Laufe der Zeit genauer.

Wir haben uns für eine Multi-Layer-Perceptron (MLP)-Netzwerkstruktur entschieden, die für unser Eingabedatenformat geeignet ist. Das Modell wurde entwickelt, um verdächtige von nicht verdächtigen Beschaffungen zu trennen und Betrugsarten unter verdächtigen Transaktionen zu klassifizieren.

Implementierung und Test des Modells

Wir haben beliebte Bibliotheken wie TensorFlow und Keras ausgewählt, um unsere Modelle zu implementieren. Die Normalisierung der Eingabedaten stellte sicher, dass das Modell effektiv über die verschiedenen Skalen in unserem Beschaffungsdatensatz arbeitet.

Nachdem wir unsere Modelle mit 50.000 Proben trainiert hatten, begannen wir, ihre Leistung zu bewerten. Wir verwendeten Techniken zur Kreuzvalidierung, um ein besseres Verständnis dafür zu bekommen, wie gut unsere Modelle insgesamt funktionieren.

Genauigkeitsresultate und Leistungsbewertung

Sowohl unser binäres Modell (zur Erkennung verdächtiger Beschaffungen) als auch unser Multiklassenmodell (zur Klassifizierung von Betrugsarten) zeigten vielversprechende Genauigkeitsraten. Die Ergebnisse unseres binären Modells deuten darauf hin, dass es die meisten Fälle von Beschaffungsbetrug zuverlässig erfassen kann und besser abschneidet als traditionelle Prüfmethoden.

Das Multiklassenmodell erzielte ebenfalls bemerkenswerte Genauigkeit bei der Klassifizierung verschiedener Betrugsarten, was seine Wirksamkeit bei der Unterstützung von Prüfern während der Untersuchungen zeigt.

Zukünftige Forschungsrichtungen

Für die Zukunft gibt es mehrere Bereiche, die weiter erforscht werden müssen. Verbesserungen in den Methoden zur Datensammlung zur Schaffung einer integrierten Datenbank sind entscheidend. Darüber hinaus wird die Erhöhung des Volumens von Betrugsfällen, die für das Training von Modellen zur Verfügung stehen, deren Effektivität steigern.

Die Normalisierungsmethoden müssen ebenfalls verfeinert werden, um Konsistenz über verschiedene Datenformate hinweg sicherzustellen. Wenn Machine Learning zunehmend in Prüfungspraktiken integriert wird, werden weitere Studien helfen, potenzielle Herausforderungen und Vorteile bei der Betrugserkennung zu erkennen.

Fazit

Unsere Forschung zeigt, dass Machine Learning erhebliches Potenzial hat, die Beschaffungsprüfung zu transformieren. Durch den Einsatz fortschrittlicher Modelle wie neuronaler Netze können wir Beschaffungsbetrug besser identifizieren und klassifizieren, was letztendlich die Effizienz und Effektivität der Prüfungsabteilungen verbessert.

Die Zusammenarbeit mit Unternehmen wie SF Express war von unschätzbarem Wert, da sie die notwendigen Daten und Einblicke bereitgestellt hat, um dieses Gebiet weiter zu erforschen. Während wir unsere Modelle verfeinern und Änderungen umsetzen, können wir mit einer erheblichen Verbesserung der Erkennung von Beschaffungsbetrug rechnen, was den Weg für ein zuverlässigeres Geschäftsumfeld ebnet.

Mehr von den Autoren

Ähnliche Artikel