Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Gesundheitswissenschaften# Öffentliche und globale Gesundheit

Vorhersage des Sterberisikos für Lebensversicherungen im Vereinigten Königreich

Diese Studie untersucht Sterblichkeitsprognosen anhand von Daten ähnlicher Länder.

Asmik Nalmpatian, C. Heumann, L. Alkaya, W. Jackson

― 7 min Lesedauer


Sterberisiko-VorhersageSterberisiko-Vorhersagefür VersichererSterblichkeit ohne lokale Daten.Ein neuer Ansatz zur Vorhersage von
Inhaltsverzeichnis

Die Vorhersage des Sterberisikos ist für Lebensversicherungsunternehmen super wichtig. Die müssen wissen, wie wahrscheinlich es ist, dass Leute innerhalb eines bestimmten Zeitraums sterben. Das hilft ihnen, die Preise für Lebensversicherungen festzulegen und ihr Gesamtrisiko zu managen. Aber genaue Vorhersagen zu treffen, kann echt schwierig sein, vor allem, wenn nicht genug Daten für bestimmte Gruppen verfügbar sind. Das ist ein grosses Problem für Firmen, die zuverlässige Versicherungspläne erstellen wollen.

Probleme mit der aktuellen Datenverfügbarkeit

Sterbefälle sind rar. Das bedeutet, dass es lange dauert, genug Daten zu sammeln, was es den Versicherern erschwert, starke Vorhersagemodelle aufzubauen. Wenn Versicherungsunternehmen keine guten Daten haben, könnten sie falsche Risikoeinschätzungen vornehmen, was zu schlechten Preisstrategien führen kann. Das kann ihr Geschäft schädigen und es ihnen schwerer machen, rentabel zu sein und den Kunden günstige Preise anzubieten.

Eine Lösung: Transferlernen

Ein vielversprechender Ansatz zur Lösung dieser Herausforderungen ist das Transferlernen. Diese Methode ermöglicht es Unternehmen, Modelle zu nutzen, die bereits mit Daten aus Ländern trainiert wurden, wo es viele Informationen gibt. Sie können diese Modelle anpassen, um in Regionen zu funktionieren, wo es nur begrenzte Daten gibt. Das bedeutet, dass eine Firma selbst ohne lokale Daten immer noch zuverlässige Vorhersagen über Sterberaten machen kann.

Während frühere Forschungen komplexe Modelle wie tiefe neuronale Netze verwendet haben, benötigen diese oft viel Rechenleistung und sind schwer zu optimieren, besonders mit kleinen Datenmengen. Stattdessen kann die Verwendung von Gradient Boosting Machines (GBMs) eine effizientere und verständlichere Option sein. GBMs können gute Ergebnisse liefern, ohne so viele Daten zu brauchen.

Der Ansatz der Studie

In dieser Studie konzentrieren wir uns darauf, GBMs zur Vorhersage von Sterberaten im UK zu verwenden, wo es keine lokalen Lebensversicherungsdaten gibt. Um dies zu erreichen, sammeln wir synthetische Daten aus Ländern, die dem UK ähnlich sind. So können wir zuverlässige Sterbevorhersagen machen, ohne zu stark auf lokale Datensätze angewiesen zu sein. Ausserdem fügen wir unserem Rahmen ein Driftmodell hinzu, um Unterschiede zu identifizieren und zu korrigieren, die zwischen den Demografien verschiedener Länder auftreten können.

Forschungsfragen

Um unsere Studie zu leiten, konzentrieren wir uns auf drei Hauptforschungsfragen:

  1. Wie können wir die Sterberaten in einem Land ohne lokale Lebensversicherungsdaten schätzen?
  2. Wie genau sind unsere Vorhersagen und kann ein Driftmodell helfen, Diskrepanzen zwischen den vorhergesagten und den tatsächlichen Sterberaten zu beheben?
  3. Können zusätzliche Variablen jenseits von Alter und Geschlecht unsere Vorhersagen zum Sterberisiko verbessern?

Datenquellen und Methoden

Für unsere Forschung verwenden wir die Human Mortality Database (HMD) als unsere Hauptquelle für externe Daten. Die HMD bietet Sterbedaten für verschiedene Länder, organisiert nach Alter und Geschlecht. Wir wollen jedoch nicht die allgemeinen Sterberaten im UK finden; stattdessen möchten wir die spezifischen Sterberaten innerhalb des Lebensversicherungsportfolios eines Unternehmens dort verstehen.

Es ist wichtig zu beachten, dass die Sterberaten der Allgemeinbevölkerung erheblich von denen innerhalb eines spezifischen Lebensversicherungsportfolios abweichen können. Um dies zu berücksichtigen, sammeln wir Daten aus acht Ländern, um die Lücke zwischen der allgemeinen Sterblichkeit und den spezifischen Raten, die für unser Zielunternehmen relevant sind, zu schliessen.

Wir analysieren drei Bevölkerungsgruppen, um verschiedene Settings widerzuspiegeln:

  1. Die allgemeinen Bevölkerungssterberaten für jedes Land.
  2. Die globale versicherte Bevölkerung des Unternehmens.
  3. Die versicherte Bevölkerung des Unternehmens in einem bestimmten Land.

Allgemeine Bevölkerungssterberaten

Wir holen uns alters- und geschlechtsspezifische Sterberaten aus der HMD für unsere teilnehmenden Länder. Während diese Raten die Gesamtbevölkerung repräsentieren, ermöglichen sie uns, Verbindungen zwischen der allgemeinen und der versicherten Sterblichkeit herzustellen. Um die Daten relevanter zu machen, projizieren wir die Sterberaten von 2008 bis 2018 mithilfe statistischer Methoden, die mögliche jährliche Anomalien berücksichtigen.

Daten zur versicherten Bevölkerung

Ausserdem nutzen wir einen Pool-Datensatz aus verschiedenen Ländern, um unser GBM-Modell zur Vorhersage von Sterberaten innerhalb der globalen versicherten Bevölkerung zu trainieren. Dieser Datensatz umfasst gemeinsame Merkmale wie Alter, Geschlecht und Deckungsbetrag. Indem wir diese Daten mit der allgemeinen Bevölkerungssterblichkeit kombinieren, erstellen wir ein umfassendes Set von Merkmalen.

Unser Datensatz besteht aus Policendaten eines globalen Versicherungsanbieters, die fast 10 Millionen Lebensjahre an Risiko und etwa 10.000 dokumentierte Todesfälle umfassen. Wir analysieren diese Daten, indem wir sie in einzigartige Kombinationen gruppieren, was es uns ermöglicht, die Todesfälle und die Risikodauer für jede Kombination von Merkmalen über alle an der Studie beteiligten Länder hinweg zusammenzufassen.

Merkmale der spezifischen versicherten Bevölkerung

Neben globalen Merkmalen fügen wir lokale Merkmale aus jedem Land basierend auf den verfügbaren Daten hinzu. Diese lokalen Merkmale können Faktoren wie den Beruf umfassen, die regional variieren. Nachdem wir unser allgemeines Modell trainiert haben, verfeinern wir es mit diesen lokalen Merkmalen, um die Genauigkeit für das spezifische Land, auf das wir uns konzentrieren, in diesem Fall das UK, zu verbessern.

Generierung synthetischer Daten

Da uns echte Sterbedaten für das UK fehlen, erstellen wir synthetische Datensätze, um diese Einschränkung zu überwinden. Indem wir Informationen aus den K Ländern kombinieren, nutzen wir Sampling-Techniken, um Daten zu generieren, die die Merkmale der britischen Bevölkerung nachahmen. So können wir Sterbevorhersagen erkunden, ohne uns ausschliesslich auf lokale Datensätze zu stützen.

Verfeinerung des Modells mit einem Driftmodell

Um unsere Vorhersagen weiter zu verbessern, wenden wir ein Driftmodell an. Dieses Modell hilft uns, verbleibende Unterschiede zwischen unseren Vorhersagen und den erwarteten Ergebnissen zu identifizieren. Indem wir die Unterschiede in den Sterberaten betrachten, können wir Faktoren bestimmen, die zu Ungenauigkeiten in unserem Modell beitragen.

Bewertungsmetriken und Modellevaluation

Um zu messen, wie gut unsere Vorhersagen mit den erwarteten Sterberaten übereinstimmen, verwenden wir verschiedene Bewertungsmetriken. Dazu gehört, die Korrelationen zwischen unserer vorhergesagten Sterblichkeit und den erwarteten Raten zu überprüfen. Unsere Modellevaluation auf diese Weise gewährleistet, dass wir ein solides Verständnis seiner Genauigkeit haben.

Anwendung des Transferlernrams im UK

Wenn wir unser Transferlernen-Framework im UK anwenden, können wir unsere Ergebnisse aus den anderen Ländern nutzen. Dieser Schritt ist entscheidend, da er die Grundlage für unsere Analyse legt. Wir stellen fest, dass Länder innerhalb Europas eine engere Übereinstimmung mit dem UK bieten, was es uns ermöglicht, genauere Vorhersagen zu treffen.

Behebung verbleibender Unterschiede

Sobald wir festgestellt haben, dass unser Transferlernenprozess effektiv ist, überprüfen wir die verbleibenden Unterschiede in unseren Vorhersagen im Vergleich zu den etablierten Raten im UK. Durch die Untersuchung spezifischer Faktoren wie Alter und Geschlecht identifizieren wir die kleinen Variationen, die existieren. Auch wenn unsere Vorhersagen einige Unterbewertungen zeigen, ermöglicht uns das Verständnis der Gründe dahinter, unseren Ansatz in Zukunft zu verbessern.

Zusätzliche Variablen zur Verbesserung der Vorhersagen

Unsere Studie betrachtet auch zusätzliche Variablen jenseits von Alter und Geschlecht. Durch die Bewertung dieser zusätzlichen Faktoren können wir besser verstehen, wie sie das Sterberisiko beeinflussen können. Dadurch können Versicherer ihre Preisstrategien genauer an das Risikoprofil ihrer Kunden anpassen.

Fazit

Das Transferlernen-Framework, das wir entwickelt haben, zeigt eine effektive Methode zur Vorhersage von Sterberaten im UK, auch ohne lokale Daten. Durch die Verwendung von Daten aus ähnlichen Ländern und die Verfeinerung zur Berücksichtigung lokaler Sterbemuster können wir zuverlässige Vorhersagen für Lebensversicherungsunternehmen erstellen. Unsere Ergebnisse deuten darauf hin, dass es auch mit begrenzten lokalen Daten möglich ist, ein starkes Modell zu erstellen, das wertvolle Einblicke für Risikobewertungen und Preisstrategien liefert.

Wenn wir nach vorne schauen, könnten die Ergebnisse dieser Studie breitere Anwendungen in anderen Regionen haben, die nicht über ausreichend lokale Daten verfügen. Indem wir unsere Methoden weiter verfeinern und zusätzliche Variablen erkunden, können wir die Vorhersagekraft von Sterberisikomodellen verbessern und den Versicherern helfen, besser informierte Entscheidungen zu treffen.

Mehr von den Autoren

Ähnliche Artikel