Prédire le risque de mortalité pour l'assurance vie au Royaume-Uni
Cette étude explore les prévisions de mortalité en utilisant des données de pays similaires.
Asmik Nalmpatian, C. Heumann, L. Alkaya, W. Jackson
― 9 min lire
Table des matières
- Problèmes avec la disponibilité des données actuelles
- Une solution : l'Apprentissage par transfert
- L'approche de l'étude
- Questions de recherche
- Sources de données et méthodes
- Taux de mortalité de la population générale
- Données de la population assurée
- Caractéristiques spécifiques de la population assurée
- Génération de données synthétiques
- Amélioration du modèle avec un modèle de dérive
- Métriques d'accord et évaluation du modèle
- Application du cadre d'apprentissage par transfert au Royaume-Uni
- Traitement des différences restantes
- Variables supplémentaires pour améliorer les prédictions
- Conclusion
- Source originale
Prédire le risque de Mortalité est super important pour les compagnies d'assurance-vie. Elles doivent savoir à quel point il est probable que les gens décèdent dans un certain laps de temps. Ça les aide à décider combien facturer pour les polices d'assurance-vie et à gérer leur risque global. Mais obtenir des prédictions précises peut être compliqué, surtout quand il n'y a pas assez de données pour certains groupes de personnes. C'est un gros souci pour les entreprises qui essaient de créer des plans d'assurance fiables.
Problèmes avec la disponibilité des données actuelles
Les événements de mortalité sont rares. Ça veut dire qu'il faut beaucoup de temps pour rassembler suffisamment de données, ce qui complique la tâche des assureurs pour construire des Modèles prédictifs solides. Quand les compagnies d'assurance manquent de bonnes données, elles peuvent faire des évaluations de risque incorrectes, ce qui peut mener à de mauvaises stratégies de tarification. Ça peut nuire à leur business, rendant plus difficile le fait d'être rentables et de proposer des prix abordables aux clients.
Apprentissage par transfert
Une solution : l'Une approche prometteuse pour relever ces défis est l'apprentissage par transfert. Ce procédé permet aux entreprises d'utiliser des modèles déjà entraînés sur des données de pays avec beaucoup d'infos. Elles peuvent adapter ces modèles pour fonctionner dans des endroits où les données sont limitées. Ça veut dire que même si une compagnie n'a pas de données locales, elle peut quand même faire des prédictions fiables sur les taux de mortalité.
Alors que les recherches précédentes ont utilisé des modèles complexes, comme des réseaux neuronaux profonds, ceux-ci peuvent nécessiter beaucoup de puissance de calcul et peuvent être difficiles à peaufiner, surtout avec peu de données. Au lieu de ça, utiliser des machines à gradient boosting (GBM) peut être une option plus efficace et compréhensible. Les GBM peuvent donner de bons résultats sans avoir besoin de trop de données.
L'approche de l'étude
Dans cette étude, on se concentre sur l'utilisation des GBM pour prédire les taux de mortalité au Royaume-Uni, où il n'existe pas de données d'assurance-vie locales. Pour cela, on collecte des données synthétiques provenant de pays similaires au Royaume-Uni. En faisant ça, on peut créer des prédictions de mortalité fiables sans dépendre excessivement des ensembles de données locaux. De plus, on ajoute un modèle de dérive à notre cadre pour identifier et corriger les différences qui peuvent survenir entre les démographies de différents pays.
Questions de recherche
Pour orienter notre étude, on se concentre sur trois grandes questions de recherche :
- Comment peut-on estimer les taux de mortalité dans un pays sans données d'assurance-vie locales ?
- Quelle est la précision de nos prédictions, et un modèle de dérive peut-il aider à adresser les différences entre la mortalité prédite et les taux réels ?
- Des Variables supplémentaires au-delà de l'âge et du sexe peuvent-elles améliorer nos prédictions de risque de mortalité ?
Sources de données et méthodes
Pour mener notre recherche, on utilise la Base de données de mortalité humaine (HMD) comme source principale de données externes. La HMD fournit des données de mortalité pour divers pays, organisées par âge et par sexe. Cependant, on ne cherche pas à trouver les taux de mortalité globaux au Royaume-Uni ; au contraire, on veut comprendre les taux de mortalité spécifiques dans le portefeuille d'assurance-vie d'une société qui y opère.
Il est important de noter que les taux de mortalité pour la population générale peuvent différer considérablement de ceux dans un portefeuille d'assurance-vie spécifique. Pour tenir compte de ça, on collecte des données provenant de huit pays pour aider à combler l'écart entre la mortalité globale et les taux spécifiques pertinents pour notre entreprise cible.
On analyse trois populations pour refléter différents contextes :
- Les taux de mortalité de la population générale pour chaque pays.
- La population assurée mondiale de l'entreprise.
- La population assurée de l'entreprise dans un pays spécifique.
Taux de mortalité de la population générale
On récupère les taux de mortalité spécifiques par âge et sexe de la HMD pour nos pays participants. Bien que ces taux représentent la population générale, ils nous permettent d'établir des liens entre la mortalité générale et assurée. Pour rendre les données plus pertinentes, on projette les taux de mortalité de 2008 à 2018 en utilisant des méthodes statistiques qui ajustent les éventuelles anomalies annuelles.
Données de la population assurée
On utilise également un ensemble de données regroupées de différents pays pour entraîner notre modèle GBM afin de prédire les taux de mortalité au sein de la population assurée à l'échelle mondiale. Cet ensemble de données inclut des caractéristiques partagées telles que l'âge, le sexe et le montant de la couverture. En combinant ces données avec la mortalité de la population générale, on crée un ensemble de caractéristiques complet.
Notre ensemble de données se compose de données de polices d'un fournisseur d'assurance mondial, incluant près de 10 millions d'années-vie d'exposition et environ 10 000 décès enregistrés. On analyse ces données en les regroupant en combinaisons uniques, ce qui nous permet de résumer les comptes de décès et le temps d'exposition pour chaque combinaison de caractéristiques dans tous les pays impliqués dans l'étude.
Caractéristiques spécifiques de la population assurée
En plus des caractéristiques globales, on inclut des caractéristiques locales de chaque pays basées sur les données disponibles. Ces caractéristiques locales peuvent inclure des facteurs comme la profession, qui varient selon les régions. Après avoir entraîné notre modèle général, on le peaufine en utilisant ces caractéristiques locales pour améliorer la précision pour le pays spécifique sur lequel on se concentre, dans ce cas, le Royaume-Uni.
Génération de données synthétiques
Étant donné qu'on manque de données de mortalité réelles pour le Royaume-Uni, on crée des ensembles de données synthétiques pour surmonter cette limitation. En combinant les informations des K pays, on utilise des techniques d'échantillonnage pour générer des données qui imitent les caractéristiques de la population britannique. Ça nous permet d'explorer les prédictions de mortalité sans se fier uniquement aux ensembles de données locaux.
Amélioration du modèle avec un modèle de dérive
Pour améliorer encore nos prédictions, on applique un modèle de dérive. Ce modèle nous aide à identifier toute différence restante entre nos prédictions et les résultats attendus. En examinant les différences dans les taux de mortalité, on peut déterminer les facteurs qui contribuent à d'éventuelles inexactitudes dans notre modèle.
Métriques d'accord et évaluation du modèle
Pour mesurer à quel point nos prédictions s'alignent sur les taux de mortalité attendus, on utilise diverses métriques d'accord. Cela inclut la vérification des corrélations entre notre mortalité prédite et les taux attendus. Évaluer notre modèle de cette manière assure qu'on a une bonne compréhension de sa précision.
Application du cadre d'apprentissage par transfert au Royaume-Uni
Quand on applique notre cadre d'apprentissage par transfert au Royaume-Uni, on peut tirer parti de nos découvertes des autres pays. Cette étape est cruciale car elle jette les bases de notre analyse. On observe que les pays d'Europe offrent un rapprochement plus étroit avec le Royaume-Uni, ce qui nous permet de faire des prédictions plus précises.
Traitement des différences restantes
Une fois qu'on établit que notre processus d'apprentissage par transfert est efficace, on examine les différences restantes entre nos prédictions et les taux établis au Royaume-Uni. En étudiant des facteurs spécifiques comme l'âge et le sexe, on identifie les légères variations qui existent. Bien que nos prédictions puissent montrer certaines sous-estimations, comprendre les raisons derrière cela nous permet d'améliorer notre approche à l'avenir.
Variables supplémentaires pour améliorer les prédictions
Notre étude examine également l'inclusion de variables supplémentaires au-delà de l'âge et du sexe. En évaluant ces facteurs supplémentaires, on peut mieux comprendre comment ils peuvent influencer le risque de mortalité. Ça permet aux assureurs d'ajuster leurs stratégies de tarification en fonction du profil de risque de leurs clients de manière plus précise.
Conclusion
Le cadre d'apprentissage par transfert qu'on a développé démontre une méthode efficace pour prédire les taux de mortalité au Royaume-Uni, même sans données locales. En utilisant des données de pays similaires et en les affinant pour tenir compte des patterns de mortalité locaux, on peut produire des prédictions fiables pour les compagnies d'assurance-vie. Nos découvertes suggèrent qu'il est possible de créer un modèle solide qui fournit des insights précieux pour l'évaluation des risques et les stratégies de tarification, même avec des données locales limitées.
En regardant vers l'avenir, les résultats de cette étude pourraient avoir des applications plus larges dans d'autres régions manquant de données locales suffisantes. En continuant à peaufiner nos méthodes et à explorer des variables supplémentaires, on peut améliorer la puissance prédictive des modèles de risque de mortalité tout en aidant les assureurs à prendre de meilleures décisions.
Titre: Transfer learning for mortality risk: A case study on the United Kingdom
Résumé: This study introduces a transfer learning framework to address data scarcity in mortality risk prediction for the UK, where local mortality data is unavailable. By leveraging a pretrained model built from data across eight countries (excluding the UK) and incorporating synthetic data from the country most similar to the UK, our approach extends beyond national boundaries. This framework reduces reliance on local datasets while maintaining strong predictive performance. We evaluate the model using the Continuous Mortality Investigation (CMI) dataset and a drift model to address discrepancies arising from local demographic differences. Our research bridges machine learning and actuarial science, enhancing mortality risk prediction and pricing strategies, particularly in data-poor settings.
Auteurs: Asmik Nalmpatian, C. Heumann, L. Alkaya, W. Jackson
Dernière mise à jour: 2024-10-27 00:00:00
Langue: English
Source URL: https://www.medrxiv.org/content/10.1101/2024.10.25.24316112
Source PDF: https://www.medrxiv.org/content/10.1101/2024.10.25.24316112.full.pdf
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à medrxiv pour l'utilisation de son interopérabilité en libre accès.