Mettre à jour ses croyances avec des preuves : un guide pratique
Apprends à ajuster tes croyances en fonction de nouvelles preuves dans la prise de décisions.
― 7 min lire
Table des matières
- L'Importance de l'Apprentissage
- Le Défi avec Plusieurs Éléments de Preuve
- Exemple Concret : Tests Médicaux
- Réponses des Experts
- Le Rôle de la Validité
- Méthodes de Mise à Jour
- Comment Utiliser les Preuves
- L'Analogie du Flux d'Eau
- Importance de la Bonne Approche
- La Grande Image en IA et Médecine
- Augmentation de la Validité et Apprentissage
- Conclusion
- Un Appel à la Conscience
- Source originale
- Liens de référence
La mise à jour probabiliste, c'est un moyen de changer nos croyances en fonction des nouvelles infos. Ça consiste à transformer une croyance initiale, qu'on appelle la distribution a priori, en une nouvelle croyance, appelée distribution a posteriori. Cette transformation se fait quand on ajoute de nouvelles Preuves à ce qu'on sait déjà. Ce processus est au cœur de l'apprentissage et est souvent décrit avec les méthodes bayésiennes.
L'Importance de l'Apprentissage
Quand on reçoit de nouvelles preuves, ça peut changer notre perception des chances de certains résultats. Par exemple, si on a une croyance a priori sur les chances qu'une personne ait une maladie, et qu'on reçoit ensuite des résultats de tests, on peut mettre à jour notre croyance. La croyance mise à jour prend en compte la nouvelle preuve, ce qui la rend plus précise.
Le Défi avec Plusieurs Éléments de Preuve
Mettre à jour une croyance avec un seul élément de preuve, c'est simple, mais ça devient compliqué quand on a plusieurs éléments de preuve. Les différentes manières de combiner ces preuves peuvent mener à des croyances mises à jour différentes, et tout le monde n'est pas d'accord sur la meilleure méthode. Deux approches principales pour mettre à jour les croyances avec plusieurs éléments de preuve viennent de différents chercheurs. Comprendre ces approches peut aider à clarifier comment gérer efficacement plusieurs entrées de données.
Exemple Concret : Tests Médicaux
Imagine qu'il y a une maladie, comme le Covid-19, qui touche un certain pourcentage de la population. Ce pourcentage représente notre croyance a priori sur la probabilité qu’une personne ait la maladie. Il existe un test pour savoir si une personne a la maladie, mais les tests ne sont pas toujours parfaits. Ils ont une certaine chance de détecter correctement la maladie (sensibilité) et une chance de la détecter à tort (spécificité).
En testant une personne, on pourrait obtenir deux résultats positifs et un résultat négatif sur trois tests séparés. Ça soulève une série de questions :
- Quelle est la probabilité d'avoir deux tests positifs et un négatif ?
- Étant donné ces résultats, quelle est la probabilité mise à jour que la personne ait la maladie ?
- Avec cette nouvelle probabilité mise à jour, si on teste encore avec le même type de tests, quelle est la probabilité qu'on obtienne à nouveau deux positifs et un négatif ?
Ces questions aident à illustrer comment on peut utiliser plusieurs éléments de preuve pour affiner nos croyances sur une situation.
Réponses des Experts
Quand ces questions ont été posées à des experts en intelligence artificielle et en statistiques médicales, leurs réponses ont considérablement varié. Certains préféraient une méthode de mise à jour des croyances, d'autres en préféraient une autre. Ce manque de consensus souligne l'importance de comprendre les différentes approches disponibles.
Validité
Le Rôle de laLa validité est un concept clé dans l'apprentissage. Ça concerne l'exactitude de nos croyances par rapport aux preuves qu'on a. L'essence de la mise à jour bayésienne, c'est que la croyance mise à jour doit refléter la nouvelle preuve plus précisément que l'ancienne croyance. En gros, quand on apprend quelque chose de nouveau, on doit devenir plus malin sur la situation.
Méthodes de Mise à Jour
Les deux principales méthodes pour mettre à jour les croyances avec plusieurs éléments de preuve sont connues sous le nom de mise à jour de Jeffrey et mise à jour de Pearl.
Mise à Jour de Jeffrey : Cette méthode combine les éléments de preuve individuellement, traitant chaque élément comme séparé. Elle se concentre sur la façon dont les éléments interagissent de manière plus flexible.
Mise à Jour de Pearl : Cette approche traite les éléments de preuve comme un ensemble combiné. Elle évalue le résultat global plutôt que de regarder chaque élément séparément.
Les deux méthodes visent à augmenter la validité de nos croyances, mais elles le font de manière différente. Comprendre ces différences est crucial pour les appliquer correctement en pratique.
Comment Utiliser les Preuves
Mettre à jour les croyances implique quelques concepts mathématiques, mais l'idée de base est simple : quand on reçoit de nouvelles preuves, on ajuste nos croyances en conséquence. Dans une situation pratique, comme les tests médicaux, après avoir collecté plusieurs résultats de tests, on peut utiliser soit la méthode de Jeffrey soit celle de Pearl pour arriver à notre croyance mise à jour sur un patient ayant une maladie.
L'Analogie du Flux d'Eau
Pour mieux comprendre la mise à jour, on peut utiliser une analogie simple avec de l'eau qui s'écoule à travers des tuyaux. Imagine une pompe qui pousse de l'eau à travers trois tuyaux de tailles différentes. La quantité d'eau qui s'écoule dans chaque tuyau représente les probabilités de différents résultats. Quand on reçoit de nouvelles preuves, comme le fait qu'un des tuyaux soit bouché, on doit ajuster le flux dans les tuyaux restants. Cet ajustement reflète comment notre croyance mise à jour intègre les nouvelles preuves.
Importance de la Bonne Approche
Utiliser la bonne méthode de mise à jour est essentiel. Les différences dans les approches peuvent mener à des changements petits mais significatifs dans la croyance finale. Par exemple, si une personne a deux résultats de tests positifs et un négatif, appliquer la méthode de Jeffrey pourrait donner une probabilité mise à jour différente comparée à celle obtenue en utilisant la méthode de Pearl.
La Grande Image en IA et Médecine
Les implications de ces méthodes de mise à jour vont au-delà d'exemples simples. Dans des domaines comme l'intelligence artificielle et la médecine, les décisions basées sur ces probabilités mises à jour peuvent avoir des conséquences importantes, influençant tout, des options de traitement aux approbations de prêts. Comprendre comment gérer efficacement plusieurs éléments de preuve est crucial dans ces contextes.
Augmentation de la Validité et Apprentissage
Un des principaux objectifs de la mise à jour de nos croyances est d'augmenter la validité. Chaque fois qu'on incorpore de nouvelles preuves, on devrait voir une augmentation de l'exactitude de nos croyances. Cependant, mélanger les différentes méthodes de mise à jour peut entraîner des diminutions de validité, ce qui est contre-productif.
Conclusion
La mise à jour probabiliste est un outil puissant pour apprendre et prendre des décisions basées sur des preuves. Comprendre les subtilités de ce processus, surtout quand il s'agit de gérer plusieurs éléments de preuve, est essentiel pour faire des choix informés. En utilisant les bonnes méthodes de mise à jour, que ce soit celle de Jeffrey ou celle de Pearl, on peut s'assurer que nos croyances deviennent plus valides et nos décisions plus fiables.
Un Appel à la Conscience
Alors qu'on continue d'apprendre à partir des données, il est essentiel que les professionnels dans des domaines comme l'IA et la médecine soient conscients des différentes approches pour mettre à jour les probabilités. Cette conscience peut mener à une meilleure prise de décision et à des prédictions plus précises dans un monde de plus en plus axé sur les données.
Titre: Getting Wiser from Multiple Data: Probabilistic Updating according to Jeffrey and Pearl
Résumé: In probabilistic updating one transforms a prior distribution in the light of given evidence into a posterior distribution, via what is called conditioning, updating, belief revision or inference. This is the essence of learning, as Bayesian updating. It will be illustrated via a physical model involving (adapted) water flows through pipes with different diameters. Bayesian updating makes us wiser, in the sense that the posterior distribution makes the evidence more likely than the prior, since it incorporates the evidence. Things are less clear when one wishes to learn from multiple pieces of evidence / data. It turns out that there are (at least) two forms of updating for this, associated with Jeffrey and Pearl. The difference is not always clearly recognised. This paper provides an introduction and an overview in the setting of discrete probability theory. It starts from an elementary question, involving multiple pieces of evidence, that has been sent to a small group academic specialists. Their answers show considerable differences. This is used as motivation and starting point to introduce the two forms of updating, of Jeffrey and Pearl, for multiple inputs and to elaborate their properties. In the end the account is related to so-called variational free energy (VFE) update in the cognitive theory of predictive processing. It is shown that both Jeffrey and Pearl outperform VFE updating and that VFE updating need not decrease divergence - that is correct errors - as it is supposed to do.
Auteurs: Bart Jacobs
Dernière mise à jour: 2024-05-21 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2405.12700
Source PDF: https://arxiv.org/pdf/2405.12700
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.
Liens de référence
- https://stats.stackexchange.com/questions/120278/probability-of-disease-given-multiple-samples-of-a-single-test
- https://www.ncbi.nlm.nih.gov/pmc/articles/PMC8441124/
- https://math.stackexchange.com/questions/837768/bayes-two-tests-in-a-row
- https://cran.r-project.org/web/classifications/ACM.html
- https://social.edu.nl/@bjacobs/112051242549499170
- https://en.wikipedia.org/wiki/Multinomial_theorem
- https://www.frontiersin.org/journals/psychology/articles/10.3389/fpsyg.2012.00548/full
- https://arxiv.org/pdf/2107.12979.pdf
- https://doi.org/10.1007/s11229-016-1288-5
- https://doi.org/10.1017/s0960129518000488
- https://arxiv.org/abs/1512.05813
- https://doi.org/10.1093/mind/fzx038
- https://doi.org/10.1017/9781316219317
- https://doi.org/10.1016/j.tics.2009.04.005
- https://doi.org/10.1098/rstb.2008.0300
- https://doi.org/10.1016/J.AIM.2020.107239
- https://doi.org/10.7551/mitpress/10951.001.0001
- https://doi.org/10.1093/acprof:oso/9780199682737.001.0001
- https://doi.org/10.1016/j.jlamp.2016.11.006
- https://doi.org/10.1613/jair.1.11349
- https://doi.org/10.4204/EPTCS.351.8
- https://doi.org/10.1007/978-3-031-24117-8_29
- https://doi.org/10.1007/978-3-031-39784-4_16
- https://www.cs.ru.nl/B.Jacobs/PAPERS/ProbabilisticReasoning.pdf
- https://doi.org/10.46298/entics.12281
- https://doi.org/10.1017/9781108770750.010
- https://doi.org/10.48550/arXiv.2107.12979
- https://doi.org/10.1016/C2009-0-27609-4
- https://doi.org/10.1007/978-94-009-0553-5_10
- https://doi.org/10.5402/2012/785791
- https://doi.org/10.1016/j.cogsys.2013.07.003
- https://doi.org/10.48550/arXiv.2308.00861