Améliorer la détection des hémorragies intracrâniennes avec G-VGPMIL
G-VGPMIL améliore l'apprentissage par instances multiples pour une analyse efficace des images médicales.
― 6 min lire
Table des matières
L'Apprentissage par Instances Multiples (MIL) est une méthode utilisée en apprentissage automatique où, au lieu de marquer des objets individuels, on marque des groupes d'objets, connus sous le nom de sacs. Cette approche est utile parce qu'elle réduit le temps de travail nécessaire pour le marquage. Dans le MIL, un sac est marqué comme positif s'il contient au moins un objet positif, sinon, il est considéré comme négatif. Cette technique est particulièrement précieuse dans des domaines comme l'imagerie médicale, où marquer chaque image peut prendre beaucoup de temps et coûter cher.
Un des gros défis du MIL est de déterminer les étiquettes des objets individuels dans un sac en se basant uniquement sur l'étiquette du sac. Ce défi est particulièrement pertinent dans des contextes médicaux, comme identifier des conditions à partir d'images médicales.
Détection des hémorragies intracrâniennes
Un problème pressant en médecine est de détecter les hémorragies intracrâniennes (ICH), qui sont des saignements à l'intérieur du cerveau. L'ICH peut être mortelle et un diagnostic rapide est crucial. Les scanners CT sont couramment utilisés à cet effet. Chaque scan se compose de plusieurs coupes, et un scan est marqué comme positif pour l'ICH si l'une de ses coupes montre des signes de saignement.
Au lieu de devoir marquer chaque coupe dans un scan, l'approche MIL permet aux radiologues de marquer le scan dans son ensemble. Cela simplifie le processus de marquage et permet une analyse plus rapide. Cependant, l'application réussie du MIL nécessite des modèles prédictifs précis qui peuvent tirer parti des étiquettes au niveau du sac pour inférer des informations au niveau des instances.
Apprentissage profond et des Processus Gaussiens
Le rôle de l'L'apprentissage profond (DL) est de plus en plus utilisé dans des scénarios MIL pour gérer des structures de données complexes. Les modèles combinent DL avec des mécanismes d'attention pour déterminer quelles instances sont les plus pertinentes pour la tâche à accomplir. Cependant, ces méthodes ne modélisent généralement pas explicitement les étiquettes des instances individuelles, ce qui complique l'évaluation de l'incertitude au niveau des instances.
Pour répondre à ces défis, les processus gaussiens (GP) se sont révélés être des outils puissants pour le MIL grâce à leur efficacité à exprimer l'incertitude et à fournir des modèles flexibles. Les GP ont donné de bons résultats dans diverses tâches, y compris la détection de l'ICH.
VGPMIL : une approche populaire
VGPMIL est une méthode qui utilise des GP pour les tâches MIL, en particulier dans les problèmes de classification. Elle introduit une approche variationnelle pour gérer la complexité de l'utilisation des fonctions logistiques dans le cadre des GP. Essentiellement, VGPMIL crée une approximation à bornes inférieures de l'objectif d'entraînement réel, ce qui lui permet d'apprendre à partir d'étiquettes au niveau des sacs.
Cependant, VGPMIL a des limites liées aux techniques d'approximation qu'elle utilise, ce qui peut réduire ses performances prédictives.
Pólya-Gamma
VariablesUne amélioration récente implique l'utilisation de variables aléatoires Pólya-Gamma. Ces variables facilitent un traitement plus précis des fonctions logistiques dans le contexte des GP. En intégrant des variables Pólya-Gamma, un nouveau modèle appelé PG-VGPMIL peut être formulé, qui maintient les mêmes procédures de mise à jour que VGPMIL tout en améliorant la flexibilité et les performances du modèle.
Introduction de la distribution Gamma
S'appuyant sur les idées de PG-VGPMIL, une nouvelle extension introduit la distribution Gamma, menant à une nouvelle approche appelée G-VGPMIL. Ce modèle vise à maintenir les points forts de ses prédécesseurs tout en offrant une meilleure précision prédictive et efficacité d'entraînement.
Expériences avec G-VGPMIL
Pour valider l'efficacité de G-VGPMIL, de nombreuses expériences ont été réalisées sur plusieurs ensembles de données, y compris des données synthétiques, des ensembles de données de référence établis et des problèmes médicaux réels. Les expériences avaient pour but de démontrer les capacités de G-VGPMIL en matière d'efficacité d'entraînement et de performance prédictive par rapport aux méthodes existantes, en particulier VGPMIL.
Expérience 1 : Ensemble de données MNIST
Lors d'une expérience, l'ensemble de données MNIST, qui se compose d'images de chiffres manuscrits, a été transformé en un scénario MIL. L'objectif principal était d'évaluer comment G-VGPMIL peut fonctionner à la fois au niveau des instances et des sacs. Les résultats ont montré que G-VGPMIL fonctionne comparativement à VGPMIL tout en nécessitant moins de temps d'entraînement.
Expérience 2 : Ensembles de données MUSK
Les ensembles de données MUSK1 et MUSK2 ont été utilisés ensuite pour valider G-VGPMIL par rapport aux benchmarks établis. Les expériences ont révélé que G-VGPMIL a constamment mieux performé que VGPMIL, ce qui illustre encore son efficacité et son efficacité.
Expérience 3 : Détection des hémorragies intracrâniennes
Enfin, G-VGPMIL a été appliqué à la tâche de détection de l'ICH, en utilisant des scanners CT. L'évaluation s'est concentrée sur la performance prédictive, la rapidité et la robustesse par rapport aux modèles à la pointe de la technologie. G-VGPMIL a obtenu des résultats notables, démontrant efficacement son potentiel dans des scénarios de santé critiques.
Conclusion
Ce travail introduit G-VGPMIL comme une nouvelle approche qui améliore les méthodes existantes pour l'apprentissage par instances multiples. Il tire parti des distributions Pólya-Gamma et Gamma pour fournir un modèle flexible qui peut s'adapter à diverses tâches, y compris les défis d'imagerie médicale comme la détection de l'ICH. La bonne performance de G-VGPMIL sur différents ensembles de données suggère qu'il pourrait jouer un rôle important dans la recherche future et les applications pratiques dans le domaine de l'apprentissage automatique pour le diagnostic médical.
Titre: Hyperbolic Secant representation of the logistic function: Application to probabilistic Multiple Instance Learning for CT intracranial hemorrhage detection
Résumé: Multiple Instance Learning (MIL) is a weakly supervised paradigm that has been successfully applied to many different scientific areas and is particularly well suited to medical imaging. Probabilistic MIL methods, and more specifically Gaussian Processes (GPs), have achieved excellent results due to their high expressiveness and uncertainty quantification capabilities. One of the most successful GP-based MIL methods, VGPMIL, resorts to a variational bound to handle the intractability of the logistic function. Here, we formulate VGPMIL using P\'olya-Gamma random variables. This approach yields the same variational posterior approximations as the original VGPMIL, which is a consequence of the two representations that the Hyperbolic Secant distribution admits. This leads us to propose a general GP-based MIL method that takes different forms by simply leveraging distributions other than the Hyperbolic Secant one. Using the Gamma distribution we arrive at a new approach that obtains competitive or superior predictive performance and efficiency. This is validated in a comprehensive experimental study including one synthetic MIL dataset, two well-known MIL benchmarks, and a real-world medical problem. We expect that this work provides useful ideas beyond MIL that can foster further research in the field.
Auteurs: F. M. Castro-Macías, P. Morales-Álvarez, Y. Wu, R. Molina, A. K. Katsaggelos
Dernière mise à jour: 2024-03-21 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2403.14829
Source PDF: https://arxiv.org/pdf/2403.14829
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.