Un modèle d'IA transforme l'analyse d'images de tissus pour le cancer
HIPI prédit les niveaux de protéines à partir d'images H&E, aidant au diagnostic du cancer.
― 8 min lire
Table des matières
- Techniques de Coloration
- Nouvelles Méthodes en Recherche sur le Cancer
- Le Rôle de l'Intelligence Artificielle
- Présentation de HIPI
- Performance de HIPI
- Aperçu de la Méthodologie
- Résultats et Conclusions
- Évaluation de Nouveaux Échantillons
- Analyse des Interactions Cellulaires
- Comparaison aux Modèles de Référence
- Conclusion
- Source originale
- Liens de référence
Analyser les images de tissus, c'est super important pour identifier les tumeurs et comprendre leurs caractéristiques. Cette analyse aide les docs à donner de meilleurs diagnostics et plans de traitement. La méthode standard pour regarder les échantillons de tissus, c'est une technique de coloration appelée Hematoxylin et Eosin (H&E). Cette méthode permet aux pathologistes de voir la structure des tissus et de différencier les parties des cellules. Mais bon, ça a ses limites, surtout pour trouver des protéines spécifiques ou des marqueurs dans les tumeurs.
Techniques de Coloration
La coloration H&E est largement utilisée dans le traitement du cancer. En examinant les images de lames entières colorées à H&E (WSIs), les médecins peuvent identifier la structure des tissus, comment les cellules sont organisées, et commencer à comprendre comment les tumeurs interagissent avec leur environnement. En plus de la coloration H&E, les médecins utilisent aussi une méthode appelée Immunohistochimie (IHC) pour trouver des protéines spécifiques dans le tissu. Mais l'IHC, c'est plus compliqué et coûteux, ce qui limite le nombre de colorations qu'on peut faire sur chaque échantillon. Certains marqueurs protéiques importants ne peuvent même pas être détectés avec l'IHC.
Nouvelles Méthodes en Recherche sur le Cancer
Récemment, de nouvelles méthodes ont été développées pour mesurer les protéines tout en gardant leur information spatiale. Ces nouvelles techniques montrent comment différentes protéines sont réparties dans le tissu. Par exemple, la Transcriptomique spatiale mesure les expressions d'ARN de nombreux gènes à travers de petites zones d'une coupe de tissu, et l'Immunofluorescence Cyclique (CyCIF) fournit des images détaillées des expressions protéiques. Ces techniques ont du potentiel, mais elles sont surtout utilisées en recherche et pas encore dans la pratique clinique routinière à cause de leur coût élevé et du besoin d'équipement spécialisé.
Le Rôle de l'Intelligence Artificielle
Ces dernières années, l'intelligence artificielle (IA) a beaucoup fait parler d'elle dans le domaine de la pathologie. Les modèles d'IA peuvent analyser des images histopathologiques et faire des tâches qui demanderaient normalement beaucoup de travail manuel. Par exemple, ces modèles peuvent prédire des étiquettes importantes des WSIs, comme le stade et le grade du cancer, et même suggérer des options de traitement basées sur les caractéristiques de la tumeur.
Un domaine d'intérêt, c'est la capacité des modèles d'IA à transférer des informations entre différents types d'images colorées. Une méthode récente utilise l'IA pour convertir des images colorées H&E en images CyCIF, mais ces modèles ont surtout été testés sur le même type de tissu que celui utilisé pour leur entraînement, ce qui rend difficile de savoir comment ils fonctionneraient sur d'autres tissus.
Présentation de HIPI
On a développé un nouveau modèle d'IA appelé H&E Image Interpretation and Protein Expression Inference (HIPI) qui peut prédire les niveaux de protéines à partir d'images H&E. Pour entraîner notre modèle, on utilise des données provenant de tranches de tissus adjacentes de cancer colorectal. Ça nous permet d'aligner les données H&E avec les données des images CyCIF, rendant possible la prédiction de plusieurs marqueurs protéiques à partir d'une seule image H&E.
Pour pallier le manque de données, on utilise une technique appelée Apprentissage auto-supervisé (SSL), qui permet au modèle d'apprendre à partir de grandes quantités de données non étiquetées. Cette approche aide le modèle à extraire des caractéristiques utiles des images. On utilise aussi des techniques d'entraînement spécifiques pour gérer les variations d'intensité de coloration et d'autres artefacts qui peuvent se produire pendant le processus d'imagerie H&E.
Performance de HIPI
On a trouvé que HIPI est efficace pour prédire les niveaux d'expression des protéines dans les tissus de cancer colorectal, et ça fonctionne aussi bien sur de nouveaux échantillons de tumeurs provenant de différents patients. Notre modèle peut identifier des marqueurs moléculaires importants juste avec les images H&E. Par exemple, le modèle peut prédire les interactions entre des marqueurs spécifiques qui peuvent être ciblés pour thérapie chez les patients atteints de cancer colorectal.
Aperçu de la Méthodologie
HIPI traite les images H&E en petites sections, ou tuiles. Chaque tuile est analysée pour ses niveaux d'expression protéique. On a entraîné HIPI en utilisant des paires d'images H&E et CyCIF provenant de tranches adjacentes d'échantillons de cancer colorectal. Ça impliquait un alignement soigné des images pour assurer l'exactitude. Le modèle prédit ensuite les niveaux de protéines dans chaque tuile et les combine pour créer une image complète de l'expression protéique dans le tissu.
Pendant notre entraînement, on a utilisé un grand jeu de données qui incluait de nombreuses tuiles provenant de différentes sections du tissu. On a divisé les tuiles en ensembles d'entraînement, de validation et de test pour s'assurer que le modèle pourrait généraliser ses prédictions et qu'il ne ferait pas que mémoriser les données.
Résultats et Conclusions
Nos tests ont montré que HIPI donne des prédictions précises des niveaux de protéines sur différents échantillons. Pour les ensembles d'entraînement, de validation et de test, on a observé une forte corrélation entre les niveaux de protéines prédites et réelles. Certains marqueurs, comme la kératine et Ki67, ont montré une précision particulièrement élevée dans les prédictions.
Cependant, certains marqueurs comme PD1 et PDL1 étaient plus difficiles à prédire, mais le modèle a quand même réussi à bien corréler avec les mesures réelles. On a aussi observé des motifs spécifiques, comme certaines protéines qui tendent à s'exprimer ensemble dans les mêmes zones du tissu, ce qui est important pour comprendre le comportement des tumeurs.
Évaluation de Nouveaux Échantillons
Ensuite, on a testé HIPI sur de nouveaux échantillons de cancer colorectal qui n'étaient pas dans les données d'entraînement. On a trouvé que les prédictions étaient quand même positivement corrélées avec les mesures réelles de protéines, même si la précision était un peu plus basse par rapport aux données d'entraînement. Le modèle a quand même bien fonctionné, surtout pour des marqueurs comme Ki67 et CD45.
Cette capacité à généraliser sur de nouveaux échantillons met en lumière le potentiel de HIPI comme un outil utile pour prédire l'expression des protéines dans divers types de cancers au-delà du cancer colorectal.
Analyse des Interactions Cellulaires
Comprendre comment les différents types de cellules et marqueurs interagissent dans l'environnement tumoral est crucial pour planifier les traitements. HIPI nous permet d'examiner comment différents marqueurs coexistent dans le tissu. En analysant les résultats, on peut voir comment certaines protéines s'expriment ensemble, et ces informations peuvent révéler des interactions importantes liées au traitement du cancer.
Notre modèle a bien fonctionné pour identifier les co-occurrences de marqueurs spécifiques, enrichissant notre compréhension de la dynamique dans l'environnement tumoral.
Comparaison aux Modèles de Référence
On a aussi comparé HIPI à un modèle plus simple qui se contente de regarder l'intensité de couleur moyenne des images, sans utiliser de caractéristiques avancées de la structure du tissu. Même étant plus simple, le modèle de base a constamment moins bien performé que HIPI, surtout pour les protéines plus difficiles à prédire. Ça montre clairement que l'information morphologique contenue dans les images est précieuse pour faire des prédictions précises.
Conclusion
Pour résumer, HIPI est un modèle innovant qui prédit les expressions protéiques à partir d'images H&E dans des échantillons de cancer colorectal. Il traite efficacement des données appariées provenant de tranches de tissus adjacents et montre un potentiel pour des applications plus larges dans le diagnostic du cancer. Bien qu'il fonctionne à une résolution plus basse, il permet d'agréger des informations à travers plusieurs cellules et aide à atténuer le bruit présent dans les mesures de cellules individuelles. En gros, HIPI représente une avancée significative dans la combinaison de la technologie IA avec la pathologie, offrant une méthode prometteuse pour améliorer l'évaluation et la recherche sur le cancer.
En regardant vers l'avenir, il y a plusieurs opportunités pour améliorer et étendre les capacités de HIPI, y compris son application à d'autres types de cancer et l'amélioration de la résolution pour capturer des détails encore plus fins dans les interactions des tissus.
Titre: HIPI: Spatially Resolved Multiplexed Protein Expression Inferred from H&E WSIs
Résumé: Solid tumors are characterized by complex interactions between the tumor, the immune system and the microenvironment. These interactions and intra-tumor variations have both diagnostic and prognostic significance and implications. However, quantifying the underlying processes in patient samples requires expensive and complicated molecular experiments. In contrast, H&E staining is typically performed as part of the routine standard process, and is very cheap. Here we present HIPI (H&E Image Interpretation and Protein Expression Inference) for predicting cell marker expression from tumor H&E images. We process paired H&E and CyCIF images taken from serial sections of colorectal cancers to train our model. We show that our model accurately predicts the spatial distribution of several important cell markers, on both held-out tumor regions as well as new tumor samples taken from different patients. Moreover, using only the tissue image morphology, HIPI is able to colocalize the interactions between different cell types, further demonstrating its potential clinical significance.
Auteurs: Ron Zeira, L. Anavy, Z. Yakhini, E. Rivlin, D. Freedman
Dernière mise à jour: 2024-06-30 00:00:00
Langue: English
Source URL: https://www.biorxiv.org/content/10.1101/2024.03.26.586744
Source PDF: https://www.biorxiv.org/content/10.1101/2024.03.26.586744.full.pdf
Licence: https://creativecommons.org/licenses/by-nc/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.