Avancées dans la détection automatisée des cristaux de protéines
De nouveaux outils améliorent l'efficacité et la précision dans la recherche sur la cristallisation des protéines.
― 22 min lire
Table des matières
- Contexte sur la classification automatisée des images expérimentales
- Enquêtes précédentes sur la classification automatisée
- Contexte sur la détection d'objets cristallins dans les images
- Enquêtes précédentes sur la détection automatisée des cristaux
- Justification de la création de nouveaux outils
- Création des modèles de classificateur CHiMP
- L'ensemble de données MARCO
- Entraînement du classificateur CHiMP-V1
- Entraînement du classificateur CHiMP-V2
- Création d'ensembles de tests d'images pour évaluer la performance du modèle
- Entraînement des réseaux Mask R-CNN pour détecter des objets dans des micrographies expérimentales
- Entraînement du réseau VMXi CHiMP Detector
- Entraînement du réseau XChem CHiMP Detector
- Performance du réseau de classification
- Performance du réseau de détection
- Résumé et conclusion
- Source originale
- Liens de référence
Déterminer la structure des protéines est super important pour comprendre comment elles fonctionnent. Une méthode courante utilisée, c’est la cristallographie aux rayons X. Cette technique peut donner des infos détaillées sur comment les protéines interagissent avec d’autres molécules, comme les substrats et les médicaments. Même avec les avancées technologiques comme l'intelligence artificielle et la cryo-microscopie électronique, la cristallographie aux rayons X reste la méthode la plus précise pour étudier les structures protéiques, permettant aux chercheurs d'analyser les réactions biochimiques et comment les molécules se lient.
Pour utiliser la cristallographie aux rayons X avec succès, les scientifiques doivent d'abord faire pousser des cristaux de protéines. Ces cristaux doivent être disposés d'une manière spécifique pour produire un motif mesurable quand exposés aux faisceaux de rayons X. Cependant, faire pousser ces cristaux peut être difficile, car les protéines plus grandes ne se forment pas facilement dans les solutions utilisées. Trouver les bonnes conditions, comme la concentration de protéines et la température, nécessite souvent beaucoup d'essais et d'erreurs, ce qui pousse les chercheurs à mener un bon nombre d’expériences juste pour augmenter leurs chances de succès. De plus, produire des solutions de protéines pures peut être coûteux et long, ce qui conduit à des expériences à petite échelle.
Dans une expérience typique de cristallisation, une solution de protéine est mélangée avec divers produits chimiques pour créer des gouttes de cristallisation. Ces gouttes sont placées sur des plaques qui peuvent contenir différentes combinaisons de ces produits. Au début, les chercheurs utilisent des conditions connues qui ont fonctionné dans des études précédentes. Une fois qu'ils trouvent une condition prometteuse, ils affinent le processus pour améliorer la qualité des cristaux et augmenter le volume pour des études ultérieures.
Savoir comment faire pousser des cristaux de protéines de manière cohérente est essentiel pour des techniques comme la découverte de médicaments basée sur des fragments (FBDD) et la cristallographie aux rayons X à température ambiante des macromolécules (RTX). Dans la FBDD, les chercheurs ont besoin de beaucoup de cristaux de haute qualité pour tester de nombreux petits composés qui pourraient se lier à la protéine. Ces composés sont ajoutés aux gouttes de cristallisation après la formation des cristaux. Les chercheurs collectent ensuite des données pour chaque combinaison de composé et de cristal pour comprendre les modes de liaison et les pistes potentielles de médicaments. La RTX permet aux scientifiques d'étudier les protéines dans des conditions similaires à celles des systèmes vivants, offrant des aperçus sur le fonctionnement des protéines sans les complications qui peuvent survenir lors de la congélation et de la cryo-protection.
Pendant les expériences, les scientifiques suivent le processus de cristallisation, soit manuellement, soit avec des systèmes d'imagerie robotique. Les outils d'imagerie automatisés incubent les plaques de cristallisation, les récupèrent pour l'imagerie et prennent des photos des gouttes à intervalles réguliers pendant des jours, voire des mois. Le grand nombre d'expériences et de points de temps d'imagerie conduit à la création de nombreuses images microscopiques qui nécessitent une évaluation minutieuse par des experts ou des systèmes automatisés capables de gérer cette tâche.
Une fois que les cristaux de protéines sont formés, l'étape suivante est la collecte de données en utilisant la cristallographie aux rayons X macromoléculaire. Ce processus est devenu de plus en plus automatisé, en particulier dans les installations de synchrotron. Pour les expériences sur des cristaux uniques, les chercheurs montent d'abord les cristaux sur des broches, puis utilisent des systèmes robotiques pour échanger des échantillons stockés dans des conteneurs cryo-refroidis. Cette automatisation réduit le besoin d'implication humaine directe pendant le processus de collecte de données par rayons X. Les avancées technologiques des détecteurs et des systèmes de centrage automatiques facilitent également le processus, permettant aux scientifiques de collecter des données à distance. Pour les expériences RTX, la collecte de données in situ peut avoir lieu dans l'environnement de croissance des cristaux, éliminant le besoin de manipulation manuelle des échantillons.
Au Diamond Light Source (DLS), la facility VMXi beamline permet des expériences RTX efficaces avec peu d'intervention de l'utilisateur. Les expériences de cristallisation sont mises en place par un robot de manipulation de liquide, et les plaques résultantes sont stockées à proximité pour l'imagerie automatisée. Le système identifie les emplacements des cristaux en utilisant des images et enregistre les coordonnées dans un système de gestion des informations de laboratoire. Après que les utilisateurs aient sélectionné des points d'intérêt, les plaques sont transférées à la beamline, où la collecte de données se fait automatiquement.
Dans une autre installation, XChem, des campagnes de découverte de médicaments basées sur des fragments se déroulent avec de nombreux composés à faible poids moléculaire. Au lieu de co-cristalliser les composés avec des protéines, les chercheurs font tremper les cristaux dans des solutions de composés après leur croissance. Un ciblage précis du composé dans la goutte de cristallisation est essentiel pour éviter d'endommager la structure cristalline. Actuellement, ce ciblage se fait via une interface manuelle, mais automatiser le processus améliorerait considérablement l'efficacité.
Cette étude présente deux outils d'apprentissage profond conçus pour faciliter la navigation dans les images et la sélection des coordonnées. Le premier outil, appelé CHiMP (Crystal Hits in My Plate) Classifier, surpasse les classificateurs existants sur des images internes. Le deuxième outil, VMXi CHiMP Detector, détecte et segmente les positions des cristaux. De plus, un troisième outil, XChem CHiMP Detector, aide à déterminer les positions de distribution optimales pour les solutions de composés dans les gouttes de cristallisation.
Contexte sur la classification automatisée des images expérimentales
Au fil des ans, de nombreuses méthodes ont été explorées pour automatiser le suivi des essais de cristallisation. Différentes institutions utilisent des systèmes de notation distincts pour catégoriser les résultats expérimentaux, entraînant des incohérences dans la manière dont les images sont étiquetées. Les experts humains sont souvent en désaccord sur les catégories attribuées aux images, avec des études montrant que seulement environ 70 % des experts peuvent s'accorder sur le même ensemble d'images. Ce manque de consensus souligne le défi de catégoriser des résultats qui peuvent souvent varier le long d'une échelle.
Dans l'analyse de la performance des algorithmes de classification automatisée, diverses métriques sont utilisées, y compris la précision, le rappel et le score F1. Bien que la précision soit courante, elle peut prêter à confusion avec des ensembles de données déséquilibrés, où les images de cristallisation réussie pourraient être en minorité. Par conséquent, la précision, le rappel et le score F1 sont mis en avant pour comparer les performances des classificateurs.
La précision indique combien des prédictions faites étaient correctes, tandis que le rappel mesure combien d'instances positives réelles ont été identifiées par le modèle. Le score F1 harmonise ces deux métriques, servant de mesure équilibrée.
Historiquement, les premières enquêtes sur la classification automatisée se sont concentrées sur la Détection de bords et le suivi de lignes. Les études ultérieures ont favorisé l'extraction d'informations sur la texture des images pour entraîner des classificateurs d'apprentissage automatique. À mesure que les réseaux de neurones convolutifs (CNN) gagnent en popularité, ils ont éliminé le besoin de caractéristiques manuellement conçues. L'introduction d'architectures CNN spécialisées a conduit à de meilleurs résultats dans la classification des images d'essais de cristallisation.
Malgré les avancées, des études ont montré des taux de succès variés. Certaines architectures CNN ont bien performé sur des ensembles de données d'entraînement, mais ont eu du mal avec des ensembles de données indépendants. Cette incohérence montre la nécessité de méthodes d'entraînement robustes et de la sélection minutieuse des ensembles de données pour améliorer la fiabilité des modèles.
Enquêtes précédentes sur la classification automatisée
Dans les études initiales, les chercheurs ont utilisé des méthodes comme le suivi des plus proches voisins et l'analyse de texture pour classer les images de cristallisation. À mesure que les CNN devenaient plus répandus, des modèles comme CrystalNet ont atteint des métriques de classification impressionnantes en s'appuyant sur de grands ensembles de données d'entraînement. Cependant, des tests ultérieurs ont révélé des chutes significatives de la performance du modèle lorsqu'il était appliqué à différents ensembles de données.
L'initiative MARCO visait à créer un modèle de classification robuste en utilisant un grand ensemble de données d'images étiquetées. Leurs efforts ont abouti à un classificateur performant, mais ont également exposé des problèmes au sein de l'ensemble de données, y compris des incohérences dans les étiquettes et des variations dans les configurations expérimentales. Malgré ces défis, le classificateur MARCO a établi une nouvelle référence dans le domaine.
D'autres enquêtes sur l'ensemble de données MARCO ont révélé des variations dans la performance du modèle en fonction des types d'images classées et des architectures de modèle utilisées. Certains modèles, bien qu'atteignant de hauts metrics sur l'ensemble de données d'entraînement, avaient une mauvaise performance face à des données réelles en raison d'un sur-apprentissage ou de complexités inhérentes dans les images.
Les chercheurs ont tenté diverses techniques pour améliorer la classification, y compris l'utilisation de modèles pré-entraînés et le regroupement d'images d'ensembles de données locaux. Les modèles successifs ont souvent déçu en raison du bruit et de l'ambiguïté présents dans les ensembles de données d'entraînement étiquetés.
Contexte sur la détection d'objets cristallins dans les images
Les avancées récentes ont déplacé l’attention vers la détection d'objets spécifiques dans les micrographies de cristallisation. Au lieu de simplement classer des images, les chercheurs visent à localiser les positions des cristaux de protéine et des gouttes. Les techniques de détection d'objets créent des boîtes englobantes autour des entités identifiées tout en fournissant également des estimations de taille et des coordonnées.
La segmentation d'instances va encore plus loin, permettant à des objets individuels d'être reconnus séparément. Cette méthode fournit des informations détaillées sur la taille de chaque cristal et peut faciliter le comptage et la classification précis.
La plupart des études de détection d'objets proviennent du domaine du génie chimique, où les caractéristiques des cristaux sont bien comprises. Ces méthodes ont été utilisées pour suivre les processus de cristallisation et caractériser les formations de produits finaux.
Pour évaluer la performance des réseaux de détection d'objets, la précision moyenne (mAP) est souvent utilisée. Cette métrique repose sur la précision et le rappel mais intègre des informations sur la façon dont les boîtes englobantes prédites s'alignent avec les emplacements réels des objets.
Malgré les complexités du mAP, des études précédentes n'ont pas toujours rapporté leurs résultats, rendant difficile la comparaison entre différents réseaux. Documenter ces scores peut aider à établir des références pour des recherches futures.
Enquêtes précédentes sur la détection automatisée des cristaux
Par le passé, les chercheurs ont expérimenté des réseaux conçus pour la segmentation d'instances de cristaux. Ces réseaux appliquent des architectures avancées, comme Mask-R-CNN, pour délimiter avec précision les cristaux dans diverses conditions.
Les études se concentrant sur des images simulées ont montré une promesse, avec des réseaux capables de détecter et de dimensionner les cristaux efficacement. Cependant, les métriques de performance se sont souvent obscurcies en raison de la taille limitée des ensembles de données, de la qualité variable des annotations et du manque de clarté dans la communication des résultats.
L'intérêt croissant pour l'application pratique des réseaux d'apprentissage profond a conduit à davantage d'enquêtes sur des ensembles de données du monde réel. L'annotation manuelle des images reste une tâche laborieuse, les plateformes collaboratives comme Zooniverse aidant dans ce processus.
Malgré les défis de la génération d'ensembles de données d'entraînement de haute qualité, ces réseaux montrent un potentiel pour améliorer l'efficacité et la précision de la détection de cristaux. Le développement continu permettra aux chercheurs d'automatiser encore plus ces processus, réduisant ainsi la dépendance aux inspections manuelles.
Justification de la création de nouveaux outils
Dans la quête d'une automatisation améliorée du suivi de la cristallisation, le besoin de classification et de détection d'images rapides et précises devient primordial. Les systèmes existants exigent souvent une intervention humaine pour identifier les structures cristallines et catégoriser les résultats expérimentaux. Le désir de rationaliser ces processus a conduit à l'exploration de nouveaux outils analytiques.
Les premiers efforts d'automatisation reposaient sur le réseau de classification MARCO. Cependant, les retours ont indiqué une méfiance quant à l'exactitude du classificateur lors de l'évaluation d'images internes. Cela a déclenché une évaluation approfondie de la performance du classificateur, mettant en évidence sa tendance à mal classer les images comme précipités plutôt que de les catégoriser avec précision.
Les insights de cette évaluation ont suggéré que former un nouveau modèle spécifiquement sur des images locales améliorerait l'exactitude de la classification. Avec des avancées significatives dans les capacités de détection d'objets, la recherche de nouvelles méthodes d'entraînement est devenue essentielle pour favoriser l'automatisation des processus de collecte de données.
Deux cas d'utilisation distincts illustrent le besoin de solutions plus automatisées. Le premier cas nécessite que les chercheurs identifient les positions des cristaux pour la collecte de données, tandis que le deuxième cas a besoin d'un ciblage précis des positions de distribution de composés dans les gouttes de cristallisation.
Les processus manuels peuvent être longs et sujets à erreurs. Automatiser ces tâches accélérerait non seulement les flux de travail mais améliorerait également la fiabilité des résultats. Cela motive le développement d'outils d'apprentissage profond spécialisés capables de classifier les micrographies expérimentales et de détecter les emplacements des cristaux.
Création des modèles de classificateur CHiMP
Le développement des réseaux de classification de micrographies de cristaux s'est appuyé sur deux ensembles de données principaux. Le premier, le Ensemble de données de classification VMXi, comprenait des images collectées lors d'expériences à la beamline VMXi. Le second, l'ensemble de données MARCO, servait de source complémentaire d'images étiquetées.
Le modèle initial, CHiMP Classifier-v1, était basé sur une architecture ResNet50. Ce modèle a été entraîné en utilisant l'ensemble de données de classification VMXi et a obtenu des résultats satisfaisants après un fine-tuning approfondi. Cependant, à mesure que la technologie évoluait, les chercheurs cherchaient à améliorer l'architecture du classificateur pour résoudre des limitations et incorporer des techniques modernes.
La transition vers l'architecture ConvNeXt a marqué une amélioration significative du modèle. ConvNeXt utilise des tailles de noyau augmentées et des méthodes de traitement innovantes, permettant d'améliorer les performances. Une fois formé, ce nouveau modèle, nommé CHiMP Classifier-v2, a été déployé sur la beamline VMXi pour aider les chercheurs dans la classification d'images.
Curation de l'ensemble de données de classification VMXi
Pour construire l'ensemble de données de classification VMXi, les chercheurs ont catégorisé manuellement les images de la base de données en fonction de leurs insights provenant de diverses expériences. L'objectif était de garantir une collection complète d'images capturant une gamme de résultats.
En plus de la collecte initiale de données, des efforts ont été déployés pour éliminer les images redondantes ou trompeuses. L'ensemble de données final était constitué de juste moins de 14 000 images, catégorisées en 10 classes. Les experts ont travaillé méticuleusement pour nettoyer et affiner les données, garantissant une plus grande précision et clarté dans la classification.
Mapping des étiquettes d'images de VMXi sur un système à quatre étiquettes
Les étiquettes d'images de l'ensemble de données VMXi ont été mappées sur un système simplifié à quatre classes : Cristaux, Précipité, Clair et Autre. Ce mapping visait à rationaliser le processus de classification et réduire la confusion durant l'analyse.
Une fois l'ensemble de données nettoyé et catégorisé, il a été divisé en ensembles d'entraînement et de validation, facilitant l'entraînement du classificateur tout en permettant une évaluation sur des données non vues. Avec une validation par des experts, ce processus a fourni des métriques robustes sur la performance du classificateur.
L'ensemble de données MARCO
L'initiative MARCO visait à compiler un grand ensemble de données pour améliorer la performance dans la classification des micrographies de cristallisation. Cet ensemble de données contenait plus de 400 000 images étiquetées provenant de plusieurs organisations. Cependant, lors de l'évaluation, des incohérences dans les étiquettes et la qualité de certaines images ont été identifiées.
Après le processus de nettoyage initial, l'ensemble de données a été divisé en sous-ensembles d'entraînement et de validation pour l'entraînement du modèle. Cet effort collaboratif a établi une ressource complète pour les chercheurs intéressés par l'avancement du domaine de la surveillance de la cristallisation des protéines.
Entraînement du classificateur CHiMP-V1
Dans le développement du classificateur CHiMP-v1, les chercheurs ont utilisé la bibliothèque fastai pour construire un réseau ResNet50 pré-entraîné sur la base de données ImageNet. Cette approche a permis d'utiliser efficacement les données disponibles tout en optimisant le potentiel du modèle pour des Classifications précises.
Le processus d'entraînement a impliqué d'augmenter l'ensemble de données d'entraînement pour prévenir le sur-apprentissage. Diverses techniques, comme les rotations et flips aléatoires, ont été employées pour enrichir l'ensemble d'entraînement. Après 31 époques d'entraînement, le modèle a démontré de solides métriques de performance, établissant une base pour des explorations ultérieures.
Entraînement du classificateur CHiMP-V2
L'entraînement du classificateur CHiMP Classifier-v2 a été réalisé en utilisant une architecture de modèle améliorée. Le réseau ConvNeXt-Tiny a été initialisé avec des poids provenant des entraînements précédents, permettant un fine-tuning et une adaptation aux nouvelles conditions de l'ensemble de données.
L'entraînement a commencé avec l'ensemble de données MARCO pour tirer parti des caractéristiques apprises à partir de la vaste collection d'images. Ensuite, le modèle a été affiné avec l'ensemble de données de classification VMXi pour maximiser la performance sur les images locales. Une stratégie d'entraînement minutieuse a été employée pour contrer les déséquilibres d'étiquettes et optimiser la précision globale.
Création d'ensembles de tests d'images pour évaluer la performance du modèle
Pour évaluer la performance de classification des réseaux, les chercheurs ont créé un ensemble de test d'images complet. En rassemblant une sélection représentative de micrographies, ils ont visé à garantir que le processus d'évaluation capturait divers résultats.
Trois experts ont indépendamment noté les images, créant deux sous-ensembles en fonction du niveau d'accord entre les examinateurs. Cette approche a permis aux chercheurs d'évaluer les classificateurs contre des ensembles de données à la fois sans ambiguïté et majoritairement sans ambiguïté.
Entraînement des réseaux Mask R-CNN pour détecter des objets dans des micrographies expérimentales
Pour approfondir la détection de cristaux, les chercheurs ont exploré les capacités des réseaux Mask R-CNN. Les premières expériences visaient à localiser des caractéristiques spécifiques en utilisant des techniques Grad-CAM, mais le manque de précision dans les résultats entravait leur efficacité.
Passer à une approche de détection d'objets a permis aux chercheurs d'entraîner des réseaux capables de localiser individuellement les cristaux. En générant des annotations de haute qualité et en utilisant des plateformes collaboratives, des ensembles de données ont été créés pour former les réseaux.
Sélection d'images pour les réseaux de détection
La sélection initiale des images pour entraîner le réseau de détection a impliqué un processus de curation minutieux. Les chercheurs ont échantillonné à partir d'ensembles de données précédemment collectés, garantissant une représentation diversifiée des résultats.
L'ensemble final pour entraîner le détecteur VMXi CHiMP contenait 237 images, tandis que l'ensemble de données XChem comprenait 350 images. Ces images ont subi un prétraitement pour améliorer leur visibilité et optimiser le processus d'entraînement.
Création d'annotations d'images pour les réseaux de détection
L'annotation manuelle était cruciale pour entraîner les réseaux de détection d'objets. Les experts ont annoté les images avec des masques détaillés, des étiquettes et des boîtes englobantes mettant en évidence les emplacements des cristaux. Des efforts collaboratifs ont aidé à rationaliser ce processus à travers des plateformes conçues pour l'annotation participative.
En utilisant ces annotations, les chercheurs ont généré des ensembles de données complets adaptés à l'entraînement des réseaux Mask R-CNN. La combinaison des insights d'experts et des outils automatisés a facilité le développement de modèles efficaces pour la détection de cristaux.
Entraînement du réseau VMXi CHiMP Detector
Le réseau VMXi CHiMP Detector a été créé pour détecter les positions des cristaux dans les images. L'entraînement du modèle a impliqué l'augmentation de l'ensemble de données limité et l'optimisation des performances grâce à des techniques d'entraînement stratégiques.
Après un entraînement approfondi, le réseau a atteint des métriques satisfaisantes sur l'ensemble de validation. Le modèle final a démontré sa capacité à identifier avec précision les cristaux et à rapporter leurs coordonnées pour la collecte de données ultérieure.
Entraînement du réseau XChem CHiMP Detector
L'entraînement du réseau XChem CHiMP Detector a suivi une stratégie similaire, s'appuyant sur des modèles précédemment développés. L'ensemble de données a été élargi avec des images et des annotations supplémentaires adaptées aux besoins spécifiques des expériences XChem.
L'entraînement s'est poursuivi avec plusieurs époques, en se concentrant constamment sur la préservation d'une haute précision de détection. Le modèle final a réussi à signaler les positions des cristaux, permettant un ciblage efficace lors de la distribution des composés.
Performance du réseau de classification
La performance des réseaux de classification a été évaluée en utilisant des métriques rigoureuses calculées sur des ensembles de validation et des ensembles de test indépendants. Les classificateurs CHiMP-v1 et Classifier-v2 ont montré des améliorations significatives dans leur capacité à classer les images avec précision.
Sur l'ensemble de validation de l'ensemble de données de classification VMXi, le CHiMP Classifier-v1 a atteint des précisions, rappels et scores F1 élevés. Le modèle amélioré Classifier-v2 a montré un succès encore plus élevé, mettant en avant l'efficacité des améliorations architecturales et des stratégies d'entraînement affinées.
Performance du réseau de détection
La performance des réseaux de détection d'objets a été évaluée en utilisant des métriques de précision moyenne. Les réseaux VMXi CHiMP Detector et XChem CHiMP Detector ont présenté des résultats prometteurs dans la détection des cristaux et la communication précise des coordonnées.
Les métriques de performance ont montré les améliorations de la capacité à identifier et segmenter les cristaux avec précision. Les réseaux se sont révélés bénéfiques pour rationaliser les flux de travail et améliorer l'efficacité de la collecte de données.
Résumé et conclusion
Les avancées réalisées grâce au développement des réseaux de classification et de détection CHiMP ont des implications significatives pour le domaine de la recherche sur la cristallisation des protéines. Ces outils permettent une classification et une détection des cristaux automatisées, minimisant la dépendance au travail manuel tout en améliorant la précision.
En permettant aux chercheurs de rationaliser leurs flux de travail, ces outils ouvrent la voie à une détermination plus rapide et plus efficace des structures protéiques. Le potentiel d'application de ces modèles dans divers contextes de recherche ouvre des portes pour des explorations supplémentaires et des découvertes innovantes.
Partager les données d'entraînement, les poids des modèles et le code de ces réseaux est essentiel pour favoriser la collaboration et l'amélioration au sein de la communauté scientifique. L'objectif est d'améliorer notre compréhension des protéines et de leurs fonctions, contribuant finalement aux avancées en recherche sur les maladies et au développement de traitements.
Titre: CHiMP: Deep Learning Tools Trained on Protein Crystallisation Micrographs to Enable Automation of Experiments
Résumé: A group of three deep learning tools, referred to collectively as CHiMP (Crystal Hits in My Plate) were created for analysis of micrographs of protein crystallisation experiments at the Diamond Light Source (DLS) synchrotron, UK. The first tool, a classification network, assigns images into categories relating to experimental outcomes. The other two tools are networks that perform both object detection and instance segmentation, resulting in masks of individual crystals in the first case, and masks of crystallisation droplets in addition to crystals in the second case, allowing positions and sizes of these entities to be recorded. Creation of these tools used transfer learning, where weights from a pre-trained deep learning network were used as a starting point and re-purposed by further training on a relatively small set of data. Two of the tools are now integrated at the VMXi macromolecular crystallography beamline at DLS where they absolve the need for any user input both for monitoring crystallisation experiments and for triggering in situ data collections. The third is being integrated into the XChem fragment-based drug discovery screening platform, also at DLS, to allow automatic targeting of acoustic compound dispensing into crystallisation droplets.
Auteurs: Oliver N F King, K. E. Levik, J. Sandy, M. Basham
Dernière mise à jour: 2024-05-23 00:00:00
Langue: English
Source URL: https://www.biorxiv.org/content/10.1101/2024.05.22.595345
Source PDF: https://www.biorxiv.org/content/10.1101/2024.05.22.595345.full.pdf
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.