Simple Science

La science de pointe expliquée simplement

# Sciences de la santé # Éducation médicale

Le Défi des Revues Systématiques en Vie

Un regard sur le besoin de bases de données d'essais cliniques mises à jour.

Kim Boesen, Lars G Hemkens, Perrine Janiaud, Julian Hirt

― 10 min lire


Faire face au défi de Faire face au défi de l'examen des vivants gérer les données d'essai. Besoin de bases de données à jour pour
Table des matières

Au cours des dernières décennies, le nombre d'Essais cliniques et d'examens a explosé. Du coup, pour les médecins et les chercheurs qui essaient de suivre, ça devient un job à temps plein juste pour rester au courant. Imagine essayer de boire à un tuyau d'incendie - l'info arrive trop vite pour vraiment tout assimiler. Les examens réguliers peuvent prendre une éternité à finir, nécessitant souvent beaucoup de temps pour fouiller dans des bases de données, trier les titres d'études, évaluer les études elles-mêmes, et ensuite extraire les données pertinentes. Quand ces examens sont publiés, ils peuvent être obsolètes, et on pourrait même dire trompeurs.

Pour gérer ce déluge de données, de nouveaux outils sont apparus pour simplifier le processus d'examen. Ces outils utilisent des technologies sophistiquées, comme le text mining et l'apprentissage machine, pour trouver et rassembler des infos provenant d'études. Si seulement ils pouvaient aussi faire du café !

Place aux Revues Systématiques Vivantes

Une idée innovante qui a pris de l'ampleur est la “revue systématique vivante.” À ne pas confondre avec un testament de vie, ce type de revue est censé être mis à jour en continu. L'objectif ici est d'éviter les retards habituels et de s'assurer que les nouvelles découvertes importantes ne passent pas à la trappe. Cependant, il y a encore des débats sur ce qui qualifie vraiment une “revue vivante.” En théorie, ça sonne bien - mais dans la pratique, c'est un peu flou.

L'une des premières tentatives de revue vivante a été lancée par la Cochrane Collaboration en 2017. Malheureusement, depuis, elle n'a pas été mise à jour du tout, laissant les gens se demander ce que “vivant” signifie vraiment dans ce contexte. Puis est arrivée la pandémie de COVID-19, qui a déclenché une vague de projets visant à suivre l'afflux rapide d'informations. C'est comme si tout le monde avait soudain décidé de faire la fête, mais avait oublié d'inviter les mises à jour !

Le Besoin d'une Meilleure Gestion des Données

Pour que les revues vivantes fonctionnent, il faut s'assurer que toutes les données des essais cliniques soient disponibles dans un format facilement lisible par des machines. Cela signifie trouver un moyen de les structurer de façon cohérente. Le rêve d'un système qui regrouperait toutes les données des Essais Contrôlés Randomisés (ECR) existe depuis plus de 25 ans, mais jusqu'à maintenant, c'est un rêve repoussé.

Une des premières idées pour un tel système était la Global Trial Bank, qui visait à non seulement enregistrer des essais mais aussi à rapporter les résultats d'une manière que l'ordinateur pourrait digérer. Malheureusement, ça n'a jamais décollé. Cependant, des étapes ont été prises en 2004, lorsque le Comité International des Éditeurs de Revues Médicales a décidé que tous les essais cliniques devaient être enregistrés avant publication. Ce mouvement a continué en 2007 quand il est devenu obligatoire de soumettre les résultats résumés sur ClinicalTrials.gov et plus tard sur le Registre des Essais Cliniques de l'Union Européenne en 2012.

Certains chercheurs argumentent que les données des essais cliniques devraient vraiment être dans un format standard, comme le format de Document Technique Commun utilisé pour les demandes de médicaments. D'autres estiment que les revues, comme celles systématiques, devraient s'appuyer principalement sur les registres d'essais cliniques plutôt que sur la méthode traditionnelle qui consiste à extraire des données de publications éparpillées. L'idée est de rendre le processus plus rapide et plus complet.

Mais même avec toutes ces améliorations, on ne sait toujours pas si les projets vivants actuels sont capables d'utiliser des technologies avancées pour s'assurer que les données des essais cliniques pénètrent dans des bases de données organisées sans accroc. C'est pourquoi nous avons décidé de jeter un œil de plus près à ce qui existe actuellement - pour comprendre ce que ces bases de données peuvent faire et comment elles peuvent être améliorées.

Comment Nous Nous y Sommes Pris

Pour commencer, nous avons réalisé une revue d'orientation. Comme nous nous attendions à rencontrer pas mal d'obstacles en cours de route, nous n'avons pas suivi un plan précis ni enregistré notre revue. Au lieu de cela, nous avons rapporté nos résultats sur la base de directives établies pour les revues systématiques.

Critères d'Inclusion

Nous nous sommes concentrés sur les bases de données qui sont continuellement mises à jour et accessibles au public, extrayant des données d'essais contrôlés randomisés, peu importe comment elles ont récupéré l'information. Nous étions intéressés par des bases de données axées sur des domaines spécifiques, comme le COVID-19, plutôt que des bases de données larges et générales. La langue, la date de publication et l'utilisation prévue n'étaient pas des facteurs dans notre évaluation.

Cependant, nous n'avons pas inclus les revues systématiques vivantes traditionnelles qui n'ont pas de base de données éligible associée.

Trouver la Bonne Information

Notre stratégie de recherche comportait deux étapes principales. La première était une “recherche à froid” où nous avons fouillé diverses ressources pour déterminer des mots-clés et des références. Cela nous a aidés à construire une recherche plus systématique par la suite.

Dans la seconde étape, nous avons conçu une stratégie de recherche qui incluait des mots-clés pour “vivant,” “bibliothèque,” et des termes de conception d'étude comme “ECR” et “étude clinique.” Nous avons cherché sur PubMed et Embase, trié les résultats, et utilisé un outil de sélection pour filtrer tout ce que nous avons trouvé.

Ce Que Nous Avons Découvert

Nous avons examiné de près sept caractéristiques de ces bases de données :

  1. Modèle d'Accès : Comment les utilisateurs peuvent-ils accéder à la base de données ? Est-elle ouverte à tous, ont-ils besoin d'une autorisation spéciale, ou est-ce un mélange des deux ?

  2. Architecture de la Base de Données : Sur quoi est construite la base de données ? Est-ce une simple feuille de calcul ou quelque chose de plus complexe ?

  3. Sources de Données : D'où viennent les données ? S'agit-il d'études publiées, de registres d'essais, ou des deux ?

  4. Méthodes de Récupération : Comment les essais sont-ils ajoutés à la base de données ? Est-ce fait manuellement, par automatisation, ou par des contributions communautaires ?

  5. Extraction de données : Comment l'information est-elle extraite des essais ? Est-ce manuel, totalement automatisé, ou un mélange des deux ?

  6. Présentation des Essais : Quel genre d'information les bases de données fournissent-elles sur les essais ? Cela peut aller des métadonnées de base à des résultats détaillés et des évaluations de risque.

  7. Options d'Exportation : Comment les utilisateurs peuvent-ils télécharger ou réutiliser les données ? Sont-elles facilement disponibles, ne peuvent-elles être visualisées qu'en ligne, ou ne sont-elles pas disponibles du tout ?

Les Résultats

Après nos recherches, nous avons trouvé 14 bases de données continuellement mises à jour ; sept d'entre elles étaient liées au COVID-19. Les bases de données COVID utilisaient principalement des méthodes semi-automatisées pour trouver et extraire des données, tandis que la plupart des bases de données non COVID s'appuyaient sur des méthodes traditionnelles et manuelles.

La plupart des bases de données offraient des métadonnées de base, mais seules quelques-unes fournissaient des informations détaillées sur les essais ou des évaluations de la qualité des essais. Fait intéressant, une seule base de données mentionnait qu'elle pouvait partager les données individuelles des participants.

La Vision d'Ensemble

Notre revue met en lumière le fait qu'il n'existe pas beaucoup de bases de données continuellement mises à jour axées sur des sujets spécifiques. La plupart des options existantes utilisent encore des méthodes et des technologies héritées d'anciennes revues systématiques, ce qui peut être lent et peu pratique.

Le principal souci est qu'extraire des données utiles des essais cliniques publiés reste un défi majeur puisque beaucoup d'informations se trouvent dans des publications non structurées. Et malheureusement, aucune des plateformes que nous avons examinées n'a réussi à résoudre complètement ce problème. Il y a un besoin urgent de jeux de données structurés qui soient faciles à accéder et à utiliser.

Pourquoi les Registres Actuels Ne Suffisent Pas

Il y a plusieurs raisons qui rendent l'utilisation des registres d'essais cliniques difficile pour créer des bases de données spécifiques à un sujet :

  1. Manque de Standardisation : Différents registres d'essais ont des formats et des structures de données variés. Cela rend difficile le regroupement d'informations de manière cohérente.

  2. Taux d'Erreur : D'après notre expérience, nous suspectons qu'il y a beaucoup d'erreurs lorsque les données sont saisies dans les registres. Cela peut entraîner beaucoup de “nettoyage de données” avant que l'information ne soit utilisable.

  3. Limitations d'Exportation : Tous les registres ne permettent pas l'exportation facile des données, ce qui peut entraîner de la frustration lorsque les chercheurs essaient de rassembler des informations.

Une Solution Éventuelle

Un outil appelé TrialStreamer pourrait avoir du potentiel. Bien qu'il ne soit pas spécifiquement ciblé, il collecte un grand nombre d'essais cliniques et annote des informations cruciales à leur sujet. Cela pourrait être utile pour des études de haut niveau, mais pour des applications cliniques plus détaillées, nous avons encore besoin de descriptions d'essais plus finement ajustées.

Le Wellcome Trust a récemment offert une lueur d'espoir, s'engageant à investir des fonds pour développer une meilleure infrastructure pour les projets d'évidence vivante. On dirait qu'ils pourraient être sur la bonne voie !

Limitations de Notre Revue

Notre revue d'orientation a ses limites. Comme nous n'avons pas établi une méthodologie spécifique au départ, nous avons peut-être manqué certaines sources de données précieuses. Nous avons également reconnu qu'il y a probablement beaucoup de solutions commerciales “cachées” là dehors, auxquelles nous n'avions pas accès.

Une solution commerciale publique s'appelle LiveSLR, qui combine une bibliothèque annotée avec un flux de travail pour trouver et classer des études. Cependant, les détails concernant de telles plateformes commerciales sont souvent difficiles à obtenir.

L'Avenir Qui Nous Attend

En conclusion, cette revue souligne le besoin pressant de bases de données continuellement mises à jour dans les essais cliniques. Les systèmes existants s'appuient souvent sur des méthodes traditionnelles et manuelles qui ne sont pas équipées pour suivre la production rapide de nouveaux essais et revues.

Alors que nous faisons face au défi d'extraire des données des publications de revues, il pourrait être temps de repenser des idées plus anciennes comme la Global Trial Bank. Si nous pouvions passer de la simple publication d'articles à un système entièrement numérique et lisible par machine pour les données des essais cliniques, nous pourrions peut-être suivre le monde en évolution de la synthèse des preuves.

Après tout, qui ne voudrait pas cesser de courir après les mises à jour et se servir plutôt une tasse de café ?

Source originale

Titre: Publicly available continuously updated topic specific databases of randomised clinical trials: A scoping review

Résumé: Conducting systematic reviews of clinical trials is arduous and resource consuming. One potential solution is to design databases that are continuously and automatically populated with clinical trial data from harmonised and structured datasets. We aimed to map publicly available, continuously updated, topic-specific databases of randomised clinical trials (RCTs). We systematically searched PubMed, Embase, the preprint servers medRxiv, ArXiv, and Open Science Framework, and Google. We described seven features (access model, database architecture, data input sources, retrieval methods, data extraction methods, trial presentation, and export options) and narratively summarised the results. We did not register a protocol for this review. We identified 14 continuously updated clinical trial databases, seven related to COVID-19 (first active in 2020) and seven non-COVID databases (first active in 2009). All databases, except one, were publicly funded and accessible without restrictions. They mainly employed methods similar to those from static article-based systematic reviews and retrieved data from journal publications and trial registries. The COVID-19 databases and some non-COVID databases implemented semi-automated features of data import, which combined automated and manual data curation, whereas the non-COVID databases mainly relied on manual workflows. Most reported information was metadata, such as author names, years of publication, and link to publication or trial registry. Two databases included trial appraisal information (risk of bias assessments). Six databases reported aggregate group level results, but only one database provided individual participant data on request. We identified few continuously updated trial databases, and existing initiatives mainly employ methods known from static article -based reviews. The main limitation to create truly live evidence synthesis is the access and import of machine-readable and harmonised clinical trial data.

Auteurs: Kim Boesen, Lars G Hemkens, Perrine Janiaud, Julian Hirt

Dernière mise à jour: 2024-11-18 00:00:00

Langue: English

Source URL: https://www.medrxiv.org/content/10.1101/2024.11.18.24317477

Source PDF: https://www.medrxiv.org/content/10.1101/2024.11.18.24317477.full.pdf

Licence: https://creativecommons.org/licenses/by-nc/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à medrxiv pour l'utilisation de son interopérabilité en libre accès.

Articles similaires