Évaluer les outils d'IA dans la recherche EECP
Une étude évalue le rôle des modèles d'IA dans l'identification des questions de recherche sur l'EECP.
― 6 min lire
Table des matières
La contre-pulsion externe améliorée (EECP) est un traitement sûr et non invasif qui aide à améliorer la circulation sanguine. Cette méthode utilise des manchons qui se gonflent et se dégonflent autour des bras, des jambes et des fesses en synchronisation avec le rythme cardiaque. En faisant cela, l'EECP peut aider le cœur et d'autres organes à recevoir plus de sang et de nutriments. Cette technique a montré des promesses pour aider avec divers problèmes de santé, y compris des soucis cardiaques, des complications liées au diabète, et même des pertes d'audition soudaines.
Recherche sur l’EECP
Traditionnellement, déterminer les questions clés à rechercher sur l'EECP impliquait de demander l'avis d'experts. Mais c'est long et parfois biaisé. Récemment, une nouvelle technologie appelée Traitement du langage naturel (NLP) a été utilisée pour identifier les questions de recherche plus efficacement. Des modèles de langage comme ChatGPT et Ernie Bot en sont des exemples. Ils peuvent comprendre et générer un texte qui ressemble à celui des humains et ont le potentiel de suggérer et de prioriser des sujets de recherche liés à l'EECP.
Évaluation des LLMs pour la recherche sur l’EECP
Dans cette étude, ChatGPT et Ernie Bot ont été utilisés pour établir les Priorités de recherche liées à l'EECP. Cinq domaines principaux ont été abordés : les mécanismes de fonctionnement de l’EECP, les améliorations des dispositifs utilisés, ses applications en matière de santé cardiaque, son utilisation en santé cérébrale, et d'autres applications potentielles.
Une fois ces priorités générées, un groupe de neuf experts en EECP les a examinées et notées en fonction de leur importance et de leur pertinence. Les experts avaient une solide expérience dans ce domaine, ayant publié de nombreux articles sur l'EECP.
Autres applications des LLMs en médecine
Les modèles de langage ont été utilisés dans divers domaines comme le divertissement et l'éducation, mais leur utilisation en médecine est encore en plein développement. Dans des études récentes, les chercheurs ont commencé à explorer comment ces modèles peuvent aider dans les milieux médicaux. Par exemple, certains chercheurs pensent que les LLMs peuvent aider les médecins à rester au courant des dernières études médicales, en les aidant à analyser rapidement de vastes quantités d'informations.
Cependant, il est important de noter que ces modèles peuvent avoir des limites dans la compréhension des facteurs culturels ou émotionnels qui influencent les soins de santé. De plus, des études ont indiqué que, bien que les LLMs puissent aider à résumer des informations et à proposer de nouvelles idées de recherche, ils n'ont pas encore été pleinement évalués sur leur capacité à identifier les priorités de recherche médicale.
Méthodes utilisées pour l’évaluation
Pour comprendre à quel point ChatGPT et Ernie Bot étaient efficaces pour générer des idées de recherche sur l'EECP, l'étude a utilisé des méthodes standard pour la collecte et l'analyse des données. Les experts ont noté les priorités de recherche sur une échelle de 1 à 5, 5 étant la note la plus élevée.
L'étude a également utilisé une analyse statistique pour voir à quel point les experts étaient cohérents dans leurs notations. Cela a été fait en calculant la similarité des scores donnés par les experts par rapport à ceux générés par les LLMs.
Résultats de l’évaluation
Les évaluations ont montré que ChatGPT et Ernie Bot étaient efficaces pour générer des priorités de recherche pertinentes. Ils ont bien performé en termes de clarté et ont fourni des réponses claires et compréhensibles. Cependant, ils ont obtenu des scores plus bas en ce qui concerne la fourniture d'idées spécifiques et uniques. Cela suggère que, bien qu'ils puissent proposer des sujets Pertinents, ils pourraient nécessiter des améliorations pour offrir des suggestions plus créatives et originales.
Comparaison entre ChatGPT et Ernie Bot
En comparant les deux modèles, Ernie Bot a généralement obtenu de meilleurs résultats pour identifier des questions de recherche pertinentes. D'un autre côté, ChatGPT a montré plus de variations dans ses scores d'originalité, ce qui signifie que les experts avaient des avis différents sur la créativité de ses suggestions.
Les deux modèles étaient solides en clarté et en spécificité, ce qui signifie qu'ils pouvaient fournir des réponses détaillées et directes. Cependant, il y avait des différences notables dans la performance de chaque modèle selon les sujets.
Importance des résultats
Les résultats de cette étude suggèrent que ChatGPT et Ernie Bot ont le potentiel d'être des outils utiles pour aider les chercheurs dans le domaine de l'EECP. Ils peuvent aider à rationaliser le processus d'identification des questions de recherche importantes, ce qui fait gagner du temps et des efforts. Bien qu'il y ait encore des possibilités d'amélioration, les deux modèles ont montré leur capacité à générer des idées diverses et pertinentes.
Limitations de l’étude
Malgré les résultats prometteurs, il y avait certaines limitations dans l'étude. Le groupe d'experts qui a noté les questions de recherche ne représente peut-être pas entièrement la large gamme d'opinions dans la communauté de recherche. Cela pourrait affecter les résultats de l'évaluation. De plus, l'utilisation de notations subjectives a pu introduire un biais dans l'évaluation des modèles.
Une autre limitation est que ces modèles n'ont peut-être pas accès à la Littérature médicale la plus récente, ce qui pourrait impacter la qualité des questions de recherche qu'ils génèrent. Trouver des moyens d'incorporer des informations à jour pourrait améliorer leurs capacités.
Conclusion
En résumé, tant ChatGPT qu'Ernie Bot ont montré leur potentiel en tant qu'outils précieux pour générer des priorités de recherche dans le domaine de la contre-pulsion externe améliorée. Ils ont démontré leur capacité à produire des priorités pertinentes et cohérentes qui pourraient fortement soutenir les avancées dans ce domaine de la santé. Bien qu'ils aient besoin d'améliorations pour produire des idées uniques et spécifiques, l'étude indique que ces modèles de langage pourraient être de super assistants pour les chercheurs, propulsant des progrès non seulement dans l'EECP, mais potentiellement dans des domaines de recherche médicale plus larges.
Titre: Assessing the Feasibility of Large Language Models to Identify TopResearch Priorities in Enhanced External Counterpulsation
Résumé: Enhanced External Counterpulsation (EECP), as a non-invasive, cost-effective, and efficient adjunctive circulatory technique, has found increasingly widespread applications in the cardiovascular field. Numerous basic research and clinical observations have extensively confirmed the significant advantages of EECP in promoting blood flow perfusion to vital organs such as the heart, brain, and kidneys. However, many potential mechanisms of EECP remain insufficiently validated, necessitating researchers to dedicate substantial time and effort to in-depth investigations. In this work, we attempted to use large language models (such as ChatGPT and Ernie Bot) to identify top research priorities in five key topics in the field of EECP: mechanisms, device improvements, cardiovascular applications, neurological applications, and other applications. After generating specific research priorities in each domain through language models, we invited a panel of nine experienced EECP experts to independently evaluate and score them based on four parameters: relevance, originality, clarity, and specificity. Notably, average and median scores for these evaluation parameters were high, indicating a strong endorsement from experts in the EECP field. Although further validation and refinement are required, this study preliminarily suggests that large language models like ChatGPT and Ernie Bot could serve as powerful tools for identifying and prioritizing research priorities in the EECP domain.
Auteurs: Xiuyu Leng, S. Gai, F. Huang, X. Liu, R. G. Benton, G. M. Borchert, J. Huang
Dernière mise à jour: 2024-06-03 00:00:00
Langue: English
Source URL: https://www.medrxiv.org/content/10.1101/2024.06.01.24308314
Source PDF: https://www.medrxiv.org/content/10.1101/2024.06.01.24308314.full.pdf
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à medrxiv pour l'utilisation de son interopérabilité en libre accès.