Simple Science

La science de pointe expliquée simplement

# Informatique# Calcul et langage# Intelligence artificielle

Présentation de CORE-GPT : Une ressource de recherche fiable

CORE-GPT fournit des réponses fiables en utilisant des articles scientifiques en accès libre.

― 5 min lire


CORE-GPT : Ton allié deCORE-GPT : Ton allié derecherchepar de vraies recherches.Obtiens des réponses fiables soutenues
Table des matières

CORE-GPT est une nouvelle plateforme qui aide à répondre aux questions avec des infos provenant de plus de 32 millions d'articles scientifiques en libre accès. Cette plateforme combine les capacités avancées des modèles de langage avec une riche collection de littérature de recherche. Le but principal de CORE-GPT est de fournir des réponses précises soutenues par de vraies sources, ce qui la rend plus fiable.

Le problème avec les modèles de langage actuels

Les modèles de langage récents, comme GPT-3.5 et GPT-4, ont montré des compétences impressionnantes dans la compréhension et la génération de texte. Cependant, ils ont un gros défaut : ils ne peuvent souvent pas fournir de références fiables pour soutenir les infos qu'ils donnent. Des tests ont montré qu'une grande majorité des références fournies étaient soit inventées, soit incorrectes. Ça met en lumière un manque dans leur capacité à délivrer des infos factuelles et basées sur des preuves.

La solution : CORE-GPT

CORE-GPT s'attaque à ces lacunes en se concentrant sur des réponses basées sur de vraies études de recherche. Il utilise un processus en trois étapes pour répondre aux questions des utilisateurs en rassemblant des infos pertinentes à partir d'études scientifiques. Cela améliore non seulement la Fiabilité des réponses mais réduit aussi les chances d'erreurs.

Comment fonctionne CORE-GPT

Étape 1 : Compréhension de la question

La première étape consiste à prendre la question de l'utilisateur et à la traiter pour identifier les termes clés. La plateforme enrichit ces termes avec des synonymes et crée une requête de recherche pour trouver des Articles de recherche pertinents.

Étape 2 : Recherche d'articles pertinents

Dans la deuxième étape, cette requête de recherche est utilisée pour trouver les cinq articles les plus pertinents dans le dépôt CORE. Ces articles contiennent des infos qui peuvent être utilisées pour formuler une réponse.

Étape 3 : Génération de réponse

La dernière étape consiste à prendre les titres et résumés des articles et à les utiliser pour créer une réponse détaillée à la question originale. Le modèle est instruit de baser sa réponse uniquement sur les infos fournies par les articles sélectionnés.

Les avantages de CORE-GPT

Un des plus grands avantages de CORE-GPT est qu'il garantit que les réponses générées sont basées sur de vraies sources académiques. Ça réduit considérablement les chances de donner des infos fausses. De plus, CORE-GPT peut reconnaître les situations où il ne peut pas fournir une réponse complète, lui permettant de communiquer cette incertitude aux utilisateurs clairement.

Avantage de l'accès libre

CORE-GPT fonctionne avec un avantage parce qu'il utilise des recherches en accès libre. Ça signifie qu'il peut accéder et utiliser un large éventail d'études à jour sans être limité par des murs de paiement courants dans l'édition traditionnelle. Du coup, CORE-GPT peut livrer les dernières découvertes de recherche aux utilisateurs.

Évaluation de CORE-GPT

Pour évaluer la performance de CORE-GPT, une série de tests a été réalisée avec 100 questions différentes dans 20 domaines scientifiques. Les réponses ont été notées selon trois critères principaux : à quel point la question était répondue de manière complète, à quel point la réponse était fiable et à quel point elle était utile dans l'ensemble. Cette évaluation a montré que CORE-GPT fournit généralement des réponses fiables et pertinentes.

Résultats de l'évaluation

Les résultats ont indiqué que dans la plupart des domaines, CORE-GPT a bien marché en termes de complétude, de confiance et d'utilité. Des scores de confiance élevés ont été maintenus même lorsque la complétude était plus faible, ce qui suggère que les utilisateurs peuvent se fier aux réponses données par CORE-GPT.

Limitations

Bien que CORE-GPT montre de bonnes performances, il y a encore certaines limitations. Il est contraint par la littérature en accès libre disponible. Une grande quantité de recherches reste derrière des murs de paiement, que CORE-GPT ne peut pas accéder. De plus, bien qu'il ait été testé dans divers domaines, seul un nombre limité de questions a été utilisé, donc d'autres tests pourraient donner une image plus complète de son efficacité.

Développements futurs

En regardant vers l'avenir, il y a des opportunités passionnantes pour améliorer CORE-GPT. Les efforts actuels se concentrent sur le fait de le rendre accessible via différentes plateformes et d'améliorer ses fonctionnalités. Les futures versions pourraient inclure un contenu plus détaillé des articles, menant à des réponses encore meilleures.

Conclusion

En résumé, CORE-GPT propose un outil précieux pour ceux qui cherchent des réponses crédibles à des questions scientifiques. Sa combinaison unique de traitement avancé du langage et d'accès à une vaste quantité de littérature en accès libre le distingue des solutions existantes. En se concentrant sur des réponses fiables et basées sur des preuves, CORE-GPT comble une lacune dans le paysage actuel des outils de questions-réponses et a le potentiel d'améliorer significativement la recherche académique et l'enquête.

Au fur et à mesure qu'il continue d'évoluer, CORE-GPT est en bonne position pour bénéficier à un large éventail d'utilisateurs, des étudiants et enseignants aux chercheurs et au grand public cherchant des informations fiables dans un monde où l'exactitude des données est cruciale. En maintenant un engagement envers des sources fiables et une communication claire, CORE-GPT est bien positionné pour devenir une ressource essentielle dans le domaine de l'enquête académique.

Source originale

Titre: CORE-GPT: Combining Open Access research and large language models for credible, trustworthy question answering

Résumé: In this paper, we present CORE-GPT, a novel question-answering platform that combines GPT-based language models and more than 32 million full-text open access scientific articles from CORE. We first demonstrate that GPT3.5 and GPT4 cannot be relied upon to provide references or citations for generated text. We then introduce CORE-GPT which delivers evidence-based answers to questions, along with citations and links to the cited papers, greatly increasing the trustworthiness of the answers and reducing the risk of hallucinations. CORE-GPT's performance was evaluated on a dataset of 100 questions covering the top 20 scientific domains in CORE, resulting in 100 answers and links to 500 relevant articles. The quality of the provided answers and and relevance of the links were assessed by two annotators. Our results demonstrate that CORE-GPT can produce comprehensive and trustworthy answers across the majority of scientific domains, complete with links to genuine, relevant scientific articles.

Auteurs: David Pride, Matteo Cancellieri, Petr Knoth

Dernière mise à jour: 2023-07-06 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2307.04683

Source PDF: https://arxiv.org/pdf/2307.04683

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires