Simple Science

La science de pointe expliquée simplement

# Informatique# Calcul et langage# Intelligence artificielle

MindSearch : Une nouvelle façon de trouver des infos

MindSearch améliore la recherche d'infos en ligne avec une approche structurée.

― 5 min lire


MindSearch transforme laMindSearch transforme lacollecte d'infos.pour trouver des infos précises.MindSearch propose une méthode efficace
Table des matières

Chercher des infos, c'est pas toujours simple. Que tu veuille des réponses à des questions, rassembler des données pour un projet de recherche, ou juste être curieux sur un sujet, ça peut te prendre beaucoup de temps et d'énergie. Les moteurs de recherche traditionnels ont changé notre façon de chercher des infos, mais ils manquent souvent le coche sur ce que les gens veulent vraiment. C'est là qu'intervient MindSearch.

MindSearch, c'est une nouvelle approche qui combine de gros modèles de langage (LLMs) avec des moteurs de recherche pour rendre la recherche d'infos plus facile et précise. C'est conçu pour relever les défis auxquels les gens font face quand ils cherchent des infos en ligne. Il y a trois problèmes principaux que MindSearch veut résoudre :

  1. Les demandes compliquées peuvent être difficiles à gérer pour les moteurs de recherche.
  2. Les infos sont souvent éparpillées sur plein de pages web, ce qui complique le fait d'avoir une vue d'ensemble.
  3. Les pages web longues peuvent dépasser les limites des LLMs, ce qui cause des soucis de traitement.

Comment ça marche

MindSearch imite la façon humaine de résoudre des problèmes. Il utilise un système en deux parties composé d'un WebPlanner et d'un WebSearcher.

WebPlanner :
Le WebPlanner agit comme un cerveau humain qui réfléchit à des questions complexes. Il décompose la demande d'un utilisateur en petites parties plus gérables. Chacune de ces parties, appelées sous-questions, peut être traitée une à une. Le WebPlanner crée une sorte de carte pour guider la recherche, permettant de s'appuyer sur les trouvailles précédentes en rassemblant des infos. Ce processus étape par étape ressemble à la façon dont les gens pensent à des problèmes logiquement.

WebSearcher :
Une fois que le WebPlanner a établi les sous-questions, le WebSearcher se met au travail. Il cherche sur le web en utilisant différentes requêtes conçues pour obtenir des infos pertinentes. Le WebSearcher collecte des données de plusieurs sources, qui sont ensuite résumées et renvoyées au WebPlanner.

En travaillant ensemble, le WebPlanner et le WebSearcher peuvent consulter plus de 300 pages web en seulement quelques minutes. Ce processus prendrait à un expert humain environ trois heures à réaliser.

Pourquoi c'est mieux

MindSearch a prouvé qu'il pouvait fournir de meilleures réponses que d'autres outils d'IA. Il le fait de deux manières :

  1. Profondeur et large éventail : MindSearch offre des réponses qui sont non seulement complètes mais qui couvrent aussi différents aspects d'une question. Ça veut dire que les utilisateurs obtiennent des réponses détaillées qui prennent en compte plusieurs facettes du sujet.

  2. Qualité des réponses : Des tests comparant MindSearch à des applications d'IA existantes ont montré que les gens préféraient les réponses de MindSearch. Ça suggère que MindSearch peut offrir des solutions de qualité qui rivalisent avec des moteurs de recherche d'IA propriétaires.

La science derrière

MindSearch décompose la quête d'infos en parties et gère chaque partie séparément. Ça aide le système à se concentrer sur des tâches spécifiques sans être submergé.

Dans les approches traditionnelles, une fois qu'un utilisateur pose une question, une IA peut essayer de tout répondre d'un coup. Ça peut mener à des erreurs car il est difficile pour l'IA de comprendre tous les détails d'une question complexe. MindSearch s'attaque à ça en modélisant le problème comme un graphe dirigé, où chaque sous-question est un nœud relié à d'autres nœuds par des arêtes dirigées. Cette représentation visuelle aide le système à trouver la meilleure façon de répondre.

Gestion efficace de l'information

Une des forces de MindSearch, c'est la façon dont il gère de grandes quantités d'infos. Quand il s'agit de nombreuses pages web, il utilise une stratégie simple mais efficace. D'abord, il reformule la requête initiale en plusieurs questions connexes, ce qui améliore les chances de trouver des infos pertinentes. Ensuite, après avoir collecté des données, il sélectionne les pages les plus précieuses et va plus en profondeur dans celles-ci pour obtenir de meilleures réponses.

MindSearch en action

Dans des expériences, MindSearch a été testé sur différents types de questions. Les résultats ont montré qu'il performait nettement mieux que d'autres options existantes.

  1. Questions ouvertes : Dans ces tests, les juges humains préféraient les réponses de MindSearch à celles d'autres systèmes. Les juges regardaient la profondeur (à quel point les réponses étaient détaillées), la largeur (combien d'angles étaient couverts), et la précision factuelle (à quel point les infos étaient correctes).

  2. Questions fermées : Ces tests impliquaient des ensembles de données spécifiques où MindSearch a aussi surpassé des modèles plus simples qui n'utilisaient pas de moteurs de recherche. Les résultats ont indiqué que MindSearch peut fournir une réponse plus robuste.

À l'avenir

Bien que MindSearch montre du potentiel, il y a encore des problèmes à régler. Par exemple, parfois, le système peut perdre de vue la question principale en rassemblant trop d'infos. Les recherches futures viseront à affiner le processus et réduire les malentendus qui pourraient survenir.

En conclusion, MindSearch représente un grand pas en avant dans notre façon de trouver et d'intégrer des infos en ligne. En imitant la façon dont les humains pensent, il fournit une approche plus structurée pour chercher des infos. Les résultats montrent qu'il peut réduire significativement le temps et les efforts nécessaires pour rassembler des données complexes, faisant de lui un outil précieux pour quiconque cherche à naviguer dans les vastes ressources disponibles sur le web.

Source originale

Titre: MindSearch: Mimicking Human Minds Elicits Deep AI Searcher

Résumé: Information seeking and integration is a complex cognitive task that consumes enormous time and effort. Inspired by the remarkable progress of Large Language Models, recent works attempt to solve this task by combining LLMs and search engines. However, these methods still obtain unsatisfying performance due to three challenges: (1) complex requests often cannot be accurately and completely retrieved by the search engine once (2) corresponding information to be integrated is spread over multiple web pages along with massive noise, and (3) a large number of web pages with long contents may quickly exceed the maximum context length of LLMs. Inspired by the cognitive process when humans solve these problems, we introduce MindSearch to mimic the human minds in web information seeking and integration, which can be instantiated by a simple yet effective LLM-based multi-agent framework. The WebPlanner models the human mind of multi-step information seeking as a dynamic graph construction process: it decomposes the user query into atomic sub-questions as nodes in the graph and progressively extends the graph based on the search result from WebSearcher. Tasked with each sub-question, WebSearcher performs hierarchical information retrieval with search engines and collects valuable information for WebPlanner. The multi-agent design of MindSearch enables the whole framework to seek and integrate information parallelly from larger-scale (e.g., more than 300) web pages in 3 minutes, which is worth 3 hours of human effort. MindSearch demonstrates significant improvement in the response quality in terms of depth and breadth, on both close-set and open-set QA problems. Besides, responses from MindSearch based on InternLM2.5-7B are preferable by humans to ChatGPT-Web and Perplexity.ai applications, which implies that MindSearch can already deliver a competitive solution to the proprietary AI search engine.

Auteurs: Zehui Chen, Kuikun Liu, Qiuchen Wang, Jiangning Liu, Wenwei Zhang, Kai Chen, Feng Zhao

Dernière mise à jour: 2024-07-29 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2407.20183

Source PDF: https://arxiv.org/pdf/2407.20183

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires