Simple Science

La science de pointe expliquée simplement

# Informatique# Calcul et langage# Recherche d'informations# Apprentissage automatique

Présentation de PIXAR : Une nouvelle méthode pour la récupération générative

PIXAR améliore la récupération générationnelle avec des phrases de plusieurs mots, augmentant l'efficacité et la précision.

― 9 min lire


PIXAR transforme laPIXAR transforme larécupération de donnéesl'information.vitesse et la qualité d'accès àUne nouvelle méthode améliore la
Table des matières

La recherche générative (GR) est une nouvelle méthode utilisée pour trouver des infos, surtout dans des tâches basées sur du texte. Ça fonctionne en créant une liste d'identifiants qui pointent vers des documents. Ensuite, un modèle génératif est entraîné pour produire ces identifiants à partir d'une requête donnée. Ce modèle s'appuie souvent sur des modèles autorégressifs (AR), qui génèrent les identifiants un mot ou une partie de mot à la fois. Bien que la GR ait fait de grands progrès pour améliorer la recherche d'informations, sa dépendance aux modèles AR pose certains problèmes, principalement des temps de réponse plus lents et des coûts plus élevés à cause de la manière complexe dont ces modèles génèrent les sorties.

Dans ce contexte, une approche différente appelée modèles non autorégressifs (NAR) a été étudiée. Les modèles NAR génèrent tous les jetons en même temps plutôt qu'un par un, ce qui réduit considérablement le temps et le coût associés à la génération d'identifiants. Cependant, les modèles NAR ont souvent du mal à maintenir une bonne qualité de recherche car ils ne gèrent pas bien les relations entre les mots dans un document.

Pour améliorer cette situation, on a créé une nouvelle méthode appelée PIXAR. Cette méthode utilise un Vocabulaire plus large qui inclut des expressions de plusieurs mots en plus des mots individuels et parties de mots, ce qui aide à réduire les relations complexes entre les jetons. En faisant cela, PIXAR maintient un équilibre entre le maintien d'une haute qualité de recherche tout en étant efficace.

Qu'est-ce que la recherche générative ?

La recherche générative est une approche qui transforme la manière dont on trouve des infos. Au lieu de chercher un document directement, elle génère des identifiants pour des documents qu'elle juge pertinents par rapport à une requête donnée. Cette méthode est super utile quand on traite de grands volumes de données, car elle peut produire rapidement une liste d'identifiants.

La méthode traditionnelle pour y arriver impliquait l'utilisation de modèles AR, qui créent des sorties dans un ordre. Quand une requête est donnée, le modèle prédit le prochain jeton (un mot ou une partie de mot) en fonction des jetons qu'il a déjà générés. Ce processus peut être lent, car chaque jeton doit être généré un après l'autre.

Bien que les méthodes AR puissent produire des résultats de haute qualité, le temps pris pour générer des identifiants peut être un gros obstacle. Ça l'est surtout dans des applications en temps réel comme la recherche sponsorisée, où la rapidité est cruciale.

Le défi des modèles autorégressifs

Bien que les modèles AR montrent une grande précision dans la génération d'identifiants, ils ne sont pas parfaits. Ils s'appuient beaucoup sur une séquence de jetons, ce qui signifie que si une partie de la séquence n'est pas précise, toute la sortie peut en être affectée. Cela peut mener à des scénarios où la performance du modèle diminue car il a du mal à prédire le prochain jeton en fonction des précédents.

De plus, comme chaque jeton dépend des précédents, la vitesse globale du système de recherche diminue. C'est pourquoi les chercheurs se tournent vers les modèles NAR, qui promettent un traitement plus rapide et plus efficace.

Les modèles non autorégressifs

Les modèles NAR offrent une alternative différente en générant tous les jetons en même temps plutôt qu'un à un. Cette génération parallèle réduit considérablement le temps nécessaire pour produire une sortie complète. Cependant, il y a un compromis : en faisant cela, les modèles NAR ratent souvent les relations et les dépendances entre les jetons, ce qui entraîne une diminution de la qualité de recherche.

Pour contrer ces problèmes, les modèles NAR limitent généralement leur sortie à des mots uniques ou des sous-mots. Cependant, cette simplification peut poser problème car elle ne prend pas en compte les expressions ou les entités de plusieurs mots qui peuvent fournir un contexte précieux.

Le besoin d'amélioration

Étant donné les défis rencontrés par les modèles NAR en matière de qualité de recherche, les chercheurs sont chargés de trouver des moyens de les améliorer. Les méthodes traditionnelles d'expansion du vocabulaire impliquent souvent d'ajouter des mots individuels ou des sous-mots. Mais que se passerait-il si le vocabulaire pouvait inclure de vraies expressions, qui portent plus de sens et de contexte ?

En ajoutant des expressions au vocabulaire de sortie, les modèles NAR peuvent mieux comprendre les relations entre les mots. Cela pourrait aider à créer un processus de recherche plus nuancé qui maintient l'exactitude tout en améliorant les temps de réponse.

Présentation de PIXAR

La méthode PIXAR représente un avancement significatif dans la quête d'une recherche générative efficace. En élargissant le vocabulaire des modèles NAR pour inclure des expressions de plusieurs mots, PIXAR cherche à trouver un équilibre entre un traitement efficace et une qualité de recherche.

PIXAR intègre un vocabulaire cible qui comprend jusqu'à 5 millions de jetons, incluant des expressions courantes et des entités de plusieurs mots. Ce vocabulaire élargi aide à réduire les problèmes de dépendance auxquels font face les modèles NAR standards.

De plus, la méthode PIXAR utilise des stratégies d'optimisation avancées qui maintiennent une faible latence même avec une taille de vocabulaire plus grande. L'objectif est de continuer à fournir une recherche de haute qualité tout en gardant le système efficace.

Comment fonctionne PIXAR ?

PIXAR fonctionne d'abord en encodant une requête puis en générant des identifiants de documents à l'aide d'un modèle qui a accès au vocabulaire élargi. Cet encodage permet d'identifier des expressions pertinentes et des jetons de plusieurs mots qui peuvent être liés à des requêtes spécifiques.

Après avoir généré les identifiants, PIXAR utilise un processus appelé recherche de faisceau contrainte pour s'assurer que la sortie finale reflète une grande pertinence par rapport à la requête. Cette méthode se concentre sur la génération d'identifiants qui respectent les relations au sein des expressions et améliore la qualité globale de la recherche.

Les avantages de PIXAR

L'introduction de PIXAR a plusieurs avantages notables :

  1. Qualité de recherche améliorée : En incorporant des phrases dans le vocabulaire, le modèle peut mieux saisir les significations et les nuances des requêtes, ce qui entraîne des sorties plus pertinentes.

  2. Temps de réponse plus rapides : Les modèles NAR fournissent intrinsèquement des sorties plus rapides puisqu'ils génèrent des jetons simultanément plutôt qu'un à la fois. PIXAR maintient cet avantage tout en améliorant les problèmes de qualité de recherche rencontrés par les méthodes NAR traditionnelles.

  3. Applicabilité dans le monde réel : La performance de PIXAR a été validée dans des scénarios pratiques comme la recherche sponsorisée, où une augmentation des clics sur les annonces et des revenus a été observée après son implémentation.

Validation expérimentale

Pour vérifier l'efficacité de PIXAR, divers expériences ont été menées sur des ensembles de données bien connus comme MS MARCO et Natural Questions. Ces tests visaient à évaluer la performance de PIXAR par rapport aux modèles AR et NAR traditionnels.

Les résultats ont montré une amélioration significative des métriques de recherche en utilisant PIXAR par rapport aux modèles NAR standards. De plus, il a été démontré que le vocabulaire élargi augmentait la précision de la recherche sans compromettre la vitesse.

L'importance de l'échelle du vocabulaire

Un des éléments critiques pour le succès de PIXAR est l'approche de l'échelle du vocabulaire. Les expériences ont montré qu'à mesure que la taille du vocabulaire augmentait, la performance du système de recherche s'améliorait aussi. Cela met en lumière les avantages d'inclure des phrases, car elles peuvent représenter des idées plus complexes que des mots uniques.

La capacité à générer des phrases permet une compréhension plus nuancée des requêtes. Par exemple, plutôt que de simplement reconnaître un mot clé, le modèle peut saisir des phrases spécifiques qui fournissent un contexte ou des informations supplémentaires.

Répondre aux défis de latence

Bien que l'introduction d'un vocabulaire élargi présente de nombreux avantages, cela pose aussi des défis, en particulier en ce qui concerne la latence. Plus le vocabulaire est grand, plus les opérations du modèle peuvent devenir complexes, entraînant potentiellement des temps de réponse plus longs.

PIXAR contrecarre cela en mettant en œuvre des méthodes d'inférence efficaces qui aident à réduire la sélection des jetons. En créant une liste restreinte de jetons candidats à partir du vocabulaire élargi, PIXAR peut rapidement se concentrer sur les sorties les plus pertinentes lors du processus de génération.

Cette méthode garantit que le système reste rapide tout en profitant du vocabulaire riche.

Conclusion

En résumé, PIXAR représente un avancement prometteur dans le domaine de la recherche générative. Grâce à son approche innovante d'élargir le vocabulaire et d'incorporer des phrases, elle comble efficacement le fossé entre la qualité de recherche et la vitesse.

À mesure que les systèmes de recherche d'informations continuent d'évoluer, des méthodes comme PIXAR joueront un rôle essentiel dans la manière dont nous trouvons et accédons à des infos pertinentes. En priorisant l'efficacité sans sacrifier la qualité, PIXAR ouvre la voie à de meilleurs systèmes dans diverses applications, y compris les moteurs de recherche et les systèmes de recommandation.

Les insights tirés de la mise en œuvre de PIXAR offrent un chemin clair pour les chercheurs et les développeurs cherchant à améliorer les capacités des technologies de recherche d'informations.

Source originale

Titre: Scaling the Vocabulary of Non-autoregressive Models for Efficient Generative Retrieval

Résumé: Generative Retrieval introduces a new approach to Information Retrieval by reframing it as a constrained generation task, leveraging recent advancements in Autoregressive (AR) language models. However, AR-based Generative Retrieval methods suffer from high inference latency and cost compared to traditional dense retrieval techniques, limiting their practical applicability. This paper investigates fully Non-autoregressive (NAR) language models as a more efficient alternative for generative retrieval. While standard NAR models alleviate latency and cost concerns, they exhibit a significant drop in retrieval performance (compared to AR models) due to their inability to capture dependencies between target tokens. To address this, we question the conventional choice of limiting the target token space to solely words or sub-words. We propose PIXAR, a novel approach that expands the target vocabulary of NAR models to include multi-word entities and common phrases (up to 5 million tokens), thereby reducing token dependencies. PIXAR employs inference optimization strategies to maintain low inference latency despite the significantly larger vocabulary. Our results demonstrate that PIXAR achieves a relative improvement of 31.0% in MRR@10 on MS MARCO and 23.2% in Hits@5 on Natural Questions compared to standard NAR models with similar latency and cost. Furthermore, online A/B experiments on a large commercial search engine show that PIXAR increases ad clicks by 5.08% and revenue by 4.02%.

Auteurs: Ravisri Valluri, Akash Kumar Mohankumar, Kushal Dave, Amit Singh, Jian Jiao, Manik Varma, Gaurav Sinha

Dernière mise à jour: 2024-06-10 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2406.06739

Source PDF: https://arxiv.org/pdf/2406.06739

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires