Simple Science

La science de pointe expliquée simplement

# Informatique# Calcul et langage

Révolutionner la génération de schémas d'événements avec des modèles de langage

Des chercheurs automatisent la création de schémas d'événements en utilisant des modèles de langage avancés.

― 9 min lire


Création automatique deCréation automatique deschéma d'événementsd'événements.processus de génération de schémasLes modèles de langage simplifient le
Table des matières

Ces dernières années, comprendre comment les événements se relient les uns aux autres est devenu super important. On pense souvent aux événements comme une suite d'étapes, par exemple comment une action en entraîne une autre. Par exemple, si quelqu'un tombe malade, il va généralement chez le doc et ensuite il peut recevoir un traitement. Ce moyen d'organiser les événements s'appelle les Schémas d'événements.

Les schémas d'événements sont des cadres qui décrivent comment les événements se déroulent normalement. Ils montrent la progression des événements, en indiquant l'ordre dans lequel ils se produisent et comment ils sont connectés. Comprendre ça peut être utile dans plusieurs domaines, genre le traitement du langage naturel, où les ordis doivent piger le langage humain.

Traditionnellement, créer ces schémas d'événements nécessitait pas mal de boulot manuel. Les experts devaient analyser des documents de près pour identifier tous les événements nécessaires et leurs relations. C'est long et coûteux, parce que ça demande beaucoup de compréhension et d'expertise humaine.

Une Nouvelle Façon de Penser

Au lieu de se fier à des méthodes lourdes, les chercheurs ont commencé à utiliser de grands modèles de langage (LLMs) pour générer ces schémas d'événements automatiquement. Ces modèles sont formés sur des tonnes de texte et peuvent comprendre le contexte et les relations entre différents événements.

En considérant les schémas d'événements comme des formes de savoir commun que ces modèles peuvent utiliser, les chercheurs peuvent simplifier le processus. Ça accélère les choses et ça permet d'avoir une perspective plus large, sans être limité à des domaines ou contextes spécifiques.

Le Défi des Structures d'Événements

Les schémas d'événements peuvent être compliqués, ressemblant souvent à des toiles d'araignée de relations plutôt qu'à de simples listes d'actions. Pour capturer efficacement ces relations dans un schéma, les chercheurs ont conçu des méthodes qui décomposent le processus en parties gérables.

La construction de ces schémas se fait généralement en trois étapes principales :

  1. Construction de l'ossature d'événements : Cette étape consiste à identifier les événements principaux qui sont essentiels au scénario. Ça sert de base au schéma.
  2. Expansion des événements : Une fois l'ossature en place, il faut trouver des événements supplémentaires liés qui peuvent ne pas être évidents mais qui sont importants pour avoir un tableau complet.
  3. Vérification des relations entre les événements : Enfin, on vérifie soigneusement les relations entre les événements identifiés pour garantir leur précision.

Utiliser cette approche structurée aide à s'assurer que les schémas produits sont complets et reflètent les complexités des événements du monde réel.

Comparaison des Méthodes

Les méthodes traditionnelles de génération de schémas impliquent souvent d'extraire des instances d'événements de documents, ce qui peut mener à des erreurs et des limitations. Par exemple, si un modèle ne regarde que certains types de documents ou est conçu pour des sujets spécifiques, il peut passer à côté d'infos précieuses ou de connexions.

La nouvelle approche qui utilise des LLMs est ouverte, ce qui veut dire qu'elle peut s'adapter et répondre à une grande variété de scénarios sans être limitée à des thèmes ou sujets particuliers. Ça rend le modèle plus flexible et capable de produire des résultats pertinents et riches en détails.

Comparé aux méthodes traditionnelles, cette nouvelle méthode de génération de schémas montre des améliorations significatives dans la gestion des relations complexes entre les événements. Les chercheurs ont remarqué des améliorations tant dans la précision des relations temporelles (comment les événements sont ordonnés dans le temps) que dans les relations hiérarchiques (comment les événements s'intègrent dans des catégories plus larges).

Le Rôle de la Récupération Augmentée

Pour améliorer l'efficacité de la génération de schémas, les chercheurs ont introduit un composant de récupération qui aide à guider les grands modèles de langage. Ce composant fonctionne en tirant des infos et exemples liés d'une collection de documents pour fournir du contexte au modèle.

Quand le modèle génère des réponses, il s'inspire de ces passages pertinents. En ayant plusieurs sources d'infos, le modèle peut produire des sorties plus générales et nuancées, plutôt que de se concentrer uniquement sur des instances spécifiques qui peuvent ne pas représenter le tableau global.

Construire l'Ossature d'Événements

La première étape pour créer un schéma d'événements est de construire l'ossature, ce qui implique d'identifier les événements majeurs qui se produisent dans le scénario donné. Le modèle est invité à lister ces événements en se basant sur une description du scénario.

Cette invite est cruciale pour générer une liste structurée d'événements qui pourra être utilisée plus tard pour construire le schéma complet. Chacun de ces événements est ensuite considéré comme un nœud dans ce qui deviendra une structure de graphe plus large.

Expansion du Schéma

Une fois l'ossature en place, la prochaine étape est de l'élargir en identifiant des événements supplémentaires qui sont liés aux principaux. Ça permet d'avoir une compréhension plus complète du contexte et aide le modèle à relier les événements de manière plus significative.

À ce stade, le modèle reçoit des questions sur ce qui se passe avant, pendant et après l'événement spécifié. Ça aide le modèle à générer une liste plus exhaustive d'événements liés, reflétant la complexité des situations de la vie réelle.

Validation des Relations entre Événements

Après avoir généré l'ensemble des événements, l'étape suivante est de vérifier les relations entre eux. Ça garantit que les connexions faites entre les différents événements ont du sens et sont exactes.

Les chercheurs ont mis en place des tests de vérification pour évaluer les relations. Ils vérifient si un événement fait partie d'un autre et examinent les aspects temporels, comme si un événement se produit généralement avant ou après un autre.

Ce processus de validation est essentiel pour maintenir l'intégrité du schéma. Ça aide à filtrer la redondance et s'assure que le schéma d'événements est à la fois cohérent et précis.

Évaluation de l'Approche

Pour évaluer la nouvelle approche de génération de schémas d'événements, les chercheurs l'ont comparée aux méthodes traditionnelles. Ils ont utilisé des métriques spécifiques pour évaluer la qualité des schémas produits.

Les principales métriques incluent :

  • Score F1 des Événements : Cette métrique mesure à quel point les événements générés par le modèle correspondent à des événements créés par des humains. Un score plus élevé indique un meilleur alignement et pertinence.
  • Score F1 des Relations : Cette métrique évalue à quel point les relations entre les événements sont capturées avec précision. Encore une fois, un score plus élevé reflète une meilleure performance.

Ces évaluations montrent que la nouvelle approche produit non seulement des schémas contenant plus d'événements, mais elle a aussi amélioré la lisibilité et la cohérence. Les évaluateurs humains ont indiqué que les schémas produits par cette méthode étaient plus faciles à comprendre que ceux générés par les approches traditionnelles.

Interprétabilité des Schémas

Un autre aspect important de la nouvelle méthode est son interprétabilité. Les évaluateurs humains peuvent facilement suivre les schémas générés et écrire des histoires cohérentes basées dessus.

En comparant la facilité d'utilisation des schémas produits par différentes méthodes, on a constaté que les noms et descriptions des événements générés par la nouvelle approche étaient plus simples. C'est particulièrement bénéfique pour les applications où la communication claire des événements et de leurs relations est essentielle.

Capacités de Généralisation

La capacité du modèle à généraliser à travers différents scénarios a aussi été testée. Il montre des promesses non seulement pour générer des schémas dans des domaines spécifiques, mais aussi pour créer des séquences d'événements dans des situations quotidiennes.

Alors que les méthodes précédentes étaient souvent limitées par leur formation spécifique au contexte, ce modèle tire parti de sa formation sur une large gamme de textes. Ça le rend capable de traiter efficacement divers sujets et scénarios.

Conclusion

Le développement de méthodes plus efficaces pour générer des schémas d'événements est une étape cruciale pour améliorer notre compréhension de la façon dont les événements sont structurés et reliés entre eux.

En utilisant de grands modèles de langage et en intégrant des techniques de récupération et de validation, les chercheurs peuvent créer des schémas plus sophistiqués et utiles. Ces avancées ont des implications pour divers domaines, y compris l'intelligence artificielle, l'analyse de données et le traitement du langage naturel.

À mesure que le travail futur continue à peaufiner ces méthodes, l'objectif est d'élargir la gamme d'événements et de relations qui peuvent être capturées, ainsi que d'améliorer la qualité et l'interprétabilité globales des schémas générés.

En gros, ce travail montre le potentiel de tirer parti de modèles et techniques avancés pour améliorer notre compréhension des structures d'événements complexes, ouvrant finalement la voie à une application plus large des schémas d'événements dans des contextes pratiques.

Source originale

Titre: Open-Domain Hierarchical Event Schema Induction by Incremental Prompting and Verification

Résumé: Event schemas are a form of world knowledge about the typical progression of events. Recent methods for event schema induction use information extraction systems to construct a large number of event graph instances from documents, and then learn to generalize the schema from such instances. In contrast, we propose to treat event schemas as a form of commonsense knowledge that can be derived from large language models (LLMs). This new paradigm greatly simplifies the schema induction process and allows us to handle both hierarchical relations and temporal relations between events in a straightforward way. Since event schemas have complex graph structures, we design an incremental prompting and verification method to break down the construction of a complex event graph into three stages: event skeleton construction, event expansion, and event-event relation verification. Compared to directly using LLMs to generate a linearized graph, our method can generate large and complex schemas with 7.2% F1 improvement in temporal relations and 31.0% F1 improvement in hierarchical relations. In addition, compared to the previous state-of-the-art closed-domain schema induction model, human assessors were able to cover $\sim$10% more events when translating the schemas into coherent stories and rated our schemas 1.3 points higher (on a 5-point scale) in terms of readability.

Auteurs: Sha Li, Ruining Zhao, Manling Li, Heng Ji, Chris Callison-Burch, Jiawei Han

Dernière mise à jour: 2023-07-04 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2307.01972

Source PDF: https://arxiv.org/pdf/2307.01972

Licence: https://creativecommons.org/licenses/by-sa/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires