Simple Science

La science de pointe expliquée simplement

# Informatique# Calcul et langage# Multimédia

Développer un système de dialogue japonais avec changement de sujet

Voici PLATO-JDS, un système de dialogue japonais qui s'adapte aux changements de sujet.

― 6 min lire


Développement de systèmeDéveloppement de systèmede dialogue japonaisintelligent.avec un changement de sujetPLATO-JDS améliore les conversations
Table des matières

Ces dernières années, des systèmes de dialogue à grande échelle ont été développés pour permettre aux humains d'interagir avec les machines de manière plus naturelle. Un de ces systèmes, appelé PLATO-2, a montré un grand succès en anglais et en chinois. Cependant, il n'y a pas eu beaucoup de recherches sur la performance de ces systèmes en japonais. Cet article se concentre sur la création d'un système de dialogue japonais, que nous appelons PLATO-JDS, et il introduit une méthode pour changer de sujet pendant les conversations.

Création de Dataset

Pour poser une bonne base pour notre système, on a créé un gros dataset spécifiquement pour le dialogue en japonais. Ce dataset, nommé Dialogue-Graph, inclut 1,656 million de dialogues. On a collecté les données de diverses sources comme des articles de presse, des sous-titres de TV et Wikipédia. Les données sont organisées comme un arbre, où chaque sujet peut avoir plusieurs réponses. En organisant les données de cette manière, on vise à capturer le flux des conversations plus efficacement.

Entraînement du Système de Dialogue

Après avoir créé le dataset, on a entraîné notre système de dialogue en utilisant le modèle PLATO-2. Ce modèle est capable de générer des réponses comme un humain en fonction de l'entrée qu'il reçoit. Cependant, lors de nos tests, on a trouvé que le système avait du mal à changer de sujet de manière appropriée. Cela signifie que quand un utilisateur décidait de changer de sujet au milieu de la conversation, le système continuait souvent à parler de l'ancien sujet.

Pour résoudre ce problème, on a développé un algorithme de changement de sujet. Cet algorithme utilise un outil appelé discriminateur de sujet, qui identifie si la nouvelle entrée de l'utilisateur est liée au sujet de conversation précédent. Si l'entrée de l'utilisateur ne correspond pas, le système change de sujet de manière appropriée.

Discriminateur de Sujet

Le discriminateur de sujet agit comme un juge qui examine chaque nouvelle entrée pour déterminer si elle correspond à la conversation en cours. On a entraîné ce discriminateur en utilisant le même dataset qu'on a créé. L'objectif est de comprendre le contexte du dialogue, en s'assurant que le système peut changer de sujet comme nécessaire.

Le discriminateur de sujet a été entraîné en utilisant une méthode appelée Classification binaire, ce qui signifie qu'il décide si deux pièces de dialogue appartiennent au même sujet ou non. C'est crucial pour garder la conversation pertinente et engageante pour l'utilisateur.

Évaluation du Système

Pour mesurer l'efficacité de notre système, on a utilisé plusieurs critères pour évaluer sa performance. Ces critères incluaient la cohérence, l'informativeness, l'engagement, et l'humainité.

  • Cohérence vérifie si les réponses du système sont pertinentes par rapport au sujet.
  • Informativeness évalue si les réponses apportent des informations utiles.
  • Engagement mesure à quel point la conversation est agréable pour l'utilisateur.
  • Humainité évalue si les réponses semblent naturelles, comme si elles venaient d'une vraie personne.

Nos résultats ont montré que le système PLATO-JDS a obtenu une moyenne de 1,500 sur 2,000 dans ces tests, indiquant une forte performance. L'introduction de l'algorithme de changement de sujet a encore boosté la moyenne à 1,767. Cela a montré que notre système maintenait non seulement un dialogue de haute qualité, mais s'adaptait aussi bien quand les utilisateurs changeaient de sujet.

Processus de Collecte de Données

Pour le dataset, on a rassemblé des contributions de divers participants. On a mis en place un système basé sur la foule où des volontaires pouvaient contribuer à créer des dialogues. Chaque participant alternait les rôles pendant la conversation, assurant des interactions diversifiées. Le système a été conçu pour permettre aux travailleurs de créer des dialogues dès qu'ils avaient du temps libre, ce qui a accéléré le processus de collecte.

Après avoir collecté les dialogues, on les a évalués pour filtrer ceux qui étaient absurdes ou inappropriés. Cette étape était cruciale pour s'assurer que seuls des dialogues de haute qualité étaient inclus dans notre dataset.

Approche d'Entraînement Detaillée

On a entraîné PLATO-JDS en deux étapes principales.

Dans la première étape, on s'est concentré sur la génération de réponses générales. Le modèle a appris à produire des réponses basées sur un mapping un-à-un d'entrée et de sortie. Cette étape a aidé le modèle à comprendre la structure de base de la conversation.

Dans la deuxième étape, on a introduit une approche plus complexe appelée mapping un-à-plusieurs. À ce stade, le modèle a appris à générer plusieurs réponses pour une seule entrée utilisateur. C'est important pour créer des variations dans les réponses, rendant le dialogue plus dynamique et vivant.

Méthodes de Génération de Dialogue

Le processus de génération de dialogue implique certaines étapes qui garantissent que le système produit des réponses cohérentes et de haute qualité. Le modèle génère une réponse basée sur l'entrée utilisateur actuelle et le dialogue passé.

Si l'algorithme de changement de sujet détermine que le contexte change, il ajustera son input en conséquence. Le système compare l'entrée utilisateur avec les dialogues précédents pour décider s'il doit inclure des réponses passées dans la génération de la nouvelle sortie.

Évaluations Humaines

On a réalisé des évaluations humaines dans le cadre de notre approche pour évaluer la qualité des dialogues générés par notre système. Les participants étaient invités à interagir avec le système et à fournir des retours basés sur les métriques établies.

Ces retours étaient essentiels pour affiner le modèle et s'assurer qu'il répondait aux attentes des utilisateurs. Les résultats ont montré que PRATO-JDS, surtout avec l'algorithme de changement de sujet, performait bien pour garder les conversations engageantes et pertinentes.

Conclusion

En résumé, on a réussi à développer un système de dialogue japonais, PLATO-JDS, qui peut générer des réponses humaines. En créant un gros dataset et en entraînant le modèle efficacement, on a assuré que le système comprend les nuances du dialogue en japonais.

L'introduction de l'algorithme de changement de sujet a significativement amélioré l'expérience utilisateur en permettant des transitions plus fluides entre les sujets. En conséquence, notre système montre un fort potentiel pour de futures applications dans l'IA conversationnelle dans la langue japonaise.

Source originale

Titre: Topic-switch adapted Japanese Dialogue System based on PLATO-2

Résumé: Large-scale open-domain dialogue systems such as PLATO-2 have achieved state-of-the-art scores in both English and Chinese. However, little work explores whether such dialogue systems also work well in the Japanese language. In this work, we create a large-scale Japanese dialogue dataset, Dialogue-Graph, which contains 1.656 million dialogue data in a tree structure from News, TV subtitles, and Wikipedia corpus. Then, we train PLATO-2 using Dialogue-Graph to build a large-scale Japanese dialogue system, PLATO-JDS. In addition, to improve the PLATO-JDS in the topic switch issue, we introduce a topic-switch algorithm composed of a topic discriminator to switch to a new topic when user input differs from the previous topic. We evaluate the user experience by using our model with respect to four metrics, namely, coherence, informativeness, engagingness, and humanness. As a result, our proposed PLATO-JDS achieves an average score of 1.500 for the human evaluation with human-bot chat strategy, which is close to the maximum score of 2.000 and suggests the high-quality dialogue generation capability of PLATO-2 in Japanese. Furthermore, our proposed topic-switch algorithm achieves an average score of 1.767 and outperforms PLATO-JDS by 0.267, indicating its effectiveness in improving the user experience of our system.

Auteurs: Donghuo Zeng, Jianming Wu, Yanan Wang, Kazunori Matsumoto, Gen Hattori, Kazushi Ikeda

Dernière mise à jour: 2023-02-22 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2302.11280

Source PDF: https://arxiv.org/pdf/2302.11280

Licence: https://creativecommons.org/licenses/by-sa/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires