Défis dans la classification des exigences avec de grandes taxonomies
Explorer des méthodes pour une classification multi-label efficace dans le développement logiciel.
― 6 min lire
Table des matières
Classer les exigences est super important dans le développement logiciel. Ça aide à organiser et à gérer les infos. Traditionnellement, la recherche a surtout porté sur la classification des exigences en deux catégories : binaire (oui/non) ou multi-classe (une option parmi plusieurs). Cependant, beaucoup d'exigences doivent être liées à plus d'une catégorie, ce qui rend la classification Multi-label précieuse. Cet article explore les défis de la classification des exigences avec de grandes Taxonomies.
Le Défi
Dans le domaine des infrastructures et de la construction, les taxonomies aident à structurer l'information et à lier les objets numériques à leurs homologues dans le monde réel. Une taxonomy est un ensemble de termes et de catégories conçu pour classifier l'info. Le défi se pose quand ces taxonomies sont grandes, avec des centaines ou des milliers de catégories. Classer beaucoup d'exigences à la main n'est pas pratique, donc on a besoin d'une méthode plus efficace pour aider dans ce processus.
L'apprentissage supervisé, une méthode où les machines apprennent à partir d'exemples étiquetés, peut être coûteux et chronophage, car il faut souvent une grande quantité de données étiquetées. Dans le domaine de la construction, il peut être difficile et coûteux de rassembler suffisamment d'exemples étiquetés, surtout quand chaque classification peut avoir plusieurs étiquettes.
Explorer de Nouvelles Méthodes
Pour surmonter ces défis, on se penche sur l'apprentissage sans échantillon. Cette approche permet à un système de prédire des étiquettes qu'il n'a jamais vues auparavant en s'appuyant sur des connaissances d'autres tâches. Ça veut dire qu'on peut utiliser des modèles pré-entraînés pour classer les exigences en fonction de leur contenu textuel sans avoir besoin de grands ensembles de données étiquetées. En testant la faisabilité de cette méthode pour la classification d'exigences multi-label, on espère voir si ça peut simplifier le processus.
Portée de l'Étude
Dans notre recherche, on a examiné 129 exigences et les a liées à 769 étiquettes provenant de taxonomies, qui ont entre 250 et 1183 classes. On a mené une expérience pour comprendre comment différents Classificateurs affectaient la performance de classification, surtout en prenant en compte les caractéristiques structurelles des taxonomies.
Résultats Clés
Comparaison des Classificateurs : Notre étude a trouvé qu'un classificateur basé sur des phrases performait mieux en termes de rappel par rapport à un classificateur basé sur des mots. Le rappel mesure combien d'objets pertinents sont capturés, ce qui suggère que regarder le contexte des phrases aide à améliorer la classification.
Utilisation de la Hiérarchie : Utiliser une approche hiérarchique n'a pas toujours amélioré la classification. La performance du classificateur variait selon la structure de la taxonomy. Étonnamment, avoir trop de nœuds au total et de nœuds feuilles affectait négativement le rappel, ce qui indique que trop d'options peuvent mener à la confusion.
Création d'une Vérité de Base
Pour évaluer la performance de nos méthodes de classification, on avait besoin d'une vérité de base valide, c'est-à-dire un ensemble fiable d'exigences correctement étiquetées selon la taxonomy. Ça impliquait une collaboration avec des experts du secteur pour s'assurer que les étiquettes assignées étaient correctes et significatives.
Assembler la vérité de base était un processus structuré impliquant plusieurs tours d'annotation, de curation et de construction de consensus entre des équipes expérimentées dans le domaine. Cet effort a conduit à la création systématique des 769 étiquettes.
Processus de Classification
Classificateur Basé sur des Mots
Le classificateur basé sur des mots se concentrait sur l'identification des noms dans le texte des exigences. Il utilisait des techniques pour extraire et analyser les noms, cherchant des correspondances dans la taxonomy. Cependant, classer les noms individuellement limitait la compréhension globale des exigences. Le classificateur utilisait des prédicteurs pour évaluer la pertinence des noms identifiés par rapport aux classes de la taxonomy, entraînant des classifications basées uniquement sur ces noms.
Classificateur Basé sur des Phrases
Le classificateur basé sur des phrases adoptait une approche plus holistique en analysant le texte entier plutôt qu'en se contentant d'extraire des noms. Cette méthode permettait de prendre en compte le contexte, qui est crucial quand les mots ont plusieurs significations. Grâce à des techniques comme l'Analyse Sémantique Explicite, le classificateur générait une représentation de l'exigence, la comparant à la taxonomy.
Conception de l'Expérience
On a conçu une expérience avec différents facteurs pour comparer les classificateurs et l'impact de la structure de la taxonomy. L'étude visait à déterminer comment les types de classificateurs, la classification hiérarchique versus plate, et les caractéristiques de la taxonomy influençaient la performance.
Analyse des Résultats
Après avoir mené l'expérience, on a analysé les métriques de performance, y compris le rappel, la précision et le score F1. Le rappel était significativement plus élevé pour le classificateur basé sur des phrases, ce qui suggère qu'il est meilleur pour trouver des catégories pertinentes pour les exigences. La structure hiérarchique n'a pas fourni d'améliorations de performance constantes, ce qui indique que plus de recherche est nécessaire pour comprendre la relation entre la conception de la taxonomy et le succès de la classification.
Implications Pratiques
La capacité à classifier efficacement les exigences en utilisant des taxonomies peut rationaliser divers processus en ingénierie logicielle. Une classification efficace peut aider avec la traçabilité, la conformité et l'allocation des ressources. Adopter l'apprentissage sans échantillon offre une façon économique de classifier les exigences sans un étiquetage excessif des données.
Préoccupations sur la Validité
Dans toute recherche, il y a des menaces à la validité, y compris la généralisation des résultats à travers différents domaines. Bien que notre étude se soit concentrée sur la construction, les résultats peuvent ne pas s'appliquer directement à d'autres domaines. De plus, le nombre limité d'exigences échantillonnées pourrait affecter la manière dont on peut appliquer ces résultats de manière plus large.
Conclusion
Notre étude donne un aperçu complet des défis et des possibilités de la classification multi-label des exigences utilisant de grandes taxonomies. On a appris que, bien que les classificateurs basés sur des phrases puissent offrir de meilleures performances, il reste encore des limitations à aborder. Le travail futur se concentrera sur le perfectionnement de ces techniques pour améliorer la précision et l'exactitude globale de la classification.
Grâce à la recherche continue dans ce domaine, on espère ouvrir la voie à des systèmes plus efficaces dans la gestion des exigences, offrant un équilibre entre flexibilité et précision dans les tâches de classification.
Titre: Multi-Label Requirements Classification with Large Taxonomies
Résumé: Classification aids software development activities by organizing requirements in classes for easier access and retrieval. The majority of requirements classification research has, so far, focused on binary or multi-class classification. Multi-label classification with large taxonomies could aid requirements traceability but is prohibitively costly with supervised training. Hence, we investigate zero-short learning to evaluate the feasibility of multi-label requirements classification with large taxonomies. We associated, together with domain experts from the industry, 129 requirements with 769 labels from taxonomies ranging between 250 and 1183 classes. Then, we conducted a controlled experiment to study the impact of the type of classifier, the hierarchy, and the structural characteristics of taxonomies on the classification performance. The results show that: (1) The sentence-based classifier had a significantly higher recall compared to the word-based classifier; however, the precision and F1-score did not improve significantly. (2) The hierarchical classification strategy did not always improve the performance of requirements classification. (3) The total and leaf nodes of the taxonomies have a strong negative correlation with the recall of the hierarchical sentence-based classifier. We investigate the problem of multi-label requirements classification with large taxonomies, illustrate a systematic process to create a ground truth involving industry participants, and provide an analysis of different classification pipelines using zero-shot learning.
Auteurs: Waleed Abdeen, Michael Unterkalmsteiner, Krzysztof Wnuk, Alexandros Chirtoglou, Christoph Schimanski, Heja Goli
Dernière mise à jour: 2024-06-13 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2406.04797
Source PDF: https://arxiv.org/pdf/2406.04797
Licence: https://creativecommons.org/licenses/by-nc-sa/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.