Le défi des articles orphelins sur Wikipedia
Les articles orphelins freinent l'accès à la connaissance sur Wikipédia, touchant à la visibilité et à la représentation.
― 6 min lire
Table des matières
Wikipedia est la plus grande source de knowledge gratuite sur internet, avec plus de 60 millions d’articles dans plusieurs langues. Cependant, alors que cette immense ressource grandit avec environ 200 000 nouveaux articles ajoutés chaque mois, beaucoup d'articles restent difficiles à trouver à cause du manque de liens qui les connectent à d'autres contenus. Ce document parle d'un problème spécifique sur Wikipedia connu sous le nom d'« articles orphelins », qui sont des articles sans aucun lien entrant d'autres articles.
C'est Quoi les Articles Orphelins ?
Les articles orphelins sont ceux qui n’ont pas de liens qui pointent vers eux d'autres pages Wikipedia. Même s'ils peuvent être trouvés en utilisant la fonction de recherche, ils sont en gros invisibles pour les utilisateurs qui dépendent des hyperliens pour naviguer dans l'encyclopédie. Les recherches montrent qu'environ 15 % de tous les articles Wikipedia, soit 8,8 millions, sont considérés comme des articles orphelins. Ce grand nombre indique un vrai problème de Visibilité et d'accessibilité sur la plateforme.
L'Importance des Liens
Les liens sont super importants pour les lecteurs car ils permettent de naviguer facilement entre des sujets liés. Quand les articles sont bien connectés par des hyperliens, les utilisateurs peuvent facilement découvrir des nouvelles infos. Si un article n’a pas de liens entrants, il devient moins visible et reçoit donc moins de vues. Ce manque de visibilité limite non seulement le public pour ces articles mais reflète aussi des biais dans les sujets mis en avant sur Wikipedia.
Visibilité et Vues des Pages
Des recherches montrent que les articles orphelins reçoivent généralement beaucoup moins de vues que les articles qui ont des liens entrants. En fait, les vues moyennes pour les articles orphelins peuvent être moins de la moitié de celles des articles non orphelins. Cela met en lumière un problème structurel dans Wikipedia : sans liens, beaucoup d'infos précieuses restent cachées aux utilisateurs.
Le Besoin d'Amélioration
Les efforts pour réduire le nombre d’articles orphelins se poursuivent, mais le progrès est lent. Les éditeurs Wikipedia passent par divers moyens, comme marquer les articles orphelins et créer des projets spécifiquement pour traiter ce problème. Cependant, même avec ces mesures, le nombre d’articles orphelins n’a diminué que progressivement. Actuellement, environ 35 000 articles sont désorphelinés chaque mois, mais ce chiffre est bien trop bas par rapport au nombre total d'articles orphelins.
Défis Rencontrés par les Éditeurs
Un défi majeur pour désorpheliner les articles est la nature du travail lui-même. Pour faire un lien avec un article orphelin, les éditeurs doivent d'abord trouver d'autres articles pertinents où un lien peut être ajouté. Ce processus est souvent compliqué et prend du temps. De plus, des outils comme Findlink, qui sont conçus pour aider les éditeurs à trouver des candidats pour des liens, ne donnent pas toujours de bons résultats, surtout dans les versions de Wikipedia en langues moins courantes.
Le Rôle des Initiatives Communautaires
Des campagnes menées par la communauté ont visé à améliorer le contenu lié à des groupes sous-représentés, comme les femmes. Bien que ces efforts aient réussi à ajouter et à améliorer du contenu, ils n'ont pas significativement résolu le problème de visibilité pour les articles sur les femmes. Beaucoup de ces articles restent orphelins, soulignant encore plus la nécessité de meilleures solutions.
Approches Multilingues
Une solution potentielle au problème des articles orphelins pourrait impliquer des approches multilingues. Comme Wikipedia existe dans de nombreuses langues différentes, un article orphelin dans une langue peut avoir des articles correspondants dans d'autres versions linguistiques. En identifiant ces articles existants, les éditeurs pourraient créer des liens qui aideraient à désorpheliner l'article original. Les recherches suggèrent que cette méthode pourrait mener à identifier des candidats pour des liens pour plus de 5,5 millions d'articles orphelins, offrant ainsi une manière prometteuse d'améliorer leur visibilité.
Qualité et Biais de Genre
Fait intéressant, les articles orphelins sont souvent de qualité inférieure par rapport aux articles qui sont liés à d'autres contenus. De plus, il y a un biais de genre notable parmi les articles orphelins, car ceux sur les femmes sont de manière disproportionnée plus susceptibles d'être orphelins. Ce constat indique que les problèmes structurels au sein de Wikipedia affectent non seulement la visibilité mais reflètent aussi des biais sociétaux plus larges dans la représentation des connaissances.
Résumé des Constatations
En résumé, le problème des articles orphelins sur Wikipedia est vaste et complexe. L'existence d'un si grand nombre d'articles orphelins met en avant une question d'accessibilité et de visibilité au sein de cette ressource de connaissance vitale. Bien que divers efforts aient été faits pour désorpheliner des articles, le rythme de progression est lent et les défis rencontrés par les éditeurs continuent de freiner ces efforts. Des solutions comme les approches multilingues offrent de l'espoir pour augmenter la visibilité de nombreux articles orphelins, mais plus de travail est nécessaire pour s'assurer que toutes les connaissances puissent être facilement accessibles par les utilisateurs.
L'Avenir des Articles Orphelins de Wikipedia
En regardant vers l'avenir, résoudre le problème des articles orphelins nécessitera un effort concerté de la part de la communauté Wikipedia et le développement de meilleurs outils qui peuvent aider à trouver et à lier des articles. Il y a un besoin évident de systèmes automatisés qui peuvent aider à faciliter ce processus, potentiellement en utilisant le machine learning pour suggérer des liens basés sur le contenu existant à travers différentes langues.
Conclusion
Wikipedia représente une incroyable richesse de connaissance, mais les défis posés par les articles orphelins soulignent la nécessité d'une maintenance et d'une amélioration continues. Améliorer la visibilité de ces articles aide non seulement à fournir une image plus complète du monde mais promeut aussi une représentation des connaissances plus équitable. En s'attaquant au problème des orphelins, Wikipedia peut continuer à croître en tant que source d'information fiable et accessible pour tous les utilisateurs.
Titre: Orphan Articles: The Dark Matter of Wikipedia
Résumé: With 60M articles in more than 300 language versions, Wikipedia is the largest platform for open and freely accessible knowledge. While the available content has been growing continuously at a rate of around 200K new articles each month, very little attention has been paid to the accessibility of the content. One crucial aspect of accessibility is the integration of hyperlinks into the network so the articles are visible to readers navigating Wikipedia. In order to understand this phenomenon, we conduct the first systematic study of orphan articles, which are articles without any incoming links from other Wikipedia articles, across 319 different language versions of Wikipedia. We find that a surprisingly large extent of content, roughly 15\% (8.8M) of all articles, is de facto invisible to readers navigating Wikipedia, and thus, rightfully term orphan articles as the dark matter of Wikipedia. We also provide causal evidence through a quasi-experiment that adding new incoming links to orphans (de-orphanization) leads to a statistically significant increase of their visibility in terms of the number of pageviews. We further highlight the challenges faced by editors for de-orphanizing articles, demonstrate the need to support them in addressing this issue, and provide potential solutions for developing automated tools based on cross-lingual approaches. Overall, our work not only unravels a key limitation in the link structure of Wikipedia and quantitatively assesses its impact, but also provides a new perspective on the challenges of maintenance associated with content creation at scale in Wikipedia.
Auteurs: Akhil Arora, Robert West, Martin Gerlach
Dernière mise à jour: 2024-10-05 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2306.03940
Source PDF: https://arxiv.org/pdf/2306.03940
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.
Liens de référence
- https://ctan.org/pkg/enumerate
- https://en.wikipedia.org/wiki/Wikipedia:Orphan
- https://en.wikipedia.org/wiki/Help:Drawing_attention_to_new_pages
- https://meta.wikimedia.org/wiki/List_of_articles_every_Wikipedia_should_have
- https://github.com/epfl-dlab/wikipedia-orphans
- https://anonymous.4open.science/r/wikipedia-orphans/dataset_statistics.csv
- https://w.wiki/6hoy
- https://humaniki.wmcloud.org/
- https://docs.google.com/spreadsheets/d/1uYByithFlyGoAHHjxSrUNUJ2vu2coCTB8nEf-27zbrc/edit
- https://datasociety.net/library/data-voids/
- https://doi.org/10.1145/3366423.3380209