Défis pour les contributeurs de langues à faibles ressources sur Wikipédia
Examiner les obstacles rencontrés par les contributeurs de langues à faibles ressources en Éthiopie.
― 6 min lire
Table des matières
- Contexte
- Défis rencontrés par les contributeurs
- Objectifs de l'étude
- Méthodologie
- Analyse des discussions sur le forum
- Principales conclusions des discussions sur le forum
- Enquête contextuelle avec des nouveaux contributeurs
- Principales conclusions de l'étude des nouveaux contributeurs
- Conclusions et implications
- Recommandations pour l'amélioration
- Directions futures
- Source originale
- Liens de référence
Les dépôts de connaissances en ligne, comme Wikipedia, offrent une plateforme où les gens peuvent partager leurs connaissances et leur culture. Cependant, les communautés parlant des langues peu dotées, surtout en Afrique, ont du mal à accéder à ces plateformes. Ça veut dire qu'il n'y a pas assez de contenu disponible dans leurs langues, ce qui rend difficile leur pleine participation. Beaucoup de ces dépôts sont basés sur des façons occidentales de partager des connaissances, ce qui complique l'adaptation des locuteurs de langues peu dotées.
Cette étude examine les défis auxquels font face les Contributeurs issus des communautés qui parlent des langues peu dotées en Éthiopie. On s'est concentré sur trois langues principales : l'Afan Oromo, l'Amharique et le Tigrigna. En analysant les discussions parmi les utilisateurs expérimentés de Wikipedia et en observant les nouveaux contributeurs, on visait à comprendre les obstacles qu'ils rencontrent.
Contexte
Les dépôts de connaissances sont essentiels pour préserver et partager des informations sur différentes communautés et cultures. Ils permettent aux gens d'échanger des idées à l'échelle mondiale. Rien que Wikipedia est disponible en plus de 300 langues et a plus de 191 millions d'articles. Malgré ça, la représentation des langues africaines est faible.
En Éthiopie, un pays de plus de 120 millions de personnes, trois langues principales-l'Afan Oromo, l'Amharique et le Tigrigna-ont significativement moins d'articles par rapport à l'anglais. Les articles dans ces langues sont souvent courts, mal écrits ou pas pertinents pour la culture locale. Ce manque de contenu de qualité affecte le développement de technologies qui dépendent de cette information, comme les outils de traitement linguistique. Beaucoup d'étrangers écrivent sur les communautés africaines, ce qui peut mener à des méprises.
Défis rencontrés par les contributeurs
Comprendre les besoins des contributeurs issus de communautés de langues peu dotées est crucial pour améliorer leur expérience sur des plateformes comme Wikipedia.
Objectifs de l'étude
Pour clarifier les défis que rencontrent les contributeurs, on a établi deux objectifs clés :
- Comprendre les obstacles que rencontrent les contributeurs expérimentés utilisant Wikipedia dans les langues peu dotées.
- Enquêter sur les problèmes que rencontrent les nouveaux contributeurs lorsqu'ils essaient de faire leurs contributions.
Méthodologie
Pour atteindre nos objectifs, on a mené deux études. D'abord, on a analysé les discussions sur les forums parmi les utilisateurs expérimentés de Wikipedia. Ensuite, on a observé et interviewé des nouveaux contributeurs dans leurs langues. Cela nous a aidés à identifier des thèmes et des patterns sur leurs expériences.
Analyse des discussions sur le forum
Dans la première étude, on a collecté et analysé des discussions parmi les utilisateurs de Wikipedia en Amharique, Tigrigna et Afan Oromo. On s'est concentré sur les problèmes qu'ils ont soulevés sur l'utilisation de Wikipedia et comment ils ont essayé de surmonter ces défis.
Principales conclusions des discussions sur le forum
Stratégies d'engagement : Les contributeurs ont partagé des moyens d'encourager la participation, comme le réseautage avec des organisations professionnelles pour sensibiliser sur Wikipedia.
Difficultés d'écriture : Beaucoup de contributeurs ont eu du mal à écrire dans leur langue à cause de l'interface de Wikipedia qui ne supporte pas les scripts non latins, surtout lors des mises à jour.
Besoin de Ressources : Les contributeurs cherchaient souvent de l'aide pour trouver des traductions ou créer de nouveaux articles. Ils ont discuté de la difficulté à rassembler des médias, comme des photos, pour soutenir leur écriture.
Collaboration interlangues : Les contributeurs interagissaient à travers différents forums linguistiques, partageant des ressources et s'aidant avec des traductions.
Utilisation d'Outils de traduction : Les participants ont proposé d'utiliser des outils de traduction pour les aider à écrire dans leurs langues, mais ils ont rencontré de nombreux problèmes avec la précision et le contexte culturel.
Variations d'orthographe : Le manque d'orthographe standardisée a conduit à des articles en double et a compliqué la recherche de sujets.
Enquête contextuelle avec des nouveaux contributeurs
Dans la deuxième étude, on a observé 14 nouveaux contributeurs pendant qu'ils écrivaient des articles sur Wikipedia. Notre but était de comprendre leurs expériences en interagissant avec la plateforme.
Principales conclusions de l'étude des nouveaux contributeurs
Outils de support linguistique : Beaucoup de participants ont eu des difficultés avec des claviers qui ne supportaient pas leurs scripts. Ils ont souvent dû changer de claviers ou utiliser des logiciels alternatifs pour écrire.
Défis de traduction : Les participants s'appuyaient beaucoup sur des outils de traduction, mais cela aboutissait souvent à des traductions inexactes ou pas pertinentes. Ça a causé de la frustration et de la confusion.
Questions socio-politiques : Certains participants ont rencontré des restrictions Internet à cause de leur utilisation de VPN pour accéder à Wikipedia, ce qui compliquait leurs efforts d'écriture.
Manque de ressources : Les participants ont signalé des difficultés à trouver des travaux académiques à référencer dans leurs articles. Beaucoup dépendaient de documents en anglais, ce qui limitait la qualité de leurs contributions.
Confusion d'interface : Les participants trouvaient souvent l'interface de Wikipedia difficile à cause des langues mélangées et des termes peu familiers, ce qui gênait leur capacité à éditer des articles efficacement.
Conclusions et implications
Nos résultats soulignent une gamme de défis rencontrés par les contributeurs de langues peu dotées sur des plateformes comme Wikipedia. Ces défis ne sont pas seulement techniques, mais profondément enracinés dans des facteurs sociaux et culturels. Aborder ces problèmes nécessite un effort collaboratif pour améliorer les outils et ressources disponibles pour ces communautés.
Recommandations pour l'amélioration
Améliorer le support linguistique : Améliorer les outils de clavier et d'écriture pour les langues peu dotées aidera les contributeurs à écrire plus facilement.
Affiner les outils de traduction : Développer de meilleurs systèmes de traduction qui comprennent le contexte culturel peut améliorer la qualité des contributions.
Augmenter la disponibilité des ressources : Fournir un accès à des documents académiques locaux en langues peu dotées améliorera la qualité des articles.
Adapter l'interface : Simplifier l'interface de Wikipedia et s'assurer qu'elle fonctionne pleinement dans les langues locales peut améliorer l'expérience utilisateur.
Encourager l'engagement communautaire : Encourager la collaboration entre les locuteurs de différentes langues et créer des réseaux de soutien peut booster la participation.
Directions futures
Les recherches futures devraient continuer à explorer les expériences des contributeurs de langues peu dotées. Cela inclut l'examen des effets des outils et ressources améliorés sur leur participation dans les dépôts de connaissances. S'engager directement avec ces communautés garantira que leurs voix soient entendues et valorisées dans le développement continu des plateformes de connaissances en ligne.
Titre: Low-resourced Languages and Online Knowledge Repositories: A Need-Finding Study
Résumé: Online Knowledge Repositories (OKRs) like Wikipedia offer communities a way to share and preserve information about themselves and their ways of living. However, for communities with low-resourced languages -- including most African communities -- the quality and volume of content available are often inadequate. One reason for this lack of adequate content could be that many OKRs embody Western ways of knowledge preservation and sharing, requiring many low-resourced language communities to adapt to new interactions. To understand the challenges faced by low-resourced language contributors on the popular OKR Wikipedia, we conducted (1) a thematic analysis of Wikipedia forum discussions and (2) a contextual inquiry study with 14 novice contributors. We focused on three Ethiopian languages: Afan Oromo, Amharic, and Tigrinya. Our analysis revealed several recurring themes; for example, contributors struggle to find resources to corroborate their articles in low-resourced languages, and language technology support, like translation systems and spellcheck, result in several errors that waste contributors' time. We hope our study will support designers in making online knowledge repositories accessible to low-resourced language speakers.
Auteurs: Hellina Hailu Nigatu, John Canny, Sarah E. Chasins
Dernière mise à jour: 2024-05-26 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2405.16669
Source PDF: https://arxiv.org/pdf/2405.16669
Licence: https://creativecommons.org/licenses/by-nc-sa/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.