Desafíos para los contribuyentes de lenguas poco recursos en Wikipedia
Examinando los obstáculos que enfrentan los contribuyentes de lenguas con pocos recursos en Etiopía.
― 6 minilectura
Tabla de contenidos
Los repositorios de conocimiento en línea, como Wikipedia, brindan una plataforma para que la gente comparta su conocimiento y cultura. Sin embargo, las comunidades que hablan lenguas de bajo recurso, especialmente en África, luchan por acceder a estas plataformas. Esto significa que no hay suficiente contenido disponible en sus idiomas, lo que dificulta su participación completa. Muchos de estos repositorios se basan en formas occidentales de compartir conocimiento, lo que hace que sea complicado para los hablantes de lenguas de bajo recurso adaptarse.
Este estudio examina los desafíos que enfrentan los Colaboradores de comunidades que hablan lenguas de bajo recurso en Etiopía. Nos enfocamos en tres idiomas principales: Afan Oromo, Amárico y Tigrinya. Al analizar las discusiones entre usuarios experimentados de Wikipedia y observar a colaboradores novatos, buscamos entender los obstáculos que encuentran.
Antecedentes
Los repositorios de conocimiento son esenciales para preservar y compartir información sobre diferentes comunidades y culturas. Permiten a la gente intercambiar ideas a nivel global. Wikipedia sola está disponible en más de 300 idiomas y tiene más de 191 millones de artículos. A pesar de esto, la representación de las lenguas africanas es baja.
En Etiopía, un país con más de 120 millones de personas, tres idiomas principales-Afan Oromo, Amárico y Tigrinya-tienen significativamente menos artículos en comparación con el inglés. Los artículos en estos idiomas suelen ser cortos, mal escritos o no relevantes para la cultura local. Esta falta de contenido de calidad afecta el desarrollo de tecnología que depende de esta información, como las herramientas de procesamiento de lenguaje. Muchas personas de fuera escriben sobre las comunidades africanas, lo que puede llevar a una mala representación.
Desafíos enfrentados por los colaboradores
Entender las necesidades de los colaboradores de comunidades de lenguas de bajo recurso es crucial para mejorar su experiencia en plataformas como Wikipedia.
Objetivos del estudio
Para aclarar los desafíos que enfrentan los colaboradores, establecimos dos objetivos clave:
- Comprender los obstáculos que enfrentan los colaboradores experimentados usando Wikipedia en lenguas de bajo recurso.
- Investigar los problemas que encuentran los colaboradores novatos al intentar hacer sus aportes.
Metodología
Para alcanzar nuestros objetivos, realizamos dos estudios. Primero, analizamos las discusiones en foros entre usuarios experimentados de Wikipedia. Luego, observamos e entrevistamos a colaboradores novatos en sus idiomas. Esto nos ayudó a identificar temas y patrones sobre sus experiencias.
Análisis de discusiones en foros
En el primer estudio, recolectamos y analizamos discusiones entre usuarios de Wikipedia en Amárico, Tigrinya y Afan Oromo. Nos enfocamos en los problemas que plantearon sobre el uso de Wikipedia y cómo intentaron superar estos desafíos.
Hallazgos clave de las discusiones en foros
Estrategias de participación: Los colaboradores compartieron formas de fomentar la participación, como hacer redes con organizaciones profesionales para crear conciencia sobre Wikipedia.
Dificultades de escritura: Muchos colaboradores lucharon por escribir en su idioma debido a que la interfaz de Wikipedia no soporta escrituras no latinas, especialmente durante las actualizaciones.
Necesidad de Recursos: Los colaboradores a menudo buscaban ayuda para encontrar traducciones o crear nuevos artículos. Discutieron lo difícil que era reunir medios, como fotos, para apoyar su escritura.
Colaboración entre idiomas: Los colaboradores interactuaron en diferentes foros de idiomas, compartiendo recursos y ayudándose mutuamente con traducciones.
Uso de Herramientas de traducción: Los participantes sugirieron utilizar herramientas de traducción para ayudar con la escritura en sus idiomas, pero enfrentaron muchos problemas con la precisión y el contexto cultural.
Variaciones de ortografía: La falta de ortografía estandarizada llevó a artículos duplicados y dificultó la búsqueda de temas.
Investigación contextual con colaboradores novatos
En el segundo estudio, observamos a 14 colaboradores novatos mientras escribían artículos en Wikipedia. Nuestro objetivo era entender sus experiencias mientras interactuaban con la plataforma.
Hallazgos clave del estudio de colaboradores novatos
Herramientas de soporte lingüístico: Muchos participantes lucharon con teclados que no soportaban sus escrituras. A menudo tenían que cambiar de teclado o usar software alternativo para escribir.
Desafíos de traducción: Los participantes dependían en gran medida de herramientas de traducción, pero a menudo resultaban en traducciones inexactas o irrelevantes. Esto causó frustración y confusión.
Problemas socio-políticos: Algunos participantes enfrentaron restricciones de internet debido a su uso de VPN para acceder a Wikipedia, lo que complicó sus esfuerzos de escritura.
Falta de recursos: Los participantes informaron sobre la dificultad de encontrar trabajos académicos para hacer referencia en sus artículos. Muchos dependían de materiales en inglés, lo que limitaba la calidad de sus contribuciones.
Confusión con la interfaz: Los participantes a menudo encontraban la interfaz de Wikipedia desafiante debido a los idiomas mezclados y términos desconocidos, lo que dificultaba su capacidad para editar artículos de manera efectiva.
Conclusiones e implicaciones
Nuestros hallazgos destacan una variedad de desafíos que enfrentan los colaboradores de lenguas de bajo recurso en plataformas como Wikipedia. Estos desafíos no son solo técnicos, sino que están profundamente arraigados en factores sociales y culturales. Abordar estos problemas requiere un esfuerzo colaborativo para mejorar las herramientas y recursos disponibles para estas comunidades.
Recomendaciones para la mejora
Mejorar el soporte lingüístico: Mejorar las herramientas de escritura y teclado para lenguas de bajo recurso ayudará a los colaboradores a escribir más fácilmente.
Refinar las herramientas de traducción: Desarrollar mejores sistemas de traducción que entiendan el contexto cultural puede mejorar la calidad de las contribuciones.
Aumentar la disponibilidad de recursos: Proporcionar acceso a materiales académicos locales en lenguas de bajo recurso mejorará la calidad de los artículos.
Adaptar la interfaz: Simplificar la interfaz de Wikipedia y asegurarse de que funcione completamente en lenguas locales puede mejorar la experiencia del usuario.
Fomentar la participación de la comunidad: Fomentar la colaboración entre hablantes de diferentes idiomas y crear redes de apoyo puede aumentar la participación.
Direcciones futuras
La investigación futura debe continuar explorando las experiencias de los colaboradores de lenguas de bajo recurso. Esto incluye examinar los efectos de las herramientas y recursos mejorados en su participación en repositorios de conocimiento. Involucrarse directamente con estas comunidades asegurará que sus voces sean escuchadas y valoradas en el desarrollo continuo de plataformas de conocimiento en línea.
Título: Low-resourced Languages and Online Knowledge Repositories: A Need-Finding Study
Resumen: Online Knowledge Repositories (OKRs) like Wikipedia offer communities a way to share and preserve information about themselves and their ways of living. However, for communities with low-resourced languages -- including most African communities -- the quality and volume of content available are often inadequate. One reason for this lack of adequate content could be that many OKRs embody Western ways of knowledge preservation and sharing, requiring many low-resourced language communities to adapt to new interactions. To understand the challenges faced by low-resourced language contributors on the popular OKR Wikipedia, we conducted (1) a thematic analysis of Wikipedia forum discussions and (2) a contextual inquiry study with 14 novice contributors. We focused on three Ethiopian languages: Afan Oromo, Amharic, and Tigrinya. Our analysis revealed several recurring themes; for example, contributors struggle to find resources to corroborate their articles in low-resourced languages, and language technology support, like translation systems and spellcheck, result in several errors that waste contributors' time. We hope our study will support designers in making online knowledge repositories accessible to low-resourced language speakers.
Autores: Hellina Hailu Nigatu, John Canny, Sarah E. Chasins
Última actualización: 2024-05-26 00:00:00
Idioma: English
Fuente URL: https://arxiv.org/abs/2405.16669
Fuente PDF: https://arxiv.org/pdf/2405.16669
Licencia: https://creativecommons.org/licenses/by-nc-sa/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.