Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Ingeniería Eléctrica y Ciencia de Sistemas# Interacción Persona-Ordenador# Sonido# Procesado de Audio y Voz

Desenredando el Sonido: Una Nueva Herramienta para la Realidad Mixta

Un método para ayudar a las personas con discapacidad visual a reconocer sonidos en realidad mixta.

― 6 minilectura


Revolucionando el sonidoRevolucionando el sonidopara personas condiscapacidad visualsonido para una mejor navegación.Nuevas técnicas mejoran la claridad del
Tabla de contenidos

La realidad mixta (RM) combina sonidos del mundo real con audio virtual. Esto es útil, sobre todo para personas ciegas o con discapacidades visuales que dependen del sonido en su vida diaria. Sin embargo, mezclar estos sonidos puede ser confuso y difícil de seguir para ellos. Este artículo habla de un nuevo método llamado Desmezcla de Sonido, diseñado para ayudar a los usuarios a reconocer mejor los sonidos en entornos de realidad mixta.

Desafíos de los Sonidos en la Realidad Mixta

Las personas ciegas o con discapacidades visuales enfrentan desafíos únicos en la realidad mixta. A menudo luchan por escuchar sonidos importantes en medio de otros ruidos. Por ejemplo, al caminar por una calle concurrida, pueden escuchar el tráfico, gente hablando y las instrucciones de navegación al mismo tiempo. Puede ser complicado prestar atención a los sonidos más importantes cuando muchos ocurren al mismo tiempo.

Los sonidos virtuales, como los de aplicaciones de navegación, pueden superponerse a los ruidos del mundo real. Esta superposición crea confusión y puede llevar a perder información vital, lo cual es especialmente riesgoso al navegar en entornos concurridos.

Investigando los Problemas

Para entender mejor las dificultades que enfrentan las personas ciegas, los investigadores examinaron foros en línea donde compartían sus experiencias. Buscaron temas y problemas comunes relacionados con la recepción de información de audio compleja.

El análisis reveló que muchas personas querían personalizar la forma en que escuchan los sonidos. Por ejemplo, deseaban ajustar el volumen de sonidos específicos, distribuir flujos de audio a través de diferentes dispositivos, o incluso cambiar la forma en que se presentan ciertos sonidos.

Presentando la Desmezcla de Sonido

La Desmezcla de Sonido es un concepto nuevo que utiliza seis técnicas para manipular el sonido en la realidad mixta. Estas técnicas son:

  1. Constructor de Ambientes: Esta técnica ajusta los sonidos de fondo para ayudar a los usuarios a concentrarse en el audio importante.
  2. Cambiador de Características: Cambia características de sonido específicas, como el volumen o el tono, para hacer que los sonidos sean más claros.
  3. Espacializador: Esta técnica controla de dónde vienen los sonidos, facilitando su localización.
  4. Estilizador: Modifica los sonidos para cambiar su calidad o estilo.
  5. Generador de Earcon: Crea sonidos de alerta para eventos específicos.
  6. Priorizador: Organiza los sonidos según su importancia, retrasando el audio menos crítico si entra en conflicto con sonidos más importantes.

Probando la Desmezcla de Sonido

Para evaluar la efectividad de la Desmezcla de Sonido, se realizó un estudio con 18 participantes ciegos. Experimentaron tres escenarios diferentes diseñados para imitar situaciones de la vida real. Se pidió a los participantes que identificaran sonidos mientras navegaban por estos escenarios utilizando las manipulaciones de sonido.

Tres Escenarios

  1. Enfoque en el RW: Los participantes navegaron por una calle concurrida mientras usaban una aplicación de navegación sonora y enfrentaban varios ruidos de la ciudad.
  2. Enfoque en el VR: Los participantes escucharon un manual de audio mientras trabajaban en un escritorio de ayuda, con sonidos de fondo de otras personas.
  3. Totalmente Mezclado: Los participantes asistieron a una conferencia híbrida con oradores tanto virtuales como del mundo real, necesitando discernir entre ellos.

Resultados del Estudio

Los resultados mostraron que la Desmezcla de Sonido mejoró significativamente la habilidad de los participantes para identificar sonidos en comparación con otras dos condiciones: transparencia total (escuchar todo claramente) y cancelación de ruido (bloquear la mayoría de los sonidos).

En el escenario de Enfoque en el RW, los participantes se desempeñaron mejor y se sintieron más conscientes de su entorno usando la Desmezcla de Sonido. Los comentarios sugirieron que la claridad proporcionada por la manipulación del sonido fue beneficiosa.

En el escenario de Enfoque en el VR, los participantes apreciaron cómo se organizaban los sonidos por ubicación. Sin embargo, algunos sintieron que demasiada claridad podría hacer que se perdieran otros sonidos importantes en su entorno real.

En el escenario Totalmente Mezclado, algunos participantes se sintieron abrumados por demasiados sonidos distintos. Aunque les gustó la Desmezcla de Sonido, algunos prefirieron el ambiente sonoro natural de la transparencia total.

Reduciendo la Carga Cognitiva

La carga cognitiva se relaciona con cuánta energía mental se necesita para procesar información. El estudio encontró que la Desmezcla de Sonido redujo la carga cognitiva en comparación con las otras condiciones. Los participantes sintieron que podían manejar los sonidos más fácilmente, lo que les permitió concentrarse mejor.

Aplicación de la Desmezcla de Sonido

Para mostrar cómo se puede usar la Desmezcla de Sonido en la vida real, los investigadores desarrollaron tres aplicaciones de ejemplo:

  1. Aplicación de Reuniones en Línea: Esta app ayuda a las personas en reuniones a usar lectores de pantalla sin que la retroalimentación de audio interfiera con la conversación. El sonido del lector de pantalla se prioriza cuando alguien más habla.

  2. Aplicación de Exploración de Imágenes: Este sistema ayuda a los usuarios a explorar imágenes en realidad mixta. Proporciona retroalimentación de audio que coincide con el lugar donde el usuario toca la imagen, facilitando la comprensión del diseño de la imagen.

  3. Aplicación de Navegación Móvil: Esta app escucha los sonidos del mundo real mientras da direcciones de navegación. Si se detecta un ruido fuerte, la aplicación retrasará las direcciones hasta que sea seguro hablar.

Conclusión

La Desmezcla de Sonido abre nuevas posibilidades para ayudar a personas ciegas o con discapacidades visuales a navegar entornos de realidad mixta de manera más efectiva. Mediante manipulaciones de sonido, es posible mejorar la conciencia y reducir el esfuerzo mental necesario para procesar paisajes sonoros complejos. Este estudio muestra promesas para futuras aplicaciones que priorizan la accesibilidad en experiencias de realidad mixta.

Trabajo Futuro

La investigación continua sobre soluciones de sonido personalizables podría mejorar aún más la experiencia del usuario. A medida que la tecnología avanza, mejorar las formas en que se manipula el sonido ayudará a crear una realidad mixta aún más accesible para todos. Con el tiempo, estos desarrollos pueden llevar a una mejor comprensión y reacciones a los entornos circundantes.

Proporcionar una plataforma para que los usuarios expresen sus preferencias y experiencias moldeará mejor las futuras aplicaciones, haciendo que las tecnologías de sonido sean más amigables y eficientes.

Fuente original

Título: SoundShift: Exploring Sound Manipulations for Accessible Mixed-Reality Awareness

Resumen: Mixed-reality (MR) soundscapes blend real-world sound with virtual audio from hearing devices, presenting intricate auditory information that is hard to discern and differentiate. This is particularly challenging for blind or visually impaired individuals, who rely on sounds and descriptions in their everyday lives. To understand how complex audio information is consumed, we analyzed online forum posts within the blind community, identifying prevailing challenges, needs, and desired solutions. We synthesized the results and propose SoundShift for increasing MR sound awareness, which includes six sound manipulations: Transparency Shift, Envelope Shift, Position Shift, Style Shift, Time Shift, and Sound Append. To evaluate the effectiveness of SoundShift, we conducted a user study with 18 blind participants across three simulated MR scenarios, where participants identified specific sounds within intricate soundscapes. We found that SoundShift increased MR sound awareness and minimized cognitive load. Finally, we developed three real-world example applications to demonstrate the practicality of SoundShift.

Autores: Ruei-Che Chang, Chia-Sheng Hung, Bing-Yu Chen, Dhruv Jain, Anhong Guo

Última actualización: 2024-05-26 00:00:00

Idioma: English

Fuente URL: https://arxiv.org/abs/2401.11095

Fuente PDF: https://arxiv.org/pdf/2401.11095

Licencia: https://creativecommons.org/licenses/by-nc-sa/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares