Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Informática# Visión por Computador y Reconocimiento de Patrones# Inteligencia artificial# Computación y lenguaje

Entendiendo el impacto del contenido sexual en TikTok

Analizando cómo los videos de TikTok afectan las actitudes de los jóvenes hacia el sexo.

― 6 minilectura


Contenido Sexual enContenido Sexual enTikTok Explicadojuventud.TikTok en las perspectivas de laAnalizando el impacto de los videos de
Tabla de contenidos

En los últimos años, TikTok se ha convertido en una plataforma muy usada, especialmente entre los jóvenes. Aunque ofrece contenido entretenido, también puede exponer a los espectadores a temas sensibles, incluyendo contenido sexual. Es importante diferenciar entre los videos que buscan educar sobre Sexo y aquellos que son sugerentes sexualmente. Esta distinción es clave porque los niños y adolescentes a menudo se ven afectados de maneras diferentes por este tipo de contenido.

Para ayudar con este tema, se ha creado un nuevo conjunto de datos llamado SexTok. Este conjunto incluye videos de TikTok etiquetados como sugerentes sexualmente, Educativos sobre sexo o ninguno de los dos. Al tener esta información, podemos entender mejor qué tipo de videos están viendo los jóvenes y cómo pueden impactar su desarrollo.

La Necesidad de Separación

Investigaciones han mostrado que los niños expuestos a contenido sugestivo sexual pueden desarrollar actitudes poco saludables sobre el sexo. Por otro lado, los videos educativos brindan información valiosa, especialmente para los jóvenes LGBTQIA+, que quizás no tengan acceso a orientación adecuada en otros lugares. TikTok, con su amplio alcance, puede jugar un papel importante en ofrecer educación sexual, logrando esto de una manera que se sienta privada e inclusiva.

Sin embargo, la plataforma a veces elimina videos que caen en ambas categorías, lo que puede afectar el aspecto educativo. Aquí es donde entra el conjunto de datos SexTok. Este comprende videos transcritos visual y auditivamente, facilitando su análisis y clasificación.

Recolección de Datos

Los datos fueron recolectados viendo varios videos de TikTok y categorizándolos en consecuencia. El conjunto contiene 1000 enlaces a videos de TikTok junto con sus etiquetas. Cada video fue etiquetado según su intención percibida: sugestivo sexual, educativo o ninguno.

Además, el conjunto incluye etiquetas de expresión de género que clasifican cómo se presenta el género en los videos. Esta característica es crítica para evaluar cualquier sesgo en los modelos de clasificación que más tarde analizarán los videos.

Clasificando Videos

Para entender mejor el contenido de estos videos, se probaron dos modelos para clasificar los videos basados en el conjunto de datos. Aunque la tarea parece simple al principio, determinar si un video es educativo o sugestivo sexualmente es complejo.

El primer modelo se centra en las transcripciones de audio de los videos. Puede captar las palabras que se dicen y evaluar si se alinean más con contenido educativo o sugestivo. El segundo modelo analiza los propios videos para obtener información visual. Ambos enfoques tienen sus fortalezas y debilidades, y combinarlos puede dar los mejores resultados.

Desafíos en la Clasificación

Diferenciar entre videos educativos y los que son sugestivos no es tan sencillo. La naturaleza subjetiva de la sugestividad sexual significa que la opinión de una persona puede diferir de la de otra. El lenguaje utilizado en los videos también juega un papel importante. Por ejemplo, frases eufemísticas pueden llevar a confusión en la categorización.

Además, algunos videos pueden no tener palabras habladas, haciendo imposible el análisis de audio. En esos casos, el contenido del video necesita ser analizado a fondo para encontrar pistas visuales.

Resultados de los Modelos

Los resultados iniciales del experimento muestran que, aunque la tarea es desafiante, es posible lograr tasas de clasificación satisfactorias. Los modelos basados en transformadores pudieron categorizar correctamente una cantidad significativa de videos. Sin embargo, algunos videos causaron confusión, especialmente cuando contenían señales mixtas-siendo tanto educativos como sugestivos al mismo tiempo.

Los resultados indicaron que el análisis de texto, cuando está disponible, es un fuerte indicador de contenido educativo. Sin embargo, los videos sugestivos tendían a ser más cortos y a menudo tenían música u otras distracciones que podían desviar la clasificación.

Visión General del Conjunto de Datos

El conjunto de datos SexTok incluye una variedad de videos, proporcionando un retrato más realista del contenido de TikTok. Contiene tres características principales: etiqueta de clase, expresión de género y transcripción de audio. Los videos fueron recolectados de diversas fuentes dentro de TikTok para permitir una representación diversa del contenido.

Expresión de Género

Entender la expresión de género en estos videos es importante para analizar sesgos. La expresión de género se refiere a cómo las personas muestran su identidad de género a través de su apariencia y comportamiento. El conjunto categoriza la expresión de género en varias etiquetas: Femenina, Masculina, No conforme, Diversa y Ninguna. Esta categorización puede revelar patrones potenciales en cómo se presentan visualmente diferentes tipos de contenido.

Importancia de la Ética

Al recolectar datos, deben considerarse cuestiones éticas. Los videos en el conjunto fueron vistos con la comprensión de que son de acceso público. Sin embargo, hay un riesgo de tergiversación. La intención detrás de los videos puede ser subjetiva, y esta subjetividad debe ser reconocida al analizar los datos.

El Papel de los Algoritmos

Los algoritmos actuales utilizados para la moderación de contenido en plataformas como TikTok tienen limitaciones. Pueden clasificar erróneamente videos que no son realmente explícitos. Esta mala clasificación puede llevar a que contenido educativo valioso sea eliminado, lo que es contraproducente para los usuarios que buscan conocimiento sobre salud sexual.

El Futuro de la Investigación

Se necesita más investigación para refinar los modelos y mejorar la precisión de clasificación. Además, las implicaciones de este trabajo podrían llevar a que mejores recursos educativos estén disponibles en plataformas de redes sociales. Abordar los sesgos en la expresión de género y cómo afectan la percepción del contenido también será significativo para esta línea de investigación.

Conclusión

El desarrollo del conjunto de datos SexTok es un paso hacia una mejor comprensión del contenido sexual en plataformas como TikTok. Al separar el contenido sugestivo sexual del contenido educativo, podemos ayudar a crear un espacio más seguro e informativo para los jóvenes. Los hallazgos de esta investigación ayudarán a mejorar cómo se clasifican y moderan los videos, llevando finalmente a un mejor acceso a la educación sexual para todos los usuarios.

Esta exploración continua del contenido de video y la interacción de los usuarios con temas sexuales es crucial para el bienestar de los jóvenes hoy en día. Las conversaciones sobre estos temas son esenciales para abrir el camino hacia una generación más informada.

Fuente original

Título: It is not Sexually Suggestive, It is Educative. Separating Sex Education from Suggestive Content on TikTok Videos

Resumen: We introduce SexTok, a multi-modal dataset composed of TikTok videos labeled as sexually suggestive (from the annotator's point of view), sex-educational content, or neither. Such a dataset is necessary to address the challenge of distinguishing between sexually suggestive content and virtual sex education videos on TikTok. Children's exposure to sexually suggestive videos has been shown to have adversarial effects on their development. Meanwhile, virtual sex education, especially on subjects that are more relevant to the LGBTQIA+ community, is very valuable. The platform's current system removes or penalizes some of both types of videos, even though they serve different purposes. Our dataset contains video URLs, and it is also audio transcribed. To validate its importance, we explore two transformer-based models for classifying the videos. Our preliminary results suggest that the task of distinguishing between these types of videos is learnable but challenging. These experiments suggest that this dataset is meaningful and invites further study on the subject.

Autores: Enfa George, Mihai Surdeanu

Última actualización: 2023-07-06 00:00:00

Idioma: English

Fuente URL: https://arxiv.org/abs/2307.03274

Fuente PDF: https://arxiv.org/pdf/2307.03274

Licencia: https://creativecommons.org/licenses/by/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares