Simple Science

La science de pointe expliquée simplement

# Génie électrique et science des systèmes# Multimédia# Intelligence artificielle# Traitement de l'image et de la vidéo

Évaluer la qualité de l'expérience en streaming en direct

Cet article parle de la mesure de la satisfaction des spectateurs dans le streaming vidéo en direct.

Zehao Zhu, Wei Sun, Jun Jia, Wei Wu, Sibin Deng, Kai Li, Ying Chen, Xiongkuo Min, Jia Wang, Guangtao Zhai

― 10 min lire


Évaluation de la QoE enÉvaluation de la QoE enstreaming livela satisfaction des vidéos en direct.Un nouveau modèle améliore la mesure de
Table des matières

Ces dernières années, regarder des vidéos en direct sur les réseaux sociaux est devenu super populaire. La Qualité de l'expérience (QoE), c'est à quel point les spectateurs sont contents de ce qu'ils voient. Pour les entreprises qui fournissent ces vidéos, comprendre la QoE est essentiel pour améliorer la compression et la diffusion du contenu vidéo. Bien qu'il existe plein de méthodes pour mesurer la QoE des vidéos préenregistrées, déterminer la QoE pour le streaming vidéo en direct est plus compliqué. Cet article aborde les défis de la mesure de la QoE pour les vidéos en direct et présente de nouvelles solutions.

Le Streaming Vidéo en Direct et son Importance

Le streaming vidéo en direct permet aux gens de regarder des événements en temps réel sur Internet. Ça a changé notre manière de consommer les médias. Avec l'essor des appareils mobiles, n'importe qui peut regarder des vidéos partout et à tout moment. Les gens s'attendent à un streaming de haute qualité sans délais. La technologie de streaming garantit une lecture fluide, même quand la vidéo n'est pas encore complètement chargée.

Quand les streams en direct sont envoyés sur Internet, le contenu vidéo est découpé en paquets de données. Ces paquets utilisent différents protocoles de transport comme HTTP et RTMP pour arriver aux serveurs. Ensuite, les serveurs utilisent des réseaux pour envoyer ces paquets vidéo aux appareils des utilisateurs. Une fois que les appareils reçoivent ces paquets, ils les reconstituent pour le visionnage.

Défis du Streaming Vidéo en Direct

Le streaming en direct pose des défis uniques qui peuvent affecter la QoE. Des problèmes comme de mauvaises conditions réseau peuvent entraîner des soucis visuels comme des images floues ou des interruptions de lecture. Si la qualité vidéo chute ou qu'il y a des pauses, les spectateurs sont moins susceptibles d'apprécier leur expérience. Donc, il est crucial que les fournisseurs de médias comprennent ce qui affecte la satisfaction des utilisateurs et comment l'améliorer.

Les indicateurs de la QoE incluent la clarté vidéo, la fluidité de la lecture et les préférences des utilisateurs. Les méthodes traditionnelles pour évaluer la qualité vidéo ne capturent souvent pas les interruptions et les changements de qualité lors des diffusions en direct. Au lieu de ça, la QoE devrait prendre en compte des facteurs comme le "stalling", qui se produit lorsque la vidéo fait une pause temporaire à cause du buffering.

Défis de Qualité Vidéo en Direct

Malgré les avancées dans l'évaluation de la qualité vidéo, mesurer la QoE pour le streaming en direct reste insuffisant. Cela est dû à deux problèmes principaux. D'abord, il n'y a pas assez de bases de données vidéo en direct accessibles au public pour aider les chercheurs à comprendre efficacement la QoE du streaming en direct. Les bases de données existantes ressemblent souvent à des scénarios de vidéos préenregistrées.

Ensuite, de nombreux modèles de QoE reposent énormément sur des données statistiques liées à la lecture vidéo. Collecter ces données en temps réel est difficile, rendant ces modèles inadaptés à une évaluation immédiate lors des diffusions en direct.

Pour aider à combler cette lacune, nous avons créé une nouvelle base de données appelée la Tao Live QoE Database. Cette base de données comprend divers vidéos en direct et est conçue pour étudier comment la QoE peut être évaluée de manière fiable dans des situations de streaming en monde réel.

Tao Live QoE Database

La Tao Live QoE Database est une grande collection de vidéos rassemblées à partir d'une plateforme de diffusion en direct. Nous avons sélectionné 42 vidéos de haute qualité et introduit des problèmes comme des artefacts de compression et des événements de stalling. Cette base de données vise à fournir un terrain réaliste pour évaluer la QoE.

Les vidéos sont variées, couvrant différentes résolutions et fréquences d'images. Nous avons aussi veillé à inclure des événements de stalling en manipulant la manière dont la vidéo est présentée. Chaque vidéo a subi des tests subjectifs approfondis pour attribuer des scores de QoE, ce qui aide les chercheurs à comprendre les expériences des spectateurs.

Expérience Subjective

Nous avons mené une expérience subjective pour recueillir des retours sur les vidéos de notre base de données. Un groupe de participants a regardé les vidéos et a noté leur expérience sur une échelle de 1 à 5. Cette méthode nous a permis de recueillir des opinions significatives, qui guideraient ensuite notre analyse de la qualité vidéo.

Pour s'assurer que les participants comprennent les types de distorsions dans les vidéos, nous avons organisé une session de formation avant le début du test principal. Nous avons cherché à impliquer un groupe équilibré avec des participants masculins et féminins ayant de l'expérience avec le contenu vidéo.

Types de Distorsion Vidéo

Dans notre base de données, nous avons inclus différents types de distorsions pour reproduire des scénarios de la vie réelle. Ces distorsions comprenaient des problèmes de compression, du stalling, et des situations où les vidéos étaient rejouées trop rapidement après une pause. Chaque type de distorsion impacte la perception de la qualité vidéo par les spectateurs.

Les artefacts de compression se produisent lorsque la vidéo est réduite en taille, entraînant une perte de détails. Le stalling se produit lorsque la vidéo fait une pause pendant la lecture, causant de la frustration. Une lecture rapide après un événement de stalling peut être désorientante pour les spectateurs et affecter leur expérience globale.

Méthodes d'Évaluation de la QoE

Pour évaluer la QoE, nous avons besoin de méthodes de mesure efficaces. Les modèles traditionnels s'appuient souvent sur des analyses statistiques qui examinent le bitrate et les occurrences de stalling. Ils ont tendance à ne pas prendre en compte l'expérience globale du spectateur, qui inclut ses réponses émotionnelles à la qualité visuelle et aux problèmes de lecture.

Les avancées récentes suggèrent qu'une combinaison de caractéristiques sémantiques et de mouvement peut améliorer la précision des évaluations de QoE. En examinant à la fois la qualité du contenu et le mouvement du spectateur entre les images, nous pouvons obtenir des évaluations plus précises.

Modèle de QoE Proposé : Tao-QoE

Nous avons développé un nouveau modèle d'apprentissage profond appelé Tao-QoE pour prédire les scores de QoE pour les vidéos en direct. Ce modèle capture des détails essentiels en utilisant diverses caractéristiques. En gros, il traite les vidéos pour identifier des événements de stalling et des caractéristiques de mouvement, fusionnant ces insights pour livrer un score QoE global.

Tao-QoE utilise des algorithmes avancés pour analyser chaque image vidéo. En extrayant des données significatives, le modèle évalue les performances de la vidéo et prédit comment les spectateurs réagiront probablement en termes de satisfaction.

Structure du Modèle

Le modèle Tao-QoE se compose de plusieurs composants qui travaillent ensemble :

  1. Sous-réseau de Restructuration Vidéo : Cette partie du modèle vérifie les problèmes de lecture vidéo, comme les stalling ou les lectures accélérées, et restructure les images vidéo en conséquence.

  2. Sous-réseau d'Extraction de Caractéristiques Sémantiques : Cette couche se concentre sur l'extraction de contenu significatif à partir des images vidéo individuelles. Elle prête attention aux caractéristiques visuelles que les spectateurs pourraient trouver attrayantes ou distrayantes.

  3. Sous-réseau d'Extraction de Caractéristiques de Mouvement : Ici, le modèle évalue le mouvement entre les images. C'est important car cela aide à identifier des problèmes comme le jitter ou le stalling qui peuvent perturber l'expérience de visionnage.

  4. Sous-réseau de Fusion de Caractéristiques Multi-Échelles : Ce composant combine les données des analyses précédentes. Il fusionne les informations pour créer une perspective unifiée de la qualité de la vidéo.

  5. Sous-réseau de Régression de Caractéristiques : Enfin, cette partie prédit le score QoE basé sur les caractéristiques combinées. Elle fait la moyenne des informations recueillies à partir des composants précédents pour former une note globale.

Configuration de l'Expérience

Pour évaluer l'efficacité du modèle Tao-QoE, nous l'avons testé sur divers ensembles de données de vidéos en direct aux côtés de modèles d'évaluation de QoE traditionnels. Le but était de déterminer les performances de notre modèle par rapport aux méthodes existantes.

Nous avons utilisé un ensemble complet de métriques pour évaluer la performance du modèle. Certaines de ces métriques comprenaient des valeurs de corrélation qui analysent comment les scores prédites s'alignaient avec les notes subjectives données par les participants.

Résultats et Conclusions

Les résultats ont montré que le modèle Tao-QoE a performé bien mieux que les modèles traditionnels lors de l'évaluation de la QoE pour les vidéos en direct. En prenant en compte à la fois la qualité du contenu et l'expérience du spectateur, on a pu générer des prédictions plus précises.

Des évaluations spécifiques ont indiqué que l'utilisation de caractéristiques sémantiques était particulièrement bénéfique pour améliorer les performances. Les modèles qui intégraient des données de mouvement ont aussi montré de meilleurs résultats, soulignant l'importance d'évaluer à la fois la qualité visuelle et le mouvement dans les vidéos.

Les expériences ont démontré qu'à mesure que la qualité vidéo diminuait ou que les événements de stalling augmentaient, les scores de QoE chutaient aussi. Cette corrélation claire a validé notre méthodologie et a mis en lumière la valeur de la Tao Live QoE Database dans la formation et le test de notre modèle.

Conclusion

En résumé, nous avons développé une base de données complète et un modèle d'apprentissage profond pour évaluer la qualité du streaming vidéo en direct. La Tao Live QoE Database permet aux chercheurs d'obtenir des informations sur les facteurs qui affectent la satisfaction des spectateurs. Notre modèle Tao-QoE répond avec succès aux défis de la mesure de la QoE lors du streaming en direct en utilisant une combinaison de caractéristiques sémantiques et de mouvement.

Les résultats de cette recherche peuvent aider les fournisseurs de médias à améliorer leurs services de streaming. Comprendre les facteurs qui influencent l'expérience des spectateurs peut les aider à allouer efficacement les ressources et à améliorer la satisfaction globale. À mesure que la technologie continue d'évoluer, d'autres études peuvent s'appuyer sur cette fondation pour développer des méthodes d'évaluation encore meilleures pour le streaming vidéo en direct.

Source originale

Titre: Subjective and Objective Quality-of-Experience Evaluation Study for Live Video Streaming

Résumé: In recent years, live video streaming has gained widespread popularity across various social media platforms. Quality of experience (QoE), which reflects end-users' satisfaction and overall experience, plays a critical role for media service providers to optimize large-scale live compression and transmission strategies to achieve perceptually optimal rate-distortion trade-off. Although many QoE metrics for video-on-demand (VoD) have been proposed, there remain significant challenges in developing QoE metrics for live video streaming. To bridge this gap, we conduct a comprehensive study of subjective and objective QoE evaluations for live video streaming. For the subjective QoE study, we introduce the first live video streaming QoE dataset, TaoLive QoE, which consists of $42$ source videos collected from real live broadcasts and $1,155$ corresponding distorted ones degraded due to a variety of streaming distortions, including conventional streaming distortions such as compression, stalling, as well as live streaming-specific distortions like frame skipping, variable frame rate, etc. Subsequently, a human study was conducted to derive subjective QoE scores of videos in the TaoLive QoE dataset. For the objective QoE study, we benchmark existing QoE models on the TaoLive QoE dataset as well as publicly available QoE datasets for VoD scenarios, highlighting that current models struggle to accurately assess video QoE, particularly for live content. Hence, we propose an end-to-end QoE evaluation model, Tao-QoE, which integrates multi-scale semantic features and optical flow-based motion features to predicting a retrospective QoE score, eliminating reliance on statistical quality of service (QoS) features.

Auteurs: Zehao Zhu, Wei Sun, Jun Jia, Wei Wu, Sibin Deng, Kai Li, Ying Chen, Xiongkuo Min, Jia Wang, Guangtao Zhai

Dernière mise à jour: 2024-09-26 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2409.17596

Source PDF: https://arxiv.org/pdf/2409.17596

Licence: https://creativecommons.org/licenses/by-sa/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires