Informatique - Multimédia

Vision par ordinateur et reconnaissance des formes NU-Class Net : Amélioration de la qualité vidéo après compression

Un nouveau modèle améliore les vidéos de mauvaise qualité tout en réduisant les besoins en traitement.

2025-09-19T05:25:42+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Une nouvelle méthode pour évaluer la qualité des images et des vidéos

SAMA améliore l'évaluation de la qualité des images et des vidéos grâce à des techniques d'échantillonnage efficaces.

2025-09-19T00:33:24+00:00 ― 6 min lire

Recherche d'informations Défis d'apprentissage à partir des clips musicaux

Cette étude examine les difficultés d'utilisation de l'apprentissage contrastif pour comprendre les clips musicaux.

2025-09-18T17:21:45+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Révolutionner les Yeux des Personnages dans l'Animation

Une nouvelle méthode simplifie la conception des yeux de personnages animés.

2025-09-18T14:01:24+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancer la compression d'images avec l'analyse de fréquence

Une nouvelle méthode améliore la compression d'images en se concentrant sur les bandes de fréquence.

2025-09-16T14:45:18+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Vlogger : Un nouvel outil pour créer des vidéos

Le vlogger simplifie le vidéo blogging, rendant ça plus rapide et plus facile pour les créateurs.

2025-09-16T11:12:00+00:00 ― 8 min lire

Multimédia Les coûts environnementaux du streaming vidéo

Examiner l'utilisation de l'énergie et l'impact du streaming vidéo sur l'environnement.

2025-09-16T01:59:00+00:00 ― 8 min lire

Son Nouveau modèle améliore l'évaluation de l'intensité de l'alimentation des poissons

Une approche unifiée pour évaluer l'alimentation des poissons en utilisant des données audio et vidéo.

2025-09-14T21:03:15+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes L'impact de l'IA sur la technologie vidéo

Découvre comment l'IA change la création et le streaming de vidéos.

2025-09-13T11:18:36+00:00 ― 7 min lire

Traitement de l'image et de la vidéo Présentation du dataset de visioconférence pour la communication dans la vraie vie

Un ensemble de données conçu pour tester la qualité vidéo dans des situations de visioconférence.

2025-09-13T03:45:30+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Nouveau cadre qui relie vidéo et texte de manière plus efficace

Des chercheurs ont développé un cadre pour mieux comprendre les vidéos et les textes.

2025-09-12T20:49:36+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans les techniques de segmentation audio-visuelle

Une nouvelle méthode améliore la segmentation audio-visuelle sans étiquettes détaillées.

2025-09-12T20:28:15+00:00 ― 7 min lire

Son Nouveau système améliore l'extraction vocale depuis des positions de tête instables

PIAVE aide les machines à extraire les voix clairement, même quand les intervenants tournent la tête.

2025-09-12T19:39:40+00:00 ― 7 min lire

Traitement de l'audio et de la parole MusiLingo : Relier la musique et la langue

Un nouveau système qui relie la musique et la langue pour mieux comprendre.

2025-09-11T14:30:40+00:00 ― 7 min lire

Multimédia Conception de posters efficaces grâce à des metrics simples

Apprends à créer des affiches qui transmettent des messages de manière claire et attrayante.

2025-09-09T08:49:24+00:00 ― 6 min lire

Multimédia BDIQA : Faire avancer la réponse aux questions vidéo avec la théorie de l'esprit

Un nouveau jeu de données améliore la capacité de l'IA à interpréter le comportement humain dans les vidéos.

2025-09-09T07:30:24+00:00 ― 9 min lire

Interaction homme-machine Spica : Un nouvel outil pour les utilisateurs aveugles

Spica améliore l'accès vidéo pour les utilisateurs aveugles et malvoyants grâce à l'interactivité.

2025-09-09T06:43:00+00:00 ― 6 min lire

Robotique Tester des robots pour des défis inattendus

Explorer des méthodes pour améliorer les performances des robots dans des environnements imprévisibles.

2025-09-09T02:53:54+00:00 ― 6 min lire

Son Avancées dans la technologie de conversion vocale grâce aux images de visage

Une nouvelle méthode transforme les voix en utilisant les traits du visage pour diverses applications.

2025-09-09T01:46:55+00:00 ― 11 min lire

Traitement de l'audio et de la parole Présentation d'AV-SUPERB : Une nouvelle référence pour les modèles audio-visuels

AV-SUPERB évalue les modèles audio et visuels sur différentes tâches pour une meilleure performance.

2025-09-08T22:32:35+00:00 ― 7 min lire

Recherche d'informations Améliorer la recherche de vidéos avec des techniques modernes

Une nouvelle méthode simplifie la recherche de vidéos en combinant différents types d'infos.

2025-09-08T20:50:30+00:00 ― 8 min lire

Multimédia Créer des machines sensibles aux émotions pour une meilleure interaction

Développer des machines qui réagissent en fonction des émotions pour améliorer l'interaction humain-ordinateur.

2025-09-08T19:31:30+00:00 ― 7 min lire

Son Génération de texte en audio plus rapide grâce à la distillation de consistance

Une nouvelle méthode améliore la vitesse et l'efficacité de la génération de texte en audio.

2025-09-08T18:29:40+00:00 ― 5 min lire

Vision par ordinateur et reconnaissance des formes Amélioration des techniques de localisation des sources sonores

Améliorer la façon dont on identifie les sources sonores en utilisant des données audio-visuelles.

2025-09-08T12:49:35+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Cartographier les sons : Une nouvelle approche de l'analyse des paysages sonores

Une méthode pour visualiser et prédire des sons dans différents environnements en utilisant une technologie avancée.

2025-09-08T11:12:25+00:00 ― 6 min lire

Multimédia Green-LL : Améliorer l'expérience de streaming vidéo en direct

Une nouvelle approche pour améliorer la qualité et l'efficacité énergétique du streaming vidéo en direct sur mobile.

2025-09-08T06:13:36+00:00 ― 11 min lire

Recherche d'informations Recommandations de nourriture personnalisées avec ChatDiet

ChatDiet combine des données personnelles et des connaissances de la population pour des conseils alimentaires améliorés.

2025-09-07T00:28:12+00:00 ― 10 min lire

Multimédia Débats télévisés : Un regard de plus près sur le biais et la civilité

Une analyse des biais et de l'incivilité dans les débats télévisés indiens.

2025-09-06T18:16:54+00:00 ― 7 min lire

Traitement de l'image et de la vidéo Avancées dans les techniques de compression vidéo

Un nouveau cadre améliore l'efficacité et la qualité de la compression vidéo.

2025-09-06T14:40:20+00:00 ― 7 min lire

Interaction homme-machine Le rôle des médias visuels dans la propagande

Cet article examine comment les images ont influencé l'opinion publique pendant le conflit Russie-Ukrainien.

2025-09-05T06:04:24+00:00 ― 5 min lire

Traitement de l'image et de la vidéo Améliorer la transmission d'images sans fil dans des environnements bruyants

Une nouvelle méthode améliore la qualité des images lors de la transmission sans fil sur des canaux bruyants.

2025-09-05T03:18:04+00:00 ― 6 min lire

Ordinateurs et société MemeCraft : Un nouvel outil pour l'engagement social

MemeCraft crée des memes engageants pour promouvoir des causes sociales en toute sécurité.

2025-09-04T14:48:00+00:00 ― 14 min lire

Vision par ordinateur et reconnaissance des formes Améliorer l'apprentissage audio-visuel avec la co-augmentation rapide

Une nouvelle méthode améliore l'apprentissage machine des données audio-visuelles.

2025-09-04T05:59:30+00:00 ― 7 min lire

Calcul et langage Tâche RVS : Un nouveau regard sur la façon de donner des directions

Des recherches montrent des façons plus larges de donner des directions en utilisant la connaissance spatiale.

2025-09-03T23:39:30+00:00 ― 9 min lire

Traitement du signal Une nouvelle approche pour identifier les symptômes de la schizophrénie

Combiner audio, vidéo et texte pour de meilleures évaluations de santé mentale.

2025-09-03T22:42:15+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Progrès dans la technologie de génération de visages qui parlent

Un nouveau cadre améliore la synchronisation labiale et la qualité visuelle dans les vidéos de visages qui parlent.

2025-09-03T04:02:24+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la détection des défauts avec des échantillons synthétiques

Une nouvelle méthode génère des faux échantillons défectueux pour améliorer la détection des anomalies dans la fabrication.

2025-09-02T21:51:06+00:00 ― 8 min lire

Son Combiner voix et visage pour une meilleure identification

Une nouvelle méthode améliore la vérification des locuteurs en combinant les données audio et visuelles.

2025-09-02T07:50:15+00:00 ― 6 min lire

Multimédia Avancées dans la localisation des haut-parleurs audio-visuels

Une nouvelle méthode améliore le suivi des intervenants en utilisant des données audio et visuelles.

2025-09-02T06:13:05+00:00 ― 8 min lire

Son Un nouveau modèle pour la génération de musique avec l'IA

MusicAOG simplifie la création et la compréhension de la musique grâce à une représentation graphique innovante.

2025-08-31T08:52:25+00:00 ― 8 min lire