Informatique - Multimédia

RSS

Interaction homme-machine Lutter contre les raids haineux dans les communautés de streaming en direct

Un coup d'œil sur les raids de haine et leur impact sur les streamers marginalisés.

2025-11-09T22:07:24+00:00 ― 6 min lire

Derniers articles

Vision par ordinateur et reconnaissance des formes Avancée de la compression d'images pour la perception humaine

2025-11-09T19:34:25+00:00 ― 7 min lire

Calcul et langage Comprendre les memes à travers une analyse contextuelle

2025-11-09T18:10:24+00:00 ― 7 min lire

Son Approches innovantes pour le réarrangement de la musique

2025-11-09T15:31:30+00:00 ― 8 min lire

Recherche d'informations Présentation du jeu de données SURE pour les dialogues d'achat

2025-11-09T10:24:18+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Une nouvelle approche pour répondre aux questions visuelles

2025-11-08T19:07:54+00:00 ― 6 min lire

Derniers articles

Calcul et langage Réviser les étapes de la tâche en utilisant l'analyse vidéo

Une nouvelle méthode pour mieux organiser les étapes des tâches avec des aperçus vidéo.

2025-11-08T18:04:42+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Améliorations dans la mesure de la qualité de défloutage

Amélioration des métriques pour évaluer les méthodes de défloutage en utilisant un nouveau jeu de données.

2025-11-08T16:14:06+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Améliorer les modèles vision-langage avec les retours de CLIP

Une nouvelle méthode améliore les modèles vision-langage grâce à des retours en temps réel pour de meilleures performances.

2025-11-08T04:38:54+00:00 ― 7 min lire

Calcul et langage Avancer les modèles de détection de fausses infos

De nouveaux modèles améliorent la détection des fake news en utilisant différentes techniques de données.

2025-11-08T01:13:30+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans les systèmes multi-caméras pour véhicules autonomes

Occ-BEV améliore la perception des véhicules grâce à une modélisation 3D multi-caméra et à l'intégration de données.

2025-11-07T14:57:18+00:00 ― 8 min lire

Cryptographie et sécurité Analyser la méthode J-UNIWARD et ses erreurs

Un aperçu de la technique de masquage de message de J-UNIWARD et de sa petite erreur de calcul.

2025-11-06T17:05:54+00:00 ― 5 min lire

Vision par ordinateur et reconnaissance des formes S'attaquer aux biais dans la réponse à des questions visuelles

Une nouvelle approche s'attaque aux biais linguistiques et visuels dans les systèmes VQA.

2025-11-06T14:27:54+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Amélioration de la qualité de compression des nuages de points 3D

Une méthode pour améliorer des données de nuages de points 3D compressées en utilisant des réseaux de neurones avancés.

2025-11-06T06:33:54+00:00 ― 7 min lire

Apprentissage automatique Avancer l'apprentissage multimodal avec le C-MCR

C-MCR simplifie l'apprentissage multi-modal en reliant efficacement les connaissances existantes.

2025-11-05T03:49:55+00:00 ― 8 min lire

Son Simplifier la synthèse sonore avec NAS-FM

Une nouvelle méthode pour créer des synthétiseurs qui profite aux musiciens.

2025-11-04T17:18:20+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Do-GOOD Benchmark : Amélioration des Modèles de Compréhension de Documents

Une nouvelle référence révèle des écarts de performance dans les modèles de traitement de documents.

2025-11-04T02:17:36+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la segmentation sémantique panoramique

Un nouveau modèle améliore l'analyse des images panoramiques pour des applications concrètes.

2025-11-04T00:19:06+00:00 ― 6 min lire

Interaction homme-machine LoopBoxes : Une nouvelle façon de faire de la musique

LoopBoxes aide les enfants à créer de la musique facilement et en collaboratif.

2025-11-03T08:55:00+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Défis dans la récupération de texte-vidéo et solutions

Un aperçu des biais dans la recherche texte-vidéo et des moyens d'améliorer la précision.

2025-11-03T00:45:00+00:00 ― 8 min lire

Son Avancées dans les techniques de classification audio

Une nouvelle méthode améliore la classification audio en apprenant efficacement de nouveaux sons.

2025-10-31T22:37:00+00:00 ― 5 min lire

Multimédia 360TripleView : Améliorer l'expérience vidéo à 360 degrés

Un nouveau système améliore la sélection de direction de vue dans les vidéos à 360 degrés.

2025-10-31T20:44:30+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes GeneCIS : Faire avancer la similarité d'image conditionnelle en vision par ordinateur

Un critère pour évaluer la similitude d'images selon des conditions définies par l'utilisateur.

2025-10-31T19:09:42+00:00 ― 8 min lire

Son Avancer le question-réponse audio avec le modèle MWAFM

Un nouveau modèle améliore la façon dont les machines comprennent et répondent aux questions audio.

2025-10-31T18:34:05+00:00 ― 7 min lire

Multimédia Équilibrer l'apprentissage actif dans des données multimodales

Une nouvelle stratégie garantit une représentation égale des types de données en apprentissage automatique.

2025-10-31T02:02:42+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans les techniques de détection de copies vidéo

Un nouveau jeu de données remet en question les méthodes de détection des contenus vidéo altérés.

2025-10-30T18:16:36+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Faire avancer la télédétection avec RS5M et DVLM

Un nouveau jeu de données et un modèle améliorent l'analyse des images de télédétection.

2025-10-29T03:49:48+00:00 ― 8 min lire

Multimédia Optimiser le stockage vidéo pour les chirurgies de la cataracte

Des recherches montrent des moyens efficaces de compresser les vidéos de chirurgie de la cataracte pour mieux gérer le stockage.

2025-10-28T02:25:06+00:00 ― 6 min lire

Son Analyser la musique avec BERT : une nouvelle approche

La recherche explore le potentiel de BERT dans l'analyse musicale au niveau des bars.

2025-10-27T07:41:05+00:00 ― 6 min lire

Son Avancée de l'harmonisation des mélodies avec un contexte émotionnel

Un nouveau modèle améliore l'harmonisation des mélodies en tenant compte des facteurs émotionnels.

2025-10-26T21:58:05+00:00 ― 8 min lire

Multimédia Avancées dans la technologie de compression vidéo

Une nouvelle méthode améliore la compression vidéo tout en gardant la qualité et l’efficacité.

2025-10-26T05:46:25+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la segmentation des instances alimentaires avec un étiquetage intelligent

Un nouveau cadre réduit les coûts de labellisation manuelle dans la segmentation d'images alimentaires.

2025-10-25T23:35:42+00:00 ― 8 min lire

Recherche d'informations Un nouveau cadre pour les recommandations multimodales

Ce cadre facilite le traitement des données pour des systèmes de recommandation plus efficaces.

2025-10-25T18:59:12+00:00 ― 7 min lire

Multimédia Améliorer l'efficacité de l'encodage vidéo avec des nouvelles techniques

Une nouvelle méthode accélère l'encodage vidéo tout en gardant la qualité.

2025-10-25T14:30:36+00:00 ― 6 min lire

Son Créer des mélodies à partir de rythmes simples

Ce projet aide tout le monde à composer de la musique en utilisant des rythmes de base et des méthodes informatiques avancées.

2025-10-25T11:57:35+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans les modèles linguistiques et visuels

Le nouveau modèle relie la compréhension du langage à la traitement d'images de manière efficace.

2025-10-25T06:20:48+00:00 ― 7 min lire

Multimédia Un nouveau système pour associer musique et vidéo

Cette recherche présente un système pour associer de la musique avec du contenu vidéo de manière efficace.

2025-10-24T07:37:10+00:00 ― 8 min lire

Multimédia Le Metavers : Un Nouveau Paysage Numérique

Découvre le métavers en pleine évolution et son impact sur la communication et l'économie.

2025-10-24T03:21:18+00:00 ― 7 min lire

Ordinateurs et société Le Rôle des Transcriptions dans les Vidéos Éducatives

Les transcriptions améliorent la compréhension des vidéos éducatives, en réglant les problèmes de qualité audio.

2025-10-24T02:33:54+00:00 ― 7 min lire

Traitement du signal Avancées dans la transmission de nuages de points 3D avec SEPT

SEPT améliore la transmission sans fil des nuages de points 3D en utilisant l'apprentissage profond.

2025-10-23T03:16:45+00:00 ― 6 min lire

Recherche d'informations Un nouveau jeu de données multilingue pour les nouvelles vidéo

Ce jeu de données vise à améliorer la recherche de nouvelles vidéo dans cinq langues.

2025-10-23T01:32:54+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la sélection des images pour la réponse aux questions vidéo

De nouvelles méthodes améliorent la façon dont les modèles choisissent les images pour répondre aux questions sur les vidéos.

2025-10-22T05:40:00+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Améliorer les appels vidéo avec le codage prédictif

Une nouvelle méthode améliore la qualité des appels vidéo tout en économisant de la bande passante.

2025-10-22T03:02:00+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Transformer des photos en dessins de personnages

Une méthode pour créer des dessins au trait artistiques à partir de photos avec un contrôle utilisateur.

2025-10-19T23:25:12+00:00 ― 8 min lire

Multimédia Faire avancer les tâches vidéo-texte en indonésien

Nouveau jeu de données améliore les tâches vidéo-texte pour les locuteurs indonésiens.

2025-10-19T21:32:45+00:00 ― 9 min lire

Son Progrès dans la mesure de la similarité musicale

La recherche vise à combiner des données audio et symboliques pour l'analyse de similarité musicale.

2025-10-19T11:49:45+00:00 ― 9 min lire