Génie électrique et science des systèmes - Traitement de l'audio et de la parole

RSS

Vision par ordinateur et reconnaissance des formes Équilibrer sons et visuels : une nouvelle approche dans l'apprentissage par IA

DAAN améliore la façon dont les machines apprennent à partir de données audio-visuelles dans des scénarios zéro-shot.

2025-02-20T15:12:36+00:00 ― 7 min lire

Son Lutter contre les deepfakes audio avec un apprentissage intelligent

Une nouvelle méthode améliore la détection des deepfakes audio en utilisant des techniques d'apprentissage innovantes.

2025-02-19T19:28:12+00:00 ― 8 min lire

Calcul et langage Présentation de MERaLiON-SpeechEncoder : Un grand pas dans la tech vocale

Un nouveau modèle de Singapour améliore la compréhension de la parole par les machines.

2025-02-19T14:32:06+00:00 ― 8 min lire

Son Le défi de la détection de la musique générée par machine

Alors que les machines produisent de la musique, on doit protéger la créativité humaine avec des méthodes de détection efficaces.

2025-02-17T18:07:12+00:00 ― 11 min lire

Son L'essor de la détection de la parole synthétique

De nouveaux modèles identifient la voix synthétique et luttent contre l'utilisation abusive de la technologie vocale.

2025-02-16T22:22:48+00:00 ― 7 min lire

Son TAME : Une nouvelle façon d'attraper des drones

TAME utilise le son pour détecter les drones, améliorant la sécurité et la surveillance.

2025-02-16T07:34:30+00:00 ― 7 min lire

Son Décomposer le code-switching dans la reconnaissance vocale

Découvrez comment CAMEL améliore la compréhension des conversations en langues mélangées.

2025-02-15T06:54:00+00:00 ― 7 min lire

Neurones et cognition Comment les signaux cérébraux pourraient identifier la musique

Des recherches montrent que l'activité cérébrale peut aider les machines à reconnaître la musique efficacement.

2025-02-15T02:14:54+00:00 ― 8 min lire

Robotique Suivre les drones avec le son : une nouvelle méthode

La technologie audio offre un moyen économique de suivre les UAVs en toute sécurité.

2025-02-14T21:01:48+00:00 ― 7 min lire

Son Le test de voix IA pourrait révolutionner la détection du cancer du larynx

Une nouvelle méthode d'IA analyse les voix pour détecter le risque de cancer du larynx.

2025-02-09T05:28:46+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes L'avenir de la synthèse vidéo-audio

Découvrez comment la synthèse vidéo-audio transforme nos expériences médias avec un son parfaitement aligné.

2025-02-08T21:54:54+00:00 ― 9 min lire

Son Transformer le design sonore avec Stable-V2A

Un nouveau système révolutionne la façon dont les designers sonores créent des audio pour les vidéos.

2025-02-08T07:06:36+00:00 ― 10 min lire

Traitement de l'audio et de la parole Améliorer la clarté de la parole : Les ingrédients clés

Un aperçu de comment l'amélioration de la parole booste la communication grâce aux caractéristiques des données.

2025-02-07T21:14:24+00:00 ― 10 min lire

Traitement de l'audio et de la parole Progrès dans la reconnaissance automatique de la parole pour les langues inconnues

De nouvelles méthodes améliorent les systèmes ASR pour des langues qu'ils n'ont jamais rencontrées avant.

2025-02-05T19:53:24+00:00 ― 8 min lire

Apprentissage automatique Connecter des Sons : L'Avenir de la Génération Texte-Audio

Découvrez comment la tech TTA fusionne mots et sons pour des expériences audio plus riches.

2025-02-04T19:12:54+00:00 ― 9 min lire

Calcul et langage Faire avancer la reconnaissance vocale pour le suisse-allemand

Des chercheurs améliorent la reconnaissance vocale en suisse-allemand grâce à une génération de données innovante.

2025-02-04T04:24:36+00:00 ― 8 min lire

Son Donner vie au doublage : améliorer la synchronisation labiale

Une nouvelle méthode améliore la synchronisation labiale dans les vidéos doublées pour une expérience de visionnage plus naturelle.

2025-02-03T03:44:06+00:00 ― 8 min lire

Calcul et langage Franchir les barrières linguistiques dans la reconnaissance vocale

Découvrez comment Whisper améliore la reconnaissance vocale dans les conversations multilingues.

2025-02-02T22:48:00+00:00 ― 6 min lire

Traitement de l'audio et de la parole Révolutionner la recherche audio : Explication de la génération augmentée par la récupération de la parole

Découvrez comment SpeechRAG améliore la réponse aux questions audio sans erreurs ASR.

2025-02-02T17:51:54+00:00 ― 7 min lire

Son Révolutionner la classification sonore : une nouvelle méthode

Une nouvelle approche rend la reconnaissance sonore plus accessible et efficace.

2025-02-01T12:15:18+00:00 ― 8 min lire

Traitement de l'audio et de la parole Anonymisation Voix : Protéger la Vie Privée dans la Technologie de la Parole

Apprends comment l'anonymisation vocale protège les infos perso dans un monde dominé par la tech.

2025-02-01T07:19:12+00:00 ― 7 min lire

Traitement de l'audio et de la parole Voir et Entendre : L'Avenir de la Reconnaissance Vocale

Fusion des indices audio et visuels pour améliorer la reconnaissance vocale dans des environnements bruyants.

2025-01-31T21:27:00+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer la clarté dans les environnements bruyants

La technologie d'amélioration de la parole s'adapte pour réduire le bruit et améliorer la communication.

2025-01-31T16:30:54+00:00 ― 6 min lire

Son Systèmes de détection avancés pour drones

Une nouvelle tech combine le son et les visuels pour une meilleure détection des drones.

2025-01-31T06:38:42+00:00 ― 8 min lire

Intelligence artificielle Une nouvelle méthode améliore la détection de la dysarthrie en utilisant la parole et le texte

Une nouvelle approche combine la parole et le texte pour de meilleures évaluations de la dysarthrie.

2025-01-31T01:42:36+00:00 ― 7 min lire

Son Entendre l'invisible : Innovations dans la localisation sonore

Explorer des nouvelles technologies qui détectent des sons provenant de sources invisibles.

2025-01-30T20:46:30+00:00 ― 6 min lire

Son Révolution du Son : La Percée Smooth-Foley

Découvrez comment Smooth-Foley améliore la génération audio pour les vidéos.

2025-01-29T15:09:54+00:00 ― 7 min lire

Traitement de l'audio et de la parole Créer des mélodies à partir des paroles : une nouvelle méthode

Une technique innovante relie les paroles et les mélodies pour créer de meilleures chansons.

2025-01-29T10:13:48+00:00 ― 8 min lire

Son Maîtriser le passage de parole dans les conversations

Améliorer la compréhension par les machines des dynamiques de tour de parole dans les dialogues humains.

2025-01-29T05:17:42+00:00 ― 10 min lire

Son Détection de DeepFake : un défi multilingue

Explorer comment la langue influence la précision de détection des DeepFake dans différentes langues.

2025-01-28T14:29:24+00:00 ― 7 min lire

Son Rencontrez VERSA : Votre Compagnon d'Évaluation Audio

VERSA évalue efficacement la qualité de la parole, de l'audio et de la musique.

2025-01-28T09:33:18+00:00 ― 11 min lire

Son Modèles audio-langage : Une nouvelle frontière

Découvrez comment les modèles audio-linguistiques transforment la technologie de reconnaissance sonore.

2025-01-27T23:41:06+00:00 ― 7 min lire

Calcul et langage Transformer la synthèse vocale conversationnelle

De nouvelles méthodes améliorent le dialogue naturel dans la technologie de la parole.

2025-01-27T08:52:48+00:00 ― 7 min lire

Calcul et langage Nouveaux horizons dans la technologie vocale

Découvrez comment SpeechSSM transforme la génération de discours long pour de meilleures interactions.

2025-01-26T13:08:24+00:00 ― 6 min lire

Calcul et langage Analyse de la traduction simultanée de la parole en texte

Découvrez comment la traduction en temps réel transforme la communication entre les langues.

2025-01-25T22:20:06+00:00 ― 7 min lire

Son Découvrez U-Mamba-Net : L'avenir de la séparation sonore

Un modèle léger conçu pour séparer efficacement les discours mélangés dans des environnements bruyants.

2025-01-25T12:27:54+00:00 ― 7 min lire

Son Prévenir le spoofing audio : La lutte pour la sécurité vocale

Des chercheurs s'attaquent au spoofing audio pour améliorer la sécurité de la reconnaissance vocale.

2025-01-25T07:31:48+00:00 ― 11 min lire

Traitement de l'audio et de la parole Reconnaissance Vocale Audiovisuelle : Une Nouvelle Frontière

Découvrez comment l'AV-ASR combine audio et visuels pour améliorer la reconnaissance vocale.

2025-01-24T21:39:36+00:00 ― 7 min lire

Son Révolutionner l'apprentissage de la musique : la méthode LOEV dévoilée

Une nouvelle méthode transforme la façon dont les machines apprennent de la musique.

2025-01-24T11:47:24+00:00 ― 8 min lire

Son Transformer des signaux silencieux en parole claire

Une nouvelle technologie transforme les murmures silencieux en communication audible pour ceux qui en ont besoin.

2025-01-23T20:59:06+00:00 ― 7 min lire