Forscher verbessern die automatische Spracherkennung für Punjabi mit innovativen Selbsttrainingstechniken.

2025-09-28T08:56:35+00:00 ― 6 min Lesedauer

Ton Fortschritte bei der Sprachrecognition für Zielsprecher

Neues Modell verbessert die Spracherkennung in lauten Umgebungen, indem es sich auf einen einzelnen Sprecher konzentriert.

2025-09-28T08:08:00+00:00 ― 4 min Lesedauer

Ton Privatsphäre und smarte Audioüberwachung in Einklang bringen

Neue Methoden zielen darauf ab, die Sprachprivatsphäre in Audioüberwachungssystemen zu schützen.

2025-09-28T06:30:50+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte in der expressiven Sprachsynthese mit neuem Datensatz

Ein neues Datenset verbessert die Sprachsynthese, indem es emotionale Ausdrucksweise erfasst, ohne auf Text angewiesen zu sein.

2025-09-27T18:22:05+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Musiktonhöhenklassifikation mit SDTW

Neue Strategien zur Verbesserung der Trainingsstabilität bei der Musiktonhöhenklassifikation.

2025-09-27T13:30:35+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Stimmwandlungstechnologie

Phoneme Hallucinator verwandelt die Sprachumwandlung mit wenig Daten für klarere Ergebnisse.

2025-09-27T10:16:15+00:00 ― 5 min Lesedauer

Ton Fortschrittliche Gesten-Generierung für digitale Menschen

Eine neue Methode erstellt realistische Gesten aus rohem Sprachaudio.

2025-09-27T08:39:05+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der bilingualen Spracherkennung mit Graphem-Einheiten

Verbesserung hybrider ASR-Systeme für zweisprachige Sprache mit Graphem-Einheiten.

2025-09-27T03:47:35+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte im gemeinsamen Lernen von Sprache und Text

Ein neues Modell verbessert die Sprach- und Textausrichtung für eine bessere automatische Erkennung.

2025-09-27T02:10:25+00:00 ― 6 min Lesedauer

Ton Fortschritte in der visuellen Sprachrecognition mit Lip2Vec

Lip2Vec verbessert die visuelle Spracherkennung mit weniger beschrifteten Daten.

2025-09-27T01:21:50+00:00 ― 7 min Lesedauer

Rechnen und Sprache Fortschritte in der Spracherkennungstechnologie

Neue Methoden verbessern die Genauigkeit und Geschwindigkeit in Spracherkennungssystemen.

2025-09-26T11:35:55+00:00 ― 5 min Lesedauer

Maschinelles Lernen O-1: Eine neue Grenze im Training für Sprachrecognition

O-1 verbessert die Spracherkennung, indem es Selbstlernmethoden optimiert.

2025-09-26T09:10:10+00:00 ― 5 min Lesedauer

Rechnen und Sprache Automatische Spracherkennung mit Texteinspeisung verbessern

Eine neue Methode verbessert die ASR-Leistung durch die Integration von Textdaten.

2025-09-26T07:33:00+00:00 ― 6 min Lesedauer

Rechnen und Sprache Spracherkennung mit Texteinspeisung verbessern

Textinjektion hilft, persönliche Informationen zu erkennen, während die Privatsphäre gewahrt bleibt.

2025-09-26T06:44:25+00:00 ― 6 min Lesedauer

Ton Fortschritte bei der Geräuscherkennung dank generativem Lernen

Entdecke, wie neue Techniken die Erkennung von Klängen für verschiedene Anwendungen revolutionieren.

2025-09-26T05:55:50+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Die Bedeutung von nichtlinearem Audio-Processing

Erforschen von nichtlinearen Methoden in Audio für Musikproduktion und Sprachanalyse.

2025-09-26T03:30:05+00:00 ― 6 min Lesedauer

Ton Fortschritte bei der Tonhöhenerkennung mit PitchNet

Eine neue Methode zur genauen Tonhöhenbestimmung in Musik und Sound.

2025-09-26T02:41:30+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Spracherkennung mit mmWave-Technologie

Radio2Text nutzt mmWave-Signale für die Echtzeit-Spracherkennung in lauten Umgebungen.

2025-09-25T22:38:35+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Bewertung eines automatischen Schallmaskierungssystems in Stadtparks

Eine Studie untersucht die Effektivität von automatisierten Geräuschmaskierern in öffentlichen Räumen.

2025-09-25T18:35:40+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Sprechererkennung mit Graph-Neuronalen Netzwerken

Graph-neuronale Netzwerke verbessern die Genauigkeit der Sprechererkennung, indem sie die Beziehungen zwischen Sprachproben analysieren.

2025-09-25T09:41:15+00:00 ― 5 min Lesedauer

Rechnen und Sprache Fortschritte in der Spracherkennung von Emotionen über Sprachen hinweg

Eine Studie zur Bewertung der Emotionserkennung in Sprachmodellen in sechs Sprachen.

2025-09-25T08:04:05+00:00 ― 5 min Lesedauer

Ton AffectEcho: Emotionen in KI-Sprache verbinden

Das AffectEcho-Modell verbessert den emotionalen Ausdruck in KI-generierter Sprache.

2025-09-25T07:15:30+00:00 ― 6 min Lesedauer

Rechnen und Sprache Verbesserung der Graphem-zu-Phonem-Konversion mit neuer Sampling-Methode

Diese Studie verbessert G2P-Modelle, indem sie sich auf fehleranfällige Bereiche während des Trainings konzentriert.

2025-09-25T05:38:20+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei den Formant-Tracking-Techniken

Entdeck Methoden, die die Genauigkeit beim Formant-Tracking für Sprachanalysen verbessern.

2025-09-24T22:21:05+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Sprachanalyse zur Bewertung der Schwere von Parkinsonkrankheit

Forscher entwickeln sprachbasierte Methoden für eine genauere Bewertung von Parkinson.

2025-09-24T21:32:30+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Schallerkennung mit Meta-Learning-Techniken

Meta-SELD verbessert die Lokalisierung von Schallereignissen in verschiedenen Umgebungen.

2025-09-24T19:55:20+00:00 ― 6 min Lesedauer

Maschinelles Lernen Audiovisuelle Momente in der Zeit: Ein neuer Datensatz für die Aktionskennung

AVMIT gibt Forschern Einblicke, wie Sound und Vision in der Aktionserkennnung zusammenhängen.

2025-09-24T07:46:35+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Audioqualitätsvorhersage mit GML

Ein neues KI-Modell verbessert die Vorhersage von Audioqualitätsbewertung.

2025-09-24T03:43:40+00:00 ― 6 min Lesedauer

Ton KI-Musikgenerierung: Eine Studie über Sampling-Techniken

Diese Forschung untersucht, wie Sampling-Methoden die Qualität von KI-generierter Musik beeinflussen.

2025-09-24T02:55:05+00:00 ― 6 min Lesedauer

Ton Fortschritte bei der Audio-Anti-Spoofing-Technologie

Eine neue Methode verbessert die Erkennung von gefälschtem Audio in Spracherkennungssystemen.

2025-09-23T23:40:45+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte beim Beat-Tracking für klassische Musik

Neue Methoden verbessern die Genauigkeit des Beat-Trackings in komplexer klassischer Musik.

2025-09-23T14:46:20+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Verstehen der Rolle der Sprachdiarisierung

Ein Blick darauf, wie Sprachdiarisierung in mehrsprachigen Gesprächen hilft.

2025-09-22T23:23:15+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte im Framework zur Audio-Textur-Generierung

Ein neues Framework vereinfacht die Erstellung von Audiotexturen, indem es den Beschriftungsaufwand reduziert.

2025-09-22T22:34:40+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Spracherkennung für laute Umgebungen

Ein neues System verbessert die Spracherkennung in lauten Umgebungen mit fortschrittlichen Techniken.

2025-09-22T21:46:05+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Bewertung der Leistung des VoicePrivacy Challenge Baseline B1

Die Wirksamkeit von Sprach-Anonymisierung bewerten, ohne den natürlichen Klang zu verlieren.

2025-09-22T14:28:50+00:00 ― 7 min Lesedauer

Ton Fortschritte in der Audio-Klassifizierung mit LCANets++

Neue Modelle verbessern die Genauigkeit der Audioklassifizierung und machen sie widerstandsfähiger gegen Lärm und Angriffe.

2025-09-22T12:51:40+00:00 ― 5 min Lesedauer

Ton KI in Musik: Kreationswerkzeuge und Techniken

Eine Übersicht über KI-Tools zur Musikproduktion und ihre einzigartigen Funktionen.

2025-09-22T08:48:45+00:00 ― 12 min Lesedauer

Ton Realistische Geräusche aus stummen Videos erzeugen

Forschung untersucht Deep Learning, um Audio zu erstellen, das zu stillem Videoinhalt passt.

2025-09-22T04:45:50+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung Klang und Bilder kombinieren, um die Audioqualität zu verbessern

Eine neue Methode verbessert Tonaufnahmen mit visuellen Hinweisen.

2025-09-22T03:57:15+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Bewertung der Sprachqualität mit XLS-R-Modellen

Ein Blick darauf, wie XLS-R Modelle die Audioqualität in Online-Meetings verbessern.

2025-09-22T01:31:30+00:00 ― 6 min Lesedauer

Computerwissenschaften - Ton