Eine flexible Methode zur Erkennung von Schlüsselwörtern in der Sprache über verschiedene Sprachen hinweg.

2025-09-13T06:11:15+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Bewertung der Sprachqualität in der AudioKommunikation

Ein Blick darauf, wie die Sprachqualität mit Crowdsourcing getestet wird.

2025-09-13T05:22:40+00:00 ― 5 min Lesedauer

Ton Neue Methoden zur Erkennung von KI-generiertem Audio

Fortgeschrittene Techniken zur Sicherstellung der Audioauthentizität im Zeitalter des Stimmenklonens.

2025-09-13T03:40:24+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte im Audio-Captioning mit nur Text-Training

Eine neue Methode trainiert Audio-Untertitelungssysteme nur mit Textbeschreibungen.

2025-09-13T02:56:55+00:00 ― 7 min Lesedauer

Ton Wichtige Schritte zum Schreiben von wissenschaftlichen Arbeiten

Ein Leitfaden zum Verfassen von klaren und effektiven wissenschaftlichen Arbeiten.

2025-09-13T01:19:45+00:00 ― 3 min Lesedauer

Mensch-Computer-Interaktion Erie: Ein neues Tool für Daten-Sonifizierung

Erie macht's einfacher, Daten in Sound umzuwandeln, damit's besser zugänglich wird.

2025-09-13T00:22:54+00:00 ― 7 min Lesedauer

Kryptographie und Sicherheit Backdoor-Angriffe: Eine verborgene Bedrohung für die Sprachverifizierung

Überprüfung der Risiken von Backdoor-Angriffen auf Sprachverifizierungssysteme.

2025-09-12T22:54:00+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung Fortschritte bei Audio-Visuellen Segmentierungstechniken

Eine neue Methode verbessert die audio-visuelle Segmentierung ohne detaillierte Labels.

2025-09-12T20:28:15+00:00 ― 6 min Lesedauer

Ton Neues System verbessert Sprachausgabe bei instabilen Kopfpositionen

PIAVE hilft Maschinen, Stimmen klar zu erfassen, selbst wenn die Sprecher den Kopf drehen.

2025-09-12T19:39:40+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Libriheavy: Ein neuer Datensatz für Spracherkennung

Libriheavy bietet 50.000 Stunden gesprochenes Englisch an, um die Spracherkennungstechnologie zu verbessern.

2025-09-12T18:51:05+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Sprachklarheit mit AV2Wav-Technologie verbessern

AV2Wav verbessert die Sprachqualität mit Audio- und visuellen Hinweisen.

2025-09-12T17:13:55+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung EmoConv-Diff: Eine neue Art, Emotionen in der Sprache zu verändern

Eine frische Methode für Maschinen, um Sprachemotionen natürlich zu verändern.

2025-09-12T16:25:20+00:00 ― 6 min Lesedauer

Ton Erkennen von KI-generierten Gesangsstimmen

Neue Methoden werden entwickelt, um Deepfake-Gesangsstimmen in der Musikindustrie zu identifizieren.

2025-09-12T14:48:10+00:00 ― 6 min Lesedauer

Ton Text-to-Speech mit Core-Set-Auswahl optimieren

Die Auswahl von Kern-Sets verbessert Text-to-Speech-Modelle, indem sie sich auf vielfältige Daten konzentriert.

2025-09-12T08:19:30+00:00 ― 5 min Lesedauer

Ton Fortschritte bei Sprach-Emotions-Erkennungssystemen

Neue Modelle verändern, wie wir Emotionen in der Sprache analysieren.

2025-09-12T07:30:55+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Privatsphäre-zuerst Aktionserkennung mit Ultraschalltechnologie

Eine neue Methode nutzt Ultraschall, um Aktionen zu erkennen und dabei die Privatsphäre zu schützen.

2025-09-12T06:42:20+00:00 ― 6 min Lesedauer

Ton Ein neues Rahmenwerk für Sprecheranonymisierung

Ein flexibles Framework vorstellen, um die Forschung zur Sprachprivatsphäre zu verbessern.

2025-09-12T05:05:10+00:00 ― 7 min Lesedauer

Ton CiwaGAN: Ein neues Modell fürs Sprachlernen

CiwaGAN kombiniert die Steuerung von Sprachbewegungen und Informationsaustausch für besseres Sprechlernen.

2025-09-12T04:16:35+00:00 ― 7 min Lesedauer

Rechnen und Sprache IntraVerbalPA: Ein neuer Ansatz zur Bewertun von Aussprache

Ein Konzept, das verbale und non-verbale Hinweise mischt, um das Sprachenlernen zu verbessern.

2025-09-12T03:28:00+00:00 ― 6 min Lesedauer

Rechnen und Sprache Erklärungen für Sprachmodelle verbessern

Eine neue Methode macht es einfacher, Sprachklassifikationsmodelle zu verstehen.

2025-09-12T02:39:25+00:00 ― 7 min Lesedauer

Rechnen und Sprache Verbesserung des Sprachenlernens mit L1-MultiMDD

Ein neues System verbessert die Aussprachefähigkeiten, indem es die Einflüsse der Muttersprache berücksichtigt.

2025-09-12T01:50:50+00:00 ― 6 min Lesedauer

Aufkommende Technologien Quantencomputing trifft Musikkomposition

Entdecke, wie Quantenwerkzeuge die Musikproduktion und -aufführung verändern.

2025-09-12T00:31:30+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Sprachumwandlungstechnologie

Neue Methode verbessert die Emotionsbewahrung in Sprachumwandlungsprozessen.

2025-09-12T00:13:40+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Emo-StarGAN: Fortschritt in der Sprachumwandlungstechnologie

Neue Methode bewahrt den emotionalen Ton in der Sprachumwandlung für eine bessere Interaktion zwischen Mensch und Computer.

2025-09-11T23:25:05+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte in der direkten Text-zu-Sprache-Übersetzung

Neue Systeme verbessern die Übersetzung von Text in gesprochene Sprache ohne Zwischenschritte.

2025-09-11T20:59:20+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Herzgeräuschklassifikation durch Datenaugmentation

Forscher verbessern die Genauigkeit der Herzgeräuschklassifizierung mit Codec-Datenaugmentierungsmethoden.

2025-09-11T19:22:10+00:00 ― 6 min Lesedauer

Ton Emotionale Rede stellt Herausforderungen für Sprachtrennungsmodelle dar

Forschung zeigt, dass emotionale Sprache die Leistung von Modellen bei Sprachtrennungsaufgaben beeinflusst.

2025-09-11T18:33:35+00:00 ― 6 min Lesedauer

Ton M-AUDIODEC: Ein neuer Weg, Audio zu komprimieren

M-AUDIODEC komprimiert Mehrkanal-Audio und behält dabei die Lautsprecherposition und Qualität.

2025-09-11T16:56:25+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Sprach-zu-Sprach Übersetzungstechnologie

Neue Methoden in S2ST verbessern die Übersetzungsqualität und erhalten gleichzeitig die Sprecheridentität.

2025-09-11T16:07:50+00:00 ― 6 min Lesedauer

Ton Fortschritte bei der Audiokompression mit neuronalen Techniken

Ein neues System verbessert die räumliche Audio-Kompression für klareren Sound und Effizienz.

2025-09-11T15:19:15+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung MusiLingo: Musik und Sprache verbinden

Ein neues System, das Musik und Sprache verbindet für ein besseres Verständnis.

2025-09-11T14:30:40+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Die Klangqualität in Hörgeräten verbessern

Forschung zeigt neue Modelle, um die Sprachklarheit in smarten Ohrhörern zu verbessern.

2025-09-11T12:04:55+00:00 ― 5 min Lesedauer

Ton Vogelgeräuscherkennung mit Metadaten verbessern

Zusätzliche Infos helfen uns, Vogelrufe besser zu erkennen.

2025-09-11T11:16:20+00:00 ― 6 min Lesedauer

Ton Verbesserung der Audioerzeugung durch Textabgleichstechniken

Ein neuer Ansatz verbessert die Audioerzeugung, indem er Audio mit Textbeschreibungen in Einklang bringt.

2025-09-11T07:13:25+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte in der Spracherkennungstechnologie

Forscher arbeiten daran, die Online-Spracherkennung mit strukturierten Zustandsraum-Modellen zu verbessern.

2025-09-11T04:47:40+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Echtzeit-Sprecherdetektion für moderne Meetings

Ein neues System verbessert das Meeting-Erlebnis, indem es Sprecher in Echtzeit erkennt.

2025-09-11T03:10:30+00:00 ― 4 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei Techniken zur Erkennung gefälschter Sprache

Neue Methoden verbessern unsere Fähigkeit, gefälschte Sprache effektiv zu erkennen.

2025-09-11T02:21:55+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Anonymisierung von Sprachdaten: Ein neuer Ansatz

Ein Verfahren zur Sprachumwandlung, das Privatsphäre und Sprachqualität verbessert.

2025-09-11T01:33:20+00:00 ― 7 min Lesedauer

Ton Fortschritte bei der Erkennung von Audio-Deepfakesystemen

Neue Methoden verbessern die Fähigkeit, gefälschte Audios von echten zu unterscheiden.

2025-09-10T22:19:00+00:00 ― 6 min Lesedauer

Ton Neue Methode zur Erkennung synthetischer Sprache

Eine Methode verbessert die Erkennung von synthetischen Stimmen und identifiziert ihre Schöpfer.

2025-09-10T20:41:50+00:00 ― 5 min Lesedauer

Computerwissenschaften - Ton