Elektrotechnik und Systemtechnik - Audio- und Sprachverarbeitung

RSS

Rechnen und Sprache Verbesserung des Sprachenlernens mit L1-MultiMDD

Ein neues System verbessert die Aussprachefähigkeiten, indem es die Einflüsse der Muttersprache berücksichtigt.

2025-09-12T01:50:50+00:00 ― 6 min Lesedauer

Aufkommende Technologien Quantencomputing trifft Musikkomposition

Entdecke, wie Quantenwerkzeuge die Musikproduktion und -aufführung verändern.

2025-09-12T00:31:30+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Sprachumwandlungstechnologie

Neue Methode verbessert die Emotionsbewahrung in Sprachumwandlungsprozessen.

2025-09-12T00:13:40+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Emo-StarGAN: Fortschritt in der Sprachumwandlungstechnologie

Neue Methode bewahrt den emotionalen Ton in der Sprachumwandlung für eine bessere Interaktion zwischen Mensch und Computer.

2025-09-11T23:25:05+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte in der direkten Text-zu-Sprache-Übersetzung

Neue Systeme verbessern die Übersetzung von Text in gesprochene Sprache ohne Zwischenschritte.

2025-09-11T20:59:20+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Herzgeräuschklassifikation durch Datenaugmentation

Forscher verbessern die Genauigkeit der Herzgeräuschklassifizierung mit Codec-Datenaugmentierungsmethoden.

2025-09-11T19:22:10+00:00 ― 6 min Lesedauer

Ton Emotionale Rede stellt Herausforderungen für Sprachtrennungsmodelle dar

Forschung zeigt, dass emotionale Sprache die Leistung von Modellen bei Sprachtrennungsaufgaben beeinflusst.

2025-09-11T18:33:35+00:00 ― 6 min Lesedauer

Ton M-AUDIODEC: Ein neuer Weg, Audio zu komprimieren

M-AUDIODEC komprimiert Mehrkanal-Audio und behält dabei die Lautsprecherposition und Qualität.

2025-09-11T16:56:25+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Sprach-zu-Sprach Übersetzungstechnologie

Neue Methoden in S2ST verbessern die Übersetzungsqualität und erhalten gleichzeitig die Sprecheridentität.

2025-09-11T16:07:50+00:00 ― 6 min Lesedauer

Ton Fortschritte bei der Audiokompression mit neuronalen Techniken

Ein neues System verbessert die räumliche Audio-Kompression für klareren Sound und Effizienz.

2025-09-11T15:19:15+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung MusiLingo: Musik und Sprache verbinden

Ein neues System, das Musik und Sprache verbindet für ein besseres Verständnis.

2025-09-11T14:30:40+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Die Klangqualität in Hörgeräten verbessern

Forschung zeigt neue Modelle, um die Sprachklarheit in smarten Ohrhörern zu verbessern.

2025-09-11T12:04:55+00:00 ― 5 min Lesedauer

Ton Vogelgeräuscherkennung mit Metadaten verbessern

Zusätzliche Infos helfen uns, Vogelrufe besser zu erkennen.

2025-09-11T11:16:20+00:00 ― 6 min Lesedauer

Ton Verbesserung der Audioerzeugung durch Textabgleichstechniken

Ein neuer Ansatz verbessert die Audioerzeugung, indem er Audio mit Textbeschreibungen in Einklang bringt.

2025-09-11T07:13:25+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte in der Spracherkennungstechnologie

Forscher arbeiten daran, die Online-Spracherkennung mit strukturierten Zustandsraum-Modellen zu verbessern.

2025-09-11T04:47:40+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Echtzeit-Sprecherdetektion für moderne Meetings

Ein neues System verbessert das Meeting-Erlebnis, indem es Sprecher in Echtzeit erkennt.

2025-09-11T03:10:30+00:00 ― 4 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei Techniken zur Erkennung gefälschter Sprache

Neue Methoden verbessern unsere Fähigkeit, gefälschte Sprache effektiv zu erkennen.

2025-09-11T02:21:55+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Anonymisierung von Sprachdaten: Ein neuer Ansatz

Ein Verfahren zur Sprachumwandlung, das Privatsphäre und Sprachqualität verbessert.

2025-09-11T01:33:20+00:00 ― 7 min Lesedauer

Ton Fortschritte bei der Erkennung von Audio-Deepfakesystemen

Neue Methoden verbessern die Fähigkeit, gefälschte Audios von echten zu unterscheiden.

2025-09-10T22:19:00+00:00 ― 6 min Lesedauer

Ton Neue Methode zur Erkennung synthetischer Sprache

Eine Methode verbessert die Erkennung von synthetischen Stimmen und identifiziert ihre Schöpfer.

2025-09-10T20:41:50+00:00 ― 5 min Lesedauer

Ton Fortschritte bei kleinen Sprachverbesserungsmodellen

Neue Methoden verbessern kleine Modelle für bessere Sprachverbesserung mit weniger Ressourcen.

2025-09-10T19:53:15+00:00 ― 5 min Lesedauer

Ton Spracherkennung durch Personalisierungstechniken verbessern

Eine neue Methode verbessert ASR-Modelle für einzelne Nutzer mithilfe von Quantisierung und Anpassung.

2025-09-10T13:24:35+00:00 ― 6 min Lesedauer

Ton Verbesserung des Vocoder-Trainings mit kontrastivem Lernen

Neue Methoden verbessern die Leistung von Vocodern mit begrenzten Audiodaten.

2025-09-10T12:36:00+00:00 ― 6 min Lesedauer

Ton Verstehen von Dysarthrie: Einblicke in Sprachstörungen

Ein Blick auf Dysarthrie, ihre Erkennung und die Rolle von Technologie.

2025-09-10T06:55:55+00:00 ― 6 min Lesedauer

Ton Spracherkennung mit sanften Eingaben verbessern

Weiche Eingaben verbessern die Spracherkennungstechnologie für bessere Leistung in lauten Umgebungen.

2025-09-10T04:30:10+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Spracherkennung verbessern durch selbstüberwachtes Lernen

Die Forschung kombiniert selbstüberwachtes Lernen und neue Messtechniken für verbesserte Sprachinvertierung.

2025-09-10T01:15:50+00:00 ― 6 min Lesedauer

Ton Die Klarheit der elektrolaryngealen Sprache verbessern

Forscher entwickeln einen neuen Ansatz, um die Sprachverständlichkeit für Benutzer von Elektrolarynges zu verbessern.

2025-09-09T22:50:05+00:00 ― 5 min Lesedauer

Kryptographie und Sicherheit Verbesserung der Deepfake-Erkennung durch vielfältige Trainingsmethoden

Diese Studie untersucht Trainingsstrategien, um die Erkennung von gefälschter Audio zu verbessern.

2025-09-09T22:01:30+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Spracherkennung durch Early-Exit-Modelle

Neue Modelle passen sich an, um die Effizienz und Reaktionsfähigkeit der Spracherkennung zu verbessern.

2025-09-09T21:12:55+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Wir stellen vor: RECAP – Eine neue Ära im Audio-Captioning

RECAP nutzt fortschrittliche Techniken, um präzise Audio-Untertitel zu erstellen, ohne neu zu trainieren.

2025-09-09T20:24:20+00:00 ― 5 min Lesedauer

Ton Grundlagen der Musiktheorie und Harmonie

Ein praktischer Leitfaden, um Musiktheorie durch Harmonie und Skalen zu verstehen.

2025-09-09T16:21:25+00:00 ― 8 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung von ASR-Systemen mit synthetischen Daten

Eine neue Methode nutzt synthetische Daten, um ASR-Systeme in unbekannten Bereichen zu verbessern.

2025-09-09T15:32:50+00:00 ― 7 min Lesedauer

Ton Schätzung der Menschenmenge mit Sound und dabei die Privatsphäre schützen

Eine neue audio-basierte Methode schätzt die Grösse von Menschenmengen, ohne die persönliche Privatsphäre zu verletzen.

2025-09-09T13:55:40+00:00 ― 5 min Lesedauer

Rechnen und Sprache Fortschritte bei Spracherkennung: Anweisungsbefolgende Systeme

Ein neuer Ansatz zur Spracherkennung verbessert die Interaktion mit Nutzern durch flexible Anweisungen.

2025-09-09T08:15:35+00:00 ― 5 min Lesedauer

Ton Eine neue Methode zum Erkennen von Stimmfälschung

Ein robuster Ansatz zur Identifizierung von Audioanomalien und zur Bekämpfung von Stimmfälschungen.

2025-09-09T07:27:00+00:00 ― 5 min Lesedauer

Rechnen und Sprache Fortschritte in der EmotionsErkennung in Gesprächen

Ein neues Modell verbessert das Verständnis von Emotionen während Gesprächen.

2025-09-09T06:38:25+00:00 ― 6 min Lesedauer

Rechnen und Sprache Folgen computer-generierte Sprachsymbole dem Zipfschen Gesetz?

Diese Studie untersucht, ob erlernte Sprachsymbole Wortfrequenzmuster nachahmen.

2025-09-09T04:12:40+00:00 ― 6 min Lesedauer

Ton DiCon: Ein neuer Ansatz zur Sprachsynthese

Wir stellen eine schnellere Methode für hochwertige Sprachsynthese mit Diffusionsmodellen vor.

2025-09-09T03:24:05+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung HiFTNet: Fortschritte in der Text-zu-Sprache-Technologie

HiFTNet bietet schnellere, hochwertige Sprachsynthese mit effizienten, innovativen Techniken.

2025-09-09T02:35:30+00:00 ― 5 min Lesedauer

Ton Fortschritte in der Sprachkonversionstechnologie mit Gesichtsabbildungen

Neue Methode verwandelt Stimmen mithilfe von Gesichtszügen für verschiedene Anwendungen.

2025-09-09T01:46:55+00:00 ― 8 min Lesedauer