Elektrotechnik und Systemtechnik - Audio- und Sprachverarbeitung

RSS

Audio- und Sprachverarbeitung Fortschritte in der Bioakustik durch Merkmals-Embedding

Diese Studie verbessert die Wildtierüberwachung mit Audio-Feature-Embeddings für eine bessere Klangklassifizierung.

2025-10-10T02:43:35+00:00 ― 9 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Sprachumwandlung mit Urhythmic-Technologie

Urhythmic verbessert die Sprachumwandlung, indem es sich auf den Sprachrhythmus konzentriert.

2025-10-09T21:52:05+00:00 ― 5 min Lesedauer

Ton Fortschritte bei der Echtzeit-Musikinformationsabfrage für Gitarristen

Forschung verbessert perkussive Fingerstyle-Techniken für Gitarristen mit Echtzeit-Soundabruf.

2025-10-09T15:23:25+00:00 ― 8 min Lesedauer

Rechnen und Sprache Fortschritte bei der Sprachabsichtsklassifizierung und Slot-Filling

In diesem Artikel wird ein neues Modell zur Identifizierung von Sprachabsicht und Slots untersucht.

2025-10-09T12:09:05+00:00 ― 6 min Lesedauer

Ton Die Wahrheit in synthetischen Stimmen erkennen

Mit dem Fortschritt der Sprachklontechnologie sind zuverlässige Erkennungsmethoden entscheidend.

2025-10-09T06:29:00+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Spracherkennung ohne Text

Neue Methode verbessert Spracherkennung nur mit Roh-Audiodaten.

2025-10-09T02:26:05+00:00 ― 5 min Lesedauer

Rechnen und Sprache Die Spracherkennung für ältere Menschen verbessern

Eine Studie verbessert die ASR für ältere Sprecher und verwendet dabei innovative Techniken.

2025-10-09T01:37:30+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte in der Sprachzusammenfassung mit BASS

BASS verbessert die Zusammenfassung von langen Audios, indem es in Blöcken verarbeitet.

2025-10-08T15:05:55+00:00 ― 5 min Lesedauer

Ton Risiken von heimlichen Hintertür-Angriffen in Sprachenerkennungssystemen

Neue Methoden bringen ernsthafte Sicherheitsrisiken für die Spracherkennungstechnologie mit sich.

2025-10-08T14:17:20+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Neuer Datensatz soll die hebräische Spracherkennung verbessern

ivrit.ai bietet wichtige Ressourcen zur Verbesserung der Hebräischen ASR-Technologie.

2025-10-08T05:22:55+00:00 ― 7 min Lesedauer

Rechnen und Sprache Fortschritte in der mehrsprachigen Sprachtechnologieübersetzung

Innovative Techniken verändern, wie wir gesprochene Sprache übersetzen.

2025-10-08T02:57:10+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei Techniken zur Sprecheranonymisierung

Neue Methoden zielen darauf ab, die Identität der Sprecher zu verbergen und dabei die Sprachklarheit zu erhalten.

2025-10-08T01:20:00+00:00 ― 6 min Lesedauer

Ton Fortschrittliche Spracherkennung mit zeitlich gespartem Transducer

Neues Modell verbessert die Erkennungsgeschwindigkeit und den Speicherverbrauch von Sprache.

2025-10-07T23:42:50+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der domänensensitiven Spracherkennungstechnologie

Neue Methoden verbessern die Spracherkennung in bestimmten Bereichen ohne umfangreiche Daten.

2025-10-07T15:37:00+00:00 ― 6 min Lesedauer

Ton Hier ist das JAZZVAR-Datenset für Jazz-Piano-Variationen

Ein neues Datenset hebt die kreativen Interpretationen von Jazzpianisten zu klassischen Standards hervor.

2025-10-07T14:48:25+00:00 ― 4 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte im HRTF-Modeling für realistischen Sound

Neue Methoden verbessern die Klangdarstellung in virtueller und erweiterter Realität.

2025-10-07T10:45:30+00:00 ― 7 min Lesedauer

Ton FlexiAST: Ein flexibler Ansatz zur Audioverarbeitung

FlexiAST ermöglicht es Modellen, sich effizient an verschiedene Audio-Patch-Grössen anzupassen.

2025-10-07T09:56:55+00:00 ― 6 min Lesedauer

Maschinelles Lernen Fortschritte in der Sprachanalyse zur Erkennung von Kehlkopfkrebs

Forscher nutzen maschinelles Lernen, um die Diagnose von Kehlkopfkrebs durch Sprachanalyse zu verbessern.

2025-10-07T06:42:35+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei akustischen Wortembeddings

Ein neues Modell verbessert, wie Computer gesprochene Sprache verarbeiten.

2025-10-07T04:16:50+00:00 ― 4 min Lesedauer

Ton Einführung von Polyffusion: Eine neue Art, Musiknoten zu erstellen

Polyffusion nutzt visuelle Techniken, um Musik effektiv zu erzeugen und zu steuern.

2025-10-07T01:51:05+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Erkennung von Alzheimer durch Sprachanalyse

Forscher nutzen Sprachmuster, um Alzheimer früher und effektiver zu erkennen.

2025-10-07T00:13:55+00:00 ― 6 min Lesedauer

Ton Neues Framework verbessert die Spracherkennung mit Metadaten

Die Integration von Metadaten verbessert die Leistung bei Sprachaufgaben wie der Spracherkennung.

2025-10-06T12:05:10+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei Transducer-Modellen für Spracherkennung

Dieser Artikel behandelt die Echtzeitfähigkeiten des Transducer-Modells und die neuesten Verbesserungen.

2025-10-06T11:16:35+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Bias in der Transfer-Lern für Musikerkennung

Diese Studie untersucht Vorurteile in Audio-Modellen, die zur Instrumentenerkennung verwendet werden.

2025-10-06T09:39:25+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Musikgenre-Klassifikation mit Deep Learning

Diese Studie untersucht einen Deep-Learning-Ansatz, um Musikgenres genau zu klassifizieren.

2025-10-06T08:50:50+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Themenidentifikation aus Audiodaten

Die Forschung untersucht Methoden zur direkten Identifizierung von Themen aus Audioaufnahmen.

2025-10-05T23:56:25+00:00 ― 5 min Lesedauer

Ton Automatisierte Klangquellenlokalisierung in flachen Gewässern

Neue Methode verbessert die Verfolgung von Schallquellen in flachen Gewässern.

2025-10-05T13:27:48+00:00 ― 7 min Lesedauer

Ton Sprachechnologie mit SCRAPS voranbringen

Ein neues Modell verbindet Phonetik und Akustik für bessere Sprachtechnologie.

2025-10-05T13:24:50+00:00 ― 7 min Lesedauer

Ton Fortschritte in der Emotionserkennung mit selbstüberwachtem Lernen

Diese Studie hebt die Rolle des selbstüberwachten Lernens bei der Erkennung von Emotionen aus Audiodaten hervor.

2025-10-05T08:33:20+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Musik für jeden einfach machen

Eine neue Benutzeroberfläche macht die Musikproduktion für Anfänger einfacher, indem sie Text-zu-Audio-Technologie nutzt.

2025-10-04T18:47:25+00:00 ― 6 min Lesedauer

Ton Bewertung von Hörgeräten und KI-Sprachverbesserung

Forschung zeigt, wie KI Hörgeräte in lauten Umgebungen verbessern kann.

2025-10-04T17:58:50+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Musikquellen-Trennung mit verrauschten Daten

Neue Methode verbessert falsch etikettierte Daten und optimiert die Trennung von Musikquellen.

2025-10-04T10:41:35+00:00 ― 7 min Lesedauer

Ton Neue Methoden zur Dekodierung von auditiver Aufmerksamkeit

Fortschritte beim Entschlüsseln, wie Leute sich auf Geräusche konzentrieren, mithilfe von Gehirnaktivität.

2025-10-04T07:43:21+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Klangfeldsynthesetechnik

Eine neue Methode verbessert die Klangklarheit und Lokalisierung mit einem hybriden Ansatz.

2025-10-04T07:27:15+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der akustischen Echo-Unterdrückung mit CMNet

CMNet verbessert die Sprachklarheit, indem es Echo in Kommunikationsgeräten reduziert.

2025-10-04T06:38:40+00:00 ― 5 min Lesedauer

Ton Verbesserung der Unterwasserzielerkennung mit neuronalen Netzen

Eine neue Methode verbessert die Klassifizierung von Unterwassergeräuschen von Schiffen mithilfe von neuronalen Netzwerken.

2025-10-04T05:01:30+00:00 ― 5 min Lesedauer

Ton Fortschritte in der Hörgerätetechnologie

Forschung zielt darauf ab, die Klarheit in Hörgeräten zu verbessern, um die Kommunikation zu erleichtern.

2025-10-04T02:35:45+00:00 ― 6 min Lesedauer

Ton Fortschritte bei der Sprachverbesserung mit spiking neuronalen Netzen

Eine neue Methode zur Verbesserung der Sprachqualität mit energieeffizienten Netzwerken.

2025-10-03T21:44:15+00:00 ― 5 min Lesedauer

Ton Das Verstehen von Kuhvokalisationen bei Stress

Forschung hebt die Kommunikation von Kühen hervor, um die Milchviehhaltung zu verbessern.

2025-10-03T15:15:35+00:00 ― 5 min Lesedauer

Ton Einführung von MuReNN: Ein neues Modell für Audioverarbeitung

MuReNN kombiniert parametrische und nichtparametrische Modelle für eine bessere Audioanalyse.

2025-10-03T14:14:43+00:00 ― 5 min Lesedauer