Elektrotechnik und Systemtechnik - Audio- und Sprachverarbeitung

RSS

Audio- und Sprachverarbeitung Bias in der Transfer-Lern für Musikerkennung

Diese Studie untersucht Vorurteile in Audio-Modellen, die zur Instrumentenerkennung verwendet werden.

2025-10-06T09:39:25+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Musikgenre-Klassifikation mit Deep Learning

Diese Studie untersucht einen Deep-Learning-Ansatz, um Musikgenres genau zu klassifizieren.

2025-10-06T08:50:50+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Themenidentifikation aus Audiodaten

Die Forschung untersucht Methoden zur direkten Identifizierung von Themen aus Audioaufnahmen.

2025-10-05T23:56:25+00:00 ― 5 min Lesedauer

Ton Automatisierte Klangquellenlokalisierung in flachen Gewässern

Neue Methode verbessert die Verfolgung von Schallquellen in flachen Gewässern.

2025-10-05T13:27:48+00:00 ― 7 min Lesedauer

Ton Sprachechnologie mit SCRAPS voranbringen

Ein neues Modell verbindet Phonetik und Akustik für bessere Sprachtechnologie.

2025-10-05T13:24:50+00:00 ― 7 min Lesedauer

Ton Fortschritte in der Emotionserkennung mit selbstüberwachtem Lernen

Diese Studie hebt die Rolle des selbstüberwachten Lernens bei der Erkennung von Emotionen aus Audiodaten hervor.

2025-10-05T08:33:20+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Musik für jeden einfach machen

Eine neue Benutzeroberfläche macht die Musikproduktion für Anfänger einfacher, indem sie Text-zu-Audio-Technologie nutzt.

2025-10-04T18:47:25+00:00 ― 6 min Lesedauer

Ton Bewertung von Hörgeräten und KI-Sprachverbesserung

Forschung zeigt, wie KI Hörgeräte in lauten Umgebungen verbessern kann.

2025-10-04T17:58:50+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Musikquellen-Trennung mit verrauschten Daten

Neue Methode verbessert falsch etikettierte Daten und optimiert die Trennung von Musikquellen.

2025-10-04T10:41:35+00:00 ― 7 min Lesedauer

Ton Neue Methoden zur Dekodierung von auditiver Aufmerksamkeit

Fortschritte beim Entschlüsseln, wie Leute sich auf Geräusche konzentrieren, mithilfe von Gehirnaktivität.

2025-10-04T07:43:21+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Klangfeldsynthesetechnik

Eine neue Methode verbessert die Klangklarheit und Lokalisierung mit einem hybriden Ansatz.

2025-10-04T07:27:15+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der akustischen Echo-Unterdrückung mit CMNet

CMNet verbessert die Sprachklarheit, indem es Echo in Kommunikationsgeräten reduziert.

2025-10-04T06:38:40+00:00 ― 5 min Lesedauer

Ton Verbesserung der Unterwasserzielerkennung mit neuronalen Netzen

Eine neue Methode verbessert die Klassifizierung von Unterwassergeräuschen von Schiffen mithilfe von neuronalen Netzwerken.

2025-10-04T05:01:30+00:00 ― 5 min Lesedauer

Ton Fortschritte in der Hörgerätetechnologie

Forschung zielt darauf ab, die Klarheit in Hörgeräten zu verbessern, um die Kommunikation zu erleichtern.

2025-10-04T02:35:45+00:00 ― 6 min Lesedauer

Ton Fortschritte bei der Sprachverbesserung mit spiking neuronalen Netzen

Eine neue Methode zur Verbesserung der Sprachqualität mit energieeffizienten Netzwerken.

2025-10-03T21:44:15+00:00 ― 5 min Lesedauer

Ton Das Verstehen von Kuhvokalisationen bei Stress

Forschung hebt die Kommunikation von Kühen hervor, um die Milchviehhaltung zu verbessern.

2025-10-03T15:15:35+00:00 ― 5 min Lesedauer

Ton Einführung von MuReNN: Ein neues Modell für Audioverarbeitung

MuReNN kombiniert parametrische und nichtparametrische Modelle für eine bessere Audioanalyse.

2025-10-03T14:14:43+00:00 ― 5 min Lesedauer

Maschinelles Lernen BioLingual: Eine neue Ära in der Bioakustik

Die Revolutionierung der Forschung zur Tierkommunikation mit innovativer Audio- und Sprachintegration.

2025-10-03T11:32:00+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der aktiven Lautsprechererkennung mit Audio

Forschung zeigt, dass mehrere Mikrofone Vorteile beim Erkennen und Lokalisieren von Sprechern haben.

2025-10-03T11:12:40+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Sprachverbesserung mit PCNN

Ein neues Modell für klarere Sprache in lauten Umgebungen.

2025-10-03T07:58:20+00:00 ― 5 min Lesedauer

Multimedia Fortschritte im visuellen akustischen Matching

Eine neue Methode verbessert die Audioanpassung mithilfe von Bildern und steigert die Realitätsnähe in Audioumgebungen.

2025-10-03T03:55:25+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Neue Datensatzverknüpfungen verbinden Emotionen mit MIDI-Musik

Ein Datensatz verbindet Emotionen mit MIDI-Songs durch die Analyse von Songtexten.

2025-10-03T02:18:15+00:00 ― 8 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei Sprachverbesserungstechniken

Die Sprachqualität verbessern durch innovative Methoden und mehrsprachige Datensätze.

2025-10-02T23:52:30+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Behebung von Audioqualitätseinbussen während der Übertragung

Neue Techniken sollen die Audioqualität verbessern, indem sie Paketverluste angehen.

2025-10-02T22:15:20+00:00 ― 5 min Lesedauer

Ton Effektive Erkennung von Deepfake-Audio

Neue Systeme werden entwickelt, um gefälschte Audioaufnahmen mit verbesserter Genauigkeit zu erkennen.

2025-10-02T18:12:25+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Sprecherdiarisierung durch Audio-Visuelle Integration

Neue Systeme verbessern die Sprecheridentifikation mit Audio- und visuellen Daten.

2025-10-02T15:46:40+00:00 ― 5 min Lesedauer

Ton MoisesDB: Ein Durchbruch in der Musikquelltrennung

MoisesDB bietet einen detaillierten Datensatz für fortgeschrittene Musiktontrennung.

2025-10-02T09:18:00+00:00 ― 6 min Lesedauer

Ton Fortschritte bei der Musikbeschriftung mit grossen Sprachmodellen

LLMs nutzen, um ein riesiges Datenset für Musikbeschriftungen zu erstellen.

2025-10-02T08:29:25+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte in der Aussprache-Trainingstechnik

Forscher verbessern das Aussprache-Training mit neuen Technologien für Sprachlerner.

2025-10-02T07:40:50+00:00 ― 5 min Lesedauer

Ton Fortschritte in der Sprachstil-Übertragungstechnologie

HierVST verwandelt Stimmen mühelos und verbessert die Audioqualität, ohne viel Daten zu brauchen.

2025-10-02T05:15:05+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Neues Modell revolutioniert die Analyse von Musikstrukturen

Ein einheitlicher Ansatz verbessert die Musikanalyse, indem er mehrere strukturelle Elemente integriert.

2025-10-01T23:35:00+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Sprachklassifizierung für Kinder mit Autismus

Die Forschung konzentriert sich darauf, die Sprache von Kindern und Erwachsenen mit unbeschrifteten Daten zu klassifizieren.

2025-10-01T22:46:25+00:00 ― 6 min Lesedauer

Multimedia Fortschritte bei der Einschätzung der Engagements in Gesprächen

Forschung entwickelt ein Modell, um Engagement in Gesprächen genau zu messen.

2025-10-01T21:57:50+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung DAVIS: Ein neuer Ansatz zur Schalltrennung

DAVIS bietet einen neuen Ansatz für die Trennung von Audio und visuellem Klang.

2025-10-01T19:32:05+00:00 ― 6 min Lesedauer

Ton Fortschritte bei Audio-Visuellen Segmentierungstechniken

Eine neue Methode verbessert die genaue Identifizierung von schallproduzierenden Objekten in Videos.

2025-10-01T13:52:00+00:00 ― 7 min Lesedauer

Ton Fortschritte bei Text-to-Speech mit DiffProsody

DiffProsody verbessert die Geschwindigkeit und Qualität der Sprachsynthese durch innovative Prosodiegenerierung.

2025-10-01T13:03:25+00:00 ― 4 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Schallfeldrekonstruktion mit GANs

Deep-Learning-Modelle verbessern die Klangfeldrekonstruktion in komplexen Umgebungen.

2025-10-01T04:57:35+00:00 ― 7 min Lesedauer

Ton Die Lautstärke-Schlacht mit De-limiter Netzwerken angehen

Neue Technologie soll die Musikqualität wiederherstellen, die durch Lautstärkereduzierung verloren gegangen ist.

2025-10-01T02:31:50+00:00 ― 5 min Lesedauer

Ton Automatisches System zur Identifizierung von Aphasie

Neue Methode verspricht schnellere Identifizierung von Sprachstörungen wie Aphasie.

2025-09-30T21:40:20+00:00 ― 5 min Lesedauer

Kryptographie und Sicherheit Unhörbare Klangtechniken zur Sprachmanipulation

Neue Methode nutzt Ultraschallgeräusche, um Spracherkennungssysteme zu verwirren, ohne erkannt zu werden.

2025-09-30T19:14:35+00:00 ― 6 min Lesedauer