Elektrotechnik und Systemtechnik - Audio- und Sprachverarbeitung

RSS

Ton Fortschritte bei der Sprachverbesserung mit spiking neuronalen Netzen

Eine neue Methode zur Verbesserung der Sprachqualität mit energieeffizienten Netzwerken.

2025-10-03T21:44:15+00:00 ― 5 min Lesedauer

Neueste Artikel

Ton Das Verstehen von Kuhvokalisationen bei Stress

2025-10-03T15:15:35+00:00 ― 5 min Lesedauer

Ton Einführung von MuReNN: Ein neues Modell für Audioverarbeitung

2025-10-03T14:14:43+00:00 ― 5 min Lesedauer

Maschinelles Lernen BioLingual: Eine neue Ära in der Bioakustik

2025-10-03T11:32:00+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der aktiven Lautsprechererkennung mit Audio

2025-10-03T11:12:40+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Sprachverbesserung mit PCNN

2025-10-03T07:58:20+00:00 ― 5 min Lesedauer

Neueste Artikel

Multimedia Fortschritte im visuellen akustischen Matching

Eine neue Methode verbessert die Audioanpassung mithilfe von Bildern und steigert die Realitätsnähe in Audioumgebungen.

2025-10-03T03:55:25+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Neue Datensatzverknüpfungen verbinden Emotionen mit MIDI-Musik

Ein Datensatz verbindet Emotionen mit MIDI-Songs durch die Analyse von Songtexten.

2025-10-03T02:18:15+00:00 ― 8 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei Sprachverbesserungstechniken

Die Sprachqualität verbessern durch innovative Methoden und mehrsprachige Datensätze.

2025-10-02T23:52:30+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Behebung von Audioqualitätseinbussen während der Übertragung

Neue Techniken sollen die Audioqualität verbessern, indem sie Paketverluste angehen.

2025-10-02T22:15:20+00:00 ― 5 min Lesedauer

Ton Effektive Erkennung von Deepfake-Audio

Neue Systeme werden entwickelt, um gefälschte Audioaufnahmen mit verbesserter Genauigkeit zu erkennen.

2025-10-02T18:12:25+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Sprecherdiarisierung durch Audio-Visuelle Integration

Neue Systeme verbessern die Sprecheridentifikation mit Audio- und visuellen Daten.

2025-10-02T15:46:40+00:00 ― 5 min Lesedauer

Ton MoisesDB: Ein Durchbruch in der Musikquelltrennung

MoisesDB bietet einen detaillierten Datensatz für fortgeschrittene Musiktontrennung.

2025-10-02T09:18:00+00:00 ― 6 min Lesedauer

Ton Fortschritte bei der Musikbeschriftung mit grossen Sprachmodellen

LLMs nutzen, um ein riesiges Datenset für Musikbeschriftungen zu erstellen.

2025-10-02T08:29:25+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte in der Aussprache-Trainingstechnik

Forscher verbessern das Aussprache-Training mit neuen Technologien für Sprachlerner.

2025-10-02T07:40:50+00:00 ― 5 min Lesedauer

Ton Fortschritte in der Sprachstil-Übertragungstechnologie

HierVST verwandelt Stimmen mühelos und verbessert die Audioqualität, ohne viel Daten zu brauchen.

2025-10-02T05:15:05+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Neues Modell revolutioniert die Analyse von Musikstrukturen

Ein einheitlicher Ansatz verbessert die Musikanalyse, indem er mehrere strukturelle Elemente integriert.

2025-10-01T23:35:00+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Sprachklassifizierung für Kinder mit Autismus

Die Forschung konzentriert sich darauf, die Sprache von Kindern und Erwachsenen mit unbeschrifteten Daten zu klassifizieren.

2025-10-01T22:46:25+00:00 ― 6 min Lesedauer

Multimedia Fortschritte bei der Einschätzung der Engagements in Gesprächen

Forschung entwickelt ein Modell, um Engagement in Gesprächen genau zu messen.

2025-10-01T21:57:50+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung DAVIS: Ein neuer Ansatz zur Schalltrennung

DAVIS bietet einen neuen Ansatz für die Trennung von Audio und visuellem Klang.

2025-10-01T19:32:05+00:00 ― 6 min Lesedauer

Ton Fortschritte bei Audio-Visuellen Segmentierungstechniken

Eine neue Methode verbessert die genaue Identifizierung von schallproduzierenden Objekten in Videos.

2025-10-01T13:52:00+00:00 ― 7 min Lesedauer

Ton Fortschritte bei Text-to-Speech mit DiffProsody

DiffProsody verbessert die Geschwindigkeit und Qualität der Sprachsynthese durch innovative Prosodiegenerierung.

2025-10-01T13:03:25+00:00 ― 4 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Schallfeldrekonstruktion mit GANs

Deep-Learning-Modelle verbessern die Klangfeldrekonstruktion in komplexen Umgebungen.

2025-10-01T04:57:35+00:00 ― 7 min Lesedauer

Ton Die Lautstärke-Schlacht mit De-limiter Netzwerken angehen

Neue Technologie soll die Musikqualität wiederherstellen, die durch Lautstärkereduzierung verloren gegangen ist.

2025-10-01T02:31:50+00:00 ― 5 min Lesedauer

Ton Automatisches System zur Identifizierung von Aphasie

Neue Methode verspricht schnellere Identifizierung von Sprachstörungen wie Aphasie.

2025-09-30T21:40:20+00:00 ― 5 min Lesedauer

Kryptographie und Sicherheit Unhörbare Klangtechniken zur Sprachmanipulation

Neue Methode nutzt Ultraschallgeräusche, um Spracherkennungssysteme zu verwirren, ohne erkannt zu werden.

2025-09-30T19:14:35+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte in der Text-zu-Sprache-Technologie

Neue Methoden verbessern die Qualität der synthetischen Sprache durch selbstüberwachtes Lernen.

2025-09-30T17:37:25+00:00 ― 5 min Lesedauer

Rechnen und Sprache Spracheerkennung mit Keyword-Boosting verbessern

Eine neue Methode verbessert die Transkription seltener Schlüsselwörter in Geschäftsgesprächen.

2025-09-30T10:20:10+00:00 ― 6 min Lesedauer

Ton Spracherkennung mit föderiertem Lernen voranbringen

Federated Learning verbessert die Spracherkennung und schützt dabei die Nutzerdaten.

2025-09-30T08:43:00+00:00 ― 6 min Lesedauer

Ton MusicLDM: Ein neuer Ansatz zur Text-zu-Musik-Generierung

MusicLDM verwandelt Texte in originelle Musik und eröffnet frische Möglichkeiten für Kreativität.

2025-09-30T05:28:40+00:00 ― 8 min Lesedauer

Ton Verbesserung der Techniken zur Melodieextraktion beim Singen mit Deep Learning

Neue Methoden verbessern die Genauigkeit beim Herausziehen von Gesangsmelodien aus gemischtem Audio.

2025-09-30T01:25:45+00:00 ― 7 min Lesedauer

Ton Fortschritte in der Sprachverbesserungstechniken

Neues Modell verbessert die Sprachklarheit in lauten Umgebungen mit innovativen Methoden.

2025-09-29T22:11:25+00:00 ― 5 min Lesedauer

Ton Die Analyse koreanischer Volkslieder durch Technologie

Eine Studie über koreanische Volkslieder mit modernen Analysemethoden.

2025-09-29T21:22:50+00:00 ― 8 min Lesedauer

Graphik DiffDance: Eine neue Ära in der Tanzgenerierung

DiffDance erstellt detaillierte Tanzsequenzen, die gut zur Musik passen.

2025-09-29T16:31:20+00:00 ― 6 min Lesedauer

Ton Die Bekämpfung von Geschlechtervorurteilen in der Gesangsstimmtranskription

Die Fairness von Transkriptionstechnologie für Gesangstimmen über Geschlechter hinweg überprüfen.

2025-09-29T15:42:45+00:00 ― 8 min Lesedauer

Ton Fortschritte bei der Anpassung von Hotwords für ASR-Systeme

SeACo-Paraformer bringt Flexibilität und Genauigkeit in die Spracherkennungstechnologie.

2025-09-29T14:05:35+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Die Untersuchung der Stimmbeschaffenheit und ihrer Auswirkungen

Diese Studie untersucht Methoden zur Klassifizierung der Stimmqualität und deren Bedeutung in der Kommunikation.

2025-09-29T12:28:25+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der aktiven Geräuschkontrolltechnologie

Lerne, wie neue Algorithmen die Geräuschunterdrückungstechniken für verschiedene Anwendungen verbessern.

2025-09-29T05:59:45+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Neues Tool misst Audioqualität mit Video-Insights

AudioVMAF kombiniert Video-Metriken für eine bessere Bewertung der Audioqualität.

2025-09-29T01:56:50+00:00 ― 6 min Lesedauer

Ton Fortschritte bei der Erkennung von gefälschten Audios mit RAWM

Eine neue Methode verbessert die Erkennung von Fake-Audio durch adaptive Gewichtsanpassung.

2025-09-29T01:08:15+00:00 ― 6 min Lesedauer

Kryptographie und Sicherheit Der wachsende Bedarf an Steganalyse in der Informationssicherheit

Steganalyse hilft dabei, versteckte Nachrichten in Multimedia zu entdecken und sorgt für sichere Kommunikation.

2025-09-28T23:31:05+00:00 ― 4 min Lesedauer

Audio- und Sprachverarbeitung Sprecheridentität von Sprachdaten trennen

Eine Studie zum Entwirren der Sprecheridentität aus Sprachsignalen für verbesserte Verarbeitung.

2025-09-28T19:28:10+00:00 ― 6 min Lesedauer

Multimedia TranSTYLer: Ein Sprung in der virtuellen Kommunikation

Gesten für virtuelle Agenten umwandeln, während die Bedeutung erhalten bleibt.

2025-09-28T18:39:35+00:00 ― 6 min Lesedauer

Ton Fortschritte bei der Schallquellenlokalisierung mit neuronalen Netzen

Untersuchung, wie neuronale Netzwerke die Genauigkeit der Schallquellenlokalisierung verbessern.

2025-09-28T12:10:55+00:00 ― 6 min Lesedauer

Rechnen und Sprache Verbesserung der Punjabi-Spracherkennung mit Selbsttrainingsmethoden

Forscher verbessern die automatische Spracherkennung für Punjabi mit innovativen Selbsttrainingstechniken.

2025-09-28T08:56:35+00:00 ― 6 min Lesedauer

Ton Fortschritte bei der Sprachrecognition für Zielsprecher

Neues Modell verbessert die Spracherkennung in lauten Umgebungen, indem es sich auf einen einzelnen Sprecher konzentriert.

2025-09-28T08:08:00+00:00 ― 4 min Lesedauer