Neuste Artikel für Audioverarbeitung

Audio- und Sprachverarbeitung Neue Metriken zur Messung von Schall in Räumen

Forschung schlägt bessere Methoden vor, um späte Nachhall in Räumen zu bewerten.

2025-06-24T02:48:20+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritt bei der Umwandlung von geflüsterten Sprachäusserungen mit MaskCycleGAN

Eine neue Methode verbessert die Umwandlung von geflüstertem Gesprochenem in normale Sprache mit fortschrittlichen Techniken.

2025-06-23T09:48:05+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Audioerkennung verbessern durch multimodales Lernen

Ein neues Framework verbessert die Audio-Klassifikation, indem es das Wissen von mehreren Geräten nutzt.

2025-06-23T00:53:40+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Sprachverbesserung mit Zeit-Kontext-Fensterung

Eine neue Methode zur Verbesserung der Sprachqualität mit zeitbasiertem Fensteransatz erkunden.

2025-06-22T17:36:25+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Sprachumwandlungstechnologie

Eine neue Methode zur Verbesserung der Qualität von Echtzeit-Sprachumwandlung.

2025-06-22T07:04:50+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Einführung von SelectTTS: Eine vereinfachte Text-zu-Sprache-Methode

SelectTTS vereinfacht die Sprachsynthese für unbekannte Sprecher mit effektiver Rahmenauswahl.

2025-06-21T18:07:30+00:00 ― 6 min Lesedauer

Ton Fortschritte bei Sprachverbesserungstechniken

Sprachverständlichkeit verbessern mit hybriden Filterbänken und neuronalen Netzen.

2025-06-21T17:18:55+00:00 ― 5 min Lesedauer

Ton AASIST3: Fortgeschrittene Lösung zur Sprachverifizierung

AASIST3 verbessert die Erkennung von Fake-Stimmen in automatischen Sprecherverifizierungssystemen.

2025-06-21T16:30:20+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte im Selbstüberwachten Lernen für Sprachverarbeitung

Eine neue Methode verbessert die Leistung von Sprachmodellen bei verschiedenen Aufgaben.

2025-06-21T02:44:25+00:00 ― 7 min Lesedauer

Ton Neuer Datensatz verbessert die Spracherkennungstechnologie

Forscher haben LibriheavyMix entwickelt, um die Spracherkennung in lauten Umgebungen zu verbessern.

2025-06-20T22:41:30+00:00 ― 5 min Lesedauer

Ton Fortschritte bei Sprachverbesserungstechniken

Neue Methoden verbessern die Sprachverständlichkeit in lauten Umgebungen mithilfe fortschrittlicher Technologien.

2025-06-20T15:24:15+00:00 ― 5 min Lesedauer

Ton Fortschritte in der Technologie zur Extraktion von Zielsprechern

Neue Methoden verbessern die Sprachtrennung in lauten Umgebungen.

2025-06-20T13:47:05+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Spracherkennung mit Lärm-unterstütztem Training verbessern

Diese Studie untersucht, wie Lärm die Sprachwahrnehmung bei Herausforderungen verbessern kann.

2025-06-19T14:18:10+00:00 ― 6 min Lesedauer

Ton Vorstellung von aTENNuate: Echtzeit Sprachverbesserung

aTENNuate bietet eine effiziente Echtzeitverbesserung von Sprachsignalen, um die Kommunikation klarer zu machen.

2025-06-18T05:54:50+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Schallquellenlokalisation mit TF-Mamba

TF-Mamba verbessert die Klanglokalisierung mit einem neuartigen Ansatz, der Zeit- und Frequenzdaten integriert.

2025-06-16T19:54:20+00:00 ― 5 min Lesedauer

Ton Fortschritte bei der Erkennung von Schallereignissen mit MTDA-HSED

Eine neue Architektur verbessert die Schallerkennung in verschiedenen Umgebungen.

2025-06-16T10:59:55+00:00 ― 6 min Lesedauer

Ton Dynamische Einbettung kausale Zielsprachenauswertung: Ein neuer Ansatz

Wir präsentieren DENSE, eine Methode zur Verbesserung der Sprachtrennung mit dynamischen Einbettungen.

2025-06-16T08:34:10+00:00 ― 6 min Lesedauer

Ton Neuer Ansatz für den Transfer von Musik-Timbre

Eine neue Methode verbessert die Audio-Transformation, während Melodie und Klangqualität erhalten bleiben.

2025-06-16T05:19:50+00:00 ― 6 min Lesedauer

Ton Verbesserung der Sprecherverifikation mit phonetischen Merkmalen

Ein neuer Rahmen verbessert die Genauigkeit der Bestätigung der Sprachidentität.

2025-06-15T01:50:18+00:00 ― 6 min Lesedauer

Ton FlowSep: Ein neuer Ansatz zur Trennung von Audioquellen

FlowSep bringt ne Methode raus, um Sounds mit Sprachabfragen zu extrahieren.

2025-06-14T18:30:45+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung OpenACE: Ein neuer Standard für die Bewertung von Audiocodecs

OpenACE bietet einen fairen Massstab, um Audio-Codecs unter verschiedenen Bedingungen zu bewerten.

2025-06-13T14:58:55+00:00 ― 5 min Lesedauer

Ton Fortschritte in der Gesangsstimmen-Konversionstechnologie

Eine neue Zero-Shot-Methode verbessert die Genauigkeit der Sprachumwandlung und minimiert Tonverlust.

2025-06-13T06:04:30+00:00 ― 5 min Lesedauer

Ton Innovative Methode zur Extraktion des Zielsprechers enthüllt

Neuer Ansatz verbessert die Sprachisolierung in gemischten Audio-Umgebungen mit diskreten Tokens.

2025-06-13T00:24:25+00:00 ― 5 min Lesedauer

Rechnen und Sprache DAC: Eine neue Ära im Audio-Capturing

Das DAC-Modell verbessert die Audiobeschreibung mit Schnelligkeit und Vielfalt.

2025-06-12T01:01:36+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei Techniken zur Extraktion gezielter Töne

Neue Methoden verbessern die Schalldämmung aus lauten Umgebungen ohne gelabelte Daten.

2025-06-11T11:09:35+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Die Sprachqualität mit Wave-U-Mamba verbessern

Wave-U-Mamba verbessert die Qualität von Sprachaufnahmen, damit man klarer kommunizieren kann.

2025-06-11T04:40:55+00:00 ― 5 min Lesedauer

Ton Fortschritte in der Video-zu-Audio-Generierung

Neue Methoden verbessern die Audio-Synchronisation bei wechselnden Videoszenen.

2025-06-10T20:35:05+00:00 ― 4 min Lesedauer

Rechnen und Sprache Die Herausforderung der synthetischen Fehlinformation angehen

Bemühungen, irreführenden Audioinhalt zu erkennen, der durch Technologie erstellt wurde, sind echt wichtig.

2025-06-10T17:01:54+00:00 ― 6 min Lesedauer

Ton Maschinenklangverständnis verbessern

Neue Methoden helfen Maschinen, einzelne Geräusche besser zu interpretieren.

2025-06-10T13:17:50+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Sprechererkennung mit i-Vektoren

Eine Studie zeigt, dass i-Vektoren mit komplexen Modellen in der Sprechererkennung konkurrieren können.

2025-06-10T06:49:10+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Gestaltungsentscheidungen, die die Leistungsfähigkeit von Sprachmodellen beeinflussen

Eine Studie darüber, wie Designentscheidungen die Sprachmodelle beeinflussen.

2025-06-10T06:00:35+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Bewertung von Sprachmodellen mit Rangmessung

Eine neue Methode bewertet selbstüberwachte Sprachmodelle mithilfe von Rangmessungen.

2025-06-10T05:12:00+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung RF-GML: Ein neuer Ansatz für Audioqualität

RF-GML misst die Audioqualität, ohne ein Referenzsignal zu brauchen.

2025-06-09T16:14:40+00:00 ― 5 min Lesedauer

Ton Verbesserung von Musik-Text-Modellen durch Datenqualität

Innovative Techniken verbessern das Training von Musik-Text-Modellen mit begrenzten Ressourcen.

2025-06-09T00:03:00+00:00 ― 7 min Lesedauer

Ton Fortschritte bei der akustischen Szenenklassifikation im DCASE 2024 Wettbewerb

Neue Modelle gehen das Thema Klangklassifikation mit begrenzten Trainingsdaten an.

2025-06-07T12:25:20+00:00 ― 6 min Lesedauer

Ton Fortschritte bei Methoden zur Erkennung von Fake-Audio

Ein neuer Ansatz verbessert die Erkennung von gefälschter Audio mit vortrainierten Modellen.

2025-06-07T11:36:45+00:00 ― 6 min Lesedauer

Signalverarbeitung Fortschritte bei der Quellenenumeration für Signalverarbeitung

Eine neue Methode verbessert das Zählen von Quellen in komplexen Signalumgebungen.

2025-06-06T22:22:20+00:00 ― 5 min Lesedauer

Signalverarbeitung Fortschritte bei der Schätzung der Ankunftsrichtung

Neue Array-Designs verbessern die Genauigkeit und Effizienz bei der Erkennung der Signalrichtung.

2025-06-05T12:38:55+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Evaluierung von neuralen Audio-Codecs: Einblicke aus der Codec-SUPERB-Herausforderung

Ein Blick auf die Ergebnisse der Codec-SUPERB-Challenge und die Leistungskennzahlen der Codecs.

2025-06-05T06:58:50+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Frühe Raumreflexionen mit der FF-PHALCOR-Methode schätzen

Eine neue Methode zur Erkennung von frühen Raumreflexionen verbessert das Audioerlebnis.

2025-06-04T07:29:55+00:00 ― 7 min Lesedauer