ASR-Transkripte mit Fehlern können helfen, Alzheimer genauer zu identifizieren.
― 8 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
ASR-Transkripte mit Fehlern können helfen, Alzheimer genauer zu identifizieren.
― 8 min Lesedauer
Neueste Artikel
― 6 min Lesedauer
― 7 min Lesedauer
― 7 min Lesedauer
― 8 min Lesedauer
― 6 min Lesedauer
Die Analyse von Hühnergeräuschen hilft, ihre Gesundheit und die Produktivität auf dem Bauernhof zu verbessern.
― 8 min Lesedauer
Eine Methode, um sehbehinderten Menschen zu helfen, Geräusche in einer gemischten Realität zu erkennen.
― 5 min Lesedauer
Dieser Artikel bespricht Lösungen für Sprach-Anwendungen in Sprachen mit begrenzten transkribierten Daten.
― 6 min Lesedauer
Forscher kombinieren generative und diskriminative Methoden für eine bessere Klangklassifizierung.
― 6 min Lesedauer
Ein neues Modell verbessert die Sicherheit bei der Sprachidentifikation und widersteht Sprachfälschungen.
― 6 min Lesedauer
Ein Blick auf die Gausssche Adaptive Aufmerksamkeit für bessere KI-Leistung.
― 6 min Lesedauer
Forschung zeigt, dass Deep Learning unser Verständnis für Sprachrhythmus verbessert.
― 6 min Lesedauer
CoAVT integriert Audio-, Visual- und Textdaten für ein besseres Verständnis.
― 8 min Lesedauer
E-SHARC verbessert die Sprecheridentifikation in verschiedenen Audio-Umgebungen.
― 6 min Lesedauer
Ein neues System erstellt Musik, die darauf ausgelegt ist, Freude und Traurigkeit auszudrücken.
― 6 min Lesedauer
Ein Leitfaden zum Verstehen von Musikähnlichkeiten in generativen Modellen.
― 9 min Lesedauer
Eine Studie zur Klangsynthetisierung und deren Bewertung in kontrollierten Umgebungen.
― 5 min Lesedauer
Eine neue Methode verbessert die Genauigkeit beim Lokalisieren von sich bewegenden Schallquellen mit Mikrofonarrays.
― 7 min Lesedauer
PAM bietet eine neuartige Möglichkeit, die Audioqualität zu messen, ohne dass man Referenzaufnahmen braucht.
― 6 min Lesedauer
Audio Flamingo ist super darin, zuzuhören, zu quatschen und sich an neue Audioaufgaben anzupassen.
― 6 min Lesedauer
Ein neues Modell verbessert das Verständnis von Maschinen für räumlichen Sound.
― 5 min Lesedauer
Ein neues Modell verbessert die Sprach-zu-Text-Effizienz in Echtzeitanwendungen.
― 6 min Lesedauer
Diese Studie bewertet Klänge im Vergleich zu Wörtern beim Rekonstruieren von Sprachbaumfamilien.
― 7 min Lesedauer
Neues Modell verbessert die Musikproduktion mit Nutzerfeedback.
― 8 min Lesedauer
Reborn bietet innovative Lösungen für automatische Spracherkennung ohne beschriftete Daten.
― 6 min Lesedauer
Ein neues Tool hilft Nutzern, Sounds ganz einfach mit einfachen Textanweisungen zu verändern.
― 9 min Lesedauer
Ein neues Modell kombiniert gesprochene und geschriebene Sprache für bessere Kommunikation.
― 6 min Lesedauer
Ein Blick auf neue Modelle für natürliche gesprochene Antworten.
― 7 min Lesedauer
Eine neue Methode integriert akustische Informationen in Sprachmodelle für eine bessere Spracherkennung.
― 9 min Lesedauer
Musik zu nutzen, um Krebs zu erklären, kann das Verständnis und das Interesse steigern.
― 7 min Lesedauer
Lern, wie Schallortung die Quelle von Geräuschen mit fortschrittlichen Techniken identifiziert.
― 4 min Lesedauer
Ein neuer Ansatz, um Stimmen mit verbesserter Rhythmusgenauigkeit zu synthetisieren.
― 8 min Lesedauer
LLMs verbessern die Genauigkeit bei medizinischen Transkriptionen, was der Patientenversorgung zugutekommt.
― 7 min Lesedauer
Eine Methode zur Verbesserung der Melodieextraktion über verschiedene Musikstile hinweg mit minimalem Aufwand für den Menschen.
― 8 min Lesedauer
Neue Methoden verbessern die Erkennung von Sprachaktivität und Überlappungen beim Speaker Diarization.
― 7 min Lesedauer
Neue Methode integriert Sprachsignale für verbesserte Depressionsdiagnose.
― 4 min Lesedauer
In diesem Artikel geht's darum, wie man mit verschiedenen Anordnungen immersive Klangfelder erstellen kann.
― 5 min Lesedauer
Eine neue Methode reduziert unerwünschte metallische Geräusche in der Audio-Raumakustik.
― 5 min Lesedauer
Chirp MFCC verbessert die Audio-Signalrepräsentation für eine bessere Klassifizierung und Erkennung.
― 4 min Lesedauer
Das EMO-SUPERB-Projekt verbessert die Spracherkennung von Emotionen durch verbesserte Techniken und Zusammenarbeit in der Community.
― 7 min Lesedauer
Ein neues System, um die Leistung von Audio-Codecs in verschiedenen Anwendungen zu bewerten.
― 7 min Lesedauer
Diese Studie untersucht, wie die Batch-Grösse die Leistung und das Training von Sprachmodellen beeinflusst.
― 7 min Lesedauer
Entdecke, wie KI die Musikproduktion durch die Zusammenarbeit mit Menschen verändert.
― 8 min Lesedauer
ASV-Systeme verbessern, um die Stimmen von Kindern genau zu erkennen.
― 9 min Lesedauer
Neue Technologie verbessert die Genauigkeit der Diagnose von Lungenerkrankungen durch Klanganalyse.
― 7 min Lesedauer