Neuste Artikel für Spracherkennung

Audio- und Sprachverarbeitung Fortschritte bei Techniken zur Erkennung gefälschter Sprache

Neue Methoden verbessern unsere Fähigkeit, gefälschte Sprache effektiv zu erkennen.

2025-09-11T02:21:55+00:00 ― 6 min Lesedauer

Ton Spracherkennung durch Personalisierungstechniken verbessern

Eine neue Methode verbessert ASR-Modelle für einzelne Nutzer mithilfe von Quantisierung und Anpassung.

2025-09-10T13:24:35+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Spracherkennung durch Early-Exit-Modelle

Neue Modelle passen sich an, um die Effizienz und Reaktionsfähigkeit der Spracherkennung zu verbessern.

2025-09-09T21:12:55+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Whisper für ressourcenarme Sprachen verbessern

Die Spracherkennung von Whisper für Vietnamesisch und andere Sprachen mit geringem Ressourcengehalt verbessern.

2025-09-08T03:55:10+00:00 ― 5 min Lesedauer

Neurowissenschaften Verstehen von Sprachverarbeitung in schwierigen Umgebungen

Diese Studie untersucht, wie das Hörvermögen das Sprachverständnis in lauten Umgebungen beeinflusst.

2025-09-07T04:34:28+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung von Audiodaten mit K-Means-Clustering

Mit k-Means-Clustering Audio-Daten optimieren für besseres Model-Training.

2025-09-06T15:28:55+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Effiziente Modellauswahl für Spracherkennung

Eine Methode, um das beste ASR-Modell basierend auf Audio-Features auszuwählen.

2025-09-05T23:17:15+00:00 ― 5 min Lesedauer

Rechnen und Sprache Mein Wissenschafts-Nachhilfe-Projekt: Eine neue Art zu lernen

MyST zielt darauf ab, das Wissenschaftslernen von Kindern durch virtuelles Tutoring zu verbessern.

2025-09-05T09:31:20+00:00 ― 5 min Lesedauer

Ton Fortschritte in der Technologie zur Transkription von Meetings

Ein Blick auf M2MeT 2.0 und seinen Einfluss auf die Transkription von Meetings.

2025-09-05T03:51:15+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte und Herausforderungen bei Spracherkennungsmodellen

Diese Studie untersucht, wie Modelkompression die Spracherkennung in lauten Umgebungen beeinflusst.

2025-09-04T19:45:25+00:00 ― 6 min Lesedauer

Ton Fortschritte in Audio- und Spracherkennungsmodellen

Ein neues Modell verbessert das Verständnis von Sprache und Geräuschen gleichzeitig.

2025-09-04T18:08:15+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Sprachextraktionstechnologie

Neue Modelle für bessere Spracherkennung in lauten Umgebungen.

2025-09-04T02:45:10+00:00 ― 6 min Lesedauer

Rechnen und Sprache Herausforderungen bei der automatischen Spracherkennung in Langform angehen

Die Forschung konzentriert sich darauf, ASR-Systeme für unsegmentierte Audiodaten zu verbessern.

2025-09-03T13:47:50+00:00 ― 5 min Lesedauer

Rechnen und Sprache Adressierung von Geschlechtervorurteilen in der Spracherkennungstechnologie

Untersuchung von Leistungsunterschieden bei der Spracherkennung zwischen den Geschlechtern.

2025-09-03T12:51:42+00:00 ― 6 min Lesedauer

Rechnen und Sprache Spracherkennung mit grossen Sprachmodellen verbessern

LLMs verbessern die Genauigkeit und Fehlerkorrektur in Spracherkennungssystemen.

2025-09-03T06:30:35+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung von Besprechungs-Texterkennungen mit dem PP-MeT-System

PP-MeT zielt darauf ab, die Genauigkeit beim Transkribieren von Mehrsprecher-Meetings zu verbessern.

2025-09-02T04:35:55+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Ein universeller Ansatz zur Sprachverbesserung

Diese Forschung stellt ein Modell vor, um die Sprachverständlichkeit unter verschiedenen Bedingungen zu verbessern.

2025-09-02T02:10:10+00:00 ― 5 min Lesedauer

Rechnen und Sprache Fortschritte in der Spracherkennung für Code-Switching

Dieses Projekt hat das Ziel, die Erkennung von gemischter Gujarati-Englisch-Sprache zu verbessern.

2025-08-30T05:46:00+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte in der Sprachklassifizierung mit multimodalen Daten

Ein neues Modell kombiniert Audio und Text für eine bessere Sprachklassifikation.

2025-08-29T18:49:00+00:00 ― 7 min Lesedauer

Ton NOTSOFAR-1 Challenge: Fortschritte bei der Transkriptionstechnologie für Meetings

Eine neue Initiative zur Verbesserung der Transkriptionstechnologie für Meetings in grossen Räumen.

2025-08-29T16:23:15+00:00 ― 8 min Lesedauer

Rechnen und Sprache Fortschritte bei der Korrektur von Fehlern in der Spracherkennung

Neue Methoden verbessern die Genauigkeit bei der Erkennung von Sprache in lauten Umgebungen mit grossen Sprachmodellen.

2025-08-29T01:48:45+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Herausforderung der Sprachtechnologie für unterversorgte Sprachen anpacken

Dieser Artikel bespricht Lösungen für Sprach-Anwendungen in Sprachen mit begrenzten transkribierten Daten.

2025-08-28T18:31:30+00:00 ― 6 min Lesedauer

Rechnen und Sprache Dokumentation bedrohter Sprachen mit IGT

Eine neue Methode unterstützt die Erhaltung von bedrohten Sprachen durch detaillierte Dokumentation.

2025-08-27T17:35:42+00:00 ― 8 min Lesedauer

Audio- und Sprachverarbeitung Neue Methode zur Beseitigung von Echo-Sprachübertragungen

Eine Methode verbessert die Sprachklarheit in lauten Umgebungen, ohne dass klare Trainingsdaten vorhanden sind.

2025-08-26T17:56:30+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Spracherkennung für ressourcenschwache Sprachen

Neue Methoden verbessern ASR für unterrepräsentierte Sprachen, indem sie Daten aus ähnlichen Sprachen nutzen.

2025-08-26T10:39:15+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Wiedergeboren: Eine neue Ära im unüberwachten ASR

Reborn bietet innovative Lösungen für automatische Spracherkennung ohne beschriftete Daten.

2025-08-25T19:16:10+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte in der Spracherkennungstechnologie

Ein Blick auf neue Modelle für natürliche gesprochene Antworten.

2025-08-25T03:04:30+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Sprecherdiarisierung mit Mehrmikrofonansätzen

Neue Methoden verbessern die Erkennung von Sprachaktivität und Überlappungen beim Speaker Diarization.

2025-08-24T13:18:35+00:00 ― 7 min Lesedauer

Signalverarbeitung Chirp MFCC: Ein neuer Ansatz in der Audiobearbeitung

Chirp MFCC verbessert die Audio-Signalrepräsentation für eine bessere Klassifizierung und Erkennung.

2025-08-23T08:58:10+00:00 ― 4 min Lesedauer

Rechnen und Sprache Kallaama-Projekt: Brücke zwischen Sprache und Technologie in der Landwirtschaft

Kallaama erstellt ein Sprachdataset in lokalen Sprachen, um senegalesischen Bauern zu helfen.

2025-08-23T02:43:54+00:00 ― 5 min Lesedauer

Rechnen und Sprache Sprachmodelle durch Sprachstile voranbringen

Ein neues Framework verbessert Sprachmodelle, indem es verschiedene Sprechstile erkennt und darauf reagiert.

2025-08-23T00:03:45+00:00 ― 8 min Lesedauer

Audio- und Sprachverarbeitung Die Verbesserung der Sprachverifizierung für Kinder

ASV-Systeme verbessern, um die Stimmen von Kindern genau zu erkennen.

2025-08-22T09:29:15+00:00 ― 9 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Schätzung von Raummaterialien Eigenschaften

Die Forschung hebt neue Modelle für bessere Audioqualität in verschiedenen Umgebungen hervor.

2025-08-22T03:00:35+00:00 ― 7 min Lesedauer

Ton Fortschritte bei automatischen Sprecherdiarisierungstechniken

Die Forschung zeigt, dass das Timing wichtiger ist als bestimmte Merkmale der Sprecher in Diarisierungsmodellen.

2025-08-21T00:17:20+00:00 ― 6 min Lesedauer

Mensch-Computer-Interaktion Fortschritte bei stillen Sprachschnittstellen

Ein Blick auf MONA, ein System, das die stille Sprachkommunikation verbessert.

2025-08-20T16:11:30+00:00 ― 5 min Lesedauer

Robotik Verbesserung der Spracherkennung von Robotern in lauten Umgebungen

Die Forschung konzentriert sich darauf, Robotern zu helfen, Sprache besser zu verstehen, auch wenn Hintergrundgeräusche da sind.

2025-08-19T22:22:40+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Bewertung der Spracherkennung in lauten Umgebungen

Ein neuer Benchmark bewertet die Leistung von Spracherkennungssystemen unter verschiedenen Störungen.

2025-08-19T14:16:50+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei Cochlea-Implantaten mit KI-Technologien

KI verbessert Cochlea-Implantate für besseres Hören und Kommunizieren in schwierigen Umgebungen.

2025-08-17T13:41:50+00:00 ― 7 min Lesedauer

Ton Neuer Ansatz zur Audio-Trennung mit Sprache

Diese Methode verbessert die Audio-Trennung, indem sie Sprachbeschreibungen mit Klanganalysen kombiniert.

2025-08-13T14:57:35+00:00 ― 6 min Lesedauer

Ton Innovative Sprachanalyse zur frühen Erkennung von Parkinson

Forschung zeigt, dass Sprachanalysen vielversprechend sind, um Parkinson frühzeitig zu erkennen.

2025-08-09T16:24:42+00:00 ― 5 min Lesedauer