Neuste Artikel für Spracherkennung

Rechnen und Sprache Neue Methoden in der Verarbeitung gesprochener Sprache

Forscher suchen nach textlosen Ansätzen, um gesprochene Sprache besser zu verstehen.

2025-07-13T18:11:30+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei Sprachverbesserungstechniken

Ein neues Modell verbessert die Sprachklarheit, indem es Geräusche und Echos gezielt angeht.

2025-07-12T15:20:35+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Fortschritte in der sprachbasierten medizinischen Bildanalyse

Ein neuer Datensatz unterstützt das Gesundheitswesen mit sprachbasierten Fragen zu medizinischen Bildern.

2025-07-12T04:00:30+00:00 ― 7 min Lesedauer

Rechnen und Sprache Optimierung der ASR-Fehlerkorrektur mit Sprachmodellen

Eine Studie zur Verbesserung der Transkriptionsgenauigkeit durch verbessertes Prompt-Design.

2025-07-11T15:03:05+00:00 ― 6 min Lesedauer

Ton Verbesserung der Spracherkennung von Emotionen in lauten Umgebungen

Ein neuer Ansatz verbessert SER-Systeme durch die Nutzung von Geräuschumgebungsbeschreibungen.

2025-07-11T06:08:40+00:00 ― 6 min Lesedauer

Ton Innovativer Ansatz zur Ausbildung von Sprachassistenten

Die Kombination von TTS und echten Daten verbessert Spracherkennungssysteme effektiv.

2025-07-10T00:59:40+00:00 ― 4 min Lesedauer

Ton Fortschritte bei stillen Sprachschnittstellen

Neue Methode verbessert die Umwandlung von stiller Sprache in verständliche Audios.

2025-07-09T22:33:55+00:00 ― 5 min Lesedauer

Ton Fortschritte bei Techniken zur audio-visuellen Sprachtrennung

Eine neue Methode verbessert die Sprachtrennung in lauten Umgebungen mit mehreren Sprechern.

2025-07-09T16:53:50+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Eine neue Methode zur Messung der Klangbedeutung

Diese Studie stellt eine Methode vor, um die Bedeutung von Klangsignalen zu bewerten.

2025-07-09T16:05:15+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung von Technologien zur Erkennung von geflüsterten Sprache

Neue Methoden sollen die Erkennung von geflüsterten Sprachäusserungen in automatischen Systemen verbessern.

2025-07-08T08:30:30+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Spracherkennung mit KI- Zusammenarbeit verbessern

KI-Modelle verbessern die Genauigkeit von Sprach-zu-Text-Umwandlungen.

2025-07-07T09:50:10+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Privatsphäre und Nutzen im Gesprächsanalyse ausbalancieren

Techniken untersuchen, um die Privatsphäre zu schützen, während aufgezeichnete Gespräche analysiert werden.

2025-07-07T04:10:05+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung SynesLM: Fortschritt in der audio-visuellen Sprachtechnologie

Ein neues Modell integriert Audio- und Visualdaten für Spracherkennung und Übersetzung.

2025-07-06T20:04:15+00:00 ― 6 min Lesedauer

Ton Herausforderungen bei der Akzent-Erkennung in der Sprachtechnologie angehen

Neue Methoden verbessern die Genauigkeit der Spracherkennung für verschiedene Akzente.

2025-07-05T05:12:15+00:00 ― 5 min Lesedauer

Rechnen und Sprache Neues Framework verwandelt Sprache in Wissensgraphen

Wav2graph erstellt Wissensgraphen aus gesprochener Sprache, um das Verständnis von KI zu verbessern.

2025-07-04T04:06:10+00:00 ― 7 min Lesedauer

Ton Wir stellen vor: MulliVC – das nächste geniale Sprachkonvertierungssystem!

MulliVC verwandelt Stimmen über Sprachen hinweg mit beeindruckender Genauigkeit und Klarheit.

2025-07-03T11:54:30+00:00 ― 6 min Lesedauer

Robotik Roboter lernen, menschliche Emotionen zu lesen

Neues Roboternavigationssystem versteht gesprochene Befehle durch Emotionen.

2025-07-02T20:42:06+00:00 ― 7 min Lesedauer

Rechnen und Sprache Neues Modell TOGGL verbessert Sprachtranskription

Das TOGGL-Modell verbessert die Transkriptionsgenauigkeit bei Situationen mit überlappendem Sprechen.

2025-07-02T03:31:10+00:00 ― 6 min Lesedauer

Rechnen und Sprache Verbesserung der Spracherkennung durch Kontextgeräuscherkennung Lernen

Eine Methode zur Verbesserung der Spracherkennung in lauten Umgebungen.

2025-07-01T23:28:15+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Sprachtechnologie mit SaSLaW

Forscher entwickeln SaSLaW, um die Sprachadaptation von Maschinen in verschiedenen Umgebungen zu verbessern.

2025-07-01T16:11:00+00:00 ― 5 min Lesedauer

Rechnen und Sprache Vorurteile in Sprachmodellen bewerten

Ein neuer Datensatz hebt Vorurteile in Sprachmodellen basierend auf Geschlecht und Alter hervor.

2025-06-30T19:07:50+00:00 ― 8 min Lesedauer

Rechnen und Sprache Fortschritte bei Sprachmodellen durch Pruning-Techniken

Forschung zeigt, wie man Sprachmodelle kleiner und effizienter machen kann.

2025-06-29T16:24:35+00:00 ― 6 min Lesedauer

Ton Verbesserung der Schlüsselworterkennung durch adversariales Training

Feindliches Training verbessert die Genauigkeit der Schlüsselworterkennung in synthetischer und echter Sprache.

2025-06-28T13:41:20+00:00 ― 5 min Lesedauer

Rechnen und Sprache Evaluierung von Sprachemotionserkennungsmodellen mit neuem Benchmark

Ein neuer Massstab verbessert die Bewertung von Sprachemotionserkennungssystemen über Sprachen und Emotionen hinweg.

2025-06-28T04:15:30+00:00 ― 6 min Lesedauer

Rechnen und Sprache Verbesserung der mehrsprachigen Spracherkennung ohne Originaldaten

Neue Methoden verbessern ASR-Modelle für mehrere Sprachen und bewahren das vorhandene Wissen.

2025-06-27T15:01:00+00:00 ― 6 min Lesedauer

Rechnen und Sprache Verbesserung der zweisprachigen Spracherkennung mit XCB

Ein neuer Ansatz verbessert die Erkennung von Code-Switching-Phrasen in zweisprachiger Sprache.

2025-06-27T11:46:40+00:00 ― 6 min Lesedauer

Maschinelles Lernen Fortschritte in der Sequenzverarbeitung mit MRConv

Eine neue Methode, um lange Datensequenzen besser zu verarbeiten.

2025-06-26T07:21:36+00:00 ― 5 min Lesedauer

Rechnen und Sprache Die Rolle von Prosodie und Pragmatik in der Sprachtechnologie

Untersuchen, wie Sprachmuster Bedeutung und Technologieleistung beeinflussen.

2025-06-25T21:43:15+00:00 ― 5 min Lesedauer

Ton Herausforderungen bei der Erkennung von teilweise gefälschten Sprachsignalen

Ein Blick auf die Komplexität, gemischte Audiospuren zu identifizieren.

2025-06-25T06:20:10+00:00 ― 6 min Lesedauer

Rechnen und Sprache O-HuBERT: Ein Schritt nach vorn in der Spracherkennung

O-HuBERT verbessert die Spracherkennung, indem es Inhalt und expressive Informationen trennt.

2025-06-24T20:04:24+00:00 ― 6 min Lesedauer

Rechnen und Sprache Verbesserung der Hindi-Spracherkennung mit Pseudo-Labeling

Eine neue Methode verbessert die Spracherkennung für Hindi mithilfe von Pseudo-Labeling-Techniken.

2025-06-24T06:02:40+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Die Erhaltung tamilscher Dialekte durch Technologie

Ein System zur Klassifizierung von literarischen und umgangssprachlichen Tamil-Dialekten anhand von Klangmerkmalen.

2025-06-23T13:51:00+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Spracherkennung verbessern: Geflüstert vs. Normal

Neue Methoden verbessern das Verständnis von geflüstertem und normalem Sprache durch Computer.

2025-06-23T08:59:30+00:00 ― 5 min Lesedauer

Maschinelles Lernen Verstehen von Micro-Batch Clipping im Machine Learning

Ein Blick auf Micro-Batch Clipping und seine Vorteile fürs Modelltraining.

2025-06-23T05:45:10+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Japanischen Spracherkennung mit GER-Techniken

Forschung zeigt, wie LLMs die automatische Spracherkennung in der japanischen Sprache verbessern.

2025-06-23T04:08:00+00:00 ― 6 min Lesedauer

Rechnen und Sprache Wie Sprachmodelle Suprasegmentale lernen

Dieser Artikel untersucht, wie Modelle Ton, Betonung und Tonhöhenakzente erkennen.

2025-06-22T21:19:54+00:00 ― 5 min Lesedauer

Rechnen und Sprache Einführung von SALSA: Eine neue Methode zur Verbesserung der Spracherkennung

SALSA verbessert die Spracherkennung für Sprachen mit wenig Ressourcen, indem es ASR- und Sprachmodelle integriert.

2025-06-22T06:16:15+00:00 ― 6 min Lesedauer

Rechnen und Sprache Verbesserung der automatischen Spracherkennung mit Sprachmodellen

Neue Methode verbessert die ASR-Genauigkeit mit Sprachmodellen für bessere Transkriptionen.

2025-06-21T20:33:15+00:00 ― 4 min Lesedauer

Rechnen und Sprache Verbesserung der Genauigkeit von Sprecher-Tags in Gesprächen

Ein neues System korrigiert Fehler bei der Sprechererkennung für klarere Gesprächsprotokolle.

2025-06-21T18:56:05+00:00 ― 8 min Lesedauer

Ton Fortschritte bei Sprachverbesserungstechniken

Sprachverständlichkeit verbessern mit hybriden Filterbänken und neuronalen Netzen.

2025-06-21T17:18:55+00:00 ― 5 min Lesedauer