Neuste Artikel für Sprachtechnologie

Ton Verbesserung der Stottererkennung mit MMSD-Net

Ein neues Verfahren verbessert die Stottererkennung, indem es Audio-, Video- und Textdaten kombiniert.

2025-07-15T07:18:40+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Spracherkennung für die polnische Sprache

Die Forschung präsentiert neue Methoden zur Bewertung von Spracherkennungssystemen in Polnisch.

2025-07-14T16:44:10+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung MSceneSpeech: Fortschritte in der Mandarin-Sprachsynthese

Ein neues Dataset verbessert die maschinelle Sprachverarbeitung für Mandarin und zielt auf natürliche Ausdrucksweise ab.

2025-07-14T09:26:55+00:00 ― 6 min Lesedauer

Ton Der Aufstieg der Sprachbearbeitung in digitalen Medien

Entdeck die wachsende Bedeutung von Sprachnachbearbeitung für Content Creator.

2025-07-11T00:28:35+00:00 ― 5 min Lesedauer

Rechnen und Sprache Fortschritte bei der Spracherkennung für ressourcenarme Sprachen

Neue Methoden verbessern Sprachsysteme für unterrepräsentierte Sprachen.

2025-07-10T04:14:00+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Spracherkennungstechnologie

Forschung kombiniert Sprachverbesserung und Transferlernen für bessere Anti-Spoofing-Systeme.

2025-07-08T23:53:35+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der emotionalen Sprachgenerierung

Neue Methoden verbessern den emotionalen Ausdruck in der Sprachsynthese von Maschinen.

2025-07-05T22:12:30+00:00 ― 7 min Lesedauer

Rechnen und Sprache Einführung von Speech-MASSIVE: Ein neuer Datensatz für mehrsprachiges Verständnis gesprochener Sprache

Speech-MASSIVE hat das Ziel, das Verständnis gesprochener Sprache in verschiedenen Sprachen zu verbessern.

2025-07-04T01:40:25+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Sicherstellung der Sprachdatenprivatsphäre mit neuen Methoden

Innovative Techniken schützen sensible Sprachdaten und sorgen gleichzeitig für eine genaue Verarbeitung.

2025-07-04T00:51:50+00:00 ― 7 min Lesedauer

Mensch-Computer-Interaktion OpenOmni: Fortschritt bei multimodalen Konversationsagenten

OpenOmni entwickelt flexible Werkzeuge zum Erstellen und Testen von Gesprächsagenten.

2025-07-01T09:40:42+00:00 ― 8 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Text-zu-Sprache-Technologie mit SSL-TTS

SSL-TTS macht die Sprachsynthese einfacher, indem es mit wenig Trainingsdaten hochwertige Ergebnisse erzielt.

2025-06-27T15:49:35+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Technologie zur Erkennung von geflüsteter Sprache

Neue Methoden verbessern die Spracherkennung für geflüsterte Kommunikation.

2025-06-25T05:31:35+00:00 ― 6 min Lesedauer

Ton StyleSpeech: Die Zukunft der Text-to-Speech-Technologie

StyleSpeech verbessert TTS-Systeme, indem es natürliche Sprachnuancen einfängt.

2025-06-24T14:08:30+00:00 ― 6 min Lesedauer

Ton EmoAttack: Eine neue Bedrohung in der Sprachtechnologie

EmoAttack nutzt emotionale Sprachumwandlung, um Schwachstellen in Sprachsystemen auszunutzen.

2025-06-24T01:59:45+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritt bei der Umwandlung von geflüsterten Sprachäusserungen mit MaskCycleGAN

Eine neue Methode verbessert die Umwandlung von geflüstertem Gesprochenem in normale Sprache mit fortschrittlichen Techniken.

2025-06-23T09:48:05+00:00 ― 5 min Lesedauer

Ton VoxInstruct: Eine neue Art, Sprache zu erzeugen

VoxInstruct kombiniert Inhalte und Stil für eine natürlichere Sprachgeneration.

2025-06-22T23:16:30+00:00 ― 5 min Lesedauer

Ton Fortschritte bei der Sprecherverifikation mit Whisper

Eine neue Methode verbessert die Spracherkennungsgenauigkeit in mehreren Sprachen.

2025-06-22T18:25:00+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Sprachverbesserung mit Zeit-Kontext-Fensterung

Eine neue Methode zur Verbesserung der Sprachqualität mit zeitbasiertem Fensteransatz erkunden.

2025-06-22T17:36:25+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Text-zu-Sprache-Technologie

Neue Methoden verbessern die Qualität der Sprachsynthese in TTS-Systemen.

2025-06-22T05:27:40+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Einführung von SelectTTS: Eine vereinfachte Text-zu-Sprache-Methode

SelectTTS vereinfacht die Sprachsynthese für unbekannte Sprecher mit effektiver Rahmenauswahl.

2025-06-21T18:07:30+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte im Selbstüberwachten Lernen für Sprachverarbeitung

Eine neue Methode verbessert die Leistung von Sprachmodellen bei verschiedenen Aufgaben.

2025-06-21T02:44:25+00:00 ― 7 min Lesedauer

Ton Fortschritte beim Erkennen von Keywords mit unlabeled Daten

Eine neue Methode verbessert die Genauigkeit der Keyword-Erkennung mit unmarkierten Audiodaten.

2025-06-21T01:55:50+00:00 ― 7 min Lesedauer

Neuronen und Kognition Automatische Erkennung von leichten kognitiven Beeinträchtigungen durch Sprachanalyse

Forschungen zeigen, dass Sprachanalysen bei der frühzeitigen Erkennung von leichter kognitiver Beeinträchtigung helfen können.

2025-06-21T01:11:33+00:00 ― 6 min Lesedauer

Ton Neuer Datensatz verbessert die Spracherkennungstechnologie

Forscher haben LibriheavyMix entwickelt, um die Spracherkennung in lauten Umgebungen zu verbessern.

2025-06-20T22:41:30+00:00 ― 5 min Lesedauer

Rechnen und Sprache Fortschritte in der Sprachtokenisierung: Ein Rahmen zur Bewertung

Ein neuer Massstab hilft dabei, Sprach-Tokenizer für bessere Leistung zu bewerten.

2025-06-20T00:01:10+00:00 ― 6 min Lesedauer

Rechnen und Sprache Gesprächsdaten zur Autismusdiagnose nutzen

Eine neue Methode nutzt Sprachdaten, um Autismusbewertungen zu verbessern.

2025-06-19T19:12:12+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Sprachsynthese mit DDSP

Entdeck, wie DDSP die Effizienz und Qualität der Spracherzeugung verbessert.

2025-06-18T17:15:00+00:00 ― 6 min Lesedauer

Rechnen und Sprache Herausforderungen bei der Sprechererkennung für Sprachmodelle

Speech-LLMs zeigen Potenzial, haben aber Schwierigkeiten mit der Sprecheridentifikation in Gesprächen.

2025-06-17T08:03:05+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Effizientes Training von Sprachmodellen mit begrenzten Ressourcen

In diesem Artikel geht's um effektive Trainingsmethoden für Sprachmodelle mit selbstüberwachtem Lernen.

2025-06-16T15:02:50+00:00 ― 5 min Lesedauer

Rechnen und Sprache Verbesserung von Sprachsystemen für indische Sprachen

Ein neuer Datensatz verbessert die mehrsprachige Sprachtechnologie in Indien.

2025-06-15T18:48:15+00:00 ― 6 min Lesedauer

Ton Fortschritte in der emotionalen Text-to-Speech-Technologie

ParaEVITS verbessert den emotionalen Ausdruck in TTS durch natürliche Sprachführung.

2025-06-15T05:50:55+00:00 ― 5 min Lesedauer

Rechnen und Sprache Fortschritte bei der Spracherkennung für die Faetar-Sprache

Bemühungen, die Sprachtechnologie für die unterversorgte Faetar-Sprache zu verbessern.

2025-06-13T09:18:50+00:00 ― 6 min Lesedauer

Rechnen und Sprache WhisperNER: Spracherkennung und Entitätserkennung zusammenbringen

Ein neues Modell kombiniert Spracherkennung und Entitätserkennung für bessere Ergebnisse.

2025-06-13T03:29:30+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Spracherkennung für Menschen mit Störungen

Ein Projekt hat das Ziel, die Sprachtechnologie für Menschen mit Kommunikationsproblemen zu verbessern.

2025-06-12T12:15:40+00:00 ― 6 min Lesedauer

Ton Akzentverbesserung in der Sprachsynthesetechnologie

Ein neues System verbessert die Akzentgenauigkeit in TTS für bessere Kommunikation.

2025-06-12T08:12:45+00:00 ― 5 min Lesedauer

Ton ESPnet-EZ: Sprachmodell-Entwicklung vereinfachen

Ein einfach zu bedienendes Tool, um Sprachmodelle ohne komplexen Code fein abzustimmen.

2025-06-11T15:12:30+00:00 ― 7 min Lesedauer

Quantenphysik Spracherkennung mit Quantencomputing vorantreiben

Eine neue Methode zur Verbesserung der Spracherkennung und gleichzeitigem Schutz der Datenprivatsphäre.

2025-06-11T07:18:42+00:00 ― 5 min Lesedauer

Ton Fortschritte bei Akzentumwandlungstechniken

Eine neue Methode zur Erzeugung von akzentuierter Sprache durch Texttransliteration.

2025-06-11T06:18:05+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Die Sprachqualität mit Wave-U-Mamba verbessern

Wave-U-Mamba verbessert die Qualität von Sprachaufnahmen, damit man klarer kommunizieren kann.

2025-06-11T04:40:55+00:00 ― 5 min Lesedauer

Ton Fortschritte in der Sprachqualitätsbewertung

Ein neues System sagt die Natürlichkeitswerte für synthetische Sprache mit innovativen Methoden voraus.

2025-06-11T03:52:20+00:00 ― 6 min Lesedauer