Neuste Artikel für Sprachtechnologie

Ton Fortschritte bei Sprachgegenmassnahmesystemen

Forscher verbessern die Erkennung von maschinell erzeugter Sprache durch Anpassungen der Phaseninformation.

2025-10-26T17:55:10+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der unüberwachten Spracherkennung

Ein neues Framework verbessert das Studium von unüberwachten Spracherkennungssystemen.

2025-10-25T13:34:45+00:00 ― 7 min Lesedauer

Ton LinDiff: Ein Sprung nach vorn in der Sprachsynthese

Neues Modell LinDiff verbessert die Sprachsynthese in Geschwindigkeit und Qualität.

2025-10-25T00:37:25+00:00 ― 5 min Lesedauer

Ton Innovative Fortschritte in der elektrolaryngealen Sprachtechnologie

Forscher mixen visuelle und akustische Merkmale, um die Sprache für Benutzer von Elektrolarynx zu verbessern.

2025-10-24T12:28:40+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Spracherkennung mit grossen Sprachmodellen verbessern

Diese Forschung zeigt, wie LLMs das Sprachverständnis in langen Videos verbessern.

2025-10-23T22:42:45+00:00 ― 4 min Lesedauer

Audio- und Sprachverarbeitung Effizientes Management von grossen Sprachmodellen

Eine neue Methode optimiert Sprachmodelle für bessere Leistung mit weniger Ressourcen.

2025-10-23T21:54:10+00:00 ― 6 min Lesedauer

Maschinelles Lernen EM-Netzwerk: Ein neuer Ansatz im Sequenzlernen

EM-Netzwerk verbessert das Sequenzlernen in Sprach- und Sprachverarbeitungsaufgaben.

2025-10-23T07:19:40+00:00 ― 5 min Lesedauer

Ton Bewertung der Sprachqualität mit Machine-Learning-Modellen

Diese Studie bewertet verschiedene Modelle zur Vorhersage der Qualität synthetischer Sprache.

2025-10-21T16:27:40+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Sprachrecognition verbessern durch vertrauensbasierte Ensembles

In diesem Artikel geht's darum, wie man die Spracherkennung mit vertrauensbasierten Ensemble-Methoden verbessern kann.

2025-10-16T18:14:30+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortgeschrittener Text-to-Speech: GenerTTS Modell erklärt

GenerTTS verbessert die Text-in-Sprache-Technologie für mehrsprachige Anwendungen.

2025-10-16T15:48:45+00:00 ― 5 min Lesedauer

Ton Fortschritte in der Sprachisolierungstechnologie

Ein neues Modell verbessert die Sprachentnahme aus lauten Hintergründen mit Hilfe von Deep Learning.

2025-10-16T02:02:50+00:00 ― 5 min Lesedauer

Ton Fortschritte in der artikulatorischen Sprachsynthese

Eine Studie zur Verbesserung der Stimmwiedergabe durch fortschrittliche Synthesetechniken.

2025-10-11T02:12:30+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei Techniken zur Sprecheranonymisierung

Neue Methoden zielen darauf ab, die Identität der Sprecher zu verbergen und dabei die Sprachklarheit zu erhalten.

2025-10-08T01:20:00+00:00 ― 6 min Lesedauer

Ton Fortschritte bei der Sprachverbesserung mit spiking neuronalen Netzen

Eine neue Methode zur Verbesserung der Sprachqualität mit energieeffizienten Netzwerken.

2025-10-03T21:44:15+00:00 ― 5 min Lesedauer

Künstliche Intelligenz Emotionen im Sprechen messen: Ein neuer Ansatz

Forscher untersuchen, wie Emotionen durch Sprache geteilt werden, indem sie verschiedene Daten nutzen.

2025-10-03T09:07:42+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte in der Text-zu-Sprache-Technologie

Neue Methoden verbessern die Qualität der synthetischen Sprache durch selbstüberwachtes Lernen.

2025-09-30T17:37:25+00:00 ― 5 min Lesedauer

Ton Spracherkennung mit föderiertem Lernen voranbringen

Federated Learning verbessert die Spracherkennung und schützt dabei die Nutzerdaten.

2025-09-30T08:43:00+00:00 ― 6 min Lesedauer

Rechnen und Sprache EmoDistill: Fortschritte bei der Spracherkennung von Emotionen

Eine neue Methode verbessert die Emotionserkennung aus Sprache nur mit Audio.

2025-09-28T23:55:36+00:00 ― 5 min Lesedauer

Maschinelles Lernen O-1: Eine neue Grenze im Training für Sprachrecognition

O-1 verbessert die Spracherkennung, indem es Selbstlernmethoden optimiert.

2025-09-26T09:10:10+00:00 ― 5 min Lesedauer

Ton Neue Studie zur Erkennung von KI-generierter Sprache

Forschung hebt Methoden zur Echtzeit-Erkennung von gefälschten Audios, die von KI erstellt wurden, hervor.

2025-09-21T19:02:50+00:00 ― 6 min Lesedauer

Ton Die Verbesserung der Sprachsynthese mit Pruning-Techniken

Neue Schnittmethoden verbessern die Leistung von Zero-Shot Multi-Speaker Text-to-Speech-Modellen.

2025-09-20T15:31:00+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte im selbstüberwachten Lernen für Spracherkennung

Neue Methoden zur Auswahl von Sprachdaten minimieren das Labeln und verbessern gleichzeitig die Erkennungsgenauigkeit.

2025-09-20T13:53:50+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Sprachqualitätsbewertung mit Präferenzpunkten

Eine neue Methode verbessert die Sprachqualitätsbewertung mithilfe von Hörervorliebe-Punkten.

2025-09-20T07:25:10+00:00 ― 5 min Lesedauer

Ton Die Verbesserung der Spracherkennung für Stotterer

Eine Methode, um ASR-Systeme für Nutzer mit Stottern zu verbessern.

2025-09-20T06:36:35+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte im Formanten-Tracking für Sprachverarbeitung

Neue Ein-Schritt-Methoden verbessern die Genauigkeit bei der Formantenverfolgung für Sprachlaute.

2025-09-19T02:16:10+00:00 ― 4 min Lesedauer

Rechnen und Sprache Sprache mit Sprachmodellen verbinden: Die BLSP-Methode

Ein neuer Ansatz verbessert die Integration von Sprache mit Sprachmodellen.

2025-09-18T15:44:35+00:00 ― 7 min Lesedauer

Rechnen und Sprache Die Rolle von vortrainierten Sprachmodellen in TTS

Untersuchen, wie vortrainierte Sprachmodelle die Qualität von Text-zu-Sprache verbessern.

2025-09-17T20:18:35+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung MuLanTTS: Eine neue Grenze im Text-zu-Sprache

Microsofts MuLanTTS bietet natürliche und ausdrucksstarke Text-zu-Sprache-Funktionen für Französisch.

2025-09-15T22:57:55+00:00 ― 5 min Lesedauer

Rechnen und Sprache Fortschritte im Selbstüberwachten Lernen für französische Sprachtechnologien

Ein Projekt zielt darauf ab, die Verarbeitung von französischer Sprache mit selbstüberwachtem Lernen zu verbessern.

2025-09-14T12:57:25+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der automatischen Prosodie-Annotation

Neue Methoden verbessern, wie Maschinen Sprachrhythmus und Emotionen erkennen.

2025-09-14T12:08:50+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Spracherkennung für Kinder

Diese Studie verbessert die Fähigkeit von ASR-Systemen, die Sprache von Kindern zu erkennen.

2025-09-14T02:25:50+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung VoxtLM: Ein einheitlicher Ansatz für Sprache und Text

VoxtLM kombiniert Spracherkennung, Synthese, Textgenerierung und Fortsetzung in einem Model.

2025-09-13T11:02:45+00:00 ― 4 min Lesedauer

Audio- und Sprachverarbeitung Libriheavy: Ein neuer Datensatz für Spracherkennung

Libriheavy bietet 50.000 Stunden gesprochenes Englisch an, um die Spracherkennungstechnologie zu verbessern.

2025-09-12T18:51:05+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Sprachklarheit mit AV2Wav-Technologie verbessern

AV2Wav verbessert die Sprachqualität mit Audio- und visuellen Hinweisen.

2025-09-12T17:13:55+00:00 ― 5 min Lesedauer

Ton Text-to-Speech mit Core-Set-Auswahl optimieren

Die Auswahl von Kern-Sets verbessert Text-to-Speech-Modelle, indem sie sich auf vielfältige Daten konzentriert.

2025-09-12T08:19:30+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Emo-StarGAN: Fortschritt in der Sprachumwandlungstechnologie

Neue Methode bewahrt den emotionalen Ton in der Sprachumwandlung für eine bessere Interaktion zwischen Mensch und Computer.

2025-09-11T23:25:05+00:00 ― 6 min Lesedauer

Ton Emotionale Rede stellt Herausforderungen für Sprachtrennungsmodelle dar

Forschung zeigt, dass emotionale Sprache die Leistung von Modellen bei Sprachtrennungsaufgaben beeinflusst.

2025-09-11T18:33:35+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Spracherkennung verbessern durch selbstüberwachtes Lernen

Die Forschung kombiniert selbstüberwachtes Lernen und neue Messtechniken für verbesserte Sprachinvertierung.

2025-09-10T01:15:50+00:00 ― 6 min Lesedauer

Ton Die Klarheit der elektrolaryngealen Sprache verbessern

Forscher entwickeln einen neuen Ansatz, um die Sprachverständlichkeit für Benutzer von Elektrolarynges zu verbessern.

2025-09-09T22:50:05+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung von ASR-Systemen mit synthetischen Daten

Eine neue Methode nutzt synthetische Daten, um ASR-Systeme in unbekannten Bereichen zu verbessern.

2025-09-09T15:32:50+00:00 ― 7 min Lesedauer