Haizhou Li

Rechnen und Sprache Die Erkennung von KI-Einfluss in akademischem Schreiben

Ein neuer Datensatz hilft dabei, KI-bearbeitete Texte in akademischen Abstracts zu identifizieren.

2025-10-17T10:11:42+00:00 ― 6 min Lesedauer

Rechnen und Sprache GrammarGPT: Verbesserung der grammatikalischen Fehlerkorrektur im Chinesischen

Ein Open-Source-Modell, das darauf abzielt, grammatikalische Fehler im nativen Chinesisch zu beheben.

2025-10-16T03:38:54+00:00 ― 5 min Lesedauer

Rechnen und Sprache Einführung des umfassenden medizinischen Benchmarks für LLMs in China

Ein neuer Massstab zur Bewertung von Sprachmodellen in chinesischen medizinischen Kontexten.

2025-10-07T18:51:24+00:00 ― 10 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei akustischen Wortembeddings

Ein neues Modell verbessert, wie Computer gesprochene Sprache verarbeiten.

2025-10-07T04:16:50+00:00 ― 4 min Lesedauer

Rechnen und Sprache Nutzung von ganzheitlichen, kommunikativen Empfehlungssystemen

Ein Blick auf konversationelle Empfehlungen, die echte Dialoge für bessere Vorschläge nutzen.

2025-09-26T18:12:24+00:00 ― 6 min Lesedauer

Künstliche Intelligenz Fortschritte in der Emotionserkennungs-Text-in-Sprache-Technologie

Das neue Modell EmoPP verbessert die Sprache mit emotionalen Hinweisen.

2025-09-24T07:13:12+00:00 ― 5 min Lesedauer

Rechnen und Sprache AceGPT: Sprache und Kultur für Arabischsprechende verbinden

AceGPT verbessert die arabische Sprachverarbeitung, die auf lokale Kultur und Werte zugeschnitten ist.

2025-09-23T18:42:42+00:00 ― 5 min Lesedauer

Ton Neues System verbessert Sprachausgabe bei instabilen Kopfpositionen

PIAVE hilft Maschinen, Stimmen klar zu erfassen, selbst wenn die Sprecher den Kopf drehen.

2025-09-12T19:39:40+00:00 ― 6 min Lesedauer

Ton Fortschritte in der textbasierten Sprachbearbeitung

FluentEditor verbessert die Audio-Bearbeitung, indem es sich auf natürlichen Fluss und Konsistenz konzentriert.

2025-09-07T20:37:55+00:00 ― 4 min Lesedauer

Neuronales und evolutionäres Rechnen Fortschritte beim Training von Spiking Neural Networks

Neue Lernmethoden verbessern die Effizienz und Genauigkeit von spikenden neuronalen Netzwerken.

2025-09-03T02:03:54+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der multimodalen Verarbeitung mit CoAVT

CoAVT integriert Audio-, Visual- und Textdaten für ein besseres Verständnis.

2025-08-28T12:02:50+00:00 ― 8 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Technologie zur aktiven Sprechererkennung

Neue Methoden verbessern die audio-visuelle Sprechererkennung in schwierigen Umgebungen.

2025-08-14T01:29:10+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der audio-visuellen Sprecherextraktion mit SEANet

SEANet verbessert die Sprechertrennung, indem es das Geräusch in der Audiobearbeitung reduziert.

2025-08-08T20:47:20+00:00 ― 7 min Lesedauer

Rechnen und Sprache Bewertung von NLG-Evaluation mit dem AdvEval-Rahmenwerk

AdvEval zeigt Schwächen in den Bewertungsmetriken für die natürliche Sprachgenerierung auf.

2025-08-08T07:29:42+00:00 ― 6 min Lesedauer

Rechnen und Sprache Dialogsysteme durch wechselseitiges Lernen verbessern

Ein neuer Ansatz verbessert Dialogsysteme, indem er Themen- und rhetorische Strukturen kombiniert.

2025-08-04T06:19:30+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Sprachsynthese mit ARDiT

Das neue Modell ARDiT verbessert die Text-zu-Sprache-Synthese und die Sprachbearbeitung.

2025-07-31T07:55:45+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Zielsprachendiarisierungstechnologie

Ein Blick auf neue Methoden zum Verständnis von überlappender Sprache während Gesprächen.

2025-07-30T14:06:55+00:00 ― 8 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der sprachübergreifenden Sprachumwandlung

Eine neue Methode verbessert die Sprachumwandlung zwischen Sprachen, während die Eigenschaften des Sprechers erhalten bleiben.

2025-07-27T15:40:10+00:00 ― 4 min Lesedauer

Rechnen und Sprache Die Bedeutung der Datenauswahl in Sprachmodellen

Eine Überprüfung, wie die Datenauswahl die Leistung von Sprachmodellen verbessert.

2025-07-26T03:06:00+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Gesicht- und Spracherkennungstechnologie

Ein neues System verbessert die Verbindung zwischen Gesichtern und Stimmen, besonders in lauten Umgebungen.

2025-07-10T17:11:20+00:00 ― 5 min Lesedauer

Ton Fortschritte bei der Schallquellenlokalisierung durch inkrementelles Lernen

Eine neue Methode verbessert die Genauigkeit der Schalllokalisation und sorgt gleichzeitig für Datensicherheit.

2025-06-14T07:59:10+00:00 ― 4 min Lesedauer

Ton Fortschritte bei Akzentumwandlungstechniken

Eine neue Methode zur Erzeugung von akzentuierter Sprache durch Texttransliteration.

2025-06-11T06:18:05+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung E1 TTS: Eine neue Ära in der Text-zu-Sprache-Technologie

E1 TTS verwandelt Text schneller und effizienter in natürliche Sprache.

2025-06-11T05:29:30+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Matryoshka-Speaker-Embeddings: Ein flexibler Ansatz zur Spracherkennung

Entdecke, wie Matryoshka-Embeddings die Effizienz und Flexibilität der Sprechererkennung verbessern.

2025-06-02T20:40:50+00:00 ― 5 min Lesedauer

Ton Fortschrittliche Multi-Audio-Verarbeitung mit MALLM

Ein neues Modell und Benchmark zur Bewertung von Multi-Audio-Aufgaben vorstellen.

2025-05-31T19:17:15+00:00 ― 6 min Lesedauer

Ton Visuelle Hinweise nutzen, um Sprache im Lärm klarer zu machen

Neue Methode verbessert die Sprachverständlichkeit durch visuelle Informationen aus der Umgebung.

2025-05-18T20:42:14+00:00 ― 5 min Lesedauer

Ton Emotion in Maschinen bringen: Die Zukunft von TTS

Entdeck, wie emotionale TTS die Kommunikation mit Maschinen verändert und sie dadurch sympathischer macht.

2025-02-23T02:25:48+00:00 ― 6 min Lesedauer