Ein neuer Ansatz zur Verbesserung der Identifizierung und Analyse von Musiksegmenten.

2025-09-16T23:15:25+00:00 ― 5 min Lesedauer

Ton Falsche Songs aufspüren: Ein neuer Datensatz-Ansatz

Neue Methoden entwickelt, um gefälschte Songs zu identifizieren, angesichts wachsender Bedenken.

2025-09-16T22:26:50+00:00 ― 5 min Lesedauer

Rechnen und Sprache Spracherkennung mit Cleancoder verbessern

Cleancoder verbessert ASR-Systeme, indem es Hintergrundgeräusche reduziert, um das Verständnis der Sprache klarer zu machen.

2025-09-16T21:38:15+00:00 ― 4 min Lesedauer

Computer Vision und Mustererkennung RADIO: Ein neuer Ansatz für Quasselstrippen

RADIO erstellt realistische sprechende Gesichter nur mit einem Referenzbild.

2025-09-16T16:46:45+00:00 ― 6 min Lesedauer

Rechnen und Sprache RoDia: Ein neuer Datensatz zur Identifizierung rumänischer Dialekte

RoDia liefert wichtige Audioproben zur Identifizierung rumänischer Dialekte.

2025-09-16T15:58:10+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Die Rolle von nonverbalen Signalen in der Kommunikation

Erschliessen, wie Gesten und Mimik unser Verständnis von gesprochener Sprache verbessern.

2025-09-16T08:40:55+00:00 ― 8 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Erkennung und Lokalisierung von Schallereignissen

Neue Methoden zur Geräuscherkennung und -lokalisierung mit synthetischen Daten erforschen.

2025-09-16T05:26:35+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Klangsimulationssystem für Musiker

Ein neues System hilft Musikern, Sound auf einer virtuellen Bühne zu erleben.

2025-09-16T03:00:50+00:00 ― 7 min Lesedauer

Ton Fortschritte bei der Erkennung von teilweise gefälschtem Audio

Neue Methode verbessert die Erkennung von gefälschten Audio-Segmenten in Aufnahmen.

2025-09-16T01:23:40+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Musiktechnologie: Rhythmus und Harmonie trennen

Computer lernen, Rhythmus und Harmonie in Musik für kreative Anwendungen zu trennen.

2025-09-15T23:46:30+00:00 ― 4 min Lesedauer

Audio- und Sprachverarbeitung MuLanTTS: Eine neue Grenze im Text-zu-Sprache

Microsofts MuLanTTS bietet natürliche und ausdrucksstarke Text-zu-Sprache-Funktionen für Französisch.

2025-09-15T22:57:55+00:00 ― 5 min Lesedauer

Ton Fortschritte in der akustischen Verkehrüberwachungstechnologie

Neue Datensätze und Methoden verbessern die Fahrzeugklassifizierung für ein besseres Verkehrsmanagement.

2025-09-15T13:14:55+00:00 ― 6 min Lesedauer

Ton Fortschritte bei automatischen Spracherkennungssystemen

Neue Methoden verbessern die Genauigkeit und Geschwindigkeit in der Spracherkennungstechnologie.

2025-09-15T06:46:15+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Foley-Sound-Synthese mit Machine Learning

Ein neuer Synthesizer verbessert die Erzeugung von realistischen Soundeffekten für Medien.

2025-09-15T05:57:40+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Vertrauensschätzung in der automatischen Spracherkennung

Ein neuer Ansatz verbessert die Vertrauensschätzung in ASR-Systemen für bessere Genauigkeit.

2025-09-15T03:14:28+00:00 ― 5 min Lesedauer

Ton Fortschritte in der Sprachsynthesetechnologie

Einführung eines Rahmens für natürlichere und ausdrucksvollere Sprachsynthese.

2025-09-15T01:06:10+00:00 ― 6 min Lesedauer

Ton Musikgenres mit Technologie klassifizieren

Lern, wie Technologie dabei hilft, Musikgenres effizient zu kategorisieren.

2025-09-14T21:51:50+00:00 ― 6 min Lesedauer

Ton Neues Modell verbessert die Bewertung der Fischnahrungsaufnahme

Ein einheitlicher Ansatz zur Bewertung der Fischfütterung mit Audio- und Videodaten.

2025-09-14T21:03:15+00:00 ― 5 min Lesedauer

Ton Fortschritte in der emotionalen Talking-Head-Technologie

Eine neue Methode verbessert die Erstellung von emotional ausdrucksvollen Talking-Head-Videos.

2025-09-14T15:23:10+00:00 ― 7 min Lesedauer

Maschinelles Lernen Herausforderungen bei der Verwendung von Convnets für die Design von Audio-Filterbänken

Diese Studie untersucht Probleme bei der Verwendung von ConvNets zur Erstellung von Audio-Filterbänken.

2025-09-14T14:34:35+00:00 ― 5 min Lesedauer

Ton Fortschritte in Audio- und Sprachmodellen

Das CLAP-Modell verbindet Audio- und Textverarbeitung für verschiedene Anwendungen.

2025-09-14T13:46:00+00:00 ― 4 min Lesedauer

Rechnen und Sprache Fortschritte im Selbstüberwachten Lernen für französische Sprachtechnologien

Ein Projekt zielt darauf ab, die Verarbeitung von französischer Sprache mit selbstüberwachtem Lernen zu verbessern.

2025-09-14T12:57:25+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der automatischen Prosodie-Annotation

Neue Methoden verbessern, wie Maschinen Sprachrhythmus und Emotionen erkennen.

2025-09-14T12:08:50+00:00 ― 7 min Lesedauer

Ton Neue Methode zur Schallabschätzung in gestreuten Umgebungen

Ein neuer Ansatz verbessert die Schallabschätzung in Räumen mit streuenden Objekten.

2025-09-14T06:28:45+00:00 ― 6 min Lesedauer

Ton Die Auswirkungen von Unentscheidbarkeit auf die Musikproduktion

Untersucht, wie Unentscheidbarkeit die Musikkomposition und -produktion heute beeinflusst.

2025-09-14T05:40:10+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Sprecher-Diarisation mit Sprachmodellen

Dieser Artikel untersucht Fortschritte in der Sprecherdiarisierung mithilfe von Sprachmodellen für eine bessere Genauigkeit.

2025-09-14T03:14:25+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Spracherkennung für Kinder

Diese Studie verbessert die Fähigkeit von ASR-Systemen, die Sprache von Kindern zu erkennen.

2025-09-14T02:25:50+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Die Rolle von Audio bei der Fussgängererkennung

Forscher untersuchen Audiotechnologie zur Verbesserung der Fussgängererkennung in städtischen Gebieten.

2025-09-14T00:48:40+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Klangfeldaufnahme-Technik

Neue Methode verbessert die Lokalisierung von Klangquellen und die Trennung von Schallfeldern.

2025-09-13T20:45:45+00:00 ― 6 min Lesedauer

Ton Fortschritte bei der Synthese von perkussiven Sounds

Eine neue Methode verbessert die Synthese von Schlagzeugklängen, indem sie sich auf spitze Transientelemente konzentriert.

2025-09-13T19:57:10+00:00 ― 6 min Lesedauer

Ton Erstellung von datenschutzfreundlichen synthetischen Sprachdatensätzen

Forscher entwickeln synthetische Sprachdaten, um die Privatsphäre bei der Sprach erken nung zu schützen.

2025-09-13T15:05:40+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung VoxtLM: Ein einheitlicher Ansatz für Sprache und Text

VoxtLM kombiniert Spracherkennung, Synthese, Textgenerierung und Fortsetzung in einem Model.

2025-09-13T11:02:45+00:00 ― 4 min Lesedauer

Audio- und Sprachverarbeitung PromptASR: Spracherkennung der nächsten Generation

Neues System verbessert die Spracherkennung mit kontextbezogenen Aufforderungen.

2025-09-13T10:14:10+00:00 ― 4 min Lesedauer

Ton Fortschritte bei den Universal Audio Modellen

EnCodecMAE kombiniert selbstüberwachtes Lernen und Audio-Codecs für bessere Audio-Aufgabenleistung.

2025-09-13T09:25:35+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Autismusdiagnose durch Klang-erkennung

Eine Studie über den Einsatz von Machine Learning zur Identifizierung von Kindergeräuschen für die ASD-Beurteilung.

2025-09-13T07:48:25+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Ein neuer Ansatz zur Erkennung von Schlüsselwörtern

Eine flexible Methode zur Erkennung von Schlüsselwörtern in der Sprache über verschiedene Sprachen hinweg.

2025-09-13T06:11:15+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Bewertung der Sprachqualität in der AudioKommunikation

Ein Blick darauf, wie die Sprachqualität mit Crowdsourcing getestet wird.

2025-09-13T05:22:40+00:00 ― 5 min Lesedauer

Ton Neue Methoden zur Erkennung von KI-generiertem Audio

Fortgeschrittene Techniken zur Sicherstellung der Audioauthentizität im Zeitalter des Stimmenklonens.

2025-09-13T03:40:24+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte im Audio-Captioning mit nur Text-Training

Eine neue Methode trainiert Audio-Untertitelungssysteme nur mit Textbeschreibungen.

2025-09-13T02:56:55+00:00 ― 7 min Lesedauer

Ton Wichtige Schritte zum Schreiben von wissenschaftlichen Arbeiten

Ein Leitfaden zum Verfassen von klaren und effektiven wissenschaftlichen Arbeiten.

2025-09-13T01:19:45+00:00 ― 3 min Lesedauer

Computerwissenschaften - Ton