Eine neue Methode verbessert die Abwehr gegen audio-adversarielle Angriffe in Spracherkennungssystemen.

2025-11-18T22:11:55+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Keyword-Erkennungstechnologie

Die Forschung konzentriert sich auf effiziente Modelle zum Erkennen von Schlüsselwörtern mithilfe von schlanken Netzwerken.

2025-11-18T19:46:10+00:00 ― 5 min Lesedauer

Ton CLaMP: Ein neuer Ansatz zur Musiksuche

CLaMP kombiniert Musik und Sprache für automatische Musikklassifizierung und -suche.

2025-11-18T15:43:15+00:00 ― 6 min Lesedauer

Ton Die Messung von Schönheit in der Musik: Ein neuer Ansatz

Eine mathematische Methode zur Bewertung der Schönheit von Musikaufführungen.

2025-11-18T07:37:25+00:00 ― 5 min Lesedauer

Ton Fortschritte bei der automatischen Spracherkennung mit multimodalen Techniken

Ein neues Modell kombiniert Audio- und Textdaten für eine bessere Spracherkennungsgenauigkeit.

2025-11-18T00:43:36+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Audio-Textur-Morphing-Technologie

Eine neue Methode verbessert das Audio-Texturmorphing für kreatives Sounddesign.

2025-11-17T21:05:50+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Audioerstellung durch Textbeschreibungen voranbringen

Eine neue Methode erzeugt Audio aus Text mit modernen Modellen.

2025-11-17T15:25:45+00:00 ― 5 min Lesedauer

Ton DCASE 2023: Fortschritte bei der automatischen Foley-Sound-Synthese

Ein Wettbewerb zur Verbesserung der automatisierten Foley-Sounderstellung für Multimedia.

2025-11-17T14:37:10+00:00 ― 5 min Lesedauer

Ton Musikklassifikation mit Playlists voranbringen

Diese Studie untersucht, wie man Playlists nutzen kann, um die Musikklassifikation und Ähnlichkeit zu verbessern.

2025-11-17T10:34:15+00:00 ― 5 min Lesedauer

Ton Fortschritte bei der automatischen Spracherkennung mit Deep Transfer Learning

Wie Deep Transfer Learning die Technologien zur automatischen Spracherkennung verändert.

2025-11-15T23:45:10+00:00 ― 6 min Lesedauer

Ton Eine neue Methode zur Trennung von Stimmen in Musik

Innovative Technologie trennt musikalische Stimmen mit fortschrittlichen Tracking-Techniken.

2025-11-15T11:36:25+00:00 ― 6 min Lesedauer

Maschinelles Lernen Neue Methode zur Überwachung von Kühen in lauten Umgebungen

Bauern können jetzt das Verhalten von Kühen genau verfolgen, trotz Hintergrundgeräuschen.

2025-11-15T09:59:15+00:00 ― 7 min Lesedauer

Ton Fortschritte in der automatischen Musiktranskription mit synthetischen Daten

Neue Methoden in der Musiktranskription zeigen vielversprechende Ergebnisse mit synthetisierten Audiodaten.

2025-11-15T04:19:10+00:00 ― 6 min Lesedauer

Ton Analyse von Babygeschrei: Das CryCeleb-Dataset

Ein grosses Datenset von Babygeschrei hilft dabei, die Kommunikation und Gesundheit von Säuglingen zu verstehen.

2025-11-15T02:42:00+00:00 ― 6 min Lesedauer

Ton Keyword-Erkennung mit CosMix verbessern

Eine neue Methode verbessert die Keyword-Erkennungssysteme unter Bedingungen mit wenig Ressourcen.

2025-11-14T21:50:30+00:00 ― 5 min Lesedauer

Ton Verbesserte Flugverkehrskontrolle-Vorhersagen mit dem SIA-FTP Rahmenwerk

Ein neues Framework verbessert die Vorhersagen von Flugbahnen mit Echtzeit-Sprachbefehlen.

2025-11-14T10:30:20+00:00 ― 4 min Lesedauer

Ton Audio-Untertitelung mit neuer Verlustmethode verbessern

Ein neuer Ansatz verbessert die Audiobeschreibung, indem er klarere und abwechslungsreichere Sätze erzeugt.

2025-11-14T09:41:45+00:00 ― 4 min Lesedauer

Ton LORIS: Ein neuer Ansatz zur Video-Musik-Generierung

LORIS erzeugt hochwertige Musik, die perfekt mit den Bewegungen im Video synchronisiert ist.

2025-11-14T05:38:50+00:00 ― 6 min Lesedauer

Rechnen und Sprache Neurale Netzwerke lernen Syntax aus Klang

Eine Studie zeigt, dass CNNs Wortkombinationen aus Rohsprachdaten erstellen können.

2025-11-14T02:24:30+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung PLiX: Ein neuer Ansatz zur Spracherkennung

PLiX nutzt Few-Shot-Lernen, um die Spracherkennung in mehreren Sprachen zu verbessern.

2025-11-13T23:10:10+00:00 ― 8 min Lesedauer

Ton Fortschritte bei der Erkennung von Schallereignissen mit Few-Shot-Learning

Dieser Artikel behandelt die Verbesserung der Erkennung von Klangfolgen in der Audioerkennung.

2025-11-13T20:44:25+00:00 ― 6 min Lesedauer

Rechnen und Sprache Trennung von Sprecher- und phonetischen Informationen in Sprachmodellen

Forschung zeigt, dass man die Spracherkennung verbessern kann, indem man die Sprecheridentität von den phonetischen Lauten trennt.

2025-11-13T16:50:30+00:00 ― 5 min Lesedauer

Rechnen und Sprache Auswirkungen der Audioqualität auf die Sprachlernforschung

Eine Studie zeigt, wie die Klarheit von Geräuschen die Sprachentwicklung bei Säuglingen beeinflusst.

2025-11-13T14:15:45+00:00 ― 5 min Lesedauer

Rechnen und Sprache Fortschritte bei Systemen zur Verständigung in gesprochener Sprache

Ein neuer Ansatz verbessert das Verständnis gesprochener Sprache durch effiziente Audioverarbeitung.

2025-11-13T02:07:00+00:00 ― 6 min Lesedauer

Ton Effizienzsteigerung von CNNs durch Filter-Pruning

Dieses Papier stellt eine Methode vor, um CNNs zu verbessern, indem unnötige Filter entfernt werden.

2025-11-12T15:35:25+00:00 ― 5 min Lesedauer

Rechnen und Sprache Fortschritte in der Spracherkennung von Emotionen

Eine neue Methode verbessert die Emotionserkennung in Sprache mit Selbstaufmerksamkeits-Techniken.

2025-11-12T06:41:00+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fast Conformer: Fortschritte in der Spracherkennung

Fast Conformer verbessert die Geschwindigkeit und Genauigkeit der Spracherkennung für verschiedene Anwendungen.

2025-11-11T20:09:25+00:00 ― 5 min Lesedauer

Ton SE-Bridge: Eine schnelle Lösung für Sprachklarheit

SE-Bridge verbessert die Sprache schnell und sorgt für mehr Klarheit in verschiedenen Anwendungen.

2025-11-11T15:12:12+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Sprach-zu-Gesang-Technologie

Forschung zeigt eine Methode, um gesprochene Wörter effizient in Gesang zu verwandeln.

2025-11-11T12:52:10+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Sprachtechnologie und Datenschutzrisiken

Untersuchung der Auswirkungen von Sprachtechnologie auf die persönliche Privatsphäre.

2025-11-11T11:15:00+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung QVoice: Dein Partner für arabische Aussprache

Eine mobile App, die darauf abzielt, die arabische Aussprache für alle Lernenden zu verbessern.

2025-11-11T08:49:15+00:00 ― 5 min Lesedauer

Ton Lücken in Sprach-Audio mit Machine Learning schliessen

Dieser Artikel bespricht, wie maschinelles Lernen Lücken in Sprach-Audio schliesst.

2025-11-11T07:12:05+00:00 ― 6 min Lesedauer

Ton Fortschritte bei der Audio-Deepfake-Erkennung mit Stereo-Techniken

Ein neues Modell verbessert die Erkennung von gefälschten Audio-Clips durch Stereo-Analyse.

2025-11-11T07:02:24+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Neue Methode zur Schallquellenlokalisierung mit drei Mikrofonen

Diese Methode hilft Menschen mit Hörverlust, Geräuschquellen in ihrer Umgebung zu erkennen.

2025-11-11T05:34:55+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Sprachverbesserungstechnologie

Entdecke die neuesten Techniken, die die Sprachverständlichkeit in lauten Umgebungen verbessern.

2025-11-11T04:46:20+00:00 ― 5 min Lesedauer

Ton Fortschritte in der Audioquellentrennung mit AudioSlots

AudioSlots verbessert die Klangklarheit, indem es gemischte Audioaufnahmen effektiv trennt.

2025-11-11T03:57:45+00:00 ― 5 min Lesedauer

Ton Digitale Sänger erschaffen: Ein neuer Ansatz

Eine Methode, um singende Stimmen zu erstellen, ohne detaillierte Sprachbeschriftungen.

2025-11-11T00:43:25+00:00 ― 7 min Lesedauer

Rechnen und Sprache Verbesserung der Spracherkennung für seltene Wörter

Eine Methode verbessert, wie Sprachassistenten ungewöhnliche Wörter im Kontext erkennen.

2025-11-10T23:54:50+00:00 ― 6 min Lesedauer

Ton Revolutionierung automatischer Synchronisationstechniken

Ein neues Framework verbessert das Synchronisieren, indem es Sprechstile über verschiedene Sprachen hinweg einfängt.

2025-11-10T23:06:15+00:00 ― 8 min Lesedauer

Ton Neue Methode zur Analyse von Audio-Jitter

Ein neuer Ansatz zur Messung von Jitter mithilfe der Nullüberquerungsanalyse in Audioequipment.

2025-11-10T18:27:30+00:00 ― 6 min Lesedauer

Computerwissenschaften - Ton