Ein neues System soll die Teilnahme an Online-Meetings mit Hilfe von Maschinenlernen verbessern.
― 6 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Ein neues System soll die Teilnahme an Online-Meetings mit Hilfe von Maschinenlernen verbessern.
― 6 min Lesedauer
Neueste Artikel
― 5 min Lesedauer
Neueste Artikel
Ein Blick auf neue Methoden, die Audio-Untertitelung für bessere Barrierefreiheit verbessern.
― 5 min Lesedauer
Die Analyse von Datensätzen, die in der Sprachbiometrie verwendet werden, zeigt erhebliche Vorurteile und Datenschutzprobleme auf.
― 7 min Lesedauer
Eine neue Methode verbessert die Sprecherverifikationssysteme bei überlappenden Stimmen.
― 6 min Lesedauer
Innovative Methoden für effektive Sprachsegmentdarstellung in Verarbeitung Aufgaben.
― 6 min Lesedauer
Verbesserung von TTS-Systemen für besseres Geschichtenerzählen durch effektives Setzen von Pausen.
― 4 min Lesedauer
AffectMachine-Classical erzeugt in Echtzeit klassische Musik, um bei der Emotionsbewältigung zu helfen.
― 7 min Lesedauer
Diese Studie untersucht, wie verschiedene TTS-Systeme die Leistung von S2ST-Modellen verbessern.
― 6 min Lesedauer
Forschung zeigt, wie Backchannels die Maschinenkommunikation verbessern.
― 5 min Lesedauer
Forschung zeigt neue Wege, wie man Sound mit neuronalen Netzen für die Musikproduktion manipulieren kann.
― 5 min Lesedauer
Forschung nutzt synchronisierte Filme, um die Verbindung zwischen Sehen und Hören im maschinellen Lernen zu verbessern.
― 6 min Lesedauer
Vorstellung von Absement, einer Methode zur dynamischen Messung von Sprachlauten über die Zeit.
― 6 min Lesedauer
Ein neuer Ansatz, um Gesangstöne und Texte genau mit Technologie zu transkribieren.
― 5 min Lesedauer
Das hierarchische Cross Attention Modell verbessert das emotionale Verständnis in verschiedenen Kommunikationsformen.
― 5 min Lesedauer
Neue Methoden verbessern das Taggen und Abrufen von Musik mit weniger menschlichem Aufwand.
― 6 min Lesedauer
Diese Studie untersucht, wie die Länge des Signals die Sprachtrennung beeinflusst.
― 6 min Lesedauer
Die Forschung beschäftigt sich damit, Sprache zu anonymisieren und gleichzeitig den emotionalen Inhalt beizubehalten.
― 5 min Lesedauer
Neue Methode schätzt Distanzen anhand von Drohnenmotorengeräuschen.
― 5 min Lesedauer
Diese Forschung stellt ein neues Modell vor, um Emotionen besser anhand von Audio- und Visualdaten zu erkennen.
― 5 min Lesedauer
Diese Studie untersucht, wie KI Geräusche bewertet und beschreibt im Vergleich zu Menschen.
― 7 min Lesedauer
Die Studie vergleicht phonetic und grafemische Eingaben in TTS-Systemen für Französisch.
― 6 min Lesedauer
Neue Methoden verbessern die Audioqualität und reduzieren gleichzeitig den Datenverbrauch.
― 4 min Lesedauer
FSB-LSTM verbessert die Sprachklarheit in lauten Umgebungen mit niedriger Latenz und geringer Komplexität.
― 6 min Lesedauer
Forschung zeigt Wege, um Keyword-Spotting-Systeme zu verbessern und gleichzeitig den Stromverbrauch zu senken.
― 5 min Lesedauer
Prak vereinfacht die phonetische Ausrichtung für die tschechische Sprachforschung.
― 5 min Lesedauer
Ein umfassendes Audio-Dataset zielt darauf ab, Dereverberationsmethoden zu verbessern, um klareren Sound zu erzielen.
― 5 min Lesedauer
DAS-N2N nutzt maschinelles Lernen, um die seismische Datenerfassung durch Rauschreduzierung zu verbessern.
― 7 min Lesedauer
Neue Techniken verbessern die Genauigkeit bei Streaming- und Nicht-Streaming-Spracherkennung.
― 5 min Lesedauer
Diese Studie zeigt, wie Subword-Tokenisierung die Qualität und Effizienz der Musikgenerierung verbessert.
― 6 min Lesedauer
Untersuchung, wie angreifende Attacken Spracherkennungssysteme beeinflussen und Methoden zur Verbesserung der Übertragbarkeit.
― 6 min Lesedauer
Moderne Methoden zum Isolieren von gemischten Signalen in der Audio- und Bildverarbeitung erkunden.
― 6 min Lesedauer
CB-Conformer verbessert die Spracherkennung für voreingenommene Wörter mit innovativen Techniken.
― 5 min Lesedauer
Erkunde die Sicherheits- und Datenschutzprobleme von Sprachassistenten-Technologie.
― 6 min Lesedauer
Die Verbesserung von Spracherkennungsmodellen für Schweizerdeutsch mit fortschrittlichen Techniken und Datensätzen.
― 5 min Lesedauer
Studie untersucht, wie mobile Daten helfen, auditive verbale Halluzinationen zu verstehen.
― 8 min Lesedauer
Eine neue Methode verbessert die Abwehr gegen audio-adversarielle Angriffe in Spracherkennungssystemen.
― 6 min Lesedauer
Die Forschung konzentriert sich auf effiziente Modelle zum Erkennen von Schlüsselwörtern mithilfe von schlanken Netzwerken.
― 5 min Lesedauer
CLaMP kombiniert Musik und Sprache für automatische Musikklassifizierung und -suche.
― 6 min Lesedauer
Eine mathematische Methode zur Bewertung der Schönheit von Musikaufführungen.
― 5 min Lesedauer
Entdecke, wie vortrainierte Modelle die Spracherkennung von Emotionen verbessern.
― 7 min Lesedauer
Eine neue Methode verbessert das Audio-Texturmorphing für kreatives Sounddesign.
― 5 min Lesedauer