Neuste Artikel für Audio

Ton Privatsphäre und smarte Audioüberwachung in Einklang bringen

Neue Methoden zielen darauf ab, die Sprachprivatsphäre in Audioüberwachungssystemen zu schützen.

2025-09-28T06:30:50+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Deepfakes erkennen: Ein neuer Ansatz

Eine Methode, die Audio und Video nutzt, um Deepfake-Detection zu verbessern.

2025-09-27T19:29:12+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Audioqualitätsvorhersage mit GML

Ein neues KI-Modell verbessert die Vorhersage von Audioqualitätsbewertung.

2025-09-24T03:43:40+00:00 ― 6 min Lesedauer

Ton Realistische Geräusche aus stummen Videos erzeugen

Forschung untersucht Deep Learning, um Audio zu erstellen, das zu stillem Videoinhalt passt.

2025-09-22T04:45:50+00:00 ― 7 min Lesedauer

Computer Vision und Mustererkennung Klang und Bilder kombinieren, um die Audioqualität zu verbessern

Eine neue Methode verbessert Tonaufnahmen mit visuellen Hinweisen.

2025-09-22T03:57:15+00:00 ― 7 min Lesedauer

Mensch-Computer-Interaktion Die Rolle der KI im digitalen Geschichtenerzählen

Den Einfluss von KI-generierten Inhalten auf die Kunst des Geschichtenerzählens erkunden.

2025-09-22T02:56:54+00:00 ― 8 min Lesedauer

Ton Die Musikqualität bei alltäglichen Aufnahmen verbessern

Ein neues System verbessert Audioaufnahmen für ein besseres Hörerlebnis.

2025-09-21T15:48:30+00:00 ― 6 min Lesedauer

Informationsbeschaffung Herausforderungen beim Lernen aus Musikvideos

Diese Studie untersucht die Schwierigkeiten bei der Verwendung von kontrastivem Lernen für das Verständnis von Musikvideos.

2025-09-18T17:21:45+00:00 ― 6 min Lesedauer

Ton Neues Modell verbessert die Bewertung der Fischnahrungsaufnahme

Ein einheitlicher Ansatz zur Bewertung der Fischfütterung mit Audio- und Videodaten.

2025-09-14T21:03:15+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Sprecher-Diarisation mit Sprachmodellen

Dieser Artikel untersucht Fortschritte in der Sprecherdiarisierung mithilfe von Sprachmodellen für eine bessere Genauigkeit.

2025-09-14T03:14:25+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Die Rolle von Audio bei der Fussgängererkennung

Forscher untersuchen Audiotechnologie zur Verbesserung der Fussgängererkennung in städtischen Gebieten.

2025-09-14T00:48:40+00:00 ― 6 min Lesedauer

Ton Neue Methoden zur Erkennung von KI-generiertem Audio

Fortgeschrittene Techniken zur Sicherstellung der Audioauthentizität im Zeitalter des Stimmenklonens.

2025-09-13T03:40:24+00:00 ― 5 min Lesedauer

Ton Verbesserung der Audioerzeugung durch Textabgleichstechniken

Ein neuer Ansatz verbessert die Audioerzeugung, indem er Audio mit Textbeschreibungen in Einklang bringt.

2025-09-11T07:13:25+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei Techniken zur Erkennung gefälschter Sprache

Neue Methoden verbessern unsere Fähigkeit, gefälschte Sprache effektiv zu erkennen.

2025-09-11T02:21:55+00:00 ― 6 min Lesedauer

Ton Verbesserung des Vocoder-Trainings mit kontrastivem Lernen

Neue Methoden verbessern die Leistung von Vocodern mit begrenzten Audiodaten.

2025-09-10T12:36:00+00:00 ― 6 min Lesedauer

Kryptographie und Sicherheit Verbesserung der Deepfake-Erkennung durch vielfältige Trainingsmethoden

Diese Studie untersucht Trainingsstrategien, um die Erkennung von gefälschter Audio zu verbessern.

2025-09-09T22:01:30+00:00 ― 5 min Lesedauer

Ton Eine neue Methode zum Erkennen von Stimmfälschung

Ein robuster Ansatz zur Identifizierung von Audioanomalien und zur Bekämpfung von Stimmfälschungen.

2025-09-09T07:27:00+00:00 ― 5 min Lesedauer

Rechnen und Sprache Fortschritte in der Erkennung gesprochener Sprache

Neue Methoden kombinieren Audio und Metadaten für eine bessere Spracherkennung.

2025-09-08T07:09:30+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Multi-Instrument Musiksynthetisierung

Eine neue Methode verbessert die Musikgenerierung, indem sie den Aufführungskontext hinzufügt.

2025-09-07T01:11:55+00:00 ― 6 min Lesedauer

Ton Musikretrieval mit selbstüberwachtem Lernen voranbringen

Ein neuer Ansatz nutzt selbstüberwachtes Lernen, um Audio und Notenblätter zu verknüpfen.

2025-09-06T21:09:00+00:00 ― 5 min Lesedauer

Ton Audio und Noten mit rekurrenten Netzwerken verknüpfen

Eine neue Methode verbessert die Übereinstimmung von Audio und Notenblatt.

2025-09-06T19:31:50+00:00 ― 6 min Lesedauer

Ton Neue Wasserzeichentechnik für Audio-Modelle

Eine neuartige Methode zur Wasserzeichenbildung in Audio, die durch Diffusionsmodelle erstellt wurde, zum Schutz des Eigentums.

2025-09-06T04:08:45+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung AVI-Talking: Eine neue Art, ausdrucksstarke animierte Gesichter zu erstellen

AVI-Talking erstellt lebensechte 3D-Gesichter, die Emotionen durch Audio ausdrücken.

2025-09-04T10:11:30+00:00 ― 6 min Lesedauer

Signalverarbeitung Ein neuer Ansatz zur Identifizierung von Schizophrenie-Symptomen

Kombination aus Audio, Video und Text für bessere psychische Gesundheitsbewertungen.

2025-09-03T22:42:15+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Fortschritte in der Generierung von sprechenden Gesichtern in Videos

Neue Methoden verbessern den Realismus von digitalen Menschen und Avataren.

2025-09-03T03:38:42+00:00 ― 4 min Lesedauer

Ton Stimme und Gesicht kombinieren für bessere Identifikation

Neue Methode verbessert die Sprecherverifikation, indem sie Audio- und Visuelle Daten kombiniert.

2025-09-02T07:50:15+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Humor in Videos mit FunnyNet-W erkennen

Ein neues Modell erkennt witzige Momente in Videos, indem es visuelle, Audio- und Textdaten nutzt.

2025-08-30T23:09:25+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der multimodalen Verarbeitung mit CoAVT

CoAVT integriert Audio-, Visual- und Textdaten für ein besseres Verständnis.

2025-08-28T12:02:50+00:00 ― 8 min Lesedauer

Ton Audio Flamingo: Ein neues Modell für das Verständnis von Sound

Audio Flamingo ist super darin, zuzuhören, zu quatschen und sich an neue Audioaufgaben anzupassen.

2025-08-26T16:19:20+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Fortschrittliche menschliche Kommunikation durch Bewegungsmodellierung

Ein neues Modell erzeugt realistische Bewegungen in Gesprächen und verbessert das Verständnis für Interaktionen.

2025-08-24T15:59:36+00:00 ― 6 min Lesedauer

Rechnen und Sprache Echtzeit-Erkennung von Problemen in KI-Konversationen

Ein neues Modell verbessert die Erkennung von Dialogunterbrechungen bei KI-Systemen.

2025-08-20T13:38:18+00:00 ― 8 min Lesedauer

Computer Vision und Mustererkennung SonicDiffusion: Klang und Bild zusammenbringen

Eine neue Methode, um Bilder mit Audiosignalen zu erstellen und zu bearbeiten.

2025-08-14T22:56:36+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung CLaM-TTS: Fortschritt in der Text-zu-Sprache-Technologie

CLaM-TTS verbessert die Sprachsynthese mit fortschrittlichen Techniken für mehr Effizienz und Qualität.

2025-08-13T08:28:55+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Fortschritte bei der Gesten-Generierung mit CoCoGesture

CoCoGesture erstellt lebensechte Gesten, die zu gesprochenen Wörtern passen und die Interaktion verbessern.

2025-08-06T05:04:00+00:00 ― 5 min Lesedauer

Rechnen und Sprache Fortschritte bei der Übersetzung von MEG-Signalen in Text

Ein neues Framework wandelt MEG-Signale in bedeutungsvollen Text um und hilft der Kommunikationstechnologie.

2025-08-03T03:43:42+00:00 ― 10 min Lesedauer

Ton Audio-Untertitelung durch innovative Methoden transformieren

Ein neuer Ansatz für Audio-Beschriftung verringert die Abhängigkeit von gepaarten Daten.

2025-07-30T21:24:10+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Audio-Technologie zur Fussgängerverfolgung nutzen

Diese Studie untersucht Audio-Methoden zur Verfolgung von Fussgängerbewegungen in städtischen Gebieten.

2025-07-29T17:52:20+00:00 ― 8 min Lesedauer

Audio- und Sprachverarbeitung AV-CrossNet: Verbesserung der Spracherkennung bei Geräuschen

Ein neues System hilft dabei, Sprache von Geräuschen zu trennen, damit die Kommunikation klarer wird.

2025-07-29T03:17:50+00:00 ― 7 min Lesedauer

Robotik Lernen mit Sound: Eine neue Ära für Roboter

Ein neues System hilft Robotern, Aufgaben zu erlernen, indem es Audio von realen Demonstrationen verwendet.

2025-07-26T09:42:35+00:00 ― 8 min Lesedauer

Maschinelles Lernen Kombination von Text und Audio für bessere Emotionserkennung

Eine Studie über die Nutzung von Text- und Audiodaten zur Verbesserung der Emotionserkennung.

2025-07-22T23:55:06+00:00 ― 6 min Lesedauer