Bhiksha Raj

Maschinelles Lernen Behebung von Label-Fehlern im Modelltraining

Dieser Artikel beschäftigt sich mit den Herausforderungen und Lösungen im Zusammenhang mit lauten Labels in Trainingsdaten.

2025-09-20T07:53:36+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte im Audio-Captioning mit nur Text-Training

Eine neue Methode trainiert Audio-Untertitelungssysteme nur mit Textbeschreibungen.

2025-09-13T02:56:55+00:00 ― 7 min Lesedauer

Maschinelles Lernen Fortschritte bei schwach überwachten Lerntechniken

Ein neues Framework verbessert das Lernen aus unvollständigen Datenlabels.

2025-09-12T00:01:24+00:00 ― 6 min Lesedauer

Robotik Roboter auf unerwartete Herausforderungen testen

Methoden erkunden, um die Leistung von Robotern in unvorhersehbaren Umgebungen zu verbessern.

2025-09-09T02:53:54+00:00 ― 5 min Lesedauer

Maschinelles Lernen Verbesserung des Lernens mit schwachen Labels durch Auswahl negativer Beispiele

Neue Strategien verbessern das Lernen mit schwachen Labels, indem sie relevante negative Beispiele auswählen.

2025-09-06T04:57:20+00:00 ― 6 min Lesedauer

Maschinelles Lernen Die Herausforderungen des Lernens mit noisym Modellen

Untersuchen, wie Rauschen in den Vortrainingsdaten die Modellleistung beeinflusst.

2025-08-30T14:35:18+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Ein neuer Ansatz zur Bewertung der Audioqualität mit PAM

PAM bietet eine neuartige Möglichkeit, die Audioqualität zu messen, ohne dass man Referenzaufnahmen braucht.

2025-08-26T21:10:50+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Bewertung der Spracherkennung in lauten Umgebungen

Ein neuer Benchmark bewertet die Leistung von Spracherkennungssystemen unter verschiedenen Störungen.

2025-08-19T14:16:50+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Die Vorteile von leichter Korruption in Diffusionsmodellen

Untersuchen, wie kleine Fehler in den Trainingsdaten AI-generierte Inhalte verbessern.

2025-08-04T09:29:06+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Bewertung von SLAM-Modellen in lauten Umgebungen

Ein neues Framework bewertet die SLAM-Leistung unter schwierigen Bedingungen.

2025-07-25T00:06:30+00:00 ― 7 min Lesedauer

Rechnen und Sprache Innovative Techniken zur Spracherkennung für ressourcenschwache Sprachen

Neue Methoden verbessern Sprachmodelle für Sprachen mit begrenzten Daten.

2025-07-24T19:39:10+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Spracherkennung für Emotionen

Neue Methoden verbessern das maschinelle Verständnis menschlicher Emotionen in der Sprache.

2025-07-12T18:34:55+00:00 ― 4 min Lesedauer

Ton Bewertung des Denkens in Audio-Sprachmodellen

Diese Studie bewertet die Denkfähigkeiten von Audio-Sprachmodellen mit einer neuen Aufgabe.

2025-07-10T09:54:05+00:00 ― 8 min Lesedauer

Rechnen und Sprache Die Auswirkung von Annotierungsmethoden auf die Sprachzusammenfassung

Diese Studie untersucht, wie verschiedene Zusammenfassungsmethoden die Qualität und den Inhalt beeinflussen.

2025-07-02T05:56:55+00:00 ― 6 min Lesedauer

Ton Verbesserung der Sprecherverifikation mit phonetischen Merkmalen

Ein neuer Rahmen verbessert die Genauigkeit der Bestätigung der Sprachidentität.

2025-06-15T01:50:18+00:00 ― 6 min Lesedauer

Ton Spracheerkennung mit menschlich inspirierten Merkmalen verbessern

Neue akustische Merkmale verbessern die Leistung von ASR-Systemen in lauten Umgebungen.

2025-06-03T14:29:40+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei Neural Codecs mit ESPnet-Codec

ESPnet-Codec verbessert das Training und die Bewertung von neuronalen Codecs für Audio und Sprache.

2025-06-03T03:09:30+00:00 ― 7 min Lesedauer

Ton Die Revolution der Audiountertitelung mit MACE

MACE verbessert Audio-Beschreibungen, indem es Geräusche mit genauen Textbeschreibungen verknüpft.

2025-05-28T17:47:08+00:00 ― 5 min Lesedauer

Maschinelles Lernen Verstehen von Graphen: Von Knoten zu Wissen

Erforsche, wie POGAT die Analyse komplexer Graphstrukturen verbessert.

2025-05-04T12:20:00+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung SoftVQ-VAE: Die Revolution in der Bilderzeugung

Entdecke, wie SoftVQ-VAE die Bilderstellung mit Effizienz und Qualität verbessert.

2025-03-08T21:22:03+00:00 ― 6 min Lesedauer