Ein neues System hilft blinden Zuschauern, kurze Videos besser zu verstehen.
― 5 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Ein neues System hilft blinden Zuschauern, kurze Videos besser zu verstehen.
― 5 min Lesedauer
Innovative Ansätze verbessern den Zugang zur Bildung für benachteiligte Gemeinschaften.
― 8 min Lesedauer
Neue Techniken verbessern ASR-Systeme für eine bessere Erkennung von langen Sprachnachrichten.
― 5 min Lesedauer
Textvereinfachung hilft, den Zugang zu Informationen für verschiedene Leser zu verbessern.
― 6 min Lesedauer
Eine Studie darüber, wie wissenschaftliche Bilder für Leute mit Farbsehschwäche zugänglich gemacht werden können.
― 7 min Lesedauer
Dieses Projekt verbessert die Echtzeit-Sprachübersetzung und automatische Untertitelungssysteme.
― 4 min Lesedauer
MAIDR hilft blinden Nutzern, Datenvisualisierungen durch Sound, Berührung und Text zugänglich zu machen.
― 8 min Lesedauer
Die Fortschritte bei automatisierten Audio-Untertitelungen und deren Einfluss auf die Barrierefreiheit erkunden.
― 5 min Lesedauer
Chart4Blind wandelt komplexe Diagramme in Formate um, die für sehbehinderte Nutzer zugänglich sind.
― 8 min Lesedauer
Ein Blick darauf, wie AVQA-Technologie Fragen mit Video und Audio beantwortet.
― 6 min Lesedauer
Forschung zeigt, was BLV-Nutzer beim Zugang zu Videos bevorzugen.
― 6 min Lesedauer
Eine Methode, um sehbehinderten Menschen zu helfen, Geräusche in einer gemischten Realität zu erkennen.
― 5 min Lesedauer
Ein neues Modell verbessert die Sprach-zu-Text-Effizienz in Echtzeitanwendungen.
― 6 min Lesedauer
Unser Modell erstellt Hinweistexte, um die Benutzerfreundlichkeit für sehbehinderte Nutzer zu verbessern.
― 4 min Lesedauer
Neue Methoden verbessern die Zugänglichkeit und Genauigkeit bei Audiountertitelung.
― 6 min Lesedauer
Die RASSAR-App verbessert die Sicherheit und Zugänglichkeit Zuhause mit fortschrittlicher Technologie.
― 5 min Lesedauer
Neue Methoden zielen darauf ab, die Kommunikation für die Gehörlosengemeinschaft zu verbessern.
― 5 min Lesedauer
Eine Methode zur Verbesserung der Spracherkennungsgüte in den Sprachen Kannada und Telugu.
― 8 min Lesedauer
Ein neuer Ansatz, um informativere Bildunterschriften für Bilder zu erstellen.
― 8 min Lesedauer
RALL-E verbessert die Text-zu-Sprache-Synthese für klarere, natürlichere Sprache.
― 5 min Lesedauer
Eine neue Methode verbessert die Klarheit und Ausdrucksstärke in der Gebärdensprache.
― 7 min Lesedauer
Eine neue Methode zur Verbesserung der Textlayout-Analyse in Bildern.
― 6 min Lesedauer
Lerne, wie das Verbessern von UI-Agenten bessere Nutzererlebnisse schaffen kann.
― 8 min Lesedauer
Eine neue Methode erstellt direkt Untertitel und verbessert die Barrierefreiheit für verschiedene Zielgruppen.
― 9 min Lesedauer
Untersuchen, wie Technologie Emotionen in der Kommunikation besser ausdrücken kann.
― 8 min Lesedauer
Neue Methoden verbessern, wie KI Text und Bilder miteinander verbindet, um bessere Ergebnisse zu erzielen.
― 8 min Lesedauer
Eine Studie zeigt die Frustrationen und Vorlieben der Nutzer in Bezug auf CAPTCHAs auf Webseiten.
― 8 min Lesedauer
Ein Modell vorstellen, das synchronen Audio und Video mit gemischten Geräuschpegeln erzeugt.
― 6 min Lesedauer
Dieses System hilft sehbehinderten Personen, selbstständiger einzukaufen, indem es einen Roboterstock verwendet.
― 6 min Lesedauer
Eine neue Methode verbessert, wie Maschinen visuelle Informationen an Menschen übermitteln.
― 7 min Lesedauer
Seed-TTS erstellt lebensechte Sprache aus Text für verschiedene Anwendungen.
― 5 min Lesedauer
Eine neue Methode erstellt bessere Videountertitel, indem sie sich auf Geschichten und Kausalität konzentriert.
― 6 min Lesedauer
Ein neuer Ansatz für Audio-Beschriftung verringert die Abhängigkeit von gepaarten Daten.
― 6 min Lesedauer
Ein neuer Ansatz, um die Änderungen der Benutzeroberfläche von mobilen Apps basierend auf Benutzeraktionen vorherzusagen.
― 5 min Lesedauer
Mit Klang astronomische Daten zugänglicher und spannender für alle machen.
― 8 min Lesedauer
Ein Projekt verbindet Tanz und Technologie für kreative Ausdrucksformen.
― 7 min Lesedauer
ReadCtrl hilft Sprachmodellen, die Textkomplexität besser an die Fähigkeiten der Leser anzupassen.
― 5 min Lesedauer
GigaSpeech 2 bietet ein riesiges Dataset für Sprachen mit wenig Ressourcen, um die Spracherkennung zu verbessern.
― 5 min Lesedauer
Die Notwendigkeit von Kontext bei genauer Übersetzung in Gebärdensprache untersuchen.
― 6 min Lesedauer
Ein System kombiniert Audio und Video, um die Erkennungsgenauigkeit von Sprechern zu verbessern.
― 5 min Lesedauer