Die RASSAR-App verbessert die Sicherheit und Zugänglichkeit Zuhause mit fortschrittlicher Technologie.
― 5 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Die RASSAR-App verbessert die Sicherheit und Zugänglichkeit Zuhause mit fortschrittlicher Technologie.
― 5 min Lesedauer
Neue Methoden zielen darauf ab, die Kommunikation für die Gehörlosengemeinschaft zu verbessern.
― 5 min Lesedauer
Eine Methode zur Verbesserung der Spracherkennungsgüte in den Sprachen Kannada und Telugu.
― 8 min Lesedauer
Ein neuer Ansatz, um informativere Bildunterschriften für Bilder zu erstellen.
― 8 min Lesedauer
RALL-E verbessert die Text-zu-Sprache-Synthese für klarere, natürlichere Sprache.
― 5 min Lesedauer
Eine neue Methode verbessert die Klarheit und Ausdrucksstärke in der Gebärdensprache.
― 7 min Lesedauer
Eine neue Methode zur Verbesserung der Textlayout-Analyse in Bildern.
― 6 min Lesedauer
Lerne, wie das Verbessern von UI-Agenten bessere Nutzererlebnisse schaffen kann.
― 8 min Lesedauer
Eine neue Methode erstellt direkt Untertitel und verbessert die Barrierefreiheit für verschiedene Zielgruppen.
― 9 min Lesedauer
Untersuchen, wie Technologie Emotionen in der Kommunikation besser ausdrücken kann.
― 8 min Lesedauer
Neue Methoden verbessern, wie KI Text und Bilder miteinander verbindet, um bessere Ergebnisse zu erzielen.
― 8 min Lesedauer
Eine Studie zeigt die Frustrationen und Vorlieben der Nutzer in Bezug auf CAPTCHAs auf Webseiten.
― 8 min Lesedauer
Ein Modell vorstellen, das synchronen Audio und Video mit gemischten Geräuschpegeln erzeugt.
― 6 min Lesedauer
Dieses System hilft sehbehinderten Personen, selbstständiger einzukaufen, indem es einen Roboterstock verwendet.
― 6 min Lesedauer
Eine neue Methode verbessert, wie Maschinen visuelle Informationen an Menschen übermitteln.
― 7 min Lesedauer
Seed-TTS erstellt lebensechte Sprache aus Text für verschiedene Anwendungen.
― 5 min Lesedauer
Eine neue Methode erstellt bessere Videountertitel, indem sie sich auf Geschichten und Kausalität konzentriert.
― 6 min Lesedauer
Ein neuer Ansatz für Audio-Beschriftung verringert die Abhängigkeit von gepaarten Daten.
― 6 min Lesedauer
Ein neuer Ansatz, um die Änderungen der Benutzeroberfläche von mobilen Apps basierend auf Benutzeraktionen vorherzusagen.
― 5 min Lesedauer
Mit Klang astronomische Daten zugänglicher und spannender für alle machen.
― 8 min Lesedauer
Ein Projekt verbindet Tanz und Technologie für kreative Ausdrucksformen.
― 7 min Lesedauer
ReadCtrl hilft Sprachmodellen, die Textkomplexität besser an die Fähigkeiten der Leser anzupassen.
― 5 min Lesedauer
GigaSpeech 2 bietet ein riesiges Dataset für Sprachen mit wenig Ressourcen, um die Spracherkennung zu verbessern.
― 5 min Lesedauer
Die Notwendigkeit von Kontext bei genauer Übersetzung in Gebärdensprache untersuchen.
― 6 min Lesedauer
Ein System kombiniert Audio und Video, um die Erkennungsgenauigkeit von Sprechern zu verbessern.
― 5 min Lesedauer
PenSLR hilft, die Kommunikation für gehörlose und schwerhörige Menschen mit Gebärdensprache zu verbessern.
― 6 min Lesedauer
Ein neues KI-System verbessert die Barrierefreiheit für Benutzer mit Sehbehinderungen durch bessere Bildschirmlesefunktion.
― 5 min Lesedauer
Konzentrier dich auf zugängliche, erklärbare KI für Menschen mit Behinderungen.
― 7 min Lesedauer
UniGloR bietet eine neue Möglichkeit, Gebärdensprache zu übersetzen und zu produzieren, ohne Glossierungen.
― 8 min Lesedauer
Forschung findet Wege, um Bildunterschriften für sehbehinderte Menschen durch kulturelle Relevanz zu verbessern.
― 7 min Lesedauer
Eine Methode, um TTS-Systeme für eine bessere Aussprache von OOV-Wörtern in Indien zu verbessern.
― 5 min Lesedauer
Neue Techniken verbessern die Erzeugung synthetischer Stimmen mit minimalen Daten.
― 5 min Lesedauer
AutoAD-Zero nutzt visuelle Hinweise für schnellere, effektive Audiodeskriptionen.
― 7 min Lesedauer
Ein grosses Datenset sorgt für bessere Kommunikation für gehörlose Nutzer mit Smartphones.
― 5 min Lesedauer
SLVideo hilft Nutzern, gezielt bestimmte Momente in Gebärdensprachvideos zu finden.
― 6 min Lesedauer
Eine flexible tragbare Radarantenne verbessert die Mobilität für sehbehinderte Menschen.
― 4 min Lesedauer
Ein Sprachbefehl-Tool hilft blinden Nutzern, Apps einfach zu bedienen.
― 7 min Lesedauer
Vision-Language-Modelle nutzen, um die Genauigkeit und Zugänglichkeit von Stadtkarten zu verbessern.
― 5 min Lesedauer
Magiv2 hat das Ziel, den Zugang zu Manga für sehbehinderte Menschen durch automatisierte Transkripte zu verbessern.
― 6 min Lesedauer
Eine innovative App hilft Nutzern, Farben effektiv zu erkennen und zu benennen.
― 8 min Lesedauer