L'app RASSAR améliore la sécurité et l'accessibilité à la maison grâce à une technologie avancée.
― 6 min lire
La science de pointe expliquée simplement
L'app RASSAR améliore la sécurité et l'accessibilité à la maison grâce à une technologie avancée.
― 6 min lire
De nouvelles méthodes visent à améliorer la communication pour la communauté sourde.
― 6 min lire
Une méthode pour améliorer la précision de la reconnaissance vocale en kannada et en télougou.
― 10 min lire
Une nouvelle approche pour créer des légendes plus informatives pour les images.
― 10 min lire
RALL-E améliore la synthèse texte-parole pour un discours plus clair et naturel.
― 6 min lire
Une nouvelle méthode améliore la clarté et l'expressivité en langue des signes.
― 8 min lire
Présentation d'une nouvelle approche pour améliorer l'analyse de la mise en page des textes dans les images.
― 7 min lire
Apprends comment améliorer les agents UI peut créer de meilleures expériences utilisateur.
― 9 min lire
Une nouvelle méthode crée directement des sous-titres, améliorant l'accessibilité pour des publics variés.
― 10 min lire
Examiner comment la technologie peut mieux exprimer les émotions dans la communication.
― 9 min lire
De nouvelles méthodes améliorent la façon dont l'IA relie le texte et les images pour de meilleurs résultats.
― 10 min lire
Une étude révèle les frustrations et les préférences des utilisateurs concernant les CAPTCHAs sur les sites web.
― 10 min lire
Présentation d'un modèle qui génère de l'audio et de la vidéo synchronisés avec des niveaux de bruit mélangés.
― 7 min lire
Ce système aide les personnes malvoyantes à faire leurs courses plus indépendamment grâce à une canne robotique.
― 7 min lire
Une nouvelle méthode améliore la façon dont les machines transmettent des infos visuelles aux humains.
― 8 min lire
Seed-TTS crée une voix réaliste à partir de texte pour différentes applications.
― 6 min lire
Une nouvelle méthode crée de meilleures sous-titres pour les vidéos en se concentrant sur les récits et la causalité.
― 7 min lire
Une nouvelle approche pour la légende audio réduit la dépendance aux données appairées.
― 7 min lire
Une nouvelle approche pour prédire les changements d'UI des applis mobiles en fonction des actions des utilisateurs.
― 6 min lire
Utiliser le son pour rendre les données astronomiques plus accessibles et engageantes pour tout le monde.
― 10 min lire
Un projet mélange danse et technologie pour s'exprimer de manière créative.
― 8 min lire
ReadCtrl permet aux modèles de langue d’adapter la complexité du texte aux capacités des lecteurs.
― 6 min lire
GigaSpeech 2 propose un énorme jeu de données pour les langues peu répandues afin d'améliorer la reconnaissance vocale.
― 6 min lire
Examiner le besoin de contexte dans une traduction précise en langue des signes.
― 7 min lire
Un système combine audio et vidéo pour améliorer la précision de la détection des intervenants.
― 6 min lire
PenSLR aide à améliorer la communication pour les personnes sourdes et malentendantes en utilisant la langue des signes.
― 8 min lire
Un nouveau système d'IA améliore l'accessibilité pour les utilisateurs malvoyants grâce à une meilleure lecture d'écran.
― 6 min lire
Concentre-toi sur une IA accessible et explicable pour les personnes avec des handicaps.
― 8 min lire
UniGloR propose une nouvelle façon de traduire et de produire la langue des signes sans glosses.
― 10 min lire
La recherche identifie des moyens d'améliorer les légendes d'images pour les personnes malvoyantes en les rendant culturellement pertinentes.
― 9 min lire
Une méthode pour améliorer les systèmes TTS pour mieux prononcer les mots OOV en Inde.
― 7 min lire
De nouvelles techniques améliorent la génération de voix synthétiques avec un minimum de données.
― 7 min lire
AutoAD-Zero utilise des invites visuelles pour des descriptions audio plus rapides et efficaces.
― 9 min lire
Un gros ensemble de données améliore la communication pour les utilisateurs sourds avec des smartphones.
― 6 min lire
SLVideo aide les utilisateurs à trouver facilement des moments précis dans des vidéos en langue des signes.
― 7 min lire
Une antenne radar portable flexible améliore la mobilité des personnes malvoyantes.
― 5 min lire
Un outil de commande vocale aide les utilisateurs aveugles à naviguer facilement dans les applications.
― 9 min lire
Utiliser des modèles vision-langage pour améliorer la précision et l'accessibilité de la cartographie urbaine.
― 6 min lire
Magiv2 vise à améliorer l'accès aux mangas pour les personnes malvoyantes grâce à des transcriptions automatiques.
― 7 min lire
Une appli innovante aide les utilisateurs à reconnaître et nommer les couleurs facilement.
― 9 min lire