FullAnno améliore les annotations d'image pour un meilleur entraînement des modèles multimodaux.
― 7 min lire
La science de pointe expliquée simplement
FullAnno améliore les annotations d'image pour un meilleur entraînement des modèles multimodaux.
― 7 min lire
Les étiquettes floues peuvent améliorer les performances des modèles de machine learning dans des situations de données incertaines.
― 8 min lire
Ce document présente un cadre pour améliorer la NER en italien en utilisant des modèles avancés.
― 7 min lire
Walker propose un suivi d'objets efficace avec un minimum d'étiquetage de données.
― 7 min lire
Le dataset Omni6D améliore l'estimation de pose d'objets avec des catégories variées et des scénarios réalistes.
― 8 min lire
Un nouveau repère pousse les limites de la compréhension vidéo en se concentrant sur des tâches au niveau des événements.
― 6 min lire
Utiliser plusieurs perspectives d'annotateurs peut améliorer les modèles de classification de texte.
― 6 min lire
Une nouvelle méthode améliore la détection de la cible du regard avec moins de données étiquetées.
― 9 min lire
Une nouvelle méthode améliore l'identification des personnes à travers les caméras avec moins de supervision.
― 6 min lire
Une méthode pour améliorer l'annotation des images médicales en utilisant le modèle Segment Anything.
― 8 min lire
Une nouvelle méthode améliore l'identification des parties des bâtiments pour une planification urbaine plus intelligente.
― 9 min lire
Une nouvelle méthode améliore la précision de la segmentation en imagerie médicale en utilisant moins d'images étiquetées.
― 8 min lire
Une nouvelle méthode améliore l'efficacité dans le labellisation des images médicales 3D.
― 11 min lire
Un nouveau cadre améliore les performances avec moins d'images étiquetées en segmentation sémantique.
― 8 min lire
Une nouvelle méthode pour entraîner des modèles 3D rapidement et de manière éco-responsable.
― 8 min lire
Découvre comment de nouvelles méthodes transforment la recherche de moments dans les vidéos.
― 7 min lire
Des chercheurs avancent la reconnaissance des entités nommées pour les langues cinghalaises et tamoules.
― 8 min lire
Un nouveau jeu de données qui améliore la précision du suivi d'objets vidéo.
― 7 min lire
Nouvelles méthodes d'apprentissage actif améliorent l'efficacité et la précision du marquage d'images.
― 7 min lire
Un nouveau jeu de données combine la compréhension vidéo de haut niveau et au niveau des pixels pour des recherches avancées.
― 11 min lire
Découvrir comment les événements sont identifiés dans les récits des enfants.
― 10 min lire
Un nouvel outil facilite l'annotation des relations d'événements dans les textes.
― 10 min lire
Une plongée profonde dans l'importance des expressions multi-mots dans le traitement du langage.
― 8 min lire