FastTCM-CR50 améliore la détection et le repérage de texte dans les scènes avec des données limitées.
― 8 min lire
La science de pointe expliquée simplement
FastTCM-CR50 améliore la détection et le repérage de texte dans les scènes avec des données limitées.
― 8 min lire
Le nouveau dataset Square-10M améliore carrément les capacités de questionnement visuel en open-source.
― 9 min lire
LongRecipe améliore la compréhension des longs textes par les modèles de langage de manière efficace.
― 7 min lire