Yu Qiao

Analyse des EDP Comprendre les opérateurs de Fredholm et leurs applications

Un aperçu des conditions de Fredholm et des opérateurs pseudodifférentiels en maths et en physique.

2025-09-29T18:38:57+00:00 ― 8 min lire

Intelligence artificielle Cadre pour former des agents IA adaptatifs

Une nouvelle méthode combine des modèles de langage avec l'apprentissage par renforcement pour former des IA.

2025-09-19T19:46:48+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Vlogger : Un nouvel outil pour créer des vidéos

Le vlogger simplifie le vidéo blogging, rendant ça plus rapide et plus facile pour les créateurs.

2025-09-16T11:12:00+00:00 ― 8 min lire

Traitement de l'image et de la vidéo A-Eval : Évaluation des modèles de segmentation des organes abdominaux

A-Eval évalue des modèles pour segmenter les organes abdominaux sur des ensembles de données variés.

2025-09-15T17:17:50+00:00 ― 16 min lire

Calcul et langage Faire avancer l'IA avec des techniques de raisonnement structuré

Une nouvelle méthode pour améliorer les capacités de raisonnement et d'explication de l'IA.

2025-09-14T14:33:54+00:00 ― 10 min lire

Robotique Faire avancer la génération de code pour robots avec RobotScript

RobotScript améliore la façon dont les robots réalisent des tâches à partir du langage naturel.

2025-09-05T03:58:00+00:00 ― 9 min lire

Robotique Avancées dans la synthèse du comportement des robots

Un nouveau cadre améliore les actions des robots grâce aux commandes humaines.

2025-09-04T09:55:42+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la reconnaissance des relations entre objets

Le Projet Tout-Visible V2 améliore la compréhension par l'IA des relations entre les objets dans les images.

2025-09-02T23:57:30+00:00 ― 9 min lire

Calcul et langage WanJuan-CC : Un nouveau dataset pour les modèles de langage

Un ensemble de données de haute qualité pour entraîner des modèles de langue à partir de contenu web en anglais.

2025-09-02T21:19:30+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Avancées de l'IA pour la conduite autonome

Les modèles d'IA améliorent la compréhension des scènes de conduite pour une navigation plus sûre.

2025-08-31T12:26:42+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes AVIBench : Nouvel outil pour évaluer les LVLM face aux attaques adversariales

AVIBench teste les LVLMs pour s'assurer qu'ils résistent aux instructions visuelles adverses.

2025-08-29T08:26:12+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans les modèles de compréhension vidéo

Un nouveau modèle améliore la compréhension des vidéos grâce à des techniques d'entraînement innovantes.

2025-08-26T20:39:36+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Nouveau jeu de données capture l'apprentissage par l'observation

Des chercheurs créent un ensemble de données pour étudier comment les gens apprennent en imitant les autres.

2025-08-26T05:31:06+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans le sous-titrage vidéo dense avec le cadre DIBS

DIBS améliore le sous-titrage des événements vidéo en affinant les limites avec des données non étiquetées.

2025-08-22T21:35:48+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Lumina-T2X : Une nouvelle ère dans la création de médias

Transforme du texte en images, vidéos et audio sans accroc avec Lumina-T2X.

2025-08-12T05:14:30+00:00 ― 8 min lire

Robotique Faire avancer les voitures autonomes avec une prise de décision comme les humains

Une nouvelle approche améliore les voitures autonomes en imitant les schémas de pensée humains.

2025-08-07T12:24:12+00:00 ― 11 min lire

Calcul et langage Recherche Faible-à-Fort : Une Nouvelle Façon de Guider les Grands Modèles de Langage

Cet article détaille une approche innovante pour améliorer les modèles de langage en utilisant des modèles plus petits.

2025-08-05T05:45:42+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Améliorer les sous-titres vidéo pour un meilleur apprentissage machine

Un nouveau jeu de données et un modèle améliorent la qualité des sous-titres vidéo pour les machines.

2025-08-01T13:56:24+00:00 ― 7 min lire

Calcul et langage Évaluer la sécurité des modèles de langage multimodaux

Un kit d'outils pour évaluer la sécurité des modèles de langage avancés.

2025-07-30T14:40:18+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans les méthodes d'entraînement des modèles de vision

Une nouvelle approche améliore l'apprentissage à partir de données image-texte entrelacées.

2025-07-30T14:16:36+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Dataset OmniCorpus : Une nouvelle ressource pour l'apprentissage multimodal

Un ensemble de données complet fusionnant images et textes pour aider l'apprentissage automatique.

2025-07-29T22:44:24+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Nouveau protocole établit une norme pour l'évaluation texte-à-vidéo

Une approche structurée pour évaluer les modèles texte-vidéo avec une efficacité améliorée.

2025-07-29T03:38:54+00:00 ― 15 min lire

Calcul et langage Faire avancer les modèles de langue avec des méthodes d'auto-formation

Un nouveau cadre aide les modèles de langage à apprendre le langage symbolique sans input humain.

2025-07-27T19:31:18+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Présentation de DocGenome : un jeu de données pour la compréhension des documents scientifiques

Un nouveau jeu de données améliore la capacité de l'IA à traiter les documents scientifiques de manière efficace.

2025-07-27T17:40:42+00:00 ― 7 min lire

Calcul et langage Avancées dans les capacités de traduction des modèles de langage

Des chercheurs améliorent les compétences de traduction pour plus de 100 langues, en se concentrant sur les langues à faibles ressources.

2025-07-17T07:07:00+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Une nouvelle façon d'ajouter des objets aux images avec du texte

Cette méthode facilite l'ajout d'objets aux images avec des commandes textuelles, garantissant des résultats naturels.

2025-07-08T14:33:24+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la technologie de conversion texte-image

Un nouveau modèle révolutionne la génération d'images à partir de descriptions textuelles, améliorant divers secteurs.

2025-07-02T04:22:30+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la reconstruction de scènes 3D avec GigaGS

GigaGS s'attaque aux défis de la modélisation de grandes scènes 3D avec des techniques innovantes.

2025-06-14T10:18:06+00:00 ― 6 min lire

Calcul et langage Améliorer les modèles de langue avec une guidance de valeur intégrée

Une méthode pour améliorer l'alignement des modèles de langage avec les préférences humaines.

2025-06-04T22:46:54+00:00 ― 6 min lire

Calcul et langage Améliorer le raisonnement dans les modèles multimodaux

Une nouvelle méthode améliore les compétences de raisonnement des modèles de langage en utilisant l'optimisation des préférences.

2025-05-22T16:25:03+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes SyncVIS : Transformer la segmentation d'instances vidéo

SyncVIS améliore le suivi et la segmentation des objets dans les vidéos pour plein d'applis différentes.

2025-04-27T23:24:15+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Optimiser la compréhension visuelle dans les modèles d'IA

Une nouvelle méthode améliore les performances des modèles de langage multimodal sur les tâches visuelles.

2025-01-24T20:33:00+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Rencontre Vinci : Ton assistant de vie intelligent

Vinci rend les tâches quotidiennes plus simples avec de l'aide sans les mains et des conseils en temps réel.

2025-01-18T22:30:27+00:00 ― 8 min lire