Tat-Seng Chua

Vision par ordinateur et reconnaissance des formes Faire avancer le question-réponse vidéo avec TranSTR

TranSTR améliore la précision des réponses aux questions sur des vidéos complexes grâce à une rationalisation spatio-temporelle.

2025-10-16T23:16:00+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes RaFormer : Une nouvelle approche pour la réponse aux questions vidéo

RaFormer réduit la redondance dans l'analyse vidéo pour une meilleure réponse aux questions.

2025-10-11T22:00:06+00:00 ― 5 min lire

Recherche d'informations Améliorer les prévisions d'événements avec des méthodes sensibles au contexte

La prise en compte du contexte améliore considérablement la précision des prévisions des événements futurs.

2025-10-09T09:49:48+00:00 ― 8 min lire

Finance statistique Avancées dans la prédiction des prix des actions sur plusieurs étapes

Un nouveau modèle améliore la précision des prévisions de prix des actions à long terme.

2025-10-01T14:10:22+00:00 ― 7 min lire

Recherche d'informations Améliorer les systèmes de recommandation avec des techniques de débruitage

Un nouveau modèle aide à améliorer les recommandations en s'attaquant au feedback utilisateur bruyant.

2025-09-17T05:30:06+00:00 ― 7 min lire

Recherche d'informations Présentation de PPLR : Un nouveau cadre pour la confidentialité dans les recommandations

PPLR améliore la vie privée tout en rendant le système de recommandation plus efficace.

2025-09-07T17:58:54+00:00 ― 9 min lire

Calcul et langage Améliorer les modèles de langage pour des questions inconnues

Une méthode pour améliorer les modèles de langage afin qu'ils répondent aux questions sans réponse.

2025-09-05T06:59:42+00:00 ― 5 min lire

Apprentissage automatique Un nouveau chemin pour les prédictions boursières

Présentation d'un cadre pour améliorer les prévisions boursières et les explications.

2025-09-03T06:20:32+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancées des modèles multimodaux avec LLaVA-UHD

Nouveau modèle améliore le traitement d'image dans les systèmes multimodaux.

2025-08-28T05:42:30+00:00 ― 7 min lire

Intelligence artificielle Faire avancer le raisonnement multimodal avec BDoG

BDoG améliore le raisonnement de l'IA en intégrant efficacement différents types de données.

2025-08-26T15:47:18+00:00 ― 9 min lire

Recherche d'informations Améliorer le regroupement de produits avec CIRP

CIRP améliore la représentation des articles pour un meilleur regroupement de produits en ligne.

2025-08-23T04:34:30+00:00 ― 10 min lire

Recherche d'informations L'essor des agents conversationnels proactifs

Apprends comment les PCA améliorent l'interaction et l'expérience utilisateur dans la technologie.

2025-08-18T01:28:00+00:00 ― 6 min lire

Intelligence artificielle Évaluer les modèles de langage avec le cadre ALI-Agent

Une nouvelle méthode pour évaluer l'alignement des modèles de langage avec les valeurs humaines.

2025-08-09T06:16:24+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Setokim : Faire avancer les modèles de langage multimodaux

Setokim améliore la fusion de la compréhension visuelle et textuelle grâce à une tokenisation innovante.

2025-08-01T00:06:54+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Une approche unifiée pour la création de texte à image

Combiner la génération d'images et la recherche pour un meilleur accès à l'information visuelle.

2025-07-31T09:30:00+00:00 ― 9 min lire

Recherche d'informations Améliorer les systèmes de recommandation avec Softmax-DPO

Softmax-DPO introduit des échantillons négatifs pour mieux aligner les préférences des utilisateurs dans les recommandations.

2025-07-29T08:15:24+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la généralisation de domaine non supervisée

DisMAE améliore la généralisation des modèles entre les domaines en utilisant des données non étiquetées.

2025-07-15T17:03:54+00:00 ― 6 min lire

Multimédia Utilisation d'images pour la prévision d'événements

Combiner des images et du texte améliore les prédictions des événements futurs.

2025-06-30T08:47:36+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Avancées et défis dans la réponse aux questions vidéo

Examiner les forces et les faiblesses des systèmes VideoQA pour comprendre le contenu vidéo.

2025-06-30T05:22:12+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Faire avancer la réponse vidéo à des questions avec du texte ancré

Une nouvelle méthode améliore la réponse aux questions vidéo grâce à la reconnaissance de texte dans les scènes.

2025-06-07T23:04:00+00:00 ― 9 min lire

Cryptographie et sécurité Améliorer la détection de malware sur Android avec des techniques innovantes

Une nouvelle méthode améliore la détection des malwares tout en résistant aux attaques adversariales.

2025-06-03T09:07:30+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Transformer l'art IA avec des modèles d'auto-amélioration

L'IA apprend à créer de l'art en se donnant des retours pour mieux aligner les images.

2025-04-01T06:18:54+00:00 ― 10 min lire

Calcul et langage Naviguer dans les limites des grands modèles de langage

Découvre les limites des connaissances des LLMs et leurs défis.

2025-03-04T15:27:00+00:00 ― 9 min lire