Réinventer la génération de données de mobilité avec MobiGeaR
Un nouveau cadre pour générer des données de mobilité réalistes en utilisant le raisonnement.
― 9 min lire
Table des matières
- Le problème avec les modèles actuels
- Présentation du cadre MobiGeaR
- Importance des données de mobilité humaine
- Approches existantes dans la génération de données de mobilité
- Apprendre des grands modèles de langage
- Comment MobiGeaR fonctionne
- Génération de modèles d'intention avec le raisonnement des LLM
- Mapping vers des emplacements physiques avec des modèles mécanistes
- Évaluation de MobiGeaR
- Évaluation statistique
- Évaluation sémantique
- Évaluation d'agrégation
- Les avantages de MobiGeaR
- Directions futures
- Conclusion
- Source originale
- Liens de référence
La mobilité humaine, c'est comment les gens se déplacent et se comportent dans différents endroits. Comprendre ce mouvement est super important, car ça peut aider à résoudre des problèmes comme les embouteillages, la consommation d'énergie et le contrôle des maladies. Mais, obtenir des données de mobilité précises peut coûter cher et soulève des préoccupations sur la vie privée. Ça veut dire qu'il y a un vrai besoin de modèles qui peuvent créer des données de mobilité de bonne qualité sans s'appuyer trop sur des enregistrements réels.
Le problème avec les modèles actuels
La plupart des méthodes existantes pour générer des données de mobilité se concentrent sur l'apprentissage à partir d'échantillons passés et ensuite créer de nouvelles données basées sur ce qu'elles ont appris. Malheureusement, ces méthodes échouent souvent à capturer les raisons derrière les mouvements des gens. À cause de ça, elles finissent par être inefficaces et n'ont pas vraiment conscience des véritables raisons de la mobilité.
Pour améliorer ça, on a réfléchi à comment les grands modèles de langage (LLMs) peuvent aider à appliquer le bon sens pour générer des motifs de mobilité. Cette nouvelle façon de penser nous encourage à aborder le problème de la génération de mobilité différemment. Au lieu de simplement copier des comportements à partir de données passées, on peut utiliser le raisonnement pour créer des données qui reflètent mieux la mobilité du monde réel.
Présentation du cadre MobiGeaR
Cet article présente un nouveau cadre appelé "Génération de Mobilité comme Raisonnement" (MobiGeaR). Ce cadre utilise les capacités des grands modèles de langage pour générer des données de mobilité en comprenant le contexte du mouvement. Dans MobiGeaR, les LLMs sont guidés pour générer des comportements de mouvement étape par étape.
Le processus consiste à créer des intentions pour les mouvements et ensuite lier ces intentions à des emplacements réels à travers un modèle mécaniste. MobiGeaR a deux étapes clés :
Génération de modèles d'intention : À cette étape, le modèle crée un emploi du temps quotidien d'intentions. Par exemple, il peut générer une liste qui inclut des horaires pour des activités comme aller au travail ou manger.
Mapping vers des emplacements physiques : Une fois les intentions générées, la prochaine tâche est de les associer à des lieux spécifiques en utilisant un modèle qui prend en compte des facteurs comme la distance et la popularité des lieux.
Importance des données de mobilité humaine
Les données de mobilité sont essentielles pour plein de domaines comme l'urbanisme, la gestion des crises sanitaires comme les pandémies, et le choix des emplacements commerciaux. Traditionnellement, ces données sont obtenues par le biais de sondages ou de dispositifs de suivi comme les smartphones. Ces méthodes peuvent être très coûteuses et soulèvent de sérieuses préoccupations sur la vie privée.
Cela a poussé les chercheurs à chercher des moyens plus économiques pour créer des données de mobilité de haute qualité. Combiner notre connaissance des comportements de mobilité avec les capacités des outils d'IA modernes offre une nouvelle solution à ce problème ancien.
Approches existantes dans la génération de données de mobilité
Les approches actuelles peuvent être divisées en deux types principaux :
Modèles Mécanistes : Ces modèles utilisent des processus mathématiques pour décrire comment les gens se déplacent. Ils se concentrent souvent uniquement sur certains aspects de la mobilité, ce qui peut ne pas représenter fidèlement les comportements réels.
Modèles d'apprentissage profond : Ceux-ci utilisent des réseaux neuronaux pour apprendre à partir des données de mobilité existantes. Ils ont tendance à négliger les intentions qui motivent les mouvements des gens, ce qui entraîne des données générées qui manquent de réalisme et de contexte.
Malgré les avancées réalisées dans ces domaines, la recherche continue pour des modèles qui peuvent générer des données de manière plus efficace et avec une meilleure compréhension des schémas de mouvement humain.
Apprendre des grands modèles de langage
Les récentes avancées dans les grands modèles de langage ont montré des capacités de raisonnement impressionnantes. Ces modèles peuvent réaliser des tâches comme générer un texte cohérent en fonction d'instructions. Des études ont suggéré que l'enchaînement des pensées peut améliorer leur potentiel de raisonnement. Cela présente une opportunité unique de relier les schémas de mobilité humaine aux processus de raisonnement.
En traitant la génération de mobilité comme un défi de raisonnement, MobiGeaR vise à utiliser les LLMs pour créer des comportements de mobilité plus réalistes. Cela permet au modèle de mieux comprendre les facteurs influençant les mouvements des gens, conduisant à des données générées de meilleure qualité, avec des résultats plus cohérents et riches en contexte.
Comment MobiGeaR fonctionne
Génération de modèles d'intention avec le raisonnement des LLM
Dans la première étape, MobiGeaR génère des modèles de comportement quotidiens qui incluent des plans et les horaires de chaque activité. Il fait cela en fournissant au LLM des informations spécifiques qui guident son raisonnement. Le modèle reçoit des exemples et utilise une chaîne de pensée pour s'assurer que les activités générées ont du sens ensemble.
Le contexte initial inclut des détails sur le profil de la personne comme la profession et le revenu. Le modèle prend en compte ces attributs lors de la génération des intentions. Par exemple, la journée d'un employé de bureau sera différente de celle d'un livreur.
De plus, MobiGeaR utilise des données existantes pour aider à définir combien d'intentions chaque jour pourrait inclure et la durée moyenne des différentes activités. L'objectif est de créer un modèle réaliste qui reflète les schémas communs de la vie quotidienne.
Mapping vers des emplacements physiques avec des modèles mécanistes
Une fois les modèles d'intention créés, la prochaine étape consiste à mapper ces intentions à des emplacements spécifiques. MobiGeaR utilise un modèle mécaniste simple, connu sous le nom de modèle de gravité, pour déterminer où chaque activité est susceptible de se produire en fonction de facteurs comme la distance et la popularité des lieux.
Le modèle de gravité est efficace parce qu'il prend en compte que plus les gens sont proches d'un endroit, plus ils sont susceptibles de le visiter. En combinant le raisonnement du LLM avec cette approche mécaniste, MobiGeaR peut créer des trajectoires de mobilité qui sont sensées et ancrées dans un comportement humain réaliste.
Évaluation de MobiGeaR
Pour évaluer les performances de MobiGeaR, des expériences ont été menées en utilisant des ensembles de données de mobilité du monde réel. Les résultats ont été comparés à différents modèles existants.
Évaluation statistique
En termes statistiques, MobiGeaR a surpassé d'autres modèles dans toutes les métriques clés. C'était significatif car il a réussi à générer des motifs d'activité réalistes en utilisant seulement une petite quantité de données d'entraînement.
Évaluation sémantique
À un niveau sémantique, MobiGeaR a également montré une performance supérieure. Il a été capable d'identifier avec précision les intentions derrière les mouvements mieux que d'autres modèles, suggérant qu'il comprenait mieux le contexte des activités.
Évaluation d'agrégation
L'évaluation d'agrégation a examiné l'authenticité globale des données générées. MobiGeaR a démontré sa capacité à créer des motifs de mouvement réalistes, se rapprochant de la distribution des données du monde réel.
Les avantages de MobiGeaR
Faibles besoins en données : MobiGeaR peut générer des données de mobilité réalistes en utilisant seulement un petit nombre d'échantillons, ce qui le rend très efficace par rapport aux modèles traditionnels qui nécessitent de grands ensembles de données.
Meilleure compréhension des intentions : En utilisant des LLMs pour le raisonnement de bon sens, MobiGeaR peut mieux saisir les motivations derrière les mouvements, ce qui donne des données plus significatives.
Rentabilité : En liant les intentions aux emplacements à l'aide d'un modèle mécaniste, MobiGeaR réduit les coûts de calcul généralement associés aux approches de deep learning.
Flexibilité : Les modèles d'intention générés par MobiGeaR peuvent être facilement ajustés et étendus, permettant de modéliser différents scénarios et populations sans souci.
Directions futures
En regardant vers l'avenir, il y a un potentiel pour un modélisation utilisateur plus raffinée avec des données de meilleure qualité, incluant des profils d'utilisateurs plus détaillés et des préférences. Des facteurs comme les vacances, la météo, et les goûts individuels peuvent être incorporés pour rendre les données générées encore plus réalistes.
MobiGeaR établit un précédent pour comment les données de mobilité peuvent être générées. Cela ne traite pas seulement certaines des failles des modèles existants mais ouvre également la voie à des approches plus sophistiquées dans le domaine.
Conclusion
Le monde de la génération de données de mobilité évolue. MobiGeaR présente une nouvelle approche pour générer des données de mobilité humaine. En utilisant le raisonnement et le contexte, ce cadre crée des données plus significatives et réalistes tout en minimisant le besoin de grands ensembles de données du monde réel. Grâce à une amélioration continue et à l'adaptation, MobiGeaR pourrait vraiment améliorer notre compréhension et notre utilisation des données de mobilité dans diverses applications.
Titre: Chain-of-Planned-Behaviour Workflow Elicits Few-Shot Mobility Generation in LLMs
Résumé: The powerful reasoning capabilities of large language models (LLMs) have brought revolutionary changes to many fields, but their performance in human behaviour generation has not yet been extensively explored. This gap likely emerges because the internal processes governing behavioral intentions cannot be solely explained by abstract reasoning. Instead, they are also influenced by a multitude of factors, including social norms and personal preference. Inspired by the Theory of Planned Behaviour (TPB), we develop a LLM workflow named Chain-of-Planned Behaviour (CoPB) for mobility behaviour generation, which reflects the important spatio-temporal dynamics of human activities. Through exploiting the cognitive structures of attitude, subjective norms, and perceived behaviour control in TPB, CoPB significantly enhance the ability of LLMs to reason the intention of next movement. Specifically, CoPB substantially reduces the error rate of mobility intention generation from 57.8% to 19.4%. To improve the scalability of the proposed CoPB workflow, we further explore the synergy between LLMs and mechanistic models. We find mechanistic mobility models, such as gravity model, can effectively map mobility intentions to physical mobility behaviours. The strategy of integrating CoPB with gravity model can reduce the token cost by 97.7% and achieve better performance simultaneously. Besides, the proposed CoPB workflow can facilitate GPT-4-turbo to automatically generate high quality labels for mobility behavior reasoning. We show such labels can be leveraged to fine-tune the smaller-scale, open source LLaMA 3-8B, which significantly reduces usage costs without sacrificing the quality of the generated behaviours.
Auteurs: Chenyang Shao, Fengli Xu, Bingbing Fan, Jingtao Ding, Yuan Yuan, Meng Wang, Yong Li
Dernière mise à jour: 2024-06-05 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2402.09836
Source PDF: https://arxiv.org/pdf/2402.09836
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.