Une nouvelle approche pour contrôler des systèmes non linéaires
Un nouveau cadre améliore la sécurité et l'efficacité dans le contrôle des systèmes complexes.
― 8 min lire
Table des matières
Dans le monde d'aujourd'hui, plein de systèmes complexes ont besoin d'un contrôle efficace pour fonctionner de manière sûre et efficace. Ça inclut tout, des véhicules autonomes à la robotique. Une méthode importante pour contrôler ces systèmes s'appelle le Contrôle Prédictif par Modèle (MPC). Cependant, le MPC traditionnel a ses limites, surtout quand il s'agit de systèmes non linéaires, où un modèle précis est souvent difficile à obtenir, et il peut y avoir des limites en puissance de calcul.
Cet article présente une nouvelle approche pour mettre en place des stratégies de contrôle qui améliorent la sécurité tout en réduisant les exigences de calcul. L'objectif est de développer un système qui contrôle des dynamiques non linéaires en utilisant des méthodes basées sur les données, garantissant la sécurité même face à des incertitudes.
Contexte
Le Contrôle Prédictif par Modèle se concentre sur la prédiction du comportement futur pour prendre des décisions de contrôle éclairées. Pour de nombreuses applications, cela nécessite un modèle précis du système. Malheureusement, ces modèles peuvent être assez compliqués, surtout pour les systèmes non linéaires. Cette complexité entraîne souvent des besoins de calcul significatifs, rendant difficile l'application du MPC en temps réel.
De plus, des techniques d'apprentissage automatique ont émergé comme des solutions potentielles pour aider à approximer des politiques de contrôle basées sur des données sans avoir besoin de modèles précis. Cependant, ces approches manquent souvent des garanties de sécurité offertes par le MPC traditionnel.
Approche Proposée
Le cadre proposé vise à fusionner la fiabilité du contrôle prédictif par modèle avec l'adaptabilité des Techniques basées sur les données. Le cœur de ce cadre est un nouveau pipeline qui identifie le comportement du système en ligne, développe des stratégies de contrôle et garantit la sécurité dans des conditions incertaines.
Aspects Clés du Cadre
Identifications de Système Basées sur les Données : Au lieu de s'appuyer sur des modèles compliqués, la méthode proposée utilise des données d'entrée-sortie pour identifier la dynamique du système. Cela se fait à travers une technique qui peut gérer à la fois des incertitudes structurées et non structurées en temps réel.
Garanties de Sécurité : La stratégie de contrôle intègre un mécanisme appelé Fonction de Barrière de Contrôle (CBF). Cela garantit que le système reste dans des limites opérationnelles sûres, empêchant efficacement les accidents.
Adaptation de Politique en Ligne : Pour améliorer la performance, la politique de contrôle s'ajuste en fonction des retours en temps réel du fonctionnement du système. Cette adaptabilité aide à maintenir un contrôle optimal face à des perturbations imprévues.
Structure du Cadre de Contrôle
Le cadre de contrôle se compose de plusieurs composants interconnectés qui travaillent ensemble pour assurer un fonctionnement efficace. Cette section décompose chaque partie du cadre et explique comment elles contribuent à l'objectif global.
1. Identification du Système
La première étape du processus de contrôle est de comprendre le comportement du système. C'est là que les techniques basées sur les données entrent en jeu. En collectant des données d'entrée-sortie, le cadre estime les dynamiques sous-jacentes du système en temps réel.
Le processus d’identification ne nécessite pas de modèle pré-déterminé, ce qui le rend flexible pour divers systèmes. La méthode s'assure également qu'elle peut s'adapter aux changements en utilisant un historique de données pour améliorer ses estimations.
Fonctions de barrière de contrôle
2.Une fois le système identifié, l'étape suivante est de développer une stratégie pour maintenir la sécurité tout en atteignant les objectifs opérationnels. Les Fonctions de Barrière de Contrôle servent à cet objectif en définissant un ensemble d'états sûrs dans lequel le système doit opérer.
L'approche CBF permet de définir des contraintes qui empêchent le système d'entrer dans des états non sûrs. C'est crucial, surtout pour des systèmes où la sécurité est primordiale, comme dans la conduite autonome ou l'automatisation industrielle.
3. Contrôle Prédictif Modèle Non Linéaire
Avec une bonne compréhension du système et de ses exigences de sécurité, le cadre utilise une version modifiée du Contrôle Prédictif par Modèle. Au lieu de résoudre des problèmes d'optimisation complexes à chaque étape, le cadre approxime ces solutions en utilisant des politiques de contrôle apprises.
Cette modification réduit considérablement les besoins en calcul, le rendant faisable à appliquer dans des scénarios en temps réel, même dans des systèmes avec des capacités de traitement limitées.
Adaptation en ligne
4.La dernière pièce du puzzle est la capacité d'adapter les politiques basées sur des retours de performance en temps réel. Au fur et à mesure que le système fonctionne, il collecte des données sur sa performance et les perturbations qu'il pourrait rencontrer. Ces informations permettent des ajustements en ligne à la politique de contrôle, s'assurant qu'elle répond continuellement aux critères de sécurité et de performance.
Applications
Le cadre proposé a été testé avec succès dans deux scénarios distincts : un système de pendule inversé sur chariot et un moteur à combustion interne turbo. Chaque application démontre la flexibilité et l'efficacité du cadre dans des conditions réelles.
Pendule Inversé sur Chariot
Le pendule inversé sur chariot est un exemple classique utilisé pour illustrer les techniques de contrôle dans des systèmes non linéaires. Ce dispositif implique un pendule monté sur un chariot qui doit rester droit pendant que le chariot se déplace. Le défi réside dans l'équilibre du pendule, surtout lorsqu'il y a des perturbations extérieures.
Dans cette application, le cadre proposé a pu contrôler efficacement le pendule, maintenant sa position verticale tout en s'adaptant à des conditions variées. La capacité à garantir la sécurité tout en gérant des dynamiques complexes a montré la robustesse du cadre.
Moteur à Combustion Interne Turbo
Pour la deuxième application, un moteur à combustion interne turbo a été utilisé. Le cadre de contrôle visait à minimiser la consommation de carburant tout en maintenant la vitesse désirée du véhicule. Ce scénario reflète les complexités des systèmes automobiles, où plusieurs actionneurs et comportements non linéaires coexistent.
Le cadre a excellé, réalisant des économies de carburant substantielles tout en atteignant les métriques de performance ciblées. En s'adaptant aux retours en temps réel, le système a maintenu un contrôle optimal même en présence d'incertitudes.
Résultats et Conclusions
Les évaluations du cadre proposé montrent qu'il offre des avantages significatifs par rapport aux approches traditionnelles. Avec sa base fondée sur les données, le cadre peut être appliqué à un plus large éventail de systèmes sans avoir besoin de modèles pré-définis étendus.
Comparaisons de Performance
Les résultats indiquent que le nouveau cadre non seulement performe bien en termes de précision de contrôle, mais réduit également considérablement la charge calculatoire par rapport aux techniques standard de Contrôle Prédictif par Modèle. Cela le rend particulièrement adapté aux applications qui exigent à la fois sécurité et efficacité.
Assurance de Sécurité
La sécurité reste une préoccupation critique dans les applications de contrôle. L'utilisation de Fonctions de Barrière de Contrôle garantit que le système opère dans un ensemble sûr défini, empêchant efficacement les conditions dangereuses. L'approche a démontré une gestion robuste des perturbations, maintenant la sécurité à travers divers scénarios opérationnels.
Conclusion
Le développement d'un cadre unifié de contrôle prédictif basé sur des données en ligne représente une avancée significative dans le domaine des systèmes de contrôle. En intégrant l'identification des données en temps réel, les garanties de sécurité et les politiques de contrôle adaptables, le cadre aborde les défis clés associés au Contrôle Prédictif par Modèle traditionnel.
Les applications réussies dans un pendule inversé sur chariot et un moteur turbo soulignent la flexibilité et l'efficacité de cette approche. Alors que la demande pour des systèmes de contrôle intelligents augmente dans divers secteurs, le cadre proposé offre une méthode précieuse pour améliorer la performance opérationnelle tout en garantissant la sécurité.
Les travaux futurs se concentreront sur le raffinement du cadre pour gérer un plus large éventail de perturbations et explorer sa applicabilité dans des systèmes réels complexes comme la robotique et la conduite autonome. L'objectif ultime reste de fournir des solutions de contrôle robustes, sûres et efficaces pour des systèmes de plus en plus sophistiqués.
Titre: A Unified Framework for Online Data-Driven Predictive Control with Robust Safety Guarantees
Résumé: Despite great successes, model predictive control (MPC) relies on an accurate dynamical model and requires high onboard computational power, impeding its wider adoption in engineering systems, especially for nonlinear real-time systems with limited computation power. These shortcomings of MPC motivate this work to make such a control framework more practically viable for real-world applications. Specifically, to remove the required accurate dynamical model and reduce the computational cost for nonlinear MPC (NMPC), this paper develops a unified online data-driven predictive control pipeline to efficiently control a system with guaranteed safety without incurring large computational complexity. The new aspect of this idea is learning not only the real system but also the control policy, which results in a reasonable computational cost for the data-driven predictive controllers. More specifically, we first develop a spatial temporal filter (STF)-based concurrent learning scheme to systematically identify system dynamics for general nonlinear systems. We then develop a robust control barrier function (RCBF) for safety guarantees in the presence of model uncertainties and learn the RCBF-based NMPC policy. Furthermore, to mitigate the performance degradation due to the existing model uncertainties, we propose an online policy correction scheme through perturbation analysis and design of an ancillary feedback controller. Finally, extensive simulations on two applications, cart-inverted pendulum and automotive powertrain control, are performed to demonstrate the efficacy of the proposed framework, which shows comparable performance with much lower computational cost in comparison with several benchmark algorithms.
Auteurs: Amin Vahidi-Moghaddam, Kaian Chen, Kaixiang Zhang, Zhaojian Li, Yan Wang, Kai Wu
Dernière mise à jour: 2023-06-29 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2306.17270
Source PDF: https://arxiv.org/pdf/2306.17270
Licence: https://creativecommons.org/publicdomain/zero/1.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.