Améliorer les prévisions de confort thermique avec des méthodes de données hybrides
Une nouvelle méthode combine des données réelles et simulées pour de meilleures prédictions de confort thermique.
― 10 min lire
Table des matières
Dans le monde d'aujourd'hui, comprendre le Confort thermique dans les bâtiments est super important pour le bien-être des occupants. Les méthodes traditionnelles pour évaluer ce confort s'appuient souvent sur des environnements contrôlés et beaucoup de données, ce qui peut être cher et difficile à rassembler. Cet article parle d'une nouvelle méthode qui combine des données réelles et des données simulées pour prédire le confort thermique de manière plus efficace.
Le besoin de données pour prédire le confort thermique
Pour prédire à quel point quelqu'un se sent à l'aise dans un espace, il faut contrôler des facteurs comme la température, l'humidité et d'autres conditions environnementales. Il faut aussi prendre en compte des caractéristiques comme l'âge et le sexe des personnes pour des prédictions précises. Cependant, collecter ces données nécessite de mettre en place des expériences contrôlées, ce qui peut coûter cher et prendre du temps.
Une approche hybride pour la collecte de données
Cette nouvelle méthode propose d'utiliser à la fois des données du monde réel provenant de Sondages et des données simulées générées par des modèles informatiques. Cela permet aux chercheurs d'augmenter la quantité de données disponibles sans les coûts élevés associés aux expériences physiques. Les Simulations sont réalisées avec un langage conçu pour la modélisation, appelé Modelica.
Évaluation de différentes techniques de modélisation
Pour s'assurer que cette approche hybride est efficace, plusieurs modèles d'Apprentissage automatique ont été testés pour voir lequel offrait les meilleures prédictions du confort thermique. Parmi eux, le modèle de forêt aléatoire a obtenu un score remarquable, montrant sa forte capacité à prédire les niveaux de confort.
Importance des simulations numériques
Les simulations numériques sont un outil essentiel pour concevoir et gérer des systèmes dans le monde réel. Elles peuvent donner des aperçus sur le comportement des systèmes sans avoir besoin de tests physiques, qui sont souvent plus coûteux. Le confort thermique est un des domaines où les simulations peuvent mener à de meilleures solutions de conception, mais souvent, les résultats des simulations ne correspondent pas aux conditions réelles.
Défis dans la collecte de données pour le confort thermique
Un des grands défis pour évaluer le confort thermique est le manque de données fiables. Rassembler ces données nécessite des environnements contrôlés où tous les facteurs pertinents, comme la température, l'humidité et le ressenti des gens, sont surveillés. De plus, ce processus peut prendre beaucoup de temps, et les chercheurs ont souvent besoin d'étudier un large éventail de participants pour avoir une vue d'ensemble.
Augmentation de données
Techniques d'Pour résoudre le problème des données limitées, des techniques comme l'augmentation de données en séries temporelles peuvent être utilisées. Ces méthodes aident à agrandir la taille du jeu de données soit en créant des données synthétiques, soit en transformant les données existantes. Cela rend les modèles d'apprentissage automatique plus robustes et les aide à mieux apprendre.
Génération de données synthétiques
Une manière bien connue de créer des données supplémentaires est la génération de données synthétiques. Cela implique de produire de nouvelles données ressemblant à des données réelles existantes. Les techniques pour cela incluent les processus de Markov, les modèles de mélange gaussien et les réseaux antagonistes génératifs (GAN). Les GAN ont gagné beaucoup d'attention pour leur capacité à créer des données réalistes et ont été utilisés dans divers domaines, y compris la génération d'images et d'audio.
Approches de transformation des données
En plus de générer des données synthétiques, modifier les données existantes est un autre moyen d'augmenter la taille du jeu de données. Des techniques comme la normalisation, les transformations de Fourier et le changement de temps peuvent être appliquées. Par exemple, le changement de temps implique de faire de petits changements aléatoires sur les données de séries temporelles existantes pour créer de nouveaux échantillons d'entraînement.
Génération de données basée sur la simulation
Une autre manière efficace d'améliorer les ensembles de données est d'utiliser des modèles de simulation pour générer des données synthétiques. Par exemple, dans le domaine de la conduite autonome, les simulateurs peuvent créer d'innombrables scénarios pour compléter les données du monde réel. Ces données de simulation peuvent compléter les ensembles de données existants et fournir des scénarios plus divers pour entraîner des modèles d'apprentissage automatique.
Processus de génération de modèles
Lors de l'utilisation de cette approche hybride, le processus de génération de données suit plusieurs étapes clés. D'abord, un prétraitement est fait pour nettoyer et préparer les données. Ensuite, les données sont adaptées pour correspondre aux paramètres du modèle de simulation. Après cela, des règles sont créées pour générer le modèle de simulation et enfin, des simulations sont réalisées pour produire les sorties nécessaires à l'analyse.
Analyse des sondages
Pour prédire le confort thermique des ménages, un sondage a été réalisé avec 4 000 foyers. Le sondage comprenait diverses questions sur les caractéristiques des bâtiments, les systèmes de chauffage et les perceptions de confort. L'objectif était de rassembler suffisamment de données pour simuler précisément les conditions thermiques dans ces maisons.
Validation et prétraitement des données du sondage
Les réponses du sondage ont été validées en les comparant à des données collectées dans des maisons équipées de capteurs. Ce processus a permis de garantir l'exactitude des réponses du sondage et la fiabilité de l'approche. Les valeurs aberrantes ont été supprimées, résultant en un ensemble de données de 3 529 maisons.
Compléter les données par simulation
À l'aide d'un modèle de simulation, les paramètres ont été remplis en fonction des caractéristiques des maisons. Par exemple, les matériaux de construction et leurs propriétés d'isolation ont été déduits en fonction de l'année de construction des bâtiments. Cela a permis de générer des conditions thermiques réalistes pour chaque maison.
Description des modèles de simulation
Deux modèles de bâtiments génériques ont été créés pour représenter les maisons sondées. Les modèles ont été conçus pour capturer le comportement thermique de maisons et appartements typiques. Chaque pièce de ces modèles était traitée comme un nœud thermique, permettant des calculs détaillés de transfert de chaleur.
Variables d'entrée pour les simulations
Les simulations utilisaient diverses variables d'entrée, y compris des données sur les conditions extérieures, les températures des pièces et les caractéristiques des systèmes de chauffage. Le modèle prenait également en compte des facteurs externes comme le rayonnement solaire et la vitesse du vent pour simuler avec précision les conditions réelles.
Exécution des simulations
Les modèles de simulation ont été exécutés sur une période donnée, produisant des résultats qui ont donné des aperçus sur l'environnement thermique de chaque logement. Ces résultats étaient essentiels pour comprendre comment différents facteurs influençaient le confort thermique.
Analyse des résultats de simulation
Les résultats ont montré des différences de températures entre les appartements et les maisons. Par exemple, les appartements avaient souvent des températures minimales plus élevées grâce à leur proximité avec d'autres espaces chauffés. Ce phénomène est important pour comprendre comment les types de bâtiments peuvent affecter les niveaux de confort.
Résultats de l'enquête sur la perception du confort
Les participants au sondage ont rapporté leurs niveaux de confort en termes de s'ils se sentaient à l'aise ou froid pendant différentes périodes. Fait intéressant, la température de l'air à elle seule ne fournissait pas une image complète du confort. Pour mieux refléter les expériences réelles, des métriques supplémentaires intégrant la présence d'individus dans différentes pièces ont été développées.
Préparation des données pour l'apprentissage
Pour que les modèles d'apprentissage automatique fonctionnent, il était important de calculer le confort thermique à chaque instant en fonction des résultats de simulation. Ce processus impliquait de déterminer des seuils pour les périodes de confort et d'inconfort sur la base des températures de fonctionnement.
Modèles d'apprentissage automatique pour la prédiction du confort
En utilisant un mélange de données réelles et simulées, différents modèles d'apprentissage automatique ont été entraînés pour prédire les niveaux de confort. L'ensemble de données a été divisé en trois parties : entraînement, validation et test. Cela a aidé à peaufiner les modèles et à évaluer leurs performances avec précision.
Comparaison des modèles d'apprentissage automatique
Différents types de modèles d'apprentissage automatique ont été testés, y compris la forêt aléatoire, XGBoost et le perceptron multicouche. Le modèle de forêt aléatoire s'est distingué par sa forte performance à travers différentes classes de confort, probablement grâce à sa capacité à gérer des processus de prise de décision complexes.
Résultats et conclusions
Les résultats ont confirmé l'efficacité de l'approche hybride, indiquant que combiner des données simulées et réelles peut donner de meilleures prédictions pour le confort thermique. Le modèle de forêt aléatoire s'est révélé être la meilleure option, montrant son potentiel pour des applications futures dans la modélisation du confort.
Directions futures
Pour améliorer encore les résultats, les efforts futurs devraient envisager d'incorporer des paramètres supplémentaires, comme l'humidité et la vitesse de l'air. De plus, améliorer les modèles de simulation pour tenir compte des échanges d'air entre les pièces mènerait probablement à des prédictions plus précises des niveaux de confort.
Conclusion
L'approche hybride consistant à combiner des données réelles avec des simulations a montré un potentiel prometteur pour améliorer les prédictions du confort thermique. En exploitant ces deux sources de données, les chercheurs peuvent surmonter les défis liés à la rareté des données et fournir des évaluations plus précises. Ce travail pose les bases pour de futures études et innovations dans le domaine de l'évaluation du confort thermique.
Titre: Hybrid data driven/thermal simulation model for comfort assessment
Résumé: Machine learning models improve the speed and quality of physical models. However, they require a large amount of data, which is often difficult and costly to acquire. Predicting thermal comfort, for example, requires a controlled environment, with participants presenting various characteristics (age, gender, ...). This paper proposes a method for hybridizing real data with simulated data for thermal comfort prediction. The simulations are performed using Modelica Language. A benchmarking study is realized to compare different machine learning methods. Obtained results look promising with an F1 score of 0.999 obtained using the random forest model.
Auteurs: Romain Barbedienne, Sara Yasmine Ouerk, Mouadh Yagoubi, Hassan Bouia, Aurelie Kaemmerlen, Benoit Charrier
Dernière mise à jour: 2023-09-04 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2309.01734
Source PDF: https://arxiv.org/pdf/2309.01734
Licence: https://creativecommons.org/licenses/by-nc-sa/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.