Simple Science

La science de pointe expliquée simplement

# Informatique# Apprentissage automatique

Approche innovante pour la détection des pannes dans l'industrie

Une nouvelle méthode améliore l'entraînement des modèles d'IA pour la détection de pannes industrielles.

― 9 min lire


IA pour la détection deIA pour la détection dedéfauts industrielsmodèles d'IA.l'efficacité de l'entraînement desUne nouvelle méthode améliore
Table des matières

L'intelligence artificielle (IA) joue un rôle crucial pour garder les applications industrielles sûres et fonctionnelles. Beaucoup de systèmes industriels se composent de plusieurs usines qui peuvent appartenir à différentes entreprises. À cause de ça, les Données sensibles sont souvent stockées séparément sur chaque site. Cette configuration rend difficile l'entraînement des modèles d'IA pour la Détection de pannes qui peuvent fonctionner dans ces différents lieux. Pour résoudre ce problème, il faut utiliser une méthode appelée Apprentissage Fédéré (FL), où différents sites peuvent collaborer pour entraîner un modèle partagé sans partager directement leurs données sensibles.

Défis dans l'entraînement des modèles de diagnostic des pannes

Les méthodes traditionnelles d'entraînement des modèles d'IA peinent souvent avec les systèmes industriels complexes. Ces modèles sont généralement assez grands et nécessitent une Communication importante entre les différents sites. Cependant, les canaux de communication sont souvent occupés par d'autres tâches, ce qui rend l'entraînement des modèles difficile.

Pour surmonter ces défis, une nouvelle approche appelée Dropout de bloc opportuniste fédéré a été développée. Cette méthode simplifie le processus d'entraînement en décomposant de grands modèles en parties plus petites et gérables. L'idée clé est de permettre aux participants de l'apprentissage fédéré de partager sélectivement uniquement les parties les plus importantes du modèle, réduisant ainsi la quantité d'informations échangées.

Application dans le monde réel

Depuis février 2022, cette approche est appliquée chez ENN Group, où elle a aidé deux usines chimiques à charbon en Chine à créer des modèles prédictifs pour identifier les pannes dans les machines. Le nouveau système a drastiquement réduit la communication nécessaire pour l'entraînement, la diminuant de plus de 70 % tout en maintenant un haut niveau de Performance du Modèle.

Importance de la surveillance des équipements

Dans l'environnement industriel actuel, les équipements deviennent de plus en plus complexes et fonctionnent souvent dans des conditions difficiles. Par exemple, des machines comme des turbines, des ventilateurs et des pompes sont critiques dans divers secteurs. Si ces machines commencent à tomber en panne, cela peut entraîner des pertes significatives et même des accidents.

Pour prévenir de tels problèmes, divers dispositifs de détection sont maintenant déployés dans les usines. Ces appareils surveillent les équipements et collectent des données, rendant possible l'entraînement de modèles d'IA qui aident à la prise de décisions en matière de maintenance.

Le rôle de l'IA dans le diagnostic des pannes

Les technologies IA prennent de plus en plus d'importance dans l'entraînement des modèles pour détecter les pannes industrielles. Entraîner ces modèles efficacement nécessite une grande quantité de données de haute qualité. Cependant, souvent, les données disponibles dans une seule usine ne suffisent pas. Comme différentes entreprises possèdent leurs propres données, collaborer par le biais d'un entraînement collaboratif peut améliorer la qualité des modèles.

Avec les préoccupations croissantes concernant la confidentialité des données, l'apprentissage fédéré est devenu plus populaire. Cette méthode permet aux entreprises de collaborer sans compromettre des informations sensibles. Elle est utilisée dans divers domaines, notamment la gestion de la sécurité et la santé.

Mettre en place l'apprentissage fédéré

Ces dernières années, des applications d'apprentissage fédéré pour détecter les pannes dans les industries ont commencé à émerger. Ces applications utilisent généralement une méthode appelée Moyenne Fédérée (FedAvg) pour agréger les modèles. Bien que cette approche soit utile pour la confidentialité, elle n'est pas adaptée pour entraîner de grands modèles que les applications industrielles demandent.

C'est là que l'approche Dropout de bloc opportuniste fédéré brille. Elle est conçue pour entraîner de grands modèles efficacement tout en respectant les limites de communication imposées par les industries. Dans de nombreux cas, les canaux de communication sont partagés avec d'autres applications critiques, ce qui peut ralentir les choses.

Avantages clés de l'approche Dropout de bloc opportuniste fédéré

  1. Entraînement efficace des grands modèles : Cette méthode divise un modèle en parties plus petites, appelées blocs. Elle se concentre sur la détermination des blocs importants et n'envoie que ces parties pour l'entraînement, réduisant considérablement les besoins en communication.

  2. Maintien de la qualité du modèle : Comme les blocs les plus cruciaux sont conservés, la performance globale du modèle est préservée.

  3. Incitations à la participation : Cette méthode permet aussi de suivre les contributions des différents propriétaires de données, ce qui peut aider à distribuer les incitations de manière équitable.

Déploiement dans les milieux industriels

L’approche Dropout de bloc opportuniste fédéré a été mise en œuvre dans le système d'entraînement d'ENN Group depuis début 2022. Cela sert d'amélioration à leur méthode d'agrégation de modèles précédente, permettant une meilleure collaboration entre les usines participantes.

La plateforme permet aux partenaires industriels de se joindre et d'entraîner en collaboration des modèles de diagnostic des pannes. Chaque usine collecte des données via des capteurs, qui sont ensuite prétraitées localement avant d'être utilisées pour l'entraînement du modèle d'IA. Cependant, comme les pannes sont rares, les données deviennent souvent rares et inégales entre les différentes usines. L'apprentissage fédéré aide à rassembler des données de plusieurs endroits pour de meilleurs résultats d'entraînement.

Aperçu du système d'entraînement des modèles

Le système d'entraînement se compose de deux composants principaux : le serveur FL et le client FL.

  • Serveur FL : C'est le hub central qui gère les différentes méthodes d'entraînement et aide les administrateurs système à configurer le processus d'entraînement.

  • Client FL : Chaque usine fonctionne via son propre client, qui collecte des données, effectue un traitement initial et partage des parties cruciales du modèle lors des sessions d'entraînement.

Flux de travail de l'approche d'apprentissage fédéré

L'approche Dropout de bloc opportuniste fédéré commence par l'envoi de l'ensemble du modèle ou des blocs importants du modèle aux clients participants. Les clients utilisent ensuite ces informations pour effectuer un entraînement local et renvoyer des mises à jour.

La méthode d'entraînement comprend deux étapes. Dans la première étape, un petit nombre de sessions d'entraînement sont réalisées pour sélectionner des blocs importants à renvoyer au serveur central. Dans la deuxième étape, des rondes d'entraînement plus importantes sont exécutées pour affiner le modèle, conduisant à de meilleures performances.

Résultats et avantages

La nouvelle approche d'entraînement a donné des résultats significatifs. La surcharge de communication a été réduite de manière significative, permettant des mises à jour de modèle plus rapides. Auparavant, il fallait environ deux jours pour mettre à jour les modèles avec l'ancienne méthode d'entraînement. Avec la nouvelle approche, ce temps a été réduit à seulement une demi-journée.

Le flux continu de nouvelles données provenant des dispositifs de surveillance signifie que les modèles ont besoin de mises à jour régulières pour rester pertinents. La méthode Dropout de bloc opportuniste fédéré a rendu cela possible, garantissant des mises à jour en temps opportun et augmentant ainsi la sécurité et l'efficacité des opérations.

Leçons tirées du déploiement

Lors du déploiement du nouveau système, certaines leçons clés ont émergé :

  • Qualité des données : La propreté et la qualité des données d'entraînement sont essentielles pour produire des modèles de diagnostic des pannes efficaces. L'entraînement peut souffrir à cause d'incohérences dans le prétraitement des données par différents partenaires.

  • Nécessité de transparence : Les partenaires industriels préfèrent les modèles qui offrent un certain niveau d'interprétabilité. Les valeurs d'importance des blocs dérivées lors du processus d'entraînement fournissent la transparence nécessaire, rendant plus facile pour les décideurs de faire confiance au modèle.

  • S'ajuster au changement : À mesure que les conditions opérationnelles et les équipements changent, les modèles doivent s'adapter. Des stratégies d'entraînement supplémentaires doivent être mises en place pour permettre des mises à jour à mesure que de nouvelles données arrivent ou que de nouveaux équipements sont ajoutés.

Conclusion et perspectives d'avenir

En conclusion, l'approche Dropout de bloc opportuniste fédéré a montré comment entraîner efficacement des modèles d'IA pour la détection de pannes à travers différents sites industriels. Sa capacité à réduire les besoins en communication tout en maintenant une haute performance du modèle est une avancée significative.

Les travaux futurs se concentreront sur le renforcement de cette approche contre des participants peu fiables. De plus, des efforts seront faits pour créer des systèmes d'incitation équitables et adapter les modèles aux besoins spécifiques des différents partenaires.

En fin de compte, il y a une ambition d'intégrer cette méthode dans des cadres d'apprentissage fédéré open-source, offrant un accès plus large aux développeurs et praticiens du monde entier.

Source originale

Titre: Efficient Training of Large-scale Industrial Fault Diagnostic Models through Federated Opportunistic Block Dropout

Résumé: Artificial intelligence (AI)-empowered industrial fault diagnostics is important in ensuring the safe operation of industrial applications. Since complex industrial systems often involve multiple industrial plants (possibly belonging to different companies or subsidiaries) with sensitive data collected and stored in a distributed manner, collaborative fault diagnostic model training often needs to leverage federated learning (FL). As the scale of the industrial fault diagnostic models are often large and communication channels in such systems are often not exclusively used for FL model training, existing deployed FL model training frameworks cannot train such models efficiently across multiple institutions. In this paper, we report our experience developing and deploying the Federated Opportunistic Block Dropout (FEDOBD) approach for industrial fault diagnostic model training. By decomposing large-scale models into semantic blocks and enabling FL participants to opportunistically upload selected important blocks in a quantized manner, it significantly reduces the communication overhead while maintaining model performance. Since its deployment in ENN Group in February 2022, FEDOBD has served two coal chemical plants across two cities in China to build industrial fault prediction models. It helped the company reduce the training communication overhead by over 70% compared to its previous AI Engine, while maintaining model performance at over 85% test F1 score. To our knowledge, it is the first successfully deployed dropout-based FL approach.

Auteurs: Yuanyuan Chen, Zichen Chen, Sheng Guo, Yansong Zhao, Zelei Liu, Pengcheng Wu, Chengyi Yang, Zengxiang Li, Han Yu

Dernière mise à jour: 2023-02-22 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2302.11485

Source PDF: https://arxiv.org/pdf/2302.11485

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires