Simple Science

La science de pointe expliquée simplement

# Informatique# Apprentissage automatique

Défi Volvo Discovery : Maintenance prédictive dans les camions

Le défi de découverte Volvo explore de nouvelles stratégies de maintenance prédictive pour les camions lourds.

Carlo Metta, Marco Gregnanin, Andrea Papini, Silvia Giulia Galfrè, Andrea Fois, Francesco Morandin, Marco Fantozzi, Maurizio Parton

― 7 min lire


Le défi de la maintenanceLe défi de la maintenanceprédictive de Volvosur les données.des camions dans une compétition baséeStratégies innovantes pour l'entretien
Table des matières

La Maintenance prédictive est une méthode utilisée pour éviter les pannes de machines en se basant sur des données pour prévoir quand la maintenance doit être effectuée. Cette technique devient de plus en plus cruciale dans l'industrie automobile, surtout pour les véhicules lourds comme les camions. L'objectif est de garder les camions en bon état, de réduire le temps d'arrêt et de faire des économies sur les coûts de maintenance.

Le Défi Volvo Discovery

Cet article parle d'une compétition particulière appelée le Défi Volvo Discovery, qui s'est tenue en 2024. Le défi était centré sur la recherche de meilleures méthodes pour prévoir quand la maintenance serait nécessaire pour certaines pièces des camions Volvo. Les participants avaient accès à un gros dataset contenant des infos sur plus de 10 000 camions, avec divers détails collectés au fil du temps.

Les participants devaient prédire les niveaux de risque de panne pour un certain composant des camions. Les niveaux de risque étaient classés en trois groupes : Faible, Moyen et Élevé. Ces infos sont super importantes pour s’assurer que les véhicules restent fiables et efficaces. Quand la maintenance est faite au bon moment, ça peut aussi contribuer à réduire les impacts environnementaux et les émissions de carbone.

L’approche adoptée

Pour relever ce défi, les participants ont utilisé une méthode avec des réseaux de mémoire à long et court terme (LSTM), qui sont un type de modèle d'apprentissage profond particulièrement adaptés aux données temporelles. En plus des LSTM, une technique supplémentaire appelée Pseudo-étiquetage a été utilisée. Cette méthode aide à faire de meilleures prédictions en utilisant les données du jeu de test pour améliorer le processus d'entraînement.

Au départ, les participants ont traité les données d'entraînement pour qu'elles ressemblent à la structure des données de test. Cette étape a permis de s’assurer que le modèle serait familier avec le format qu'il rencontrerait en faisant des prédictions. Ensuite, un modèle de base LSTM a été créé pour étiqueter progressivement les données de test. Ce processus itératif a amélioré la capacité du modèle à faire des prédictions précises.

L'entraînement a impliqué plusieurs cycles d'étiquetage et d'amélioration, ce qui a aidé le modèle à s'améliorer à chaque fois. Au fur et à mesure que le modèle apprenait, il utilisait les enseignements des prédictions précédentes pour améliorer sa précision. Cette étape est particulièrement bénéfique dans des contextes comme la maintenance prédictive, où des prédictions précises peuvent réduire significativement les coûts et améliorer la sécurité.

Importance de la performance du modèle

L’efficacité de cette approche a été mesurée à l'aide d'un indicateur appelé le score F1 macro-moyenné. Ce score indique à quel point le modèle a bien fonctionné à travers les différents niveaux de risque. Un score plus élevé signifie une meilleure précision dans les prédictions, montrant la capacité du modèle à gérer la tâche efficacement. Dans ce défi, les modèles ont obtenu un score F1 macro-moyenné de 0,879, indiquant une performance solide en maintenance prédictive.

Détails du dataset

Le dataset utilisé pour le défi était composé de plusieurs fichiers contenant des informations importantes. Le premier fichier était le dataset d'entraînement, qui incluait un grand nombre de lectures provenant de nombreux camions. Ces données comportaient diverses colonnes, capturant différents détails comme les étapes temporelles des lectures, des ID anonymisés pour chaque camion et le niveau de risque pour chaque lecture.

Le deuxième fichier était le dataset de test. Ce dataset reflétait les données d'entraînement mais incluait des informations de deux générations différentes du composant du camion. Cette addition a testé la capacité du modèle à généraliser ses prédictions à travers différents types de données. Chaque séquence dans le dataset de test était fixée à 10 étapes temporelles, posant un défi pour le modèle qui devait faire des prédictions précises avec des données historiques limitées.

Le troisième fichier contenait des détails sur les différentes spécifications des camions. Ces spécifications incluaient des informations telles que le type de moteur, le nombre de roues et le type de cabine. Ces métadonnées étaient importantes pour comprendre comment différentes variantes de camions pouvaient influencer la fiabilité des composants.

Structure du défi

Le défi comportait deux phases principales. La première phase était la phase de développement, où les participants pouvaient soumettre des prédictions plusieurs fois par jour. Ce système permettait de recevoir rapidement des retours et d’ajuster leurs modèles en fonction des résultats d'évaluation. La deuxième phase était la phase finale, où les participants avaient un nombre limité de soumissions. Les meilleures soumissions pendant cette phase étaient évaluées par rapport à l'ensemble du dataset pour déterminer les classements finaux.

Prétraitement pour de meilleures prédictions

Avant d’entraîner le modèle, les participants ont suivi un processus de nettoyage des données pour améliorer la qualité du dataset. Ce processus impliquait de supprimer les valeurs manquantes et les colonnes vides qui pouvaient déformer les résultats. Des efforts ont été faits pour aligner les datasets d'entraînement et de test pour la cohérence, s’assurant que les deux utilisaient des formats similaires.

Les participants ont aussi cherché à corriger le déséquilibre des classes dans le dataset. Ils ont ajusté le dataset pour générer plusieurs sous-séries à partir des séquences originales en fonction des niveaux de risque. Cette méthode a aidé à équilibrer le nombre d’instances de chaque classe (Faible, Moyen, Élevé), améliorant le processus d'apprentissage du modèle.

Entraînement du modèle

Le réseau LSTM était le modèle principal utilisé grâce à sa capacité à gérer efficacement les données basées sur le temps. Les participants ont expérimenté différentes architectures, allant de 2 à 10 couches, chaque couche contenant 400 neurones. Pour éviter le surapprentissage, une régularisation par abandon et d'autres techniques ont été appliquées pendant l'entraînement.

Pour améliorer encore la performance du modèle, le pseudo-étiquetage a été mis en œuvre. Cette méthode a permis au modèle d'utiliser ses prédictions du jeu de test pour enrichir son dataset d'entraînement. De cette façon, même les données non étiquetées pouvaient contribuer à améliorer la précision du modèle.

Stratégie d'ensemble

Pour améliorer la précision des prédictions, les participants ont utilisé une approche d'ensemble, combinant plusieurs modèles entraînés par le boosting et le pseudo-étiquetage. Cette stratégie améliore la capacité du modèle à gérer différentes distributions de données en agrégeant les insights de plusieurs modèles. L'ensemble final prédisait les résultats sur la base du vote majoritaire entre les modèles, garantissant des prédictions plus robustes et cohérentes à travers le dataset de test.

Conclusion

Cette initiative montre le potentiel de l'utilisation de l'apprentissage automatique, notamment des techniques de maintenance prédictive, dans l'industrie automobile. En s'appuyant sur des modèles avancés comme les LSTM et le pseudo-étiquetage, les participants ont démontré comment l'apprentissage automatique peut être intégré efficacement dans des applications industrielles.

Avec la montée des approches basées sur les données, les travaux futurs se concentreront probablement sur le raffinement de ces techniques, l'exploration de nouvelles architectures et l'intégration de méthodes innovantes pour améliorer encore la précision prédictive. La recherche continue dans ce domaine pourrait mener à des stratégies de maintenance plus efficaces, réduisant les coûts tout en maximisant la sécurité et la fiabilité des camions lourds. L'utilisation croissante de l'apprentissage automatique dans la maintenance prédictive met en évidence un changement significatif dans la façon dont les industries abordent les tâches de maintenance, ouvrant la voie à des pratiques plus durables à l'avenir.

Plus d'auteurs

Articles similaires