Naviguer dans les défis de données dans les logiciels automobiles
Le logiciel automobile dépend de données précises et de collaboration pour être sûr et efficace.
― 8 min lire
Table des matières
- Le Rôle des Données dans le Logiciel Automobil
- Défis pour Spécifier les Besoins en Données
- L'Importance des Annotations
- Processus de Collecte et d'Annotation des Données
- Les Défis de la Collaboration
- Développer un Dossier de sécurité
- Nouveaux Modèles d'Affaires et Contrats
- Le Besoin de Métriques de Qualité
- Partage de Connaissances et Documentation
- Recommandations pour l'Industrie
- Conclusion
- Source originale
- Liens de référence
Le logiciel automobile qui utilise l'apprentissage machine (ML) est devenu une partie clé du fonctionnement des voitures, surtout dans les systèmes de conduite autonome et d'assistance au conducteur. Ces systèmes s'appuient sur des Données provenant de divers capteurs, comme des caméras et des radars, pour rendre la conduite plus sûre et plus efficace. Cependant, créer ce logiciel n'est pas simple. Ça implique de rassembler des quantités énormes de données et de bien les étiqueter, ce qui peut être très compliqué.
Le Rôle des Données dans le Logiciel Automobil
Les données sont essentielles pour entraîner les modèles ML. Plus la Qualité des données est bonne, meilleure est la performance du logiciel. Ça veut dire que les fabricants doivent préciser exactement quel type de données ils ont besoin pour leurs systèmes. Malheureusement, de nombreux problèmes surgissent dans ce processus. Souvent, c'est difficile pour les fabricants et leurs fournisseurs de données de s'accorder sur les données nécessaires et sur la manière de les collecter.
Défis pour Spécifier les Besoins en Données
Un des principaux défis est le manque de directives claires sur la façon de collecter et d'étiqueter les données. De nombreuses entreprises ont des difficultés à définir ce que signifie la qualité des données et comment la mesurer. Par exemple, si les données collectées ne sont pas assez variées, le logiciel pourrait ne pas bien fonctionner dans des situations réelles, menant à des décisions biaisées.
Lors de discussions avec des pros du secteur, il est devenu clair qu'il n'y a pas d'approche universelle pour définir les spécifications des données. Les entreprises ont souvent des idées différentes sur ce qui constitue des "bonnes" données, ce qui complique la collaboration.
L'Importance des Annotations
Les annotations sont le processus d'étiquetage des données pour que les modèles ML puissent apprendre. Par exemple, dans une voiture autonome, les données d'image doivent être annotées pour identifier des objets comme des piétons, des panneaux de signalisation et d'autres véhicules. Des annotations de meilleure qualité conduisent à de meilleures performances du modèle, mais générer ces annotations peut être coûteux et prendre du temps.
De plus, il y a souvent de la confusion sur ce que signifie "qualité" en ce qui concerne les annotations. Est-ce que ça concerne le nombre d'éléments étiquetés correctement, ou est-ce que ça concerne la cohérence entre différents annotateurs interprétant les mêmes données ? Le manque de définition claire rend difficile la mise en place de standards.
Processus de Collecte et d'Annotation des Données
Collecter les bonnes données est crucial. Les entreprises passent souvent par de nombreuses itérations avant de trouver les données qui fonctionnent bien pour leurs systèmes. Utiliser des données simulées peut parfois être plus efficace et moins coûteux que de collecter des données du monde réel, surtout pour des scénarios rares difficiles à capturer. Cependant, trop compter sur des simulations peut créer des lacunes dans la compréhension de la façon dont le logiciel va réellement fonctionner.
Dans l'établissement de processus efficaces de collecte et d'annotation des données, les entreprises doivent documenter ce qu'elles attendent des données et des annotations pour maintenir la qualité et la sécurité de leurs systèmes. La transparence dans ces processus peut aider à surmonter certains des obstacles auxquels l'industrie fait face.
Les Défis de la Collaboration
La collaboration entre les fabricants d'équipements d'origine (OEM) et leurs fournisseurs est essentielle pour développer des logiciels intensifs en données. Les OEM doivent communiquer clairement leurs attentes, et les fournisseurs doivent comprendre et satisfaire ces attentes.
Cependant, les processus d'approvisionnement traditionnels peuvent ne pas bien fonctionner avec les projets plus récents axés sur les données. Les OEM passent d’une simple posture de clients à celle de partenaires avec leurs fournisseurs. Cela nécessite un changement d'état d'esprit et de modèles commerciaux. L'ancienne relation "acheteur-vendeur" cède la place à des partenariats plus dynamiques où les deux parties doivent être activement impliquées dans le processus de développement.
Développer un Dossier de sécurité
Dans l'industrie automobile, la sécurité est une priorité, surtout avec la montée de la technologie de conduite autonome. Créer un dossier de sécurité implique de rassembler des preuves qu'un système respecte les exigences de sécurité. Cela inclut la documentation de chaque étape de la collecte et du traitement des données, en veillant à ce que les standards de sécurité soient respectés.
Un défi qui se présente est que les dossiers de sécurité doivent être basés sur des données solides, qui dépendent à leur tour de spécifications de données appropriées et d'annotations de qualité. Sans une compréhension claire de ces aspects, il devient difficile d'établir la responsabilité et la sécurité du logiciel.
Nouveaux Modèles d'Affaires et Contrats
Pour faciliter une meilleure collaboration, de nouveaux modèles d'affaires et contrats sont nécessaires. Les OEM s'orientent vers la création de contrats qui permettent des conditions plus flexibles, axées sur des objectifs partagés plutôt que sur des spécifications rigides. Ce changement est essentiel pour s'adapter à la nature itérative du développement logiciel qui repose fortement sur les données et les retours constants.
Les concepts traditionnels de contrats, qui se concentrent généralement sur des livrables spécifiques, doivent évoluer pour tenir compte de la nature fluide du développement de logiciels intensifs en données. Cela nécessite des approches innovantes pour définir le succès dans de tels projets.
Le Besoin de Métriques de Qualité
Un des grands obstacles à la collaboration est la difficulté de définir des métriques de qualité tant pour les données que pour les annotations. Les entreprises ont souvent du mal à établir à quoi ressemble une qualité acceptable et comment la mesurer de manière cohérente.
Sans métriques claires, les fournisseurs et les OEM ne peuvent pas évaluer efficacement le succès. Ils finissent par travailler avec des exigences abstraites qui ne fournissent pas assez de guidance sur comment atteindre les résultats souhaités. Des métriques claires et exploitables doivent être développées, afin que tous les intervenants puissent s'aligner sur les attentes et les standards de performance.
Partage de Connaissances et Documentation
Une communication efficace est vitale pour une collaboration réussie. Le partage de connaissances entre les OEM et les fournisseurs sur la collecte de données, les processus et les attentes peut considérablement améliorer les résultats. Les entreprises doivent documenter leurs procédures pour instaurer la confiance et la compréhension entre toutes les parties impliquées.
Des échecs dans la documentation peuvent mener à des malentendus et des erreurs, ce qui diminue la sécurité et la qualité du logiciel. Une documentation transparente permet une meilleure responsabilité et aide à établir un dossier de sécurité complet pour la technologie.
Recommandations pour l'Industrie
Basé sur des conversations et retours d'expérience de professionnels du secteur, plusieurs recommandations peuvent être faites pour améliorer la situation :
Définitions Claires : Développer des standards bien définis pour la qualité des données et des annotations afin de minimiser l'ambiguïté et garantir une compréhension mutuelle.
Contrats Flexibles : Évoluer des contrats rigides vers des accords plus flexibles et collaboratifs qui permettent le développement itératif et la responsabilité partagée.
Métriques de Qualité : Créer des métriques spécifiques qui peuvent mesurer à la fois la qualité des données et celle des annotations de manière cohérente.
Documentation : Mettre en œuvre des pratiques de documentation rigoureuses pour garantir que tous les processus soient clairs et transparents, facilitant ainsi une meilleure communication.
Processus Itératifs : Adopter des processus itératifs dans la sélection et l'annotation des données, permettant une amélioration continue et une adaptation.
Formation et Ressources : Offrir des formations et des ressources pour s'assurer que tous les intervenants comprennent l'importance de la qualité des données et des annotations efficaces.
Outils de Collaboration : Utiliser des outils open-source et des plateformes partagées pour faciliter la collaboration efficace entre les OEM et leurs fournisseurs.
Conclusion
L'industrie automobile subit des changements significatifs alors qu'elle se tourne vers le développement de logiciels axés sur les données. S'attaquer aux défis liés aux spécifications des données et aux annotations est crucial pour garantir la sécurité et l'efficacité des systèmes logiciels automobiles. Une collaboration renforcée, des définitions claires, des contrats flexibles et une meilleure communication sont des étapes essentielles dans ce processus.
Alors que l'industrie continue d'évoluer, des recherches et développements continus sont nécessaires pour résoudre ces défis et garantir une collaboration réussie entre toutes les parties prenantes impliquées dans le développement de technologies automobiles innovantes.
Titre: Automotive Perception Software Development: An Empirical Investigation into Data, Annotation, and Ecosystem Challenges
Résumé: Software that contains machine learning algorithms is an integral part of automotive perception, for example, in driving automation systems. The development of such software, specifically the training and validation of the machine learning components, require large annotated datasets. An industry of data and annotation services has emerged to serve the development of such data-intensive automotive software components. Wide-spread difficulties to specify data and annotation needs challenge collaborations between OEMs (Original Equipment Manufacturers) and their suppliers of software components, data, and annotations. This paper investigates the reasons for these difficulties for practitioners in the Swedish automotive industry to arrive at clear specifications for data and annotations. The results from an interview study show that a lack of effective metrics for data quality aspects, ambiguities in the way of working, unclear definitions of annotation quality, and deficits in the business ecosystems are causes for the difficulty in deriving the specifications. We provide a list of recommendations that can mitigate challenges when deriving specifications and we propose future research opportunities to overcome these challenges. Our work contributes towards the on-going research on accountability of machine learning as applied to complex software systems, especially for high-stake applications such as automated driving.
Auteurs: Hans-Martin Heyn, Khan Mohammad Habibullah, Eric Knauss, Jennifer Horkoff, Markus Borg, Alessia Knauss, Polly Jing Li
Dernière mise à jour: 2023-03-10 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2303.05947
Source PDF: https://arxiv.org/pdf/2303.05947
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.