Dévoiler les acteurs cachés de l'économie spatiale
Des chercheurs identifient de nouvelles entreprises dans le secteur spatial en utilisant des méthodes innovantes.
Kenza Bousedra, Pierre Pelletier
― 8 min lire
Table des matières
- Une Nouvelle Méthode pour Trouver des Entreprises
- L'Approche
- Rassembler des Infos de la Press
- Pourquoi les Journaux ?
- Collecte d'Articles
- Les Règles pour Identifier des Entreprises
- Création des Règles
- Mise à l'Épreuve de la Méthode
- Découvertes Initiales
- Nouvelles Entreprises Découvertes
- Sous-Produits de la Méthode
- Évaluation de la Méthode
- Quelle Efficacité ?
- Comparaison avec les Méthodes Statistiques
- Directions Futures pour l'Amélioration
- Place pour la Croissance
- Exploration des Co-citations
- Conclusion
- Dernières Pensées
- Source originale
- Liens de référence
L'économie spatiale prend de plus en plus d'importance avec l'émergence de nouvelles technologies et services. De plus en plus d'entreprises s'impliquent dans ce qu'on appelle les "activités spatiales en aval." Ça fait référence aux entreprises qui utilisent des données et de la technologie spatiale, comme les satellites, pour créer des services ou des produits. Par exemple, internet par satellite, la surveillance de la Terre et les services de navigation.
Mais voilà le truc : beaucoup de ces entreprises ne sont pas très connues ou ne rentrent pas facilement dans les catégories industrielles traditionnelles. Ça rend le suivi pour les experts compliqué. Alors, des chercheurs se sont dit qu'il était temps de trouver un moyen de les identifier plus efficacement.
Une Nouvelle Méthode pour Trouver des Entreprises
Pour régler ce problème, un groupe de chercheurs a mis au point une méthode pour repérer les entreprises impliquées dans les activités spatiales en aval. L'objectif était de créer une liste d'entreprises qui auraient pu échapper aux méthodes d'identification traditionnelles.
L'Approche
Les chercheurs ont utilisé un truc appelé la Reconnaissance d'entités nommées (NER). En gros, c'est un outil qui aide les ordinateurs à comprendre et reconnaître des noms dans un texte. Au lieu de se fier à des méthodes statistiques compliquées, cette approche se concentre sur des règles établies par des experts dans le domaine.
Les chercheurs ont commencé leur boulot en examinant de près des articles de journaux. Les journaux sont une source d'infos riches, et ils mentionnent souvent des entreprises impliquées dans des activités spatiales. En rassemblant un grand nombre d'articles sur l'espace, ils espéraient trouver des noms de nouvelles entreprises qui s'impliquent dans le secteur.
Rassembler des Infos de la Press
Pourquoi les Journaux ?
Pourquoi les chercheurs ont choisi les journaux ? Eh bien, soyons honnêtes—si tu veux savoir ce qui se passe dans le monde, tu vas aux infos ! Les journaux couvrent une large variété de sujets, y compris le business et la technologie, et ils se mettent à jour rapidement avec les dernières informations.
Les chercheurs ont décidé d'utiliser des articles en français et en anglais. Ils se sont concentrés sur une période allant de 2000 à aujourd'hui. En couvrant deux décennies, ils ont augmenté leurs chances de dénicher des entreprises qui auraient pu être négligées auparavant.
Collecte d'Articles
Les chercheurs ont collecté des articles de deux grandes bases de données, Factiva et Europresse. Ces plateformes compilent des articles d'actualités de différentes sources, ce qui facilite la recherche de contenus pertinents. En utilisant des requêtes de recherche spécifiques, ils ont récupéré des milliers d'articles mentionnant des activités spatiales.
Au total, ils ont réussi à collecter environ 49 000 articles. Après les avoir triés, ils se sont concentrés sur ceux qui parlaient spécifiquement des activités en aval dans l'espace.
Les Règles pour Identifier des Entreprises
Création des Règles
Maintenant qu'ils avaient une montagne d'articles, les chercheurs avaient besoin d'une façon intelligente de trier toutes ces infos. Ils ont conçu une série de règles pour aider à identifier les entreprises potentielles impliquées dans les activités spatiales en aval.
Règle 1 : Codes Industriels et Catégories Légales
La première règle consistait à filtrer les entreprises selon leurs codes industriels et leur statut légal. Les chercheurs ont créé un "dictionnaire" qui n'incluait que les entreprises appartenant à des catégories légales spécifiques liées aux activités spatiales.
Par exemple, les entreprises impliquées dans les communications par satellite ou l'observation de la Terre étaient incluses, tandis que les entreprises non liées étaient filtrées. Ça a rendu le processus d'identification beaucoup plus efficace.
Règle 2 : Majuscules Uniquement
C'est courant que les noms d'entreprises commencent par des majuscules. Donc, les chercheurs ont décidé de garder uniquement les mots commençant par des majuscules dans le texte. Ce mouvement a aidé à réduire le bruit des mots et phrases ordinaires, facilitant ainsi la détection de noms d'entreprises potentielles.
Règle 3 : Le Contexte Compte
Pour éviter de prendre des noms au hasard qui ne désignaient pas vraiment des entreprises, les chercheurs ont ajouté une troisième règle. Ils cherchaient des noms qui apparaissaient dans un contexte spécifique—en gros, à une certaine distance de mots ou phrases courants associés aux activités spatiales. Ça a aidé à affiner la liste des candidats.
Règle 4 : Expressions Régulières
Enfin, les chercheurs ont employé une règle liée aux "expressions régulières." En gros, ils cherchaient des motifs dans les noms d'entreprises qui apparaissaient souvent dans le secteur spatial. En identifiant ces motifs, ils pouvaient filtrer les noms peu susceptibles d'appartenir à des entreprises sur le marché spatial en aval.
Mise à l'Épreuve de la Méthode
Avec leurs règles en place, les chercheurs ont appliqué la méthode aux articles collectés. Ils étaient impatients de voir s'ils pouvaient identifier de nouvelles entreprises qui n'avaient pas été documentées avant.
Découvertes Initiales
Après avoir appliqué leurs règles, les chercheurs ont découvert 1 475 entreprises potentielles. À partir de cette liste, ils ont effectué un examen manuel pour confirmer lesquelles étaient réellement impliquées dans les activités spatiales en aval.
En gros, cette vérification finale consistait à revoir les articles où ces entreprises étaient mentionnées ou à vérifier leurs sites web pour voir quels services elles proposaient.
Nouvelles Entreprises Découvertes
Grâce à leur méthode, les chercheurs ont identifié 88 nouvelles entreprises dans le secteur spatial en aval. Ils étaient ravis du résultat, car cela montrait que la méthode pouvait réussir à repérer des acteurs inconnus auparavant dans l'industrie.
Sous-Produits de la Méthode
Fait intéressant, ils ont aussi découvert 30 entreprises supplémentaires qui n'étaient pas sur leur liste mais qui sont apparues pendant le processus de révision. Ces entreprises ont été trouvées parce qu'elles étaient mentionnées aux côtés des entreprises identifiées.
En gros, les chercheurs ont réalisé que connaître une entreprise menait souvent à découvrir une autre, comme dénicher des trésors cachés en fouillant dans un coffre !
Évaluation de la Méthode
Quelle Efficacité ?
Après avoir identifié de nouvelles entreprises, les chercheurs ont évalué leur méthode. Ils ont regardé combien d'entreprises connues ils pouvaient trouver et si leurs règles filtraient efficacement les noms non pertinents.
Ils ont réussi à préserver un nombre significatif d'entreprises connues tout en minimisant le bruit—un bon point pour leur approche !
Comparaison avec les Méthodes Statistiques
Pour voir comment leur méthode se comparait à d'autres techniques, ils l'ont confrontée à un modèle NER statistique. Étonnamment, même si le modèle statistique a signalé beaucoup d'entreprises, il n'a pas réussi à correspondre à autant d'entreprises connues par rapport à la méthode basée sur des règles élaborée par les chercheurs.
En gros, les chercheurs ont trouvé que leurs règles sur mesure étaient plus efficaces que le modèle statistique générique. Donc, plutôt que de jeter des pâtes contre le mur pour voir ce qui colle, ils ont créé un ensemble précis de critères qui a produit de meilleurs résultats.
Directions Futures pour l'Amélioration
Place pour la Croissance
Bien que les chercheurs aient été contents de leurs résultats, ils ont reconnu qu'il y avait encore place à amélioration. Par exemple, ils ont noté que leur méthode dépendait beaucoup de l'expertise humaine. Pour augmenter l'efficacité, ils ont suggéré d'incorporer éventuellement des techniques d'apprentissage automatique qui pourraient apprendre des nouvelles données au fil du temps.
Co-citations
Exploration desLes chercheurs ont aussi mis en avant le phénomène intéressant des co-citations—c'est-à-dire, des entreprises mentionnées ensemble dans les mêmes articles. Ils pensaient qu'il serait intéressant d'explorer ces relations plus en détail, car comprendre les connexions entre les entreprises pourrait fournir des insights précieux sur le secteur spatial.
Conclusion
En résumé, identifier de nouvelles entreprises dans le secteur spatial en aval n'est pas une mince affaire. Les chercheurs ont développé une méthode pratique basée sur des règles pour dénicher des acteurs cachés dans cette industrie en pleine expansion. Avec leur approche, ils ont réussi à repérer 88 nouvelles entreprises, enrichissant ainsi la base de données existante et ouvrant la voie à de futures explorations.
Et qui sait ? La prochaine fois que tu vérifies ton GPS activé par satellite, tu pourrais bien utiliser l'innovation apportée par l'une des entreprises nouvellement découvertes !
Dernières Pensées
Bien que le chemin pour identifier de nouvelles entreprises dans le secteur spatial soit encore en cours, l'approche des chercheurs montre l'importance de s'adapter aux nouveaux défis dans le monde des affaires. En combinant expertise et techniques à la pointe, ils ont établi un précédent pour les futurs efforts de compréhension du paysage évolutif de l'économie spatiale.
Avec chaque nouvelle entreprise identifiée, le ciel n'est pas la limite—c'est juste le début !
Source originale
Titre: A Rule-Based Methodology for Company Identification: Application to the Downstream Space Sector
Résumé: This paper proposes an original methodology based on Named Entity Recognition (NER) to identify companies involved in downstream space activities, i.e., companies that provide services or products exploiting data and technology from space. Using a rule-based approach, the method leverages a corpus of texts from digitized French press articles to extract company names related to the downstream space segment. This approach allowed the detection of 88 new downstream space companies, enriching the existing database of the sector by 33\%. The paper details the identification process and provides guidelines for future replications, applying the method to other geographic areas, or adapting it to other industries where new entrants are challenging to identify using traditional activity classifications.
Auteurs: Kenza Bousedra, Pierre Pelletier
Dernière mise à jour: 2024-12-03 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2412.02342
Source PDF: https://arxiv.org/pdf/2412.02342
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.
Liens de référence
- https://www.data.gouv.fr/fr/datasets/base-sirene-des-entreprises-et-de-leurs-etablissements-siren-siret/
- https://www.entreprises.gouv.fr/fr/actualites/crise-sanitaire/france-relance/france-relance-premiers-laureats-du-volet-spatial
- https://www.connectbycnes.fr/en/space-for-good
- https://commercialisation.esa.int/startups/
- https://spacy.io/universe/project/video-spacys-ner-model