Descubriendo a los Jugadores Ocultos en la Economía Espacial
Los investigadores identifican nuevas empresas en el creciente sector espacial a través de métodos innovadores.
Kenza Bousedra, Pierre Pelletier
― 8 minilectura
Tabla de contenidos
- Un Nuevo Método para Encontrar Empresas
- El Enfoque
- Recolectando Información de la Prensa
- ¿Por Qué Periódicos?
- Recolectando Artículos
- Las Reglas para Identificar Empresas
- Creando las Reglas
- Poniendo el Método a Prueba
- Hallazgos Iniciales
- Nuevas Empresas Descubiertas
- Subproductos del Método
- Evaluación del Método
- ¿Qué Tan Bien Funcionó?
- Comparación con Métodos Estadísticos
- Direcciones Futuras para Mejoras
- Espacio para Crecer
- Explorando la Co-citación
- Conclusión
- Reflexiones Finales
- Fuente original
- Enlaces de referencia
La economía espacial está ganando cada vez más importancia a medida que surgen nuevas tecnologías y servicios. Cada vez más empresas se están metiendo en lo que se llama "actividades espaciales de downstream". Esto se refiere a negocios que utilizan datos y tecnología del espacio, como satélites, para crear servicios o productos. Algunos ejemplos son internet por satélite, monitoreo de la Tierra y servicios de navegación.
Pero aquí está el truco: muchas de estas empresas no son muy conocidas o no se pueden clasificar fácilmente bajo categorías industriales tradicionales. Esto hace que sea complicado para los expertos hacerles seguimiento. Así que los investigadores decidieron que era hora de encontrar una manera de identificar estas empresas de forma más eficiente.
Un Nuevo Método para Encontrar Empresas
Para abordar este problema, un grupo de investigadores ideó un método para detectar empresas involucradas en actividades espaciales de downstream. El objetivo era crear una lista de empresas que podrían haber escapado del radar de los métodos de identificación tradicionales.
El Enfoque
Los investigadores utilizaron algo llamado Reconocimiento de Entidades Nombradas (NER). En términos simples, es una herramienta que ayuda a las computadoras a entender y reconocer nombres dentro del texto. En lugar de depender de métodos estadísticos complicados, este enfoque se centra en reglas establecidas por expertos en el campo.
Los investigadores comenzaron su trabajo echándole un buen vistazo a artículos de periódicos. Los periódicos son fuentes ricas de información, y a menudo mencionan empresas involucradas en actividades espaciales. Al recopilar una gran cantidad de artículos sobre el espacio, esperaban encontrar nombres de nuevas empresas que están en el sector.
Recolectando Información de la Prensa
¿Por Qué Periódicos?
¿Por qué eligieron los investigadores los periódicos? Bueno, seamos sinceros: si quieres saber qué está pasando en el mundo, ¡te fijas en las noticias! Los periódicos cubren una amplia variedad de temas, incluyendo negocios y tecnología, y se actualizan rápidamente con la información más reciente.
Los investigadores decidieron usar artículos tanto en francés como en inglés. Se centraron en un período de tiempo que va desde el 2000 hasta el presente. Al cubrir dos décadas, aumentaron sus posibilidades de encontrar empresas que podrían haber sido pasadas por alto antes.
Recolectando Artículos
Los investigadores recopilaban artículos de dos bases de datos importantes, Factiva y Europresse. Estas plataformas compilan artículos de noticias de diferentes fuentes, facilitando la búsqueda de contenido relevante. Usando consultas de búsqueda específicas, recuperaron miles de artículos que mencionaban actividades espaciales.
En total, lograron recopilar alrededor de 49,000 artículos. Después de revisarlos, se centraron en aquellos que hablaban específicamente sobre actividades de downstream en el espacio.
Las Reglas para Identificar Empresas
Creando las Reglas
Ahora que tenían una montaña de artículos, los investigadores necesitaban una forma inteligente de filtrar esta información. Crearon una serie de reglas para ayudar a identificar posibles empresas involucradas en actividades espaciales de downstream.
Regla 1: Códigos Industriales y Categorías Legales
La primera regla era filtrar empresas basándose en sus códigos industriales y estatus legal. Los investigadores crearon un "diccionario" que solo incluía empresas que pertenecían a categorías legales específicas relacionadas con actividades espaciales.
Por ejemplo, se incluyeron empresas involucradas en comunicaciones por satélite o observación de la Tierra, mientras que se filtraron negocios no relacionados. Esto hizo que el proceso de identificación fuera mucho más eficiente.
Regla 2: Solo Letras Mayúsculas
Es común que los nombres de empresas empiecen con letras mayúsculas. Así que los investigadores decidieron mantener solo las palabras que comenzaban con letras mayúsculas en el texto. Esta medida ayudó a reducir la confusión de palabras y frases comunes, facilitando la identificación de nombres potenciales de empresas.
Regla 3: El Contexto Importa
Para evitar recoger nombres aleatorios que no se referían en realidad a empresas, los investigadores añadieron una tercera regla. Buscaron nombres que aparecieran dentro de un contexto específico—básicamente, a una cierta distancia de palabras o frases comunes asociadas con actividades espaciales. Esto ayudó a reducir aún más la lista de candidatos.
Regla 4: Expresiones Regulares
Finalmente, los investigadores emplearon una regla relacionada con "expresiones regulares". Básicamente, buscaron patrones en los nombres de las empresas que a menudo aparecían en el sector espacial. Al identificar estos patrones, pudieron filtrar nombres que probablemente no pertenecieran a empresas en el mercado espacial de downstream.
Poniendo el Método a Prueba
Con sus reglas en su lugar, los investigadores aplicaron el método a los artículos recopilados. Estaban ansiosos por ver si podrían identificar nuevas empresas que no habían sido documentadas antes.
Hallazgos Iniciales
Después de aplicar sus reglas, los investigadores descubrieron 1,475 empresas potenciales. De esta lista, realizaron una revisión manual para confirmar cuáles estaban realmente involucradas en actividades espaciales de downstream.
Generalmente, esta verificación final involucraba revisar los artículos donde se mencionaban estas empresas o comprobar sus sitios web para ver qué servicios ofrecían.
Nuevas Empresas Descubiertas
Como resultado de su método, los investigadores identificaron 88 nuevas empresas en el sector espacial de downstream. Estaban emocionados con el resultado, ya que demostraba que el método podría identificar con éxito a jugadores previamente desconocidos en la industria.
Subproductos del Método
Curiosamente, también descubrieron 30 empresas adicionales que no estaban en su lista pero que surgieron durante el proceso de revisión. Estas empresas fueron encontradas porque se mencionaron junto a las empresas identificadas.
Esencialmente, los investigadores se dieron cuenta de que conocer una empresa a menudo conducía a descubrir otra, ¡como encontrar joyas ocultas mientras se revisa un cofre del tesoro!
Evaluación del Método
¿Qué Tan Bien Funcionó?
Después de identificar nuevas empresas, los investigadores evaluaron su método. Miraron cuántas empresas conocidas pudieron encontrar y si sus reglas filtraban efectivamente nombres irrelevantes.
Lograron preservar un número significativo de empresas conocidas mientras minimizaban el ruido—¡una victoria para su enfoque!
Comparación con Métodos Estadísticos
Para ver cómo se comparaba su método con otras técnicas, lo compararon con un modelo estadístico de NER. Sorprendentemente, aunque el modelo estadístico marcó muchas empresas, no logró igualar tantas empresas conocidas en comparación con el método basado en reglas ideado por los investigadores.
En resumen, los investigadores encontraron que sus reglas personalizadas eran más eficientes que el modelo estadístico genérico. Así que, en lugar de simplemente lanzar espaguetis a la pared y ver qué se pega, crearon un conjunto preciso de criterios que producía mejores resultados.
Direcciones Futuras para Mejoras
Espacio para Crecer
Si bien los investigadores estaban contentos con sus resultados, reconocieron que aún había espacio para mejorar. Por ejemplo, notaron que su método dependía en gran medida de la experiencia humana. Para aumentar la eficiencia, sugirieron incorporar técnicas de aprendizaje automático que pudieran aprender de nuevos datos con el tiempo.
Co-citación
Explorando laLos investigadores también destacaron el interesante fenómeno de la co-citación—es decir, empresas que se mencionan juntas en los mismos artículos. Pensaron que valdría la pena investigar estas relaciones más a fondo, ya que entender las conexiones entre empresas podría proporcionar valiosos conocimientos sobre el sector espacial.
Conclusión
En resumen, identificar nuevas empresas en el sector espacial de downstream no es tarea fácil. Los investigadores desarrollaron un método práctico basado en reglas para descubrir jugadores ocultos en esta industria en constante crecimiento. Con su enfoque, lograron identificar 88 nuevas empresas, enriqueciendo la base de datos existente y allanando el camino para futuras exploraciones.
¿Y quién sabe? ¡La próxima vez que estés revisando tu GPS habilitado por satélites, podrías estar utilizando la innovación traída por una de las empresas recién descubiertas!
Reflexiones Finales
Si bien el viaje para identificar nuevas empresas en el sector espacial sigue en curso, el enfoque de los investigadores muestra la importancia de adaptarse a nuevos desafíos en el mundo empresarial. Al combinar experiencia y técnicas de vanguardia, establecieron un precedente para esfuerzos futuros en la comprensión del paisaje en evolución de la economía espacial.
Con cada nueva empresa identificada, ¡el cielo no es el límite, sino solo el comienzo!
Fuente original
Título: A Rule-Based Methodology for Company Identification: Application to the Downstream Space Sector
Resumen: This paper proposes an original methodology based on Named Entity Recognition (NER) to identify companies involved in downstream space activities, i.e., companies that provide services or products exploiting data and technology from space. Using a rule-based approach, the method leverages a corpus of texts from digitized French press articles to extract company names related to the downstream space segment. This approach allowed the detection of 88 new downstream space companies, enriching the existing database of the sector by 33\%. The paper details the identification process and provides guidelines for future replications, applying the method to other geographic areas, or adapting it to other industries where new entrants are challenging to identify using traditional activity classifications.
Autores: Kenza Bousedra, Pierre Pelletier
Última actualización: 2024-12-03 00:00:00
Idioma: English
Fuente URL: https://arxiv.org/abs/2412.02342
Fuente PDF: https://arxiv.org/pdf/2412.02342
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.
Enlaces de referencia
- https://www.data.gouv.fr/fr/datasets/base-sirene-des-entreprises-et-de-leurs-etablissements-siren-siret/
- https://www.entreprises.gouv.fr/fr/actualites/crise-sanitaire/france-relance/france-relance-premiers-laureats-du-volet-spatial
- https://www.connectbycnes.fr/en/space-for-good
- https://commercialisation.esa.int/startups/
- https://spacy.io/universe/project/video-spacys-ner-model