Descobrindo Jogadores Ocultos na Economia Espacial
Pesquisadores identificam novas empresas no setor espacial em crescimento através de métodos inovadores.
Kenza Bousedra, Pierre Pelletier
― 7 min ler
Índice
- Um Novo Método pra Encontrar Empresas
- A Abordagem
- Coletando Informações da Imprensa
- Por que Jornais?
- Coletando Artigos
- As Regras pra Identificar Empresas
- Criando as Regras
- Testando o Método
- Descobertas Iniciais
- Novas Empresas Descobertas
- Produtos Adicionais do Método
- Avaliação do Método
- Quão Bem Funcionou?
- Comparação com Métodos Estatísticos
- Direções Futuras para Melhorias
- Espaço para Crescimento
- Explorando Co-citação
- Conclusão
- Considerações Finais
- Fonte original
- Ligações de referência
A economia espacial tá ficando cada vez mais importante com o surgimento de novas tecnologias e serviços. Cada vez mais empresas tão se envolvendo nas chamadas "atividades espaciais downstream." Isso se refere a negócios que usam dados e tecnologia do espaço, tipo satélites, pra criar serviços ou produtos. Exemplos incluem internet via satélite, monitoramento da Terra e serviços de navegação.
Mas a parada é a seguinte: muitas dessas empresas não são muito conhecidas ou não se encaixam facilmente nas categorias tradicionais da indústria. Isso dificulta a vida dos especialistas na hora de rastreá-las. Então, os pesquisadores acharam que era hora de encontrar um jeito de identificar essas empresas de forma mais eficiente.
Um Novo Método pra Encontrar Empresas
Pra resolver essa questão, um grupo de pesquisadores bolou um método pra identificar empresas envolvidas em atividades espaciais downstream. O objetivo era criar uma lista de empresas que poderiam ter passado despercebidas pelos métodos tradicionais de identificação.
A Abordagem
Os pesquisadores usaram uma parada chamada Reconhecimento de Entidades Nomeadas (NER). Em termos simples, é uma ferramenta que ajuda os computadores a entender e reconhecer nomes dentro do texto. Em vez de depender de métodos estatísticos complicados, essa abordagem se concentra em regras definidas por especialistas na área.
Os pesquisadores começaram o trabalho dando uma olhada bem de perto em artigos de jornais. Os jornais são fontes ricas de informação e costumam mencionar empresas envolvidas em atividades espaciais. Reunindo um monte de artigos sobre o espaço, eles esperavam encontrar nomes de novas empresas que tão nesse setor.
Coletando Informações da Imprensa
Por que Jornais?
Por que os pesquisadores escolheram jornais? Bom, vamos ser sinceros—se você quer saber o que tá rolando no mundo, você recorre às notícias! Os jornais cobrem uma variedade de tópicos, incluindo negócios e tecnologia, e se atualizam rapidinho com as informações mais recentes.
Os pesquisadores decidiram usar artigos em francês e em inglês. Focaram em um período que vai de 2000 até hoje. Cobrir duas décadas aumentou as chances de encontrar empresas que talvez tenham sido ignoradas antes.
Coletando Artigos
Os pesquisadores reuniram artigos de duas grandes bases de dados, a Factiva e a Europresse. Essas plataformas compilam artigos de notícias de diferentes fontes, facilitando a busca por conteúdos relevantes. Usando buscas específicas, eles recuperaram milhares de artigos que mencionavam atividades espaciais.
No total, conseguiram coletar cerca de 49.000 artigos. Depois de filtrar, se concentraram nos que falavam especificamente sobre atividades downstream no espaço.
As Regras pra Identificar Empresas
Criando as Regras
Agora que eles tinham uma montanha de artigos, os pesquisadores precisavam de um jeito esperto de filtrar essa informação. Eles criaram uma série de regras pra ajudar a identificar possíveis empresas envolvidas em atividades espaciais downstream.
Regra 1: Códigos da Indústria e Categorias Legais
A primeira regra era filtrar empresas com base em seus códigos de indústria e status legal. Os pesquisadores fizeram um “dicionário” que incluía só as empresas que pertenciam a categorias legais específicas relacionadas a atividades espaciais.
Por exemplo, empresas envolvidas em comunicações via satélite ou observação da Terra foram incluídas, enquanto negócios não relacionados foram eliminados. Isso tornou o processo de identificação muito mais eficiente.
Regra 2: Apenas Letras Maiúsculas
É comum que os nomes de empresas comecem com letras maiúsculas. Então, os pesquisadores decidiram manter apenas as palavras que começavam com letras maiúsculas no texto. Essa estratégia ajudou a reduzir a confusão com palavras e frases comuns, facilitando a identificação de nomes de empresas potenciais.
Regra 3: O Contexto Importa
Pra não pegar nomes aleatórios que na verdade não se referiam a empresas, os pesquisadores adicionaram uma terceira regra. Eles procuraram nomes que apareciam dentro de um contexto específico—basicamente, a uma certa distância de palavras ou frases comuns associadas a atividades espaciais. Isso ajudou a afunilar ainda mais a lista de candidatos.
Regra 4: Expressões Regulares
Por fim, os pesquisadores usaram uma regra relacionada a "expressões regulares." Basicamente, eles procuraram padrões em nomes de empresas que costumam aparecer no setor espacial. Identificando esses padrões, eles conseguiram filtrar nomes que provavelmente não pertenciam a empresas do mercado espacial downstream.
Testando o Método
Com as regras definidas, os pesquisadores aplicaram o método aos artigos coletados. Eles estavam ansiosos pra ver se conseguiam identificar novas empresas que não tinham sido documentadas antes.
Descobertas Iniciais
Depois de aplicar as regras, os pesquisadores descobriram 1.475 empresas potenciais. Dessa lista, eles fizeram uma revisão manual pra confirmar quais realmente estavam envolvidas em atividades espaciais downstream.
No geral, essa verificação final envolveu revisar os artigos onde essas empresas foram mencionadas ou checar os sites delas pra ver quais serviços ofereciam.
Novas Empresas Descobertas
Como resultado do método, os pesquisadores identificaram 88 novas empresas no setor espacial downstream. Eles ficaram super empolgados com o resultado, já que isso mostrou que o método conseguia localizar players desconhecidos na indústria.
Produtos Adicionais do Método
Curiosamente, eles também descobriram 30 empresas adicionais que não estavam na lista inicial, mas apareceram durante o processo de revisão. Essas empresas foram encontradas porque foram mencionadas junto com as empresas identificadas.
Basicamente, os pesquisadores perceberam que conhecer uma empresa muitas vezes levava à descoberta de outra, como encontrar tesouros escondidos enquanto vasculhavam um baú!
Avaliação do Método
Quão Bem Funcionou?
Depois de identificar novas empresas, os pesquisadores avaliaram o método. Eles olharam quantas empresas conhecidas conseguiram encontrar e se as regras deles filtraram efetivamente os nomes irrelevantes.
Eles conseguiram preservar um número significativo de empresas conhecidas enquanto minimizavam a bagunça—um resultado positivo pra abordagem deles!
Comparação com Métodos Estatísticos
Pra ver como o método deles se saía em comparação a outras técnicas, eles compararam com um modelo estatístico de NER. Surpreendentemente, mesmo que o modelo estatístico flagrou muitas empresas, ele não conseguiu igualar a quantidade de empresas conhecidas comparado ao método baseado em regras criado pelos pesquisadores.
Resumindo, os pesquisadores descobriram que as regras personalizadas deles eram mais eficientes que o modelo estatístico genérico. Então, em vez de jogar espaguete na parede e ver o que gruda, eles criaram um conjunto preciso de critérios que produziu resultados melhores.
Direções Futuras para Melhorias
Espaço para Crescimento
Embora os pesquisadores estivessem satisfeitos com os resultados, eles reconheceram que ainda havia espaço pra melhorias. Por exemplo, notaram que o método dependia muito da experiência humana. Pra aumentar a eficiência, eles sugeriram incorporar possivelmente técnicas de machine learning que pudessem aprender com novos dados ao longo do tempo.
Co-citação
ExplorandoOs pesquisadores também destacaram o fenômeno interessante da co-citação—ou seja, empresas sendo mencionadas juntas nos mesmos artigos. Eles acharam que valeria a pena investigar esses relacionamentos mais a fundo, já que entender as conexões entre empresas poderia proporcionar insights valiosos sobre o setor espacial.
Conclusão
Resumindo, identificar novas empresas no setor espacial downstream não é tarefa fácil. Os pesquisadores desenvolveram um método prático e baseado em regras pra descobrir players ocultos nessa indústria em crescimento. Com a abordagem deles, conseguiram identificar 88 novas empresas, enriquecendo o banco de dados existente e abrindo caminho pra futuras explorações.
E quem sabe? Na próxima vez que você estiver conferindo seu GPS via satélite, pode estar utilizando a inovação trazida por uma das empresas recém-descobertas!
Considerações Finais
Enquanto a jornada pra identificar novas empresas no setor espacial continua, a abordagem dos pesquisadores mostra a importância de se adaptar a novos desafios no mundo dos negócios. Combinando expertise e técnicas de ponta, eles estabeleceram um precedente pra esforços futuros em entender o cenário em evolução da economia espacial.
Com cada nova empresa identificada, o céu não é o limite—é só o começo!
Fonte original
Título: A Rule-Based Methodology for Company Identification: Application to the Downstream Space Sector
Resumo: This paper proposes an original methodology based on Named Entity Recognition (NER) to identify companies involved in downstream space activities, i.e., companies that provide services or products exploiting data and technology from space. Using a rule-based approach, the method leverages a corpus of texts from digitized French press articles to extract company names related to the downstream space segment. This approach allowed the detection of 88 new downstream space companies, enriching the existing database of the sector by 33\%. The paper details the identification process and provides guidelines for future replications, applying the method to other geographic areas, or adapting it to other industries where new entrants are challenging to identify using traditional activity classifications.
Autores: Kenza Bousedra, Pierre Pelletier
Última atualização: 2024-12-03 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2412.02342
Fonte PDF: https://arxiv.org/pdf/2412.02342
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.
Ligações de referência
- https://www.data.gouv.fr/fr/datasets/base-sirene-des-entreprises-et-de-leurs-etablissements-siren-siret/
- https://www.entreprises.gouv.fr/fr/actualites/crise-sanitaire/france-relance/france-relance-premiers-laureats-du-volet-spatial
- https://www.connectbycnes.fr/en/space-for-good
- https://commercialisation.esa.int/startups/
- https://spacy.io/universe/project/video-spacys-ner-model