Abordagem Reborn: Uma Nova Era em Dados de Pesquisa
Um método pra criar dados que as máquinas conseguem ler antes da publicação pra melhorar a eficiência da pesquisa.
― 8 min ler
Índice
- A Necessidade de Mudança
- Introduzindo a Abordagem Reborn
- Benefícios da Produção de Dados Pré-Publicação
- Como Funciona a Abordagem Reborn
- Casos de Uso da Abordagem Reborn
- Comparação de Abordagens
- O Papel dos Editores
- Implicações para o Processo de Revisão por Pares
- Perspectivas Futuras
- Conclusão
- Fonte original
- Ligações de referência
Artigos de pesquisa ajudam a compartilhar conhecimento científico, mas muitas vezes são difíceis para as máquinas lerem e usarem. Quando os cientistas escrevem suas descobertas em texto simples, isso dificulta a compreensão e o processamento das informações pelos computadores. Isso cria problemas quando os pesquisadores querem reunir e analisar Dados de múltiplos estudos, porque muitas vezes têm que fazer esse trabalho manualmente, o que pode levar muito tempo e gerar erros.
Para resolver isso, a gente propõe uma nova abordagem chamada "reborn." Em vez de esperar até que a pesquisa seja publicada para extrair dados úteis, esse método visa criar dados legíveis por máquina mesmo antes de um estudo ser publicado. Ao garantir que a pesquisa seja produzida em um formato que os computadores possam entender facilmente, conseguimos agilizar a forma como o conhecimento científico é compartilhado e reutilizado.
A Necessidade de Mudança
Artigos Científicos têm sido a principal forma de comunicação das descobertas dos pesquisadores há séculos. No entanto, na era digital de hoje, depender apenas de texto tem suas desvantagens. A pesquisa publicada muitas vezes fica escondida em documentos longos que não são fáceis de extrair informações. Pesquisadores que querem fazer Pesquisas de síntese, como meta-análises, acabam gastando meses puxando dados manualmente de vários artigos e organizando isso em bancos de dados utilizáveis.
O tempo e o esforço necessários para esse processo destacam uma necessidade clara de uma maneira mais eficiente de organizar e compartilhar as descobertas da pesquisa. Automatizando a extração de dados dos artigos, conseguimos reduzir a carga de trabalho dos pesquisadores e melhorar a qualidade dos dados utilizados.
Introduzindo a Abordagem Reborn
A abordagem reborn busca mudar como o conhecimento científico é criado e compartilhado. Em vez de focar na extração de dados após a Publicação, ela visa garantir que os dados sejam criados em um formato padronizado e legível por máquina desde o início. Isso significa que, enquanto os pesquisadores analisam seus dados, eles também os preparariam para uso futuro por máquinas.
Esse método se baseia em tecnologias existentes para apoiar a produção de dados estruturados. Ao integrar essas práticas no fluxo de trabalho da pesquisa, conseguimos criar um sistema onde o conhecimento é facilmente encontrável e utilizável tanto por humanos quanto por máquinas.
Benefícios da Produção de Dados Pré-Publicação
Eficiência: Ao tornar os dados legíveis por máquina desde o início, os pesquisadores economizam tempo. Eles não precisarão gastar meses extraindo e organizando dados após a publicação.
Precisão: Criar dados em um formato estruturado reduz as chances de erros que podem acontecer durante a extração manual.
Padronização: Essa abordagem incentiva o uso de formatos e templates comuns, facilitando para os pesquisadores compartilhar e comparar descobertas em diferentes estudos.
Visibilidade: Quando os dados são produzidos em um formato legível por máquina, fica mais fácil para máquinas e pesquisadores encontrarem e utilizarem, melhorando o processo científico como um todo.
Como Funciona a Abordagem Reborn
O processo reborn pode ser dividido em uma série de etapas simples:
Geração de Dados: À medida que os pesquisadores conduzem sua análise, eles se certificarão de usar ferramentas que produzam dados legíveis por máquina. Isso envolve escrever instruções adicionais em seus scripts de análise de dados que convertem suas descobertas em formatos estruturados.
Submissão de Dados: Depois de finalizar sua pesquisa, os autores submetem tanto seus artigos quanto os dados suplementares aos editores. Esses dados devem estar claramente ligados ao artigo original para que seja fácil encontrá-los depois.
Coleta de Dados: Assim que o artigo é publicado, os sistemas podem coletar e organizar automaticamente os dados legíveis por máquina. Esses dados podem ser acessados e reutilizados por pesquisadores para estudos futuros.
Casos de Uso da Abordagem Reborn
Caso de Uso em Ciência do Solo
Em um exemplo recente, pesquisadores examinaram como as culturas de cobertura afetam a estrutura do solo e a distribuição de carbono. Usando a abordagem reborn, eles integraram sua análise de dados diretamente em seu processo de pesquisa.
Eles criaram templates estruturados que detalhavam suas descobertas, que foram então submetidos junto com seu artigo. Isso permitiu que eles compartilhassem seus dados de uma forma que era facilmente acessível para outros pesquisadores.
Caso de Uso em Ciência da Computação
Outro grupo de pesquisadores focou em quão bem modelos de linguagem grandes realizam tarefas como descobrir sinônimos. Seguindo o modelo reborn, eles garantiram que seus dados de desempenho fossem estruturados e claros.
Como resultado, sua pesquisa publicada incluiu expressões legíveis por máquina de suas descobertas, permitindo uma comparação direta com outros estudos na área.
Caso de Uso em Agroecologia
Um estudo analisou os efeitos da composição da paisagem no rendimento das culturas. Usando a abordagem reborn, os pesquisadores produziram dados detalhados legíveis por máquina sobre sua análise.
Isso foi aplicado retroativamente ao artigo publicado, demonstrando como estudos anteriores também poderiam se beneficiar desse novo método, aprimorando as possibilidades para futuras pesquisas.
Comparação de Abordagens
Podemos comparar os métodos tradicionais de extração de dados com a abordagem reborn ao longo de várias dimensões importantes:
Precisão: Métodos de extração automatizados frequentemente têm dificuldades em capturar informações detalhadas com precisão. Ao embutir a produção de dados no fluxo de trabalho da pesquisa, a abordagem reborn garante precisão desde o início.
Riqueza: Métodos tradicionais podem ter dificuldades em extrair expressões detalhadas e legíveis por máquina do conhecimento. A abordagem reborn torna mais simples criar representações ricas de dados.
Simplicidade: A produção de dados pré-publicação é mais fácil de implementar do que automação complexa pós-publicação.
Escalabilidade: Embora sistemas automatizados possam teoricamente gerenciar grandes quantidades de dados, sua aplicação prática pode ser limitada. A abordagem reborn pode ser aplicada amplamente às comunidades de pesquisa.
Legado: Métodos de extração tradicionais podem analisar artigos publicados há muito tempo. A abordagem reborn é projetada para pesquisas atuais e futuras, mas também pode beneficiar estudos existentes.
O Papel dos Editores
Para que a abordagem reborn ganhe tração, os editores têm um papel crucial a desempenhar. Eles podem ajudar:
Fornecendo diretrizes claras para os autores sobre como implementar a abordagem reborn em suas pesquisas.
Destacando exemplos de aplicações bem-sucedidas do método reborn em artigos publicados.
Garantindo que os dados suplementares sejam facilmente acessíveis e possam ser descobertos por meio da interligação com os metadados dos artigos.
Implicações para o Processo de Revisão por Pares
Os dados suplementares criados através da abordagem reborn podem melhorar o processo de revisão por pares de várias maneiras:
Permite apresentações mais claras das descobertas, facilitando para os revisores entenderem os resultados.
Revisores podem verificar a precisão dos resultados relatados com dados estruturados e detalhados.
Ao vincular a scripts legíveis por máquina, os revisores podem verificar facilmente a reprodutibilidade da pesquisa.
Perspectivas Futuras
Ao olharmos para o futuro, a abordagem reborn tem o potencial de transformar significativamente o cenário da pesquisa científica e publicação. Com a rápida expansão da produção de pesquisas, é crucial que encontremos maneiras mais eficazes de produzir, compartilhar e reutilizar conhecimento científico.
Ao incentivar práticas que suportem dados legíveis por máquina, abrimos caminho para avanços científicos mais rápidos e precisos. Os pesquisadores provavelmente aceitarão essas práticas à medida que se tornarem mais conscientes de seus benefícios.
A abordagem reborn pode ser um motor chave para garantir que os dados científicos sejam acessíveis e reutilizáveis, levando, em última análise, a um progresso mais rápido em vários campos de pesquisa.
Conclusão
A abordagem reborn oferece uma solução promissora para os desafios impostos pelos métodos tradicionais de publicação de pesquisa. Ao enfatizar a criação de dados legíveis por máquina desde o início do processo de investigação, podemos aumentar a eficiência, precisão e utilidade do conhecimento científico.
Adotar essa abordagem pode ajudar a modernizar a comunicação acadêmica, facilitando para os pesquisadores compartilharem suas descobertas e para outros acessarem e construírem sobre esse conhecimento. À medida que o futuro da pesquisa científica se desenrola, abraçar o modelo reborn pode se tornar cada vez mais essencial para avançar nossa compreensão do mundo.
Título: Rethinking the production and publication of machine-reusable expressions of research findings
Resumo: Literature is the primary expression of scientific knowledge and an important source of research data. However, scientific knowledge expressed in narrative text documents is not inherently machine reusable. To facilitate knowledge reuse, e.g. for synthesis research, scientific knowledge must be extracted from articles and organized into databases post-publication. The high time costs and inaccuracies associated with completing these activities manually has driven the development of techniques that automate knowledge extraction. Tackling the problem with a different mindset, we propose a pre-publication approach, known as reborn, that ensures scientific knowledge is born reusable, i.e. produced in a machine-reusable format during knowledge production. We implement the approach using the Open Research Knowledge Graph infrastructure for FAIR scientific knowledge organization. We test the approach with three use cases, and discuss the role of publishers and editors in scaling the approach. Our results suggest that the proposed approach is superior compared to classical manual and semi-automated post-publication extraction techniques in terms of knowledge richness and accuracy as well as technological simplicity.
Autores: Markus Stocker, Lauren Snyder, Matthew Anfuso, Oliver Ludwig, Freya Thießen, Kheir Eddine Farfar, Muhammad Haris, Allard Oelen, Mohamad Yaser Jaradeh
Última atualização: 2024-05-21 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2405.13129
Fonte PDF: https://arxiv.org/pdf/2405.13129
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.
Ligações de referência
- https://commons.datacite.org
- https://graph.openaire.eu/
- https://doi.org/10.5194/soil-10-139-2024
- https://doi.org/10.48366/R664252
- https://doi.org/10.57702/yztrbsd4
- https://soil.copernicus.org/articles/10/139/2024/soil-10-139-2024-assets.html
- https://api.crossref.org/works/10.5194/soil-10-139-2024
- https://doi.org/10.48366/R661500
- https://doi.org/10.57702/9zhuubz9
- https://paperswithcode.com
- https://doi.org/10.1002/eap.1695
- https://doi.org/10.48366/R689181
- https://doi.org/10.57702/eyff90ic
- https://hi-knowledge.org/
- https://plazi.org/
- https://stato-ontology.org
- https://typeregistry.org
- https://typeregistry.lab.pidconsortium.net/
- https://purl.obolibrary.org/obo/OBI
- https://www.crossref.org/
- https://datacite.org/
- https://orkg.org/help-center/article/47/reborn
- https://orkg.org/templates
- https://orkg.org
- https://orkg.readthedocs.io
- https://sandbox.orkg.org
- https://orkg.org/paper/R691379
- https://orkg.org/comparison?contributions=R691381,R691401,R691391
- https://gitlab.com/TIBHannover/orkg/
- https://orkg.org/data
- https://doi.org/10.1007/s12110-009-9068-2
- https://www.nature.com/sdata/policies/editorial-and-publishing-policies#competing
- https://purl.obolibrary.org/obo/TO_0002605
- https://api.datacite.org/dois/10.57702/yztrbsd4
- https://service.tib.eu/.../contribution-1.json
- https://api.datacite.org/dois?query=