Compartir Datos de Investigación en la Sociedad Max Planck en 2020
Este artículo revisa las prácticas de compartir datos en la investigación en la Sociedad Max Planck.
― 10 minilectura
Tabla de contenidos
- El Aumento del Compartir Datos en la Investigación
- Percepciones sobre el Compartir Datos
- Progreso en las Políticas de Datos Abiertos
- El Estado de las Políticas de Datos de Investigación Abiertos en 2020
- Observaciones sobre el Compartir Datos de Investigación
- Compartir Datos como Parte de una Buena Práctica Científica
- Ejemplos de Proyectos de Datos de Investigación Abiertos
- Examinando Publicaciones de la Sociedad Max Planck en 2020
- Hallazgos sobre la Disponibilidad de Datos de Investigación
- Software de Investigación en Publicaciones
- Resumen de los Puntos Clave
- Fuente original
- Enlaces de referencia
Este artículo analiza cómo se publicaron y gestionaron los Datos de Investigación dentro de la Sociedad Max Planck en 2020. Un hallazgo clave fue que alrededor del 40% de las publicaciones empíricas tenían datos de investigación asociados. Aunque hubo pequeñas diferencias entre las distintas secciones de la Sociedad, no fueron tan significativas como uno podría pensar. Las revistas con políticas de datos claras tendían a tener más datos publicados conectados a sus artículos. Por último, la frase "datos disponibles a solicitud razonable" a menudo no conducía a que se compartieran datos reales.
El Aumento del Compartir Datos en la Investigación
Compartir datos se está convirtiendo en una práctica común en la investigación científica. La Accesibilidad de los datos se ve cada vez más como crucial para hacer que los resultados científicos sean reproducibles. Los organismos financiadores y las Instituciones públicas están comenzando a exigir a los investigadores que hagan sus datos lo más accesibles posible. Hay esfuerzos en curso para que el manejo adecuado de los datos de investigación sea una práctica estándar.
A pesar de esta tendencia, a menudo hay una brecha entre lo que se espera y lo que realmente se hace. Las razones de esta brecha involucran a científicos, editores y las instituciones que brindan el apoyo necesario. Aunque muchos científicos están de acuerdo en compartir sus datos, ya sea por elección u obligación, sigue siendo sorprendentemente raro. El objetivo es hacer que compartir datos sea menos doloroso y más sencillo.
Percepciones sobre el Compartir Datos
Compartir datos no es un concepto nuevo; la gente ha compartido conocimiento durante mucho tiempo. Sin embargo, la práctica de compartir datos abiertamente ha ganado impulso en los últimos años, especialmente debido al auge de las tecnologías digitales. Este nuevo enfoque ha llevado a un tipo de Publicación conocido como "datos" o "conjunto de datos".
La tendencia hacia los datos abiertos significa que los investigadores están cada vez más dispuestos a compartir sus datos libremente, permitiendo que otros accedan a ellos sin barreras. Esto se puede hacer adjuntando los datos a la publicación escrita o publicándolos como un conjunto de datos independiente en un repositorio. La visibilidad de los datos de investigación también está creciendo, ya que se pueden descubrir mediante diversos métodos de acceso. Para los datos con acceso restringido, es vital que la información descriptiva sobre los datos, conocida como metadatos, esté fácilmente disponible. Esta información ayuda a los investigadores a entender qué datos existen y cómo pueden solicitar acceso.
Además, los datos a menudo pueden reutilizarse de maneras inesperadas. Un enfoque más reflexivo sobre las licencias de datos puede facilitar que otros utilicen los datos en futuros estudios. Los investigadores están comenzando a reconocer que pueden surgir nuevas preguntas a partir de datos pasados, similar al desarrollo de software, donde la licencia se está convirtiendo en una práctica estándar. Cuando se comparten datos, a menudo conducen a más citas en resultados científicos, destacando su importancia.
Progreso en las Políticas de Datos Abiertos
En Alemania, durante la década de 2010, las discusiones sobre compartir datos se volvieron más intensas, lo que llevó a una mayor aceptación de formatos de publicación de datos estándar. Un paso significativo fue la introducción de los principios FAIR de datos en 2016, que buscaban proporcionar pautas simples para hacer que los datos de investigación sean más encontrables, accesibles, interoperables y reutilizables. Estos principios no solo han influido en las discusiones a nivel nacional, sino que también se alinean con los desarrollos en toda Europa y a nivel global.
En el tiempo que precedió a los principios FAIR, varias recomendaciones destinadas a mejorar la accesibilidad de los datos fueron realizadas por diversas organizaciones alemanas. Contribuciones notables se hicieron en 2007 cuando la OCDE publicó pautas para los datos. En 2009 y 2010, la Fundación Alemana de Investigación y la Alianza de Organizaciones Científicas Alemanas publicaron sus propias recomendaciones para la gestión de datos. Estas sentaron las bases para desarrollos posteriores.
Las instituciones comenzaron a crear sus propias políticas de datos, con un aumento notable de tales políticas alrededor de 2014. Las diferencias entre instituciones se hicieron evidentes, ya que algunas adoptaron políticas por un deseo de cumplimiento, mientras que otras buscaron fomentar la participación voluntaria. Esta tendencia reflejó un enfoque creciente en gestionar los datos de investigación de manera responsable.
El Estado de las Políticas de Datos de Investigación Abiertos en 2020
En 2020, no se estableció una política general de datos de investigación en la Sociedad Max Planck. Diferentes institutos y departamentos abordaron el tema de diversas maneras. Se desarrollaron algunas pautas locales en institutos específicos que delineaban cómo se deberían manejar los datos de investigación. Sin embargo, muchas áreas parecían carecer de procedimientos formales, lo que puede indicar que los investigadores ya estaban manejando sus datos de manera responsable. Aún así, a menudo resultó en enfoques variados para la gestión de datos en diferentes departamentos.
Junto con las motivaciones internas, las perspectivas de las agencias financiadoras también influyeron en las prácticas de compartir datos. Ha habido un claro movimiento hacia hacer los datos de investigación abiertos como condición para recibir subvenciones. Tanto los organismos de financiación nacionales como europeos presionaron a los investigadores para que fueran más considerados en su gestión de datos.
Observaciones sobre el Compartir Datos de Investigación
El análisis del compartir datos de investigación destacó varios puntos importantes. En primer lugar, la disponibilidad de datos variaba significativamente entre diferentes tipos de publicaciones. En trabajos empíricos, los investigadores generalmente esperan que sus datos sean accesibles, ya sea abiertamente o de manera limitada. Sin embargo, alrededor del 60% de las publicaciones empíricas no proporcionaron datos disponibles, lo que indica que hay margen para mejorar.
En segundo lugar, el nivel de agregación de los datos disponibles se analizó a menudo, pero los datos en bruto también seguían siendo demandados. La decisión sobre la publicación debería hacerse caso por caso, dependiendo del contexto y la disciplina.
En tercer lugar, las políticas de datos institucionales pueden aumentar la visibilidad de la investigación asociada con los textos publicados. Normas claras pueden llevar a que los datos de investigación sean más accesibles en el futuro.
Sin embargo, las declaraciones comunes como "datos disponibles a solicitud razonable" a menudo fallaron en entregar los resultados esperados, con bajas tasas de respuesta de los autores. Esto ilustra un desajuste entre lo que los científicos pretenden hacer y lo que realmente sucede.
Compartir Datos como Parte de una Buena Práctica Científica
En la Sociedad Max Planck, la buena práctica científica estableció pautas para gestionar datos de investigación. Sin embargo, estas pautas no se referían explícitamente a los datos de investigación en ese momento. En cambio, términos como "datos primarios" eran más utilizados. Se esperaba que los investigadores documentaran sus datos adecuadamente, asegurando acceso para personal autorizado.
Para 2020, quedó claro que la conversación sobre el compartir datos estaba evolucionando, especialmente dadas las nuevas reglas que se habían establecido respecto a las buenas prácticas científicas. La creciente tendencia hacia los datos de investigación abiertos indicó una necesidad urgente de un cambio cultural dentro de la Sociedad.
Ejemplos de Proyectos de Datos de Investigación Abiertos
Varios proyectos clave dentro de la Sociedad Max Planck tenían como objetivo promover datos de investigación abiertos. Por ejemplo, un proyecto se centra en una colección de imágenes de alta calidad de rostros humanos. Aunque el acceso es algo restringido, facilita en última instancia una variedad de estudios científicos y resulta beneficioso para los investigadores.
Otro proyecto relevante es una plataforma que recoge y procesa datos sobre el movimiento animal, permitiendo la visión de varios comportamientos. Este proyecto ha crecido significativamente a lo largo de los años y ha llevado a numerosas publicaciones científicas.
El Repositorio NOMAD funciona como un extenso banco de datos para la ciencia de materiales computacionales, donde los investigadores pueden compartir y acceder a datos en bruto y procesados. Tales iniciativas muestran el compromiso con los datos de investigación abiertos.
Examinando Publicaciones de la Sociedad Max Planck en 2020
En 2020, las discusiones sobre los datos de investigación y el acceso abierto se volvieron más prominentes en la Sociedad Max Planck. Sin embargo, no había una obligación general para que los investigadores hicieran públicos sus datos. Las publicaciones de ese año pueden servir como base para observar los desarrollos futuros.
El análisis se centró en publicaciones con al menos un autor del Instituto Max Planck. La mayoría de las publicaciones eran artículos de revistas. También fue evidente que una parte significativa de las publicaciones empíricas tenía datos de investigación asociados; sin embargo, un número considerable carecía de este elemento esencial.
Hallazgos sobre la Disponibilidad de Datos de Investigación
El enfoque en la disponibilidad de datos reveló que solo el 40% de las publicaciones empíricas seleccionadas hicieron datos de investigación disponibles. Sin embargo, este porcentaje necesita un examen más cercano. El número real de publicaciones donde los datos estaban completamente accesibles era mucho menor.
Para muchas publicaciones, los autores afirmaron que los datos estaban "disponibles a solicitud razonable", pero los intentos de acceder a estos datos a menudo resultaron improductivos. Solo una minoría de solicitudes resultó en datos reales compartidos, destacando los desafíos en obtener datos de investigación.
Software de Investigación en Publicaciones
En muchos estudios, los investigadores también utilizan software necesario para analizar sus datos. Curiosamente, el software se mencionó en un número considerable de publicaciones, siendo la mayoría de acceso abierto. Esto contrasta marcadamente con la disponibilidad de datos de investigación, donde el acceso a menudo es limitado.
Resumen de los Puntos Clave
El análisis de las publicaciones de investigación de la Sociedad Max Planck en 2020 mostró variaciones significativas en las prácticas de manejo de datos. Aquí hay varios aspectos destacados:
Hubo una notable diferencia entre las expectativas y la disponibilidad real de datos entre los investigadores, especialmente para trabajos empíricos. Solo alrededor del 40% de los datos estaban fácilmente disponibles, mientras que casi el 60% no tenía datos accesibles.
Los niveles de agregación de los datos disponibles variaron. No hay una respuesta única sobre cuándo publicar datos; a menudo depende de la situación.
Políticas de datos sólidas pueden llevar a una mayor disponibilidad de datos asociados con publicaciones científicas.
La declaración prevalente sobre los datos disponibles a solicitud a menudo no cumplió con entregar datos reales.
Diferentes secciones dentro de la Sociedad Max Planck mostraron culturas variadas respecto al manejo de datos de investigación, pero las diferencias no fueron tan marcadas como se anticipaba.
En conclusión, a medida que la Sociedad Max Planck avanza, la importancia de la ciencia abierta y de los datos de investigación abiertos probablemente continuará creciendo. Hay numerosas oportunidades para avanzar en el manejo de datos de investigación y fomentar una cultura que valore el compartir datos. Observar cómo cambian los comportamientos de publicación en respuesta a estos desarrollos será crucial en los próximos años.
Título: Handling Open Research Data within the Max Planck Society -- Looking Closer at the Year 2020
Resumen: This paper analyses the practice of publishing research data within the Max Planck Society in the year 2020. The central finding of the study is that up to 40\% of the empirical text publications had research data available. The aggregation of the available data is predominantly analysed. There are differences between the sections of the Max Planck Society but they are not as great as one might expect. In the case of the journals, it is also apparent that a data policy can increase the availability of data related to textual publications. Finally, we found that the statement on data availability "upon (reasonable) request" does not work.
Autores: Martin Boosen, Michael Franke, Yves Vincent Grossmann, Sy Dat Ho, Larissa Leiminger, Jan Matthiesen
Última actualización: 2024-02-28 00:00:00
Idioma: English
Fuente URL: https://arxiv.org/abs/2402.18182
Fuente PDF: https://arxiv.org/pdf/2402.18182
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.
Enlaces de referencia
- https://orcid.org/#1
- https://orcid.org/0009-0009-3989-5087
- https://orcid.org/0000-0002-2661-8242
- https://orcid.org/0000-0002-2880-8947
- https://orcid.org/0000-0002-6218-4146
- https://orcid.org/0000-0002-6491-3197
- https://orcid.org/0000-0001-6548-3654
- https://ror.org/0061msm67
- https://quest-dashboard.charite.de
- https://eoscpilot.eu
- https://pandoradata.earth
- https://edmond.mpdl.mpg.de
- https://s.gwdg.de/G14Bgw
- https://data.goettingen-research-online.de
- https://www.wdc-climate.de
- https://faces.mpdl.mpg.de
- https://www.movebank.org
- https://www.movebank.org/cms/movebank-content/literature
- https://nomad-lab.eu/services/repo-arch
- https://pure.mpg.de
- https://esac-initiative.org/market-watch/
- https://github.com
- https://arxiv.org/
- https://rdm.mpdl.mpg.de/mpdl-services/workshops/
- https://fairdashboard.helmholtz-metadaten.de/
- https://barometredelascienceouverte.esr.gouv.fr
- https://doi.org/10.17617/3.XI0LP5
- https://mybinder.org/v2/dataverse/10.17617/3.XI0LP5