Sfruttare il Microsoft Academic Knowledge Graph per la ricerca
Una nuova strumento semplifica l'accesso ai dati scientifici per i ricercatori.
― 6 leggere min
Indice
- Sfide nell’Accesso ai Dati Scientifici
- Introduzione al Microsoft Academic Knowledge Graph
- Vantaggi del Microsoft Academic Knowledge Graph
- Creazione del Microsoft Academic Knowledge Graph
- Collegamento ad Altre Fonti di Dati
- Utilizzo del Microsoft Academic Knowledge Graph
- Utilizzo Attuale del Microsoft Academic Knowledge Graph
- Prospettive Future
- Conclusione
- Fonte originale
- Link di riferimento
Ogni anno, milioni di articoli scientifici e atti di conferenze vengono pubblicati. Attualmente, ci sono più di 81 milioni di articoli di riviste e oltre 4 milioni di atti di conferenze disponibili in vari campi della scienza. Questa ricchezza di informazioni può supportare nuovi sistemi e metodi nelle biblioteche digitali, rendendo più facile per le persone trovare studi, articoli e ricercatori pertinenti.
Sfide nell’Accesso ai Dati Scientifici
Accedere a grandi set di dati sui lavori scientifici, i ricercatori e le Istituzioni è spesso difficile. Molti fornitori di dati non seguono le regole stabilite dal World Wide Web Consortium (W3C) per rendere i dati accessibili. Pochissimi di loro organizzano i propri dati in un modo che consente un accesso più facile e una connessione con altre fonti di dati. I set di dati esistenti spesso hanno limitazioni, come essere troppo piccoli o focalizzati solo su aree specifiche della scienza, o essere obsoleti.
Introduzione al Microsoft Academic Knowledge Graph
Per affrontare queste sfide, è stato creato un nuovo grande set di dati, noto come Microsoft Academic Knowledge Graph (MAKG). Questo set di dati contiene oltre 8 miliardi di informazioni relative a pubblicazioni scientifiche, ricercatori, istituzioni, riviste e materiali delle conferenze. È costruito sul Microsoft Academic Graph, che è una grande risorsa di informazioni scientifiche.
Contrariamente a quanto suggerisce il nome, i dati non sono presentati come un grafo di conoscenza, ma sono forniti in grandi file di testo. Anche se i dati sono estesi e coprono molte aree di ricerca, gestirli richiede molto impegno ed esperienza. I ricercatori in aree come le biblioteche digitali e le scienze sociali potrebbero non avere le abilità o gli strumenti necessari per lavorare con questo tipo di dati.
Per rendere questi dati più facili da usare, il MAKG è stato organizzato in formato RDF, il che facilita l'accesso e l'uso con tecnologie web comuni. Inoltre, questi dati possono essere collegati ad altri database, rendendoli più preziosi per l'analisi e la ricerca.
Vantaggi del Microsoft Academic Knowledge Graph
Il MAKG offre vari vantaggi. Permette di esplorare gli articoli, rendendo possibile ricevere aggiornamenti ogni pochi mesi. Semplifica anche l'integrazione dei dati attraverso l'uso di RDF, consentendo alle risorse di connettersi facilmente con altri hub di dati. Inoltre, i ricercatori possono analizzare i dati per misurare l'impatto degli articoli, raccomandare studi e Autori pertinenti ed esplorare come i temi di ricerca cambiano nel tempo.
Questo grafo di conoscenza fornisce dati su diversi tipi di entità, come:
- Articoli: Il cuore del MAKG, che dettaglia il titolo, la data di pubblicazione e il conteggio delle citazioni.
- Autori: Informazioni su chi ha scritto gli articoli, le loro affiliazioni e i loro record di pubblicazione.
- Istituzioni: Dati sulle istituzioni di ricerca e i loro legami con articoli e autori.
- Conferenze: Dettagli sugli eventi accademici dove vengono presentati articoli di ricerca.
- Campi di Studio: Categorizzazione delle aree di ricerca a cui appartengono gli articoli.
Con queste connessioni, i ricercatori possono condurre analisi approfondite del panorama scientifico.
Creazione del Microsoft Academic Knowledge Graph
Per creare il MAKG, i dati dell'originale Microsoft Academic Graph sono stati elaborati e convertiti in formato RDF. Questo ha comportato diversi passaggi chiave:
- Estrazione dei Metadati degli Articoli: Le informazioni di base su ogni articolo sono state raccolte e organizzate.
- Collegamento di Autori e Istituzioni: Sono state fatte connessioni tra autori e le rispettive istituzioni utilizzando un dataset che includeva dettagli sulle affiliazioni.
- Incorporamento delle Informazioni sulle Conferenze: I dati delle conferenze e delle riviste sono stati collegati agli articoli pertinenti, fornendo contesto per i luoghi di pubblicazione.
- Organizzazione dei Campi di Studio: I campi di ricerca sono stati categorizzati in base alla loro complessità e associazioni con diversi articoli.
- Stabilire i Link di Citazione: Le informazioni su quali articoli citano altri articoli sono state documentate per creare una rete di riferimenti.
Questa trasformazione ha creato un ricco set di dati che può essere accessibile e utilizzato per molti scopi.
Collegamento ad Altre Fonti di Dati
Il MAKG collega anche i suoi dati ad altre fonti di dati ben note come DBpedia e Wikidata. Questo significa che i ricercatori possono facilmente connettersi e incrociare informazioni provenienti da diversi domini. Apre possibilità per ricerche più ampie e analisi più complete.
Utilizzo del Microsoft Academic Knowledge Graph
Il MAKG può essere utilizzato in vari modi:
- Query di Dati: Gli utenti possono estrarre informazioni specifiche su articoli, autori e citazioni tramite linguaggi di query progettati per il recupero dei dati.
- Elaborazione del Linguaggio Naturale: Il MAKG supporta compiti come le raccomandazioni di citazione, aiutando gli utenti a trovare articoli pertinenti al loro lavoro o interessi.
- Funzioni della Biblioteca Digitale: Il MAKG può assistere in compiti come l'analisi delle citazioni e il monitoraggio dell'impatto delle pubblicazioni.
- Strumenti di Benchmarking: Serve come risorsa per valutare metodi e sistemi nella ricerca scientifica e nella gestione dei dati.
Utilizzo Attuale del Microsoft Academic Knowledge Graph
Il MAKG è già utilizzato dalla comunità accademica. È stato citato in vari studi e analisi dei dati. Gli utenti visitano regolarmente il sito web del MAKG per accedere alle sue risorse. I dati hanno implicazioni pratiche in molti campi, tra cui istruzione, tecnologia e scienze sociali. Si incoraggiano i ricercatori a integrare il MAKG nei loro progetti per sfruttare l'enorme quantità di dati che contiene.
Prospettive Future
Guardando al futuro, ci sono piani per migliorare ulteriormente il MAKG. Si prevede che lo stile di lavoro dei ricercatori evolverà grazie alla flessibilità dell'uso dei dati collegati. Potrebbero emergere nuove forme di pubblicazione che includono annotazioni ed elementi interattivi, e il MAKG può facilmente integrare questi avanzamenti.
Le applicazioni potenziali per il MAKG sono enormi. Man mano che i ricercatori continuano a esplorare la ricchezza di dati che contiene, potrebbe cambiare significativamente il modo in cui le informazioni scientifiche vengono gestite e accessibili.
Conclusione
Il Microsoft Academic Knowledge Graph rappresenta un significativo avanzamento nella gestione dei dati scientifici. Con il suo vasto database e il potenziale per integrazione e analisi, fornisce risorse preziose per i ricercatori in vari discipline. Rendendo questi dati più accessibili e facili da usare, il MAKG apre nuove porte per l'esplorazione scientifica e la collaborazione. Si incoraggiano i ricercatori a esplorare le sue capacità e a sfruttare le informazioni disponibili per migliorare il loro lavoro.
Titolo: SemOpenAlex: The Scientific Landscape in 26 Billion RDF Triples
Estratto: We present SemOpenAlex, an extensive RDF knowledge graph that contains over 26 billion triples about scientific publications and their associated entities, such as authors, institutions, journals, and concepts. SemOpenAlex is licensed under CC0, providing free and open access to the data. We offer the data through multiple channels, including RDF dump files, a SPARQL endpoint, and as a data source in the Linked Open Data cloud, complete with resolvable URIs and links to other data sources. Moreover, we provide embeddings for knowledge graph entities using high-performance computing. SemOpenAlex enables a broad range of use-case scenarios, such as exploratory semantic search via our website, large-scale scientific impact quantification, and other forms of scholarly big data analytics within and across scientific disciplines. Additionally, it enables academic recommender systems, such as recommending collaborators, publications, and venues, including explainability capabilities. Finally, SemOpenAlex can serve for RDF query optimization benchmarks, creating scholarly knowledge-guided language models, and as a hub for semantic scientific publishing.
Autori: Michael Färber, David Lamprecht, Johan Krause, Linn Aung, Peter Haase
Ultimo aggiornamento: 2023-08-07 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2308.03671
Fonte PDF: https://arxiv.org/pdf/2308.03671
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.
Link di riferimento
- https://www.openaire.eu/pausing-our-lod-services
- https://wikicite.org/
- https://m.wikidata.org/wiki/Wikidata:SPARQL_query_service/WDQS_backend_update/Blazegraph_failure_playbook
- https://www.dagstuhl.de/en/institute/news/2022/dblp-in-rdf
- https://semopenalex.org/
- https://research.com/university/materials-science/humboldt-university-of-berlin
- https://marius-project.org
- https://doi.org/10.5281/zenodo.7912776
- https://semopenalex.org/class/
- https://semopenalex.org/property/
- https://openalex.org/
- https://www.w3.org
- https://www.w3.org/2002/07/owl
- https://www.w3.org/1999/02/22-rdf-syntax-ns
- https://www.w3.org/2000/01/rdf-schema
- https://purl.org/dc/terms/
- https://purl.org/spar/cito/
- https://purl.org/spar/fabio/
- https://purl.org/spar/bido/
- https://purl.org/spar/datacite
- https://prismstandard.org/namespaces/basic/2.0/
- https://dbpedia.org/ontology/
- https://dbpedia.org/property/
- https://xmlns.com/foaf/0.1/
- https://www.w3.org/ns/org
- https://www.geonames.org/ontology
- https://www.w3.org/2004/02/skos/core
- https://github.com/metaphacts/semopenalex
- https://www.w3.org/TR/rdf11-concepts/
- https://github.com/RDFLib/rdflib/
- https://www.w3.org/TR/trig/
- https://semopenalex.org/author/A2430569270
- https://www.w3.org/2001/XMLSchema#
- https://www.w3.org/2004/02/skos/core#
- https://openalex.org/about
- https://aws.amazon.com/opendata/open-data-sponsorship-program/
- https://5stardata.info/
- https://semopenalex.s3.amazonaws.com/browse.html
- https://semopenalex.org/work/W4239696231
- https://semopenalex.org/sparql
- https://orcid.org/#1
- https://semopenalex.org
- https://w3id.org/SemOpenAlex
- https://github.com/metaphacts/semopenalex/
- https://creativecommons.org/publicdomain/zero/1.0/
- https://opensource.org/license/mit/
- https://www.microsoft.com/en-us/research/project/microsoft-academic-graph/
- https://opendatacommons.org/licenses/by/1-0/index.html
- https://github.com/michaelfaerber/MAG2RDF
- https://www.grid.ac/
- https://ma-graph.org
- https://w3id.org/makg/
- https://doi.org/10.5281/zenodo.2159723
- https://ma-graph.org/entity/2826592117
- https://ma-graph.org/sparql
- https://www.springernature.com/de/researchers/scigraph
- https://ma-graph.org/
- https://rdfs.org/sioc/ns
- https://purl.org/NET/c4dm/timeline.owl#
- https://purl.org/vocab/frbr/core#
- https://url.org/spar/cito/
- https://purl.org/spar/datacite/
- https://prismstandard.org/namespaces/1.2/basic/
- https://purl.org/spar/c4o/
- https://www.grid.ac/institutes/grid.446382.f
- https://clair.eecs.umich.edu/aan/index.php
- https://www.comp.nus.edu.sg/~sugiyama/Dataset2.html
- https://github.com/michaelfaerber/makg-linking
- https://dx.doi.org/
- https://www.w3.org/1999/02/22-rdf-syntax-ns#
- https://ma-graph.org/property/
- https://www.w3.org/ns/org#
- https://ma-graph.org/class/FieldOfStudy
- https://dbpedia.org/resource/
- https://docs.microsoft.com/en-us/academic-services/graph/get-started-setup-provisioning
- https://lov.okfn.org/vocommons/voaf
- https://www.w3.org/TR/void/
- https://ma-graph.org/usage-statistics/
- https://www.openacademic.ai/oag/