Simple Science

Scienza all'avanguardia spiegata semplicemente

# Informatica# Recupero delle informazioni

3DLNews: Un Archivio Completo di Notizie Locali

Esplora quasi un milione di articoli di notizie locali dal 1996 al 2024.

― 6 leggere min


Archivio Notizie Locali:Archivio Notizie Locali:1996-2024tutto gli Stati Uniti.Accedi a un sacco di notizie locali in
Indice

3DLNews è una nuova raccolta di Articoli di notizie locali dagli Stati Uniti. Copre un arco di tempo dal 1996 al 2024 e include quasi 1 milione di link a notizie da oltre 14.000 fonti, come giornali, canali TV e stazioni radio di ogni stato degli U.S.A. Questo dataset offre una buona panoramica delle notizie locali e del loro ruolo nelle diverse Comunità del paese. I dati sono stati raccolti cercando articoli su Google e Twitter e filtrando i link non legati alle notizie.

Importanza delle Notizie Locali

Le notizie locali sono fondamentali per le comunità. Con oltre 329 milioni di persone che vivono negli U.S.A. in migliaia di contee, i media nazionali non possono coprire ogni problema locale. I media locali si concentrano su preoccupazioni specifiche della comunità, come le attività governative, le performance scolastiche e gli eventi locali. Più della metà delle storie di notizie originali è creata da fonti locali. Le notizie locali hanno giocato un ruolo significativo nel riportare eventi importanti, come l'impatto della crisi degli oppioidi in Virginia Occidentale o la crisi idrica di Flint. Possono anche illustrare come diverse comunità hanno affrontato sfide come la pandemia di COVID-19. Per analizzare questi aspetti, avere dati sulle notizie locali è fondamentale.

Dataset di Notizie Esistenti

La maggior parte degli attuali dataset di notizie si concentra su argomenti nazionali o globali, fanno pagare un costo o hanno una copertura troppo ristretta. Qui è dove 3DLNews si distingue. È il primo dataset a fornire articoli di notizie locali dal 1996 al 2024 per l'intero Stati Uniti. Contiene link da vari media locali e include dettagli essenziali su ogni articolo.

Esistono altri dataset, ma non eguagliano la copertura o l'accessibilità di 3DLNews. Ad esempio, Media Cloud offre articoli di notizie globali ma non è gratuito. LexisNexis è una fonte a pagamento che potrebbe includere notizie locali degli U.S.A., ma manca di trasparenza sulla quantità di articoli locali. I dataset Nela-GT e GDELT, sebbene utili per analisi specifiche, non si concentrano esclusivamente sulle notizie locali americane. NELA-Local è quella più vicina per focus, ma include solo articoli di un periodo più breve e da meno fonti rispetto a 3DLNews.

Costruzione del Dataset 3DLNews

Per creare 3DLNews, il team ha utilizzato un dataset di notizie locali già esistente. Questo dataset precedente includeva siti web di migliaia di giornali e stazioni di broadcasting locali. Usando questo come punto di partenza, hanno raccolto ulteriori fonti di notizie locali per ampliare la collezione.

Passaggi di Estrazione Dati

  1. Creazione di Query di Ricerca: Hanno inizialmente scritto richieste specifiche di ricerca su Google per trovare articoli di notizie da ogni media, puntando ad articoli pubblicati dal 1996 al 2024. Un metodo simile è stato usato per cercare su Twitter.

  2. Raccolta Link: Il team ha poi raccolto link dai risultati di ricerca su Google e Twitter. Si sono concentrati sulla prima pagina dei risultati di Google e sui primi 20 tweet per ogni query per mantenere una collezione rappresentativa di storie di notizie locali.

  3. Filtraggio dei Link Non Notizie: Con il set iniziale di link raccolti, il team ha esaminato gli URL per rimuovere tutto ciò che non era un articolo di notizie. Hanno utilizzato vari criteri, tra cui il controllo dei reindirizzamenti e il confronto dei percorsi negli URL per separare gli articoli di notizie dai link alla home page.

  4. Arricchimento Dati: Per ogni articolo, hanno aggiunto informazioni utili come la data di pubblicazione, la posizione della fonte di notizie e i metadati riguardanti il media. Questo rende il dataset molto più prezioso per diversi tipi di analisi.

Panoramica della Copertura Dati

3DLNews copre tutti e 50 gli stati degli U.S.A. e include circa il 68% delle contee del paese. Tuttavia, alcune aree non hanno articoli di notizie locali disponibili, indicando "deserti di notizie", dove potrebbero mancare i media locali. Una mappa dettagliata mostra la distribuzione degli articoli per contea, aiutando a visualizzare il panorama delle notizie locali.

Analisi Temporale delle Notizie Locali

Il dataset mostra un aumento costante nel numero di articoli pubblicati nel tempo, riflettendo la crescita dell'accesso alle notizie digitali. Negli anni precedenti, c'erano meno articoli disponibili, il che suggerisce che le fonti di notizie locali avevano una presenza online minore. Questa tendenza crescente negli articoli può fornire spunti su come le notizie locali si siano evolute grazie alle piattaforme digitali.

Possibili Applicazioni di 3DLNews

3DLNews offre molte potenziali applicazioni per ricercatori e giornalisti. Ecco quattro aree chiave di applicazione:

  1. Studiare il Passaggio alle Notizie Nazionali: Un problema nei media locali è la tendenza a concentrarsi di più sulle notizie nazionali rispetto a quelle locali. 3DLNews può aiutare a quantificare quanto la copertura delle notizie locali sia oscurata dalle storie nazionali.

  2. Analizzare il Bias Mediatico: Indagare sul bias mediatico nel reporting locale è essenziale poiché influisce su come le comunità consumano notizie. Con una vasta gamma di articoli, 3DLNews può aiutare a identificare modelli di bias e fornire un quadro più chiaro della fiducia nei media locali rispetto a quelli nazionali.

  3. Ricercare i Deserti di Notizie: Il dataset può aiutare ad esaminare le aree che mancano di copertura locale. Monitorando il declino delle fonti di notizie locali, i ricercatori possono ottenere spunti sull'impatto della perdita di queste risorse sulle comunità.

  4. Acquisire Introspezioni sulla Comunità: Analizzando i contenuti delle notizie locali, i ricercatori possono scoprire le prospettive delle persone su vari problemi, tra cui salute, politica e sfide economiche nelle loro regioni.

Limitazioni di 3DLNews

Anche se 3DLNews è uno strumento prezioso, ha alcune limitazioni.

  • Potrebbero esserci alcuni URL non legati alle notizie che sono sfuggiti al processo di filtraggio. I ricercatori possono accedere ai dati grezzi per applicare i propri filtri.

  • Il dataset non include articoli che erano archiviati ma non sono più accessibili online. Aggiornamenti futuri potrebbero affrontare questo problema.

  • Il processo di web scraping ha limitato il numero di articoli raccolti.

  • Alcuni articoli potrebbero provenire da organizzazioni di notizie ormai chiuse, rendendo difficile determinare quanti articoli non siano disponibili.

  • Il focus geografico si basa sulle posizioni delle organizzazioni di notizie piuttosto che sulle aree trattate negli articoli. Lavori futuri mirano a identificare le effettive località menzionate negli articoli.

Conclusione

3DLNews apre la strada ai ricercatori per studiare le notizie locali negli U.S.A. e capirne l'importanza negli ultimi tre decenni. Con la sua ampia copertura delle storie di notizie locali, questo dataset può aiutare ad analizzare vari problemi comunitari e come influenzano la vita delle persone. Il progetto evidenzia il ruolo critico che i media locali svolgono nel riportare argomenti importanti che contano per le comunità in tutto il paese. Man mano che i ricercatori continuano a esplorare questo dataset, potrebbero svelare nuove intuizioni sul panorama delle notizie locali negli U.S.A. e sulla sua evoluzione nel tempo.

Articoli simili