Tempi delle Revisioni Sistematiche della Letteratura nell'Ingegneria del Software
Questo studio identifica le caratteristiche chiave dei dataset nelle RSL di Ingegneria del Software.
― 6 leggere min
Indice
Le revisioni sistematiche della letteratura (SLR) sono importanti nel campo dell'Ingegneria del Software (SE). Negli ultimi vent'anni, il numero di studi SLR è aumentato. Le SLR sono più complesse delle revisioni letterarie normali e richiedono una pianificazione e un'esecuzione accurata. A causa dello sforzo coinvolto, i ricercatori devono essere certi della necessità di condurre una SLR.
Una domanda chiave è: quando è il momento giusto per condurre una SLR? Nonostante le linee guida disponibili, non c'è una risposta chiara su quando iniziare una SLR. Questo articolo cerca di fare luce su questo argomento analizzando i dati che formano la base di queste revisioni.
Obiettivo dello studio
L'obiettivo principale di questo studio è scoprire quali sono le caratteristiche dei dataset utilizzati nelle SLR in SE. In particolare, vogliamo sapere quanti articoli vengono solitamente esaminati in una SLR. Conoscere la dimensione del dataset può aiutare i ricercatori a capire se è un buon momento per condurre una SLR.
Per raggiungere questo obiettivo, abbiamo analizzato una selezione di SLR pubblicate in riviste SE rispettabili. Abbiamo raccolto dati sul numero di articoli esaminati e sul periodo di tempo che coprono.
Lavori correlati
Anche se ci sono linee guida che spiegano perché le SLR siano importanti e come condurle, nessuna fornisce tempistiche chiare o suggerimenti su quanti articoli includere in una SLR. Alcuni studi precedenti hanno esaminato quando aggiornare le SLR esistenti, ma non le SLR per la prima volta.
La ricerca indica che ogni argomento nel SE ha modelli di crescita diversi, rendendo difficile suggerire un numero unico di articoli per una SLR. Tuttavia, comprendere la dimensione media dei dataset delle SLR passate può aiutare i futuri ricercatori a prendere decisioni informate.
Approccio di ricerca
Per rispondere alla domanda principale, abbiamo utilizzato un metodo chiamato sintesi della ricerca. Questo significa che abbiamo preso vari studi sullo stesso argomento, riassunto i loro risultati e tratto delle conclusioni. Abbiamo esaminato diverse SLR in SE e ci siamo concentrati sui dataset utilizzati.
Raccolta dati
Per creare il nostro campione, abbiamo seguito una strategia di ricerca specifica. Anziché cercare di raccogliere tutte le SLR possibili, abbiamo mirato a un numero ragionevole che ci fornisse comunque dati solidi. Abbiamo incluso solo SLR da riviste di alto livello nel campo.
Abbiamo sviluppato una stringa di ricerca che combinava parole chiave relative a revisioni sistematiche con i nomi delle riviste rilevanti. Dopo aver cercato in un database, abbiamo trovato 412 articoli. Abbiamo poi esaminato attentamente questi articoli per assicurarci che soddisfacessero i nostri criteri per le SLR.
Estrazione dati
Il passo successivo è stato raccogliere dettagli importanti sulle SLR che abbiamo accettato nel nostro campione. Ci siamo concentrati su tre punti principali:
- Il numero di articoli esaminati (NoRP).
- L'anno di pubblicazione più antico negli articoli esaminati.
- L'anno di pubblicazione più recente negli articoli esaminati.
Se un SLR non forniva queste informazioni, l'abbiamo escluso dalla nostra analisi. Il nostro campione finale consisteva in 170 SLR.
Analisi dei dati
Nella fase di analisi, abbiamo esaminato il numero di articoli e il periodo di tempo che coprivano. Abbiamo calcolato le medie e le deviazioni standard per comprendere meglio i dati.
Panoramica del campione
Per prima cosa abbiamo esaminato le 170 SLR nel nostro campione. Negli anni, il numero di SLR pubblicate è generalmente aumentato, anche se ci sono stati alcuni anni con meno pubblicazioni.
Nei nostri risultati, abbiamo notato che il Journal of Systems and Software aveva il numero più alto di SLR, seguito da Information and Software Technology.
Caratteristiche dei dataset
Analizzando i dataset, abbiamo trovato un'ampia gamma nel numero di articoli esaminati. Il numero più basso era 6, mentre il più alto era 925. La media era di circa 80 articoli, il che significa che molte SLR esaminano più di 50 articoli.
Il periodo di revisione degli articoli variava anche, con la media che copriva circa 14 anni. Alcune SLR esaminavano articoli che si estendevano fino a 41 anni, mentre altre coprivano solo 2 anni.
Relazione tra le variabili
Abbiamo anche esaminato se ci fosse una connessione tra il numero di articoli esaminati e il periodo di revisione. Tuttavia, abbiamo trovato poca o nessuna relazione tra queste due variabili.
Questo significa che semplicemente contare il numero di articoli esaminati potrebbe non essere un modo affidabile per valutare il momento per condurre nuove SLR. Ogni domanda di ricerca o argomento potrebbe avere le sue caratteristiche uniche che non si adattano a una formula.
Conclusioni
Il nostro studio mostra che non c'è una regola chiara su quanti articoli dovrebbero essere inclusi in una SLR. Tuttavia, guardare il numero medio di articoli esaminati (circa 57) e il periodo di revisione tipico (circa 14 anni) può offrire una guida iniziale ai ricercatori.
Se i ricercatori stanno esaminando un argomento dove il numero di articoli è significativamente inferiore alla media, potrebbero considerare quel campo non ancora completamente sviluppato. Al contrario, se ci sono molti più articoli della media, potrebbe suggerire che la SLR potrebbe essere stata fatta prima.
Limitazioni
Una limitazione significativa di questo studio è che abbiamo esaminato solo SLR da riviste specifiche di alto livello e non abbiamo incluso quelle provenienti da conferenze. Di conseguenza, i nostri risultati potrebbero non essere applicabili a tutte le SLR nel campo.
Un'altra limitazione è che il numero di articoli esaminati è noto solo dopo che i ricercatori investono tempo nel raccogliere gli studi pertinenti. Questo rende difficile utilizzare questo numero come indicatore principale per quando condurre una SLR.
Passi futuri
Questo articolo è solo la prima parte di un'indagine più ampia sul momento delle SLR in SE. I lavori futuri esploreranno altri indicatori, come il numero totale di articoli trovati utilizzando la nostra strategia di ricerca.
Pianifichiamo anche di esaminare i fattori che potrebbero influenzare la dimensione dei dataset delle SLR, come i metodi utilizzati nella ricerca di articoli. Inoltre, vogliamo confrontare le SLR pubblicate in varie riviste e conferenze per avere una comprensione più ampia dell'argomento.
Next, we will investigate qualitative aspects, such as which areas of SE have been reviewed and how this relates to the overall development of the field.
Crediamo che le domande sollevate dalla nostra ricerca siano importanti per vari tipi di revisioni della letteratura, non solo per le SLR. Questo significa che il nostro approccio potrebbe aiutare a far avanzare la conoscenza in diverse aree.
Il supporto per questo studio è stato fornito da organizzazioni di ricerca pertinenti dedicate all'IT e alle comunicazioni.
Titolo: How Many Papers Should You Review? A Research Synthesis of Systematic Literature Reviews in Software Engineering
Estratto: [Context] Systematic Literature Review (SLR) has been a major type of study published in Software Engineering (SE) venues for about two decades. However, there is a lack of understanding of whether an SLR is really needed in comparison to a more conventional literature review. Very often, SE researchers embark on an SLR with such doubts. We aspire to provide more understanding of when an SLR in SE should be conducted. [Objective] The first step of our investigation was focused on the dataset, i.e., the reviewed papers, in an SLR, which indicates the development of a research topic or area. The objective of this step is to provide a better understanding of the characteristics of the datasets of SLRs in SE. [Method] A research synthesis was conducted on a sample of 170 SLRs published in top-tier SE journals. We extracted and analysed the quantitative attributes of the datasets of these SLRs. [Results] The findings show that the median size of the datasets in our sample is 57 reviewed papers, and the median review period covered is 14 years. The number of reviewed papers and review period have a very weak and non-significant positive correlation. [Conclusions] The results of our study can be used by SE researchers as an indicator or benchmark to understand whether an SLR is conducted at a good time.
Autori: Xiaofeng Wang, Henry Edison, Dron Khanna, Usman Rafiq
Ultimo aggiornamento: 2023-07-12 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2307.06056
Fonte PDF: https://arxiv.org/pdf/2307.06056
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.