Simple Science

Scienza all'avanguardia spiegata semplicemente

# Statistica# Metodologia

Testare l'Adattamento dei Modelli INAR: Un Nuovo Approccio

Presentiamo un metodo flessibile per valutare l'adeguatezza del modello INAR senza assunzioni rigide.

― 6 leggere min


Test del modello INARTest del modello INARinnovativoper modelli INAR.Nuovo test di adattamento flessibile
Indice

Tra i vari tipi di modelli per i dati di conteggio, i processi autoregressivi a valori interi (INAR) sono abbastanza popolari. Questi modelli sono utili quando i dati consistono in conteggi che cambiano nel tempo, permettendo di analizzare schemi e tendenze. Di solito, quando gli statistici usano i modelli INAR, fanno certe assunzioni sui dati sottostanti, come avere una distribuzione di Poisson o negativa binomiale.

Questo articolo introduce un modo nuovo per testare se un modello INAR si adatta bene senza imporre assunzioni specifiche sul tipo di distribuzione dei dati. Invece di assumere una distribuzione particolare, proponiamo un approccio Semi-parametrico, che consente maggiore flessibilità nell'esaminare i dati.

Introduzione ai Modelli INAR

I modelli INAR sono particolarmente adatti per modellare dati di serie temporali che consistono in valori interi non negativi, come conteggi di eventi o occorrenze. Un modo principale per definire un modello INAR è attraverso un'equazione ricorsiva. In queste equazioni, il conteggio attuale a un certo tempo dipende dai conteggi precedenti e da un insieme di innovazioni, che sono gli shock casuali o le fluttuazioni nei dati.

I coefficienti del modello giocano un ruolo chiave in questo contesto, assicurando che il processo rimanga a valori interi. Per fare ciò, introduciamo operazioni che aiutano a mantenere la natura intera della serie. In particolare, usiamo una tecnica chiamata operatore di diradamento binomiale, che assicura che le variabili casuali coinvolte nel modello si comportino in modo appropriato.

Sebbene i modelli INAR siano flessibili e abbiano molte applicazioni, la pratica comune nella letteratura è assumere una distribuzione specifica per le innovazioni. Questa assunzione può limitare l'applicabilità del modello e renderlo meno flessibile, poiché potrebbe non adattarsi sempre bene ai dati reali.

La Flessibilità dei Modelli Semi-Parametrici

Testare l'adattamento di un modello INAR richiede spesso un'ipotesi nulla specifica riguardo la distribuzione delle innovazioni sottostanti. Questa situazione porta a sfide poiché assumere una distribuzione rigida potrebbe non catturare la vera natura dei dati. Il nostro approccio suggerisce di testare l'ipotesi nulla che i dati seguano un modello INAR senza specificare la distribuzione delle innovazioni.

Questa flessibilità ci permette di esplorare modelli più complessi e potenzialmente più adatti ai dati in questione, portando a migliori intuizioni e decisioni basate su analisi statistiche. L'obiettivo è creare una procedura di test che possa convalidare accuratamente i modelli INAR senza queste assunzioni rigide.

Costruzione di una Statistica di Test

Per creare una statistica di test adeguata per la nostra ipotesi nulla, ci affidiamo a stimatori della funzione generatrice di probabilità congiunta (pgf). Questa funzione fornisce una descrizione completa della relazione tra i conteggi osservati e il modello sottostante. Costruendo una statistica di test basata su due diversi stimatori della pgf, possiamo valutare se il modello si adatta bene ai dati.

Un estimatore fornisce coerenza generale in vari contesti, mentre l'altro è adattato per adattarsi sotto l'ipotesi nulla. Questo approccio doppio ci consente di testare la bontà di adattamento senza essere vincolati a restrizioni parametriche specifiche.

Funzione Generatrice di Probabilità Congiunta

Un elemento chiave nella nostra procedura di test è la pgf congiunta di variabili casuali consecutive, che cattura la struttura di dipendenza dei dati. Questa funzione è cruciale per determinare se i dati mostrano il comportamento INAR previsto. Derivando la pgf congiunta, possiamo analizzare quanto bene il modello si adatta ai dati.

La pgf congiunta può essere espressa come un prodotto di due fattori: uno dipende esclusivamente dalla distribuzione delle innovazioni, mentre l'altro riguarda i coefficienti del modello. Questa rappresentazione non richiede ulteriori assunzioni sulla distribuzione sottostante, rendendola una scelta solida per la nostra metodologia di test.

Stima del Modello INAR

Quando si stima il modello INAR senza fare assunzioni parametriche, diventa difficile determinare i coefficienti del modello e la natura delle innovazioni. Invece di affidarsi a metodi di stima tradizionali, proponiamo un estimatore semi-parametrico che consente la stima congiunta dei coefficienti del modello e della distribuzione delle innovazioni.

Questo estimatore semi-parametrico è efficace ed efficiente, poiché non impone restrizioni inutili pur catturando le caratteristiche essenziali dei dati sottostanti. Questa adattabilità è significativa quando si lavora con dati reali che potrebbero non rispettare assunzioni rigide sulla distribuzione.

Procedura di Test

Iniziamo osservando un campione di dati di conteggio di serie temporali e puntiamo a costruire la nostra statistica di test per l'ipotesi nulla. Utilizzando due stimatori della pgf, stabiliremo una statistica di test che sia robusta e possa tenere conto delle variazioni nei dati senza essere ostacolata da assunzioni parametriche.

Poiché la nostra procedura di test comporta integrazione, introduciamo anche una procedura bootstrap per stimare valori critici, migliorando la praticità del nostro metodo. Questo passaggio è essenziale poiché ci consente di applicare la nostra procedura di test più facilmente in scenari reali con set di dati diversi.

Studi di Simulazione

Per valutare le prestazioni del nostro test di bontà di adattamento proposto, conduciamo ampie simulazioni. In queste simulazioni, generiamo dati da diversi processi, sia sotto l'ipotesi nulla che sotto varie alternative, per valutare quanto bene il nostro test possa rilevare deviazioni dall'ipotesi nulla.

I risultati dei nostri studi di simulazione indicano che il nostro test semi-parametrico funziona bene e mantiene il suo livello quando i dati si comportano secondo il modello INAR. Notiamo che il nostro test ha un forte potere nell'individuare deviazioni dall'ipotesi nulla, specialmente quando adeguiamo la statistica di test in modo appropriato.

Applicazione su Dati Reali

Per illustrare l'efficacia del nostro test di bontà di adattamento, lo applichiamo a tre set di dati reali. Il primo set di dati consiste in conteggi settimanali di impianti di perforazione attivi, che sono indicatori della domanda nel settore energetico. La nostra analisi suggerisce che questi conteggi si conformano a un modello INAR, poiché il test non rifiuta l'ipotesi nulla.

Nella seconda applicazione, analizziamo i conteggi delle transazioni nel trading azionario, rivelando che i dati mostrano sovradispersione. In questo caso, la nostra flessibilità ci consente di accettare la struttura del modello INAR nonostante i dati non si adattino a rigide assunzioni parametriche.

Per il terzo set di dati, consideriamo i conteggi delle transazioni per un'azione specifica in un dato periodo. La natura erratica di questi dati inizialmente ci porta a mantenere l'ipotesi nulla. Tuttavia, quando utilizziamo una statistica di test di ordine superiore, troviamo prove sufficienti per rifiutare l'ipotesi nulla, convalidando la complessità nella struttura dei dati sottostanti.

Conclusione

In conclusione, il nostro nuovo test di bontà di adattamento semi-parametrico per i modelli INAR fornisce un'alternativa flessibile ai metodi parametrici esistenti. Evitando assunzioni rigide sulla distribuzione delle innovazioni, possiamo valutare se il modello INAR cattura adeguatamente la struttura dei dati sottostanti.

I nostri risultati attraverso studi di simulazione dimostrano che questo approccio mantiene buone prestazioni in una varietà di scenari, consentendo di essere applicato efficacemente in casi reali. In generale, la metodologia di test proposta contribuisce a preziose intuizioni nell'analisi dei dati di conteggio di serie temporali, enfatizzando l'importanza della flessibilità e dell'adattabilità nella modellazione statistica.

Fonte originale

Titolo: Semi-parametric goodness-of-fit testing for INAR models

Estratto: Among the various models designed for dependent count data, integer-valued autoregressive (INAR) processes enjoy great popularity. Typically, statistical inference for INAR models uses asymptotic theory that relies on rather stringent (parametric) assumptions on the innovations such as Poisson or negative binomial distributions. In this paper, we present a novel semi-parametric goodness-of-fit test tailored for the INAR model class. Relying on the INAR-specific shape of the joint probability generating function, our approach allows for model validation of INAR models without specifying the (family of the) innovation distribution. We derive the limiting null distribution of our proposed test statistic, prove consistency under fixed alternatives and discuss its asymptotic behavior under local alternatives. By manifold Monte Carlo simulations, we illustrate the overall good performance of our testing procedure in terms of power and size properties. In particular, it turns out that the power can be considerably improved by using higher-order test statistics. We conclude the article with the application on three real-world economic data sets.

Autori: Maxime Faymonville, Carsten Jentsch, Christian H. Weiß

Ultimo aggiornamento: 2024-10-15 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2402.17425

Fonte PDF: https://arxiv.org/pdf/2402.17425

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili