Probando el ajuste de modelos INAR: un nuevo enfoque
Presentando un método flexible para evaluar el ajuste del modelo INAR sin suposiciones estrictas.
― 7 minilectura
Tabla de contenidos
- Introducción a los Modelos INAR
- La Flexibilidad de los Modelos Semiparamétricos
- Construyendo una Estadística de Prueba
- Función Generadora de Probabilidad Conjunta
- Estimación del Modelo INAR
- Procedimiento de Prueba
- Estudios de Simulación
- Aplicación en Datos del Mundo Real
- Conclusión
- Fuente original
- Enlaces de referencia
Entre los diferentes tipos de modelos para datos de conteo, los procesos autorregresivos de valores enteros (INAR) son bastante populares. Estos modelos son útiles cuando los datos consisten en conteos que cambian con el tiempo, lo que nos permite analizar patrones y tendencias. Por lo general, cuando los estadísticos usan modelos INAR, hacen ciertas suposiciones sobre los datos subyacentes, como tener una distribución de Poisson o binomial negativa.
Este artículo presenta una nueva forma de probar si un modelo INAR se ajusta bien sin imponer suposiciones específicas sobre el tipo de distribución de datos. En lugar de asumir una distribución particular, proponemos un enfoque semiparamétrico, que permite más flexibilidad al examinar los datos.
Introducción a los Modelos INAR
Los modelos INAR son especialmente adecuados para modelar datos de series temporales que consisten en valores enteros no negativos, como conteos de eventos o ocurrencias. Una forma principal de definir un modelo INAR es a través de una ecuación recursiva. En estas ecuaciones, el conteo actual en un cierto tiempo depende de conteos previos así como de un conjunto de innovaciones, que son los choques o fluctuaciones aleatorias en los datos.
Los coeficientes del modelo juegan un papel clave en esta configuración, asegurando que el proceso mantenga valores enteros. Para lograr esto, introducimos operaciones que ayudan a mantener la naturaleza entera de la serie. Específicamente, usamos una técnica llamada operador de disminución binomial, que asegura que las variables aleatorias involucradas en el modelo se comporten adecuadamente.
Aunque los modelos INAR son flexibles y tienen muchas aplicaciones, la práctica común en la literatura es asumir una distribución específica para las innovaciones. Esta suposición puede restringir la aplicabilidad del modelo y hacerlo menos flexible, ya que puede no ajustarse bien a los datos reales.
La Flexibilidad de los Modelos Semiparamétricos
Probar el ajuste de un modelo INAR a menudo requiere una hipótesis nula específica respecto a la distribución de innovaciones subyacente. Esta situación presenta desafíos, ya que asumir una distribución estricta podría no capturar la verdadera naturaleza de los datos. Nuestro enfoque sugiere probar la hipótesis nula de que los datos siguen un modelo INAR sin especificar la distribución de innovaciones.
Esta flexibilidad nos permite explorar modelos más complejos y potencialmente más adecuados para los datos en cuestión, lo que lleva a mejores ideas y decisiones basadas en análisis estadísticos. El objetivo es crear un procedimiento de prueba que valide con precisión los modelos INAR sin estas suposiciones estrictas.
Construyendo una Estadística de Prueba
Para crear una estadística de prueba adecuada para nuestra hipótesis nula, dependemos de estimadores de la función generadora de probabilidad conjunta (pgf). Esta función proporciona una descripción completa de la relación entre los conteos observados y el modelo subyacente. Al construir una estadística de prueba basada en dos estimadores diferentes de la pgf, podemos evaluar si el modelo es un buen ajuste para los datos.
Un Estimador proporciona consistencia general en varios entornos, mientras que el otro está diseñado para ajustarse bajo la hipótesis nula. Este enfoque dual nos permite probar la bondad del ajuste sin estar atados a restricciones paramétricas específicas.
Función Generadora de Probabilidad Conjunta
Un elemento clave en nuestro procedimiento de prueba es la pgf conjunta de variables aleatorias consecutivas, que captura la estructura de dependencia de los datos. Esta función es crucial para determinar si los datos exhiben el comportamiento INAR esperado. Al derivar la pgf conjunta, podemos analizar qué tan bien se ajusta el modelo a los datos.
La pgf conjunta se puede expresar como un producto de dos factores: uno depende únicamente de la distribución de innovaciones, mientras que el otro se relaciona con los coeficientes del modelo. Esta representación no requiere suposiciones adicionales sobre la distribución subyacente, lo que la convierte en una elección sólida para nuestra metodología de prueba.
Estimación del Modelo INAR
Cuando se estima el modelo INAR sin hacer suposiciones paramétricas, se vuelve complicado determinar los coeficientes del modelo y la naturaleza de las innovaciones. En lugar de depender de métodos de estimación tradicionales, proponemos un estimador semiparamétrico que permite la estimación conjunta de coeficientes del modelo y la distribución de innovaciones.
Este estimador semiparamétrico es efectivo y eficiente, ya que no impone restricciones innecesarias mientras captura las características esenciales de los datos subyacentes. Esta adaptabilidad es significativa cuando se trabaja con datos del mundo real que pueden no adherirse a suposiciones rígidas sobre la distribución.
Procedimiento de Prueba
Comenzamos observando una muestra de datos de conteo de series temporales y buscamos construir nuestra estadística de prueba para la hipótesis nula. Al usar dos estimadores de la pgf, establecemos una estadística de prueba que es robusta y puede tener en cuenta variaciones en los datos sin verse obstaculizada por suposiciones paramétricas.
Dado que nuestro procedimiento de prueba implica integración, también introducimos un procedimiento bootstrap para estimar valores críticos, mejorando la practicidad de nuestro método. Este paso es esencial ya que nos permite aplicar nuestro procedimiento de prueba más fácilmente en escenarios del mundo real con conjuntos de datos diversos.
Estudios de Simulación
Para evaluar el rendimiento de nuestra prueba de bondad de ajuste propuesta, realizamos simulaciones extensas. En estas simulaciones, generamos datos de diferentes procesos, tanto bajo la hipótesis nula como bajo varias alternativas, para evaluar qué tan bien nuestra prueba puede detectar desviaciones de la nula.
Los resultados de nuestros estudios de simulación indican que nuestra prueba semiparamétrica funciona bien y mantiene su nivel cuando los datos se comportan de acuerdo con el modelo INAR. Observamos que nuestra prueba tiene un poder fuerte para detectar desviaciones de la hipótesis nula, especialmente cuando ajustamos apropiadamente la estadística de prueba.
Aplicación en Datos del Mundo Real
Para ilustrar la efectividad de nuestra prueba de bondad de ajuste, la aplicamos a tres conjuntos de datos del mundo real. El primer conjunto de datos consiste en conteos semanales de plataformas de perforación activas, que son indicadores de demanda en el sector energético. Nuestro análisis sugiere que estos conteos se ajustan a un modelo INAR, ya que la prueba no rechaza la hipótesis nula.
En la segunda aplicación, analizamos conteos de transacciones en el comercio de acciones, revelando que los datos exhiben sobredispersión. En este caso, nuestra flexibilidad nos permite aceptar la estructura del modelo INAR a pesar de que los datos no se ajusten a estrictas suposiciones paramétricas.
Para el tercer conjunto de datos, consideramos conteos de transacciones para una acción específica durante un período dado. La naturaleza errática de estos datos inicialmente nos lleva a mantener la hipótesis nula. Sin embargo, al emplear una estadística de prueba de orden superior, encontramos suficiente evidencia para rechazar la nula, validando la complejidad en la estructura de datos subyacente.
Conclusión
En conclusión, nuestra nueva prueba semiparamétrica de bondad de ajuste para modelos INAR proporciona una alternativa flexible a los métodos paramétricos existentes. Al evitar suposiciones rígidas sobre la distribución de innovaciones, podemos evaluar si el modelo INAR captura adecuadamente la estructura de datos subyacente.
Nuestros hallazgos a través de estudios de simulación demuestran que este enfoque mantiene un buen rendimiento en una variedad de escenarios, permitiendo su aplicación efectiva en casos del mundo real. En general, la metodología de prueba propuesta contribuye con valiosos insights en el análisis de datos de conteo de series temporales, enfatizando la importancia de la flexibilidad y adaptabilidad en el modelado estadístico.
Título: Semi-parametric goodness-of-fit testing for INAR models
Resumen: Among the various models designed for dependent count data, integer-valued autoregressive (INAR) processes enjoy great popularity. Typically, statistical inference for INAR models uses asymptotic theory that relies on rather stringent (parametric) assumptions on the innovations such as Poisson or negative binomial distributions. In this paper, we present a novel semi-parametric goodness-of-fit test tailored for the INAR model class. Relying on the INAR-specific shape of the joint probability generating function, our approach allows for model validation of INAR models without specifying the (family of the) innovation distribution. We derive the limiting null distribution of our proposed test statistic, prove consistency under fixed alternatives and discuss its asymptotic behavior under local alternatives. By manifold Monte Carlo simulations, we illustrate the overall good performance of our testing procedure in terms of power and size properties. In particular, it turns out that the power can be considerably improved by using higher-order test statistics. We conclude the article with the application on three real-world economic data sets.
Autores: Maxime Faymonville, Carsten Jentsch, Christian H. Weiß
Última actualización: 2024-10-15 00:00:00
Idioma: English
Fuente URL: https://arxiv.org/abs/2402.17425
Fuente PDF: https://arxiv.org/pdf/2402.17425
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.