Testen der Passgenauigkeit von INAR-Modellen: Ein neuer Ansatz
Eine flexible Methode vorstellen, um die Anpassung von INAR-Modellen ohne strenge Annahmen zu bewerten.
― 6 min Lesedauer
Inhaltsverzeichnis
Unter den verschiedenen Arten von Modellen für Zähldaten sind ganzzahlige autoregressive (INAR) Prozesse ziemlich beliebt. Diese Modelle sind nützlich, wenn die Daten aus Zählungen bestehen, die sich über die Zeit ändern, sodass wir Muster und Trends analysieren können. Typischerweise machen Statistiker, wenn sie INAR-Modelle verwenden, bestimmte Annahmen über die zugrunde liegenden Daten, wie dass sie eine Poisson- oder negative Binomialverteilung haben.
Dieser Artikel stellt eine neue Methode vor, um zu testen, ob ein INAR-Modell gut passt, ohne spezifische Annahmen über die Art der Datenverteilung zu treffen. Anstatt eine bestimmte Verteilung anzunehmen, schlagen wir einen semiparametrischen Ansatz vor, der mehr Flexibilität bei der Untersuchung der Daten ermöglicht.
Einführung in INAR-Modelle
INAR-Modelle sind besonders gut geeignet, um Zeitreihendaten zu modellieren, die aus nicht-negativen Ganzzahlen bestehen, wie Zählungen von Ereignissen oder Vorkommen. Eine Hauptmethode zur Definition eines INAR-Modells ist durch eine rekursive Gleichung. In diesen Gleichungen hängt die aktuelle Zählung zu einem bestimmten Zeitpunkt von vorherigen Zählungen sowie einer Reihe von Innovationen ab, die die zufälligen Schocks oder Schwankungen in den Daten sind.
Die Modellkoeffizienten spielen in diesem Setup eine Schlüsselrolle, um sicherzustellen, dass der Prozess ganzzahlig bleibt. Um dies zu erreichen, führen wir Operationen ein, die helfen, die ganzzahlige Natur der Serie aufrechtzuerhalten. Insbesondere verwenden wir eine Technik namens binomialer Dünnungoperator, der sicherstellt, dass die im Modell verwendeten Zufallsvariablen sich angemessen verhalten.
Während INAR-Modelle flexibel sind und viele Anwendungen haben, ist die übliche Praxis in der Literatur, eine spezifische Verteilung für die Innovationen anzunehmen. Diese Annahme kann die Anwendbarkeit des Modells einschränken und es weniger flexibel machen, da es möglicherweise nicht immer gut zu den realen Daten passt.
Die Flexibilität semiparametrischer Modelle
Das Testen der Passgenauigkeit eines INAR-Modells erfordert oft eine spezifische Nullhypothese bezüglich der zugrunde liegenden Innovationsverteilung. Diese Situation führt zu Herausforderungen, da die Annahme einer strengen Verteilung möglicherweise die wahre Natur der Daten nicht einfängt. Unser Ansatz schlägt vor, die Nullhypothese zu testen, dass die Daten einem INAR-Modell folgen, ohne die Innovationsverteilung zu spezifizieren.
Diese Flexibilität ermöglicht es uns, komplexere und potenziell passendere Modelle für die vorliegenden Daten zu untersuchen, was zu besseren Einsichten und Entscheidungen basierend auf statistischer Analyse führt. Das Ziel ist es, ein Testverfahren zu schaffen, das INAR-Modelle genau validieren kann, ohne diese strengen Annahmen.
Teststatistik
Konstruktion einerUm eine geeignete Teststatistik für unsere Nullhypothese zu erstellen, stützen wir uns auf Schätzer der gemeinsamen Wahrscheinlichkeits-generierenden Funktion (pgf). Diese Funktion bietet eine umfassende Beschreibung der Beziehung zwischen den beobachteten Zählungen und dem zugrunde liegenden Modell. Indem wir eine Teststatistik basierend auf zwei verschiedenen Schätzern der pgf konstruieren, können wir bewerten, ob das Modell gut zu den Daten passt.
Ein Schätzer bietet allgemeine Konsistenz über verschiedene Einstellungen, während der andere darauf ausgelegt ist, unter der Nullhypothese zu passen. Dieser duale Ansatz ermöglicht es uns, die Güte der Anpassung zu testen, ohne an spezifische parametrische Einschränkungen gebunden zu sein.
Gemeinsame Wahrscheinlichkeits-generierende Funktion
Ein Schlüsselelement in unserem Testverfahren ist die gemeinsame pgf aufeinanderfolgender Zufallsvariablen, die die Abhängigkeitsstruktur der Daten erfasst. Diese Funktion ist entscheidend, um festzustellen, ob die Daten das erwartete INAR-Verhalten zeigen. Durch die Ableitung der gemeinsamen pgf können wir analysieren, wie gut das Modell zu den Daten passt.
Die gemeinsame pgf kann als Produkt von zwei Faktoren ausgedrückt werden: einer hängt ausschliesslich von der Innovationsverteilung ab, während der andere zu den Modellkoeffizienten gehört. Diese Darstellung erfordert keine zusätzlichen Annahmen über die zugrunde liegende Verteilung, was sie zu einer soliden Wahl für unsere Testmethodik macht.
Schätzung des INAR-Modells
Bei der Schätzung des INAR-Modells, ohne parametrische Annahmen zu treffen, wird es schwierig, die Modellkoeffizienten und die Natur der Innovationen zu bestimmen. Anstatt sich auf traditionelle Schätzmethoden zu verlassen, schlagen wir einen semiparametrischen Schätzer vor, der die gemeinsame Schätzung von Modellkoeffizienten und der Verteilung der Innovationen ermöglicht.
Dieser semiparametrische Schätzer ist effektiv und effizient, da er keine unnötigen Einschränkungen auferlegt und dennoch die wesentlichen Merkmale der zugrunde liegenden Daten erfasst. Diese Anpassungsfähigkeit ist wichtig, wenn man mit realen Daten arbeitet, die möglicherweise nicht strikten Annahmen über die Verteilung entsprechen.
Testverfahren
Wir beginnen damit, eine Stichprobe von Zeitreihen-Zähldaten zu beobachten und zielen darauf ab, unsere Teststatistik für die Nullhypothese zu konstruieren. Indem wir zwei Schätzer der pgf verwenden, stellen wir eine Teststatistik auf, die robust ist und Variationen in den Daten berücksichtigen kann, ohne durch parametrische Annahmen behindert zu werden.
Da unser Testverfahren Integration umfasst, führen wir auch ein Bootstrap-Verfahren ein, um kritische Werte zu schätzen, was die Praktikabilität unserer Methode erhöht. Dieser Schritt ist entscheidend, da er es uns ermöglicht, unser Testverfahren einfacher in realen Szenarien mit unterschiedlichen Datensätzen anzuwenden.
Simulationsstudien
Um die Leistung unseres vorgeschlagenen Tests zur Anpassungsgüte zu bewerten, führen wir umfangreiche Simulationen durch. In diesen Simulationen generieren wir Daten aus verschiedenen Prozessen, sowohl unter der Nullhypothese als auch unter verschiedenen Alternativen, um zu beurteilen, wie gut unser Test Abweichungen von der Null erkennen kann.
Die Ergebnisse unserer Simulationsstudien zeigen, dass unser semiparametrischer Test gut funktioniert und sein Niveau beibehält, wenn die Daten sich gemäss dem INAR-Modell verhalten. Wir beobachten, dass unser Test eine hohe Power hat, um Abweichungen von der Nullhypothese zu erkennen, insbesondere wenn wir die Teststatistik entsprechend anpassen.
Anwendung auf reale Daten
Um die Wirksamkeit unseres Tests zur Anpassungsgüte zu veranschaulichen, wenden wir ihn auf drei reale Datensätze an. Der erste Datensatz besteht aus wöchentlichen Zählungen aktiver Bohranlagen, die Indikatoren für die Nachfrage im Energiesektor sind. Unsere Analyse deutet darauf hin, dass diese Zählungen einem INAR-Modell entsprechen, da der Test die Nullhypothese nicht verwirft.
Im zweiten Anwendungsfall analysieren wir die Zählungen von Transaktionen im Aktienhandel, was zeigt, dass die Daten Überdispersion aufweisen. In diesem Fall ermöglicht uns unsere Flexibilität, die INAR-Modellstruktur zu akzeptieren, obwohl die Daten nicht strengen parametrischen Annahmen entsprechen.
Für den dritten Datensatz betrachten wir die Zählungen von Transaktionen für eine bestimmte Aktie über einen bestimmten Zeitraum. Die unregelmässige Natur dieser Daten führt zunächst dazu, dass wir die Nullhypothese beibehalten. Allerdings finden wir beim Einsatz einer höhergradigen Teststatistik ausreichende Beweise, um die Null abzulehnen, was die Komplexität der zugrunde liegenden Datenstruktur bestätigt.
Fazit
Zusammenfassend bietet unser neuer semiparametrischer Test zur Anpassungsgüte für INAR-Modelle eine flexible Alternative zu bestehenden parametrischen Methoden. Indem wir starre Annahmen über die Innovationsverteilung vermeiden, können wir beurteilen, ob das INAR-Modell die zugrunde liegende Datenstruktur angemessen einfängt.
Unsere Erkenntnisse aus den Simulationsstudien zeigen, dass dieser Ansatz unter verschiedenen Szenarien gute Leistung erbringt und effektiv in der realen Welt anwendbar ist. Insgesamt trägt die vorgeschlagene Testmethodik wertvolle Einsichten zur Analyse von Zeitreihen-Zähldaten bei und betont die Bedeutung von Flexibilität und Anpassungsfähigkeit in der statistischen Modellierung.
Titel: Semi-parametric goodness-of-fit testing for INAR models
Zusammenfassung: Among the various models designed for dependent count data, integer-valued autoregressive (INAR) processes enjoy great popularity. Typically, statistical inference for INAR models uses asymptotic theory that relies on rather stringent (parametric) assumptions on the innovations such as Poisson or negative binomial distributions. In this paper, we present a novel semi-parametric goodness-of-fit test tailored for the INAR model class. Relying on the INAR-specific shape of the joint probability generating function, our approach allows for model validation of INAR models without specifying the (family of the) innovation distribution. We derive the limiting null distribution of our proposed test statistic, prove consistency under fixed alternatives and discuss its asymptotic behavior under local alternatives. By manifold Monte Carlo simulations, we illustrate the overall good performance of our testing procedure in terms of power and size properties. In particular, it turns out that the power can be considerably improved by using higher-order test statistics. We conclude the article with the application on three real-world economic data sets.
Autoren: Maxime Faymonville, Carsten Jentsch, Christian H. Weiß
Letzte Aktualisierung: 2024-10-15 00:00:00
Sprache: English
Quell-URL: https://arxiv.org/abs/2402.17425
Quell-PDF: https://arxiv.org/pdf/2402.17425
Lizenz: https://creativecommons.org/licenses/by/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.