Funkcja autokorelacji cząstkowej

Wartości funkcji autokorelacji cząstkowej głębokości jeziora Huron (na niebiesko przedział ufności)

Funkcja autokorelacji cząstkowej (ang. partial autocorrelation function, PACF) – stosowana w analizie szeregów czasowych miara korelacji cząstkowej stacjonarnego szeregu czasowego z jego własnymi opóźnionymi wartościami. Autokorelacja cząstkowa dla danego rzędu opóźnienia jest wyznaczona z wyłączeniem wpływu korelacji dla wszystkich krótszych opóźnień, pod tym względem różni się od zwykłej funkcji autokorelacji, która nie kontroluje pozostałych opóźnień.

Funkcja ta odgrywa ważną rolę w analizie danych mającej na celu określenie rozmiaru opóźnienia uwzględnianego w modelu autoregresyjnym (AR). Funkcja ta została wprowadzona jako część podejścia Boxa-Jenkinsa do modelowania szeregów czasowych, w ramach którego wykreślanie PACF umożliwia określenie odpowiednich opóźnień p w modelu AR (p) lub w rozszerzonym modelu ARIMA (p, d, q).

Definicja

Dla danego szeregu czasowego z t {\displaystyle z_{t}} , cząstkowa autokorelacja z opóźnieniem k {\displaystyle k} , oznaczana przez ϕ k , k {\displaystyle \phi _{k,k}} , to autokorelacja między z t {\displaystyle z_{t}} i z t + k {\displaystyle z_{t+k}} po wyłączeniu liniowej zależności z t {\displaystyle z_{t}} od z t + 1 {\displaystyle z_{t+1}} , ..., z t + k 1 {\displaystyle z_{t+k-1}} . Innymi słowy, cząstkowa autokorelacja między z t {\displaystyle z_{t}} a z t + k {\displaystyle z_{t+k}} wskazuje na dodatkowy wkład z t + k {\displaystyle z_{t+k}} do z t {\displaystyle z_{t}} ponad to, co zostało już wniesione przez opóźnienia od 1 do k 1 {\displaystyle k-1} włącznie[1].

ϕ 1 , 1 = corr ( z t + 1 , z t )  dla  k = 1 , {\displaystyle \phi _{1,1}=\operatorname {corr} (z_{t+1},z_{t}){\text{ dla }}k=1,} ϕ k , k = corr ( z t + k z ^ t + k , z t z ^ t )  dla  k 2 , {\displaystyle \phi _{k,k}=\operatorname {corr} (z_{t+k}-{\hat {z}}_{t+k},\,z_{t}-{\hat {z}}_{t}){\text{ dla }}k\geq 2,}

gdzie z ^ t + k {\displaystyle {\hat {z}}_{t+k}} i z ^ t {\displaystyle {\hat {z}}_{t}} to kombinacje liniowe { z t + 1 , z t + 2 , . . . , z t + k 1 } {\displaystyle \{z_{t+1},z_{t+2},...,z_{t+k-1}\}} , które minimalizują błąd średniokwadratowy względem odpowiednio z t + k {\displaystyle z_{t+k}} i z t {\displaystyle z_{t}} . W przypadku procesów stacjonarnych, współczynniki w z ^ t + k {\displaystyle {\hat {z}}_{t+k}} i z ^ t {\displaystyle {\hat {z}}_{t}} są takie same, lecz w odwrotnej kolejności[2]:

z ^ t + k = β 1 z t + k 1 + + β k 1 z t + 1 i z ^ t = β 1 z t + 1 + + β k 1 z t + k 1 . {\displaystyle {\hat {z}}_{t+k}=\beta _{1}z_{t+k-1}+\cdots +\beta _{k-1}z_{t+1}\qquad {\text{i}}\qquad {\hat {z}}_{t}=\beta _{1}z_{t+1}+\cdots +\beta _{k-1}z_{t+k-1}.}

Obliczenie

Teoretyczne wartości funkcji autokorelacji cząstkowej stacjonarnego szeregu czasowego można obliczyć, stosując algorytm Durbina-Levinsona:

ϕ n , n = ρ ( n ) k = 1 n 1 ϕ n 1 , k ρ ( n k ) 1 k = 1 n 1 ϕ n 1 , k ρ ( k ) , {\displaystyle \phi _{n,n}={\frac {\rho (n)-\sum _{k=1}^{n-1}\phi _{n-1,k}\rho (n-k)}{1-\sum _{k=1}^{n-1}\phi _{n-1,k}\rho (k)}},}

gdzie ϕ n , k = ϕ n 1 , k ϕ n , n ϕ n 1 , n k {\displaystyle \phi _{n,k}=\phi _{n-1,k}-\phi _{n,n}\phi _{n-1,n-k}} dla 1 k n 1 {\displaystyle 1\leq k\leq n-1} , zaś ρ ( n ) {\displaystyle \rho (n)} jest funkcją autokorelacji[3][4][5].

Powyższy wzór można wykorzystać dla wyznaczenia autokorelacji w próbie w celu znalezienia próbkowych wartości funkcji autokorelacji cząstkowej dowolnego szeregu czasowego[6][7].

Przykłady

Poniższa tabela podsumowuje wartości PACF dla różnych modeli[8]:

Model PACF
Biały szum Autokorelacja cząstkowa wynosi 0 dla wszystkich opóźnień.
Model autoregresyjny Autokorelacja cząstkowa dla modelu AR(p) jest różna od zera dla opóźnień mniejszych lub równych p oraz 0 dla opóźnień większych niż p .
Model średniej ruchomej Jeśli ϕ 1 , 1 > 0 {\displaystyle \phi _{1,1}>0} , Autokorelacja cząstkowa oscyluje do 0.
Jeśli ϕ 1 , 1 < 0 {\displaystyle \phi _{1,1}<0} , Autokorelacja cząstkowa geometrycznie zanika do 0.
Model ARMA Autokorelacja cząstkowa modelu ARMA(p, q) geometrycznie zanika do 0, ale tylko po opóźnieniach większych niż p .

Zachowanie funkcji autokorelacji cząstkowej stanowi odbicie lustrzane zachowania funkcji autokorelacji w modelach autoregresyjnych i średniej ruchomej. Na przykład funkcja autokorelacji cząstkowej szeregu AR(p) jest zerowa powyżej opóźnienia p, podobnie jak funkcja autokorelacji szeregu MA(q) jest zerowa powyżej q. Ponadto funkcja autokorelacji procesu AR(p) wygasa (zanika) w taki sam sposób, jak funkcja autokorelacji cząstkowej procesu MA(q).

Identyfikacja modelu autoregresyjnego

The partial autocorrelation graph has 3 spikes and the rest is close to 0.
Przykładowa funkcja autokorelacji cząstkowej z przedziałem ufności symulowanego szeregu czasowego AR(3)

Autokorelacja cząstkowa jest powszechnie stosowanym narzędziem służącym do identyfikacji rzędu modelu autoregresyjnego[6]. Jak wspomniano wcześniej, autokorelacja cząstkowa procesu AR(p) wynosi zero dla opóźnień większych niż p[8]. Jeśli zostanie stwierdzone, że model AR jest odpowiedni, wówczas analizuje się wykres PACF, aby pomóc w określeniu rzędu modelu.

Cząstkowa autokorelacja opóźnień większych niż p dla szeregów czasowych wygenerowanych przez model AR(p) jest w przybliżeniu niezależna i normalna ze średnią równą 0[9]. Dlatego przedział ufności można skonstruować, dzieląc wybrany wynik z przez n {\displaystyle {\sqrt {n}}} . Opóźnienia z wartościami PACF poza przedziałem ufności wskazują, że rząd modelu AR generującego szereg jest prawdopodobnie większy lub równy opóźnieniu. Wykreślenie PACF i narysowanie linii przedziału ufności to typowy sposób analizy rzędu modelu AR. Aby ocenić rząd modelu, należy przeanalizować wykres i znaleźć opóźnienie, po którym wszystkie cząstkowe autokorelacje znajdą się w przedziale ufności. Opóźnienie to prawdopodobny rząd modelu AR[1].

Przypisy

  1. a b 6.4.4.6.3. Partial Autocorrelation Plot [online], www.itl.nist.gov [dostęp 2024-08-23] .
  2. Robert H.R.H. Shumway Robert H.R.H., David S.D.S. Stoffer David S.D.S., Time Series Analysis and Its Applications: With R Examples, Springer Texts in Statistics, Cham: Springer International Publishing, 2017, s. 97–99, DOI: 10.1007/978-3-319-52452-8, ISBN 978-3-319-52451-1 [dostęp 2024-08-23]  (ang.).
  3. J. Durbin. The Fitting of Time-Series Models. „Revue de l'Institut International de Statistique / Review of the International Statistical Institute”. 28 (3), s. 233–244, 1960. DOI: 10.2307/1401322. ISSN 0373-1138. JSTOR: 1401322. 
  4. Robert H. Shumway: Time Series Analysis and Its Applications: With R Examples. Cham: Springer International Publishing, 2017, s. 103–104, seria: Springer Texts in Statistics. DOI: 10.1007/978-3-319-52452-8. ISBN 978-3-319-52451-1. (ang.).
  5. WalterW. Enders WalterW., Applied econometric time series, wyd. 2nd ed, Wiley series in probability and mathematical statistics, Hoboken, NJ: J. Wiley, 2004, s. 65–67, ISBN 978-0-471-23065-6 [dostęp 2024-08-23] .
  6. a b George E.P.G.E.P. Box George E.P.G.E.P., Gwilym M.G.M. Jenkins Gwilym M.G.M., Gregory C.G.C. Reinsel Gregory C.G.C., Time series analysis: forecasting and control, wyd. 4th ed, Wiley series in probability and statistics, Hoboken, N.J: John Wiley, 2008, ISBN 978-0-470-27284-8, OCLC 176895531 [dostęp 2024-08-23] .
  7. Peter J. Brockwell: Time Series: Theory and Methods. Wyd. 2nd. New York, NY: Springer, 1991, s. 102, 243–245. ISBN 978-1-4419-0319-8. (ang.).
  8. a b PanchananP. Das PanchananP., Econometrics in theory and practice: analysis of cross section, time series and panel data with Stata 15.1, Singapore: Springer, 2019, s. 294–299, ISBN 978-981-329-019-8 [dostęp 2024-08-23] .
  9. M.H.M.H. Quenouille M.H.M.H., Approximate Tests of Correlation in Time-Series, „Journal of the Royal Statistical Society Series B: Statistical Methodology”, 11 (1), 1949, s. 68–84, DOI: 10.1111/j.2517-6161.1949.tb00023.x, ISSN 1369-7412 [dostęp 2024-08-23]  (ang.).