Professional Documents
Culture Documents
ARFIMA procesi
Wen-Jen Tsay *
( Primljeno 14. januara 2009.; konačna verzija primljena 23. januara 2009. )
Ovaj članak razmatra maksimalnu procjenu vjerojatnosti (MLE) klase stacionarnih i invertnih-
ible vektor automatski progresivno frakcijski integrirani pomični prosjek (VARFIMA) procesi u
Jednadžba (26) Lucenoa [ Brza aproksimacija vjerojatnosti za vektorske opće linearne procese s dugim
serija: Primjena na frakcijsko razlikovanje , Biometrika 83 (1996), str. 603–614] ili Model A Lobato
[ Konzistentnost prosječnog unakrsnog periodograma u seriji dugih memorija , J. Time Ser. Analni. 18
(1997),str. 137–155] pri čemu je svaka komponenta y i, t djelomično integriran proces reda d i , i =
1 , ..., r .Pod uvjetima navedenim u pretpostavci 1 ovog članka, uvjetna vjerojatnost funkcionira
ova klasa VARFIMA modela može se učinkovito i tačno izračunati s uvjetnom vjerovatnoćom
Durbin – Levinson (CLDL) algoritam predložen ovdje. Ovaj algoritam CLDL zasnovan je na
multivarijantuDurbin-Levinson algoritam Whittlea [ O uklapanju multivarijantnih autoregresija i
približnom brojukanonička faktorizacija matrice spektralne gustine , Biometrika 50 (1963), str. 129–
134] i nih verovatnoća princip Box i Jenkins [ analize vremenskih serija , predviđanja , i kontrola , 2.
izd.,Holden-Day, San Francisko, Kalifornija]. Nadalje, uvjeti u spomenutoj pretpostavci 1 jesu
dovoljno općenit da obuhvati model razmatran u Andersen et al. [ Modeliranje i prognoziranje
ostvarenovolatilnost , Econometrica 71 (2003), 579–625] za opisivanje realizirane volatilnosti i
model proučavan u Haslettu i Rafteryju [ Prostor-vrijeme modeliranje sa ovisnošću dugog pamćenja:
Procjena Ire-izvor energije vjetra na kopnu , Appl. Statist. 38 (1989), str. 1–50] za prostorne podatke
kao posebne slučajeve. Kao računski trošak implementacije algoritma CLDL mnogo je manji od
troškova korištenja algoritama predloženo u Sowellu [ Maksimalna procjena vjerojatnosti frakcijski
integriranih modela vremenskih serija , Rad papir, Sveučilište Carnegie-Mellon], stoga smo u
mogućnosti izvesti eksperiment Monte Carlo da bismo istražili konačni uzorak performansi algoritma
CLDL za trodimenzionalne VARFIMA procese sa veličina uzorka 400. Rezultati simulacije vrlo su
zadovoljavajući i otkrivaju velike potencijale korištenja CLDL metoda za empirijske aplikacije.
Ključne riječi: Durbin-Levinson algoritam; duga memorija; maksimalna procena
verovatnoće; multivarijantno vrijeme serija
AMS 2000 Predmetna klasifikacija : 60G18; 65C20
* Email: wtsay@econ.sinica.edu.tw
1. Uvod
(1)
(B) su polinomi matriksa konačnog reda u B (uobičajeni operator zaostajanja), takvi da:
, I r je matrica identiteta (r × r) , a dijagonalna matrica dijagonale ( ∇ d ) definirana je kao
diag ( ∇ d ) =
Jednadžba (1) je r -dimenzionalni nezavisni i identično raspodijeljeni (i.i.d.) postupak bijelog buke
s ne-singularnom kovarijantnom matricom Ʃ.
Pod pretpostavkom da Φ(B) i Ɵ(B) udovoljavaju uobičajenim stacionarnim i invertibilnim uslovima,
respektivno, multivarijantni proces Y t može se predstaviti sa sljedećim predstavom MA:
(4)
Doprinos ovog članka je pokazati da je uslovna vjerovatnost funkcija Proces VARFIMA u jednadžbi (1)
može se procijeniti točno i učinkovito ako je model u Jednadžba (1) može se predstaviti kao:
(5)
Na primjer, razlika između modela u jednadžbama (1) i (5) je irelevantna ako je serija podataka je
univarijantna, tj. r = 1. U scenariju multivarijantnih vremenskih serija modeli u jednadžbama (1) i (5)
su identične ako je bilo (B) dijagonala ili su vrijednosti razlikovanja parametri ostaju netaknuti
preko i = 1 , ..., r kako je nametnuto u pretpostavci 1 u sljedećem odjeljku. Dakle, svaka
komponenta y i, t u jednadžbi (5) još uvijek je frakcijski integriran postupak reda d i definiran u
Jednadžba (3) s obzirom da su gore navedena dva uvjeta zadovoljena. U stvari, ovi uvjeti bili su
zaposleni u multivarijantnoj literaturi o dugoj memoriji, npr. Haslett i Raftery [9] nameću homogenu
strukturu frakcijskim razlikovanjem i ARMA parametrima širom meteorološke stanice za opisivanje
brzine vjetra zabilježene na 12 sinoptičkih meteoroloških stanica u Irskoj, kada za svoje prostorne
podatke koristi model VARFIMA. Štaviše, Andersen i sur. [10] upotrijebiti Gaussov trovaratni VAR
model dugog pamćenja u svojoj jednadžbi (15) za opisivanje ostvarene vogartilnosti tečaja logaritma
tečaja gdje su vrijednosti diferencijalnih parametara isto identično preko i = 1 , ..., r . Razlog zašto im
nameću takvu homogenu strukturu Vrijednost parametara razlikovanja u razlozima je da se smanji
računski teret procjene model VARFIMA čija su dimenzionalnost i raspon serija podataka
veliki. Međutim, Metodologija razvijena u ovom članku omogućava nam da se bavimo VARFIMA
modelom u jednadžbi (1) pri čemu se integracija svake komponente y i, t razlikuje u i = 1 , ..., r .
Model jednadžbe (5) diskutiran je u Luceñovoj jednadžbi (27) [5]. Također je ekvivalentno prema
modelu B koji se razmatra u Lobatu [6] i može se procijeniti Luceñovim [5] aproksimativom funkcija
vjerojatnosti dnevnika. Kao što smo prethodno tvrdili, greška zaokruživanja neizbježna je prilikom
upotrebe približni postupak Luceñoa [5]. Naprotiv, s obzirom na to da model u jednadžbi (1) može
transformirati kao onaj u Jednadžbi (5), pokazat ćemo da je uvjetna vjerojatnost funkcija VARFIMA
postupak u jednadžbi (1) može se procijeniti točno i učinkovito kombiniranjem multivarijantni Durbin-
Levinson algoritam Whittlea [11] sa principom uslovne vjerojatnosti Box-a i Jenkinsa [12], iako su
dimenzionalnost i raspon serija podataka relativno veliko. Ovaj postupak nazivamo algoritmom
uslovne vjerojatnosti Durbin – Levinson (CLDL) algoritam. U literatura, Deriche i Tewfik [13] i Tsay i
Härdle [14] procjenjuju univarijantnu ARFIMA postupak s univarijantnim algoritmom Durbin-
Levinson, dok Doornik i Ooms [15] sugeriraju koristeći Whittle-ovu [11] metodu za VARFIMA modele,
ali bez implementacije. Jer su procesi VARFIMA razmatrani u Andersen i sur. [10] pripadaju
podskupovima od modela u jednadžbi (1), predloženi CLDL algoritam lako se primjenjuje na podatke
Andersena et al. [10]. Najvažnije je da će algoritam CLDL pružiti znatno efikasniju procjenu nego
metoda jednadžbe običnih najmanjih kvadrata (OLS) Andersen et al. [10], ko popravite vrijednost d u
jednadžbi (1) s zajedničkom procjenom 0.401 kroz tri niza podataka. Još jedna vrijedna značajka CLDL
algoritma je njegov računski dobitak u odnosu na izvornik algoritam Sowella [7]. Poznato je da su
računski tereti primjene Sowellovih [7] algoritam prema VARFIMA podacima je ogroman. Posebno,
prilikom proučavanja zajedničkog ponašanja stopa američkih i kanadskih obveznica, Dueker i Startz
[16] pokazuju da je potrebno oko 35 min na PC-u od 200 MHz za svaku iteraciju MLE-a bivarijantnog
VARFIMA procesa sa 121 opažanja i 18 parametara prilikom implementacije Sowellovog [7]
algoritma. Međutim, potrebno je manje od oko 40 s na PC-u od 1066 MHz za svaku iteraciju uvjetnog
MLE-a bivarijata VARFIMA (1 , d, 1) proces s 400 promatranja i 11 parametara prilikom
implementacije predloženi CLDL algoritmi. Ovo jasno pokazuje snagu algoritma CLDL za mnoge
potencijalne empirijske aplikacije. Takođe objašnjava zašto možemo sprovesti eksperiment u Monte
Carlu ispitati performanse konačnog uzorka CLDL algoritma za trodimenzionalni VARFIMA procesa
ispod veličine uzorka do 400.
Model u jednadžbi (5) bitno se razlikuje od modela iz jednadžbe (1) o redoslijedu od Φ(B) i
diag ( ∇d ) . Glavna ideja ovog članka je pokazati kolika je uslovna verovatnoća funkcija VARFIMA
procesa u jednadžbi (1) može se procijeniti točno i učinkovito ako je model u jednadžbi (1) može se
transformirati kao onaj u jednadžbi (5). Pretpostavka 1 sumira ovih uslova.
Pod uslovom da pretpostavka 1 drži, razlika u izboru između modela u jednačine (1) i (5) više ne
postoje. Shodno tome, mi postavljamo uvjete iz Pretpostavke 1 u ovom članku, a svaka
komponenta y i, t u modelu (1) ili (5) je dijelom integrirana postupak reda d i , i = 1 , ..., r, kako je
definirano u jednadžbi (3). Točka (ii) pretpostavke 1 omogućava nam za procjenu podataka
Andersena i sur. [10] i one Hasletta i Rafteryja [9] sa predloženim CLDL algoritam kasnije je jasnije
objasnio. Prednosti upotrebe točke (i) pretpostavke 1 su očitije kada je dimenzionalnost serije
podataka relativno velika. Na primjer, kada r = 7, možda ćemo zahtijevati da Φ (B) bude dijagonalna i
pridruženi broj parametara za takav a 7-dimenzionalni VARFIMA (1 , d, 1) postupak je samo 91 u
usporedbi sa 133 parametra unutar VARFIMA (1 , d, 1) proces bez nametanja bilo kakvih
ograničenja. Pri tome, rezultirajući pojednostavljeni model je još uvijek prilično fleksibilan, jer
strukturi ne namećemo nikakva ograničenja MA parametara; međutim, računski teret procjene
takvog pojednostavljenog modela je znatno ublaženo na osnovu CLDL algoritma kao što je
dokumentirano u 1. odjeljku.
Prije implementacije MLE-a za model u jednadžbi (1), moramo izračunati autovarijanca Funkcije
VARFIMA modela. Prvo razmotrimo najjednostavniji slučaj gdje nastaje Y t kao model VARFIMA (0 ,
d, 0):
(.) je gama funkcija. Označavanje
(h) = E (Y t + h Y t ) , h = - T + 1 , - T +
Od Abramowitza i Steguna [17, str. 556, odjeljci 15.1.1 i 15.1.20], napominjemo da hipergeometrijska
funkcija je definirana kao
Koristeći
gornje rezultate, dobivamo (m, n) element Ω(h) u jednadžbi (8) kao
Luceño [5, str. 611] neovisno predstavlja formulu za Ωm, n (h) u svojoj jednadžbi (8), ali indirektno.
Za računsku efikasnost dobro je poznato u literaturi da Ωm, n (h) u Jednadžbi (9) može izračunava se
na sljedeći način:
) kao j ≥ 2. Ovdje je V j −1 odgovarajuća greška predviđanja u jednom koraku naprijed matrica. Kao j =
1, Y 1 = 0, i V 0 = ( 0 ) . Za definiciju i izračunavanje Y j i onihV j -1 , za detalje pogledajte Whittle [11] ili
Brockwell i Davis [18, Prijedlog 11.4.1]. Kada je Y t VARFIMA (0 , d, q ) proces,
gdje
a Ɵmn, k označava (m, n) th element Ɵk u Jednadžbi (1). Imajte na umu da postoje (rq + 1 ) 2izrazi s
desne strane jednadžbe (13). Sa funkcijama autokovane vrijednosti u jednadžbi (13),na VARFIMA (0 ,
d, q ) primjenjujemo multivarijantni Durbin-Levinson algoritam Whittlea [11]procesi kao što smo
predložili za VARFIMA (0 , d, 0) procese.
Za restriktivniji VARFIMA (0 , d, q ) postupak gdje Ɵ(B) je dijagonala, vrijednost Ωm, n (h) u jednadžbi
(13) postaje
m, n (h) ≡ σ mn
Sada na
2
desnoj strani jednadžbe (16) postoje samo (q + 1 ) pojma. Kako je r = 1, funkcija autokovane
vrijednosti u jednadžbi (16) jednaka je Sowellovoj [8, str. 173] formula.
Sada pokazujemo da je funkcija uvjetne vjerojatnosti modela u (1) pod pretpostavkom 1 može se
tačno proceniti. Iz jednadžbe (1) ili (5) imamo Φ(B) Y t = diag ( ∇ - d )Ɵ(B) Z t , i
izraz dijagnoza ( ∇ - d ) Ɵ(B) Z t na desnoj strani znaka jednakosti odgovara a VARFIMA (0 , d, q ) proces
čije su autokovane vrijednosti prikazane u jednadžbi (13). Usvajanje ideju o funkciji uslovne
vjerojatnosti u Boxu i Jenkinsu [12, Poglavlje 7], transformiramo Y t u jednadžbi (1) u diag ( ∇ - d ) Ɵ(B)
Z t za zadani izbor parametara u Φ(B) i od odgovarajuće početne vrijednosti. Posebno, ako je p = 1,
onda je uslovljeno na Φ1 i Y 1 , Y t -Φ 1 Y t −1 , t = 2 , 3 , ..., T , je VARFIMA (0 , d, q ) proces, i
označavamo njegovu pridruženu uvjetnu vjerovatnost. funkcioniraju kao
Ovdje se moraju riješiti tri primjedbe. Prvo, slično kao Li i McLeod [19], CLDL algoritam je postupak u
jednom koraku, jer procjenjujemo sve parametre Φ, Ɵ, d i Ʃ u Jednadžba (1) istovremeno. Drugo,
ako je Ɵ(B) u jednadžbi (1) dijagonalan, tada promatramo
Treće, za razliku od Li i McLeoda [19], koji prvi primjenjuju binomnu transformaciju na podataka, Y t ,
a zatim izračunati vjerojatnu funkciju za preostale parametre AR i MA, mi u početku
transformirajte Y t s nizom početnih vrijednosti AR parametara, a zatim izračunajte tačno vjerojatnost
funkcija preostalog VARFIMA (0 , d, q ) procesa. Pri tome izbjegavamo pristranosti svojstvena
mnogim metodama procjene za stacionarne univarijantne ARFIMA procese koji skraćuju beskonačna
suma koja definira ( 1 - B) d , uključujući metode vremenske i frekvencijske domene.
Ovaj problem odrezanog beskonačnog zbroja prvi je ukazao Sowell [8], koji tvrdi da je transformirani
niz iz skraćene beskonačne frakcijske diferencirajuće transformacije je zbroj an ARMA model i
linearna kombinacija beskonačnog broja neopaženih pojmova. Dakle, ARMA parametri se nikada ne
mogu ispravno procijeniti iz procjenitelja na temelju skraćene beskonačnosti frakcijska
diferencirajuća transformacija. Stoga je procjena iz jednadžbe po jednadžbi OLS metoda Andersena i
dr. [10] popravljanjem vrijednosti d u jednadžbi (1) s zajedničkim procjena 0.401 kroz tri serije
podataka može biti problematična. Vidi Sowell [8, str. 170] za detalje diskusija o ovom problemu
skraćenja.
Ovaj dio razmatra performanse konačnih uzoraka MLE-a VARFIMA procesa sa predloženi CLDL
algoritam. Koliko znamo, ovo je prva simulacijska studija koja se odnosi na to na puni MLE vremenske
domene VARFIMA procesa. Bez gubitka općenitosti, fokusiramo se na postupak u kojem su svi
parametri frakcijskog razlikovanja pozitivni u toj dugoj memoriji Proces je glavna briga frakcijski
integrirane literature. Štaviše, dijelimo naše studije u dva dela. Prvi dio se bavi trodimenzionalnim
VARFIMA (0 , d, 1) procesom, dok drugi dio razmatra dvodimenzionalnu VARFIMA (1 , d, 1).
Procjenjujemo parametar
gde
jesu li parametri stvarno procijenjeni predloženim algoritmom. Za kreiranje realne simulacije sheme,
ne koristimo izračunatu inverznu funkciju prethodne funkcije transformacije pri stvarnoj vrijednosti
parametra od ξ kao početne vrijednosti za postupak procjene. Umjesto toga, zapošljavamo pravu
vrijednost ξ kao početne vrijednosti for~ ξ . Drugim riječima, u simulaciji koju koristimo
kao početne vrijednosti za ˜ ξ u jednadžbi (24). Ovo je prvi mehanizam za stvaranje realne simulacije
šemu.
Svi programi su napisani u GAUSS-u koji se vrednuje u tri veličine uzorka, T = 200 , 300 , 400. Izbor
ovih veličina uzorka snažno otkriva da je računski teret implementacije CLDL algoritam je
blag. Štaviše, ove veličine uzorka se često susreću sa uobičajene makroekonomske vremenske serije.
Da bismo dali jasniju sliku o konačnim uzorcima performansi algoritma CLDL, takođe smo izvijestite
rezultate simulacije s okvirnim crtežima na slikama 1-3 za slučaj ρ = 0 . 5. Slika 1 pokazuje
okvir-crteži procijenjenog d , dok slika 2 prikazuje okvire-crteže procijenjenog Ɵ. The okvirne ploče
procijenjene Ʃ prikazani su na slici 3. Sve ove brojke pokazuju da je performanse algoritma CLDL
djeluju dobro na većoj veličini uzorka kao što je prikazano u tablici 1,
Rezultati simulacije za slučaj ρ = 0 . 2 su kvalitativno identične onima u Tablici 1 i na slikama 1-3, gdje
je ρ = 0 . 5. Da bismo uštedjeli prostor, rezultate ne izvještavamo sa ρ = 0 . 2 Međutim, ovi su rezultati
dostupni na zahtjev autora.
Za razliku od CLDL algoritma, gdje je maksimalni broj iteracija za svaki replikacija je 100, ne
namećemo ograničenje na maksimalni broj ponavljanja kada vođenje QMLE-a. Ovo je prvi dizajn koji
favorizira implementaciju QMLE-a u odnosu na CLDL algoritam. Nadalje, prave vrijednosti
parametara d i u jednadžbi (20) postavljaju se kao početna vrijednost za postupak procjene. Ovo je
drugi dizajn koji favorizira implementacija QMLE-a u odnosu na CLDL algoritam. Ako rezultati
simulacije to pokazuju izvedba algoritma CLDL u procjeni parametara razlikovanja frakcije je još bolji
od QMLE-a Lobato [23] u okviru gore spomenutog eksperimentalnog dizajna, tada ovaj nalaz
možemo pribaviti izvanrednim performansama MLE-a u odnosu na njegovu poluparametriju prema
ispravnoj šemi specifikacije modela.
Radi lakše usporedbe, rezultati simulacije QMLE-a također su prikazani u tablici 1 za ρ = 0 . 5. Tabela 1
jasno pokazuje da se performanse QMLE poboljšavaju kada je m = [ T 0 . 5 ] koristi se u usporedbi s
drugim izborom m = [ T 0 . 65 ]. Ovaj nalaz je razuman, jer je dizajn QMLE motivira se ispitivanjem
funkcije spektralne gustoće blizu nulte frekvencije dugog procesa pamćenja. Ova tablica također
otkriva da za sva tri različita parametra uzeti u obzir u eksperimentu, performanse algoritma CLDL
mnogo su bolje od onih u QMLE čak i kada je m = [ T 0 . 5 ] je odabrano, jer je RMSE algoritam CLDL
manji od QMLE, respektivno. Ovo je očekivano s obzirom da je algoritam CLDL uvjet
procjena najveće vjerojatnosti koja bi trebala biti učinkovitija od poluparametrijskog kolege pod
tačnom specifikacijom modela.
Rezultati simulacije iz CLDL-a i QMLE-a također su spojeni s okvirnim crtežima radi jasnoće
izlaganja. Na slici 4 prikazani su rezultati za slučaj ρ = 0 . 5. Da bismo uštedjeli prostor, samo
predstavljamo simulacije koje se odnose na parametar d 1 = 0 . 4. Imajte na umu da se rezultati
QMLE-a temelje o izboru m = [ T 0 . 5 ] iz ranije navedenog razloga. Iz ove cifre je jasno da performanse
algoritma CLDL mnogo su bolje od performansi QMLE-a. Štaviše, prethodni nalazi ostaju netaknuti
kada je ρ = 0 . 2. Opet, rezultati sa ρ = 0 . 2 su dostupni na zahtjev autora
Ovaj pododjeljak razmatra utjecaj AR parametara na performanse CLDL algoritmi kada van
dijagonalni elementi Φ(B) u jednadžbi (5) nisu jednaki nuli. Da biste spremili opterećenja procjene,
fokusiramo se na sljedeći dvodimenzionalni VARFIMA (1 , d, 1) model:
Slika 7. Okvirni crteži
procijenjenog AR parametra iz dvodimenzionalnog VARFIMA (1 , d, 1) modela definiranog
uJednadžbe (29) i (30), a ρ = 0 . 5 zasnovana na CLDL algoritmu sa 250 replikacija. Gornja leva ploča
prikazuje slikuprocjene za 11 , 1 , gornja desna ploča prikazuje procjene za 12 , 1 , donja lijeva ploča
prikazuje procjene za 21 , 1 ,a ploča desno u desno prikazuje procjene za 22 , 1 .
gde
Slika 8. Okvirne plohe procijenjenog d iz dvodimenzionalnog VARFIMA (1 , d, 1) modela definirane u jednadžbama (29) i (30)
sa 250 replikacija i ρ = 0 . 5. Vrijednost f (g, QMLE ) označava rezultate procjene kada procjenitelj je QMLE od Lobatoa [23],
a m = [ T 0 . 50 ], f označava pravu vrijednost d = f , a g označava veličinu uzorka, takvu da je g = A = 200, g = B = 300, g = C =
400. Isto tako, vrijednost f (g, CLDL ) označava rezultate procjene kada je procjenjivač je predloženi CLDL
algoritam, f označava pravu vrijednost d = f , a g označava veličinu uzorka, tako da g = A = 200, g = B = 300, g = C = 400.
Mi također pripremamo usporedbu između QMLE i CLDL algoritma u procjeni parametar frakcijskog
razlikovanja pod modelom u jednadžbama (29) i (30). Prije nego što razgovaramo nalaza, ovdje
ističemo da redoslijed integracije y 1 , t u jednadžbu (29) nije 0,4 zbog prisustva nulta nulta
dijagonalnog elementa prikazanog u (B) jednadžbe (29). Dakle, procjene za d 1 iz upotrebe QMLE-a
naravno neće biti blizu stvarnog parametra vrijednost 0,4. Zapravo, na slici 8 nalazimo
procjene d 1 na temelju Lobatovog [23] QMLE-a daleko udaljen od prave vrijednosti parametra d 1 =
0 . 4. Naprotiv, uslovni MLE na osnovu CLDL algoritam daje obećavajuću procjenu d 1 , što ukazuje na
izvrsnu sposobnost predložio CLDL algoritam za procjenu svih AR, MA i frakcijskih razlika po modelu iz
jednadžbe (5).
5. Zaključak