You are on page 1of 231

Econometrie

Prof. univ. dr. Claudiu HERŢELIU

Joi, 25 Februarie 2021


Finalitate

 Examen scris
 Activitatea de la seminar: (30% din nota finală);
 Examen final: (70% din nota finală).
Tematica (1)

1. Curs organizatoric şi introductiv


2. Modelul liniar unifactorial
3. Generalizarea modelului (multifactorial, neliniar etc.)
4. Teste de semnificaţie
5. Ipotezele MCMMP/ OLS (I)
6. Ipotezele MCMMP (II)
7. Analiză şi prognoză cu modelul de regresie
Tematica (2)

8. Introducere în serii cronologice


9. Staționaritatea seriilor cronologice
10. Modele de tip ARMA
11. Modele cu ecuații simultane
Bibliografie

 Andrei, T., Bourbonnais, R. Econometrie, Ed.


Economică, 2007
 Andrei, T., Statistică şi Econometrie, Ed. Economică,
2005
 Pecican, E. Ş. Econometrie, Ed. C. H. Beck, Bucureşti,
2006
 Andrei, T., Oancea, B., Mirică, A., Toma, I.E., Herțeliu,
C. Econometrie. Teorie și aplicații în EViews și R, Ed.
Economică, 2018
Elemente introductive
Econometria – definiţie
 provine din cuvintele greceşti: „eikonomia” - economie şi „metren” - măsură.
 „experienţa a arătat că fiecare din următoarele 3 puncte de vedere, al statisticii, al teoriei
economice şi al matematicii este o condiţie necesară, dar nu şi suficientă pentru o
înţelegere efectivă a relaţilor cantitative din economia modernă; unificarea lor este aceea
care asigură eficienţa. Econometria este tocmai această unificare.” (R.Frisch,
Econometrica)
 scopul econometriei este acela de a testa o teorie economică folosind date reale.
 Econometria poate fi folosită în două moduri, care nu
sînt mutual exclusive:

 Ca unealtă de previziune i.e. date fiind valori ipotetice ale


anumitor variabile, putem previziona valoarea variabilei
de interes.

 Ca metodă explicatorie i.e. poate fi folosită pentru a


confirma sau infirma o teorie economică.
Etapele demersului econometric

 Delimitarea ipotezelor din teoria economică ce


urmează a fi testate
 Teoria cererii si ofertei
 Formularea matematică a ipotezelor economice
 P=f(Q), unde f’(Q)<0
 Specificarea modelului econometric
 P=a+bQ+ε
 Culegerea datelor
 Estimarea parametrilor
 Predicţia pe baza modelului
 Concluzii şi recomandări: e.g. poate fi ales acel preţ
care maximizează profitul
Statistică vs Econometrie

 Econometria pleacă de la un model economic, adică


există anumite relaţii a priori acceptate pe baza unui
model economic; aceste relaţii sînt testate folosind
date reale.

 Statistica, de cele mai multe ori, caută anumite


corelaţii între variabile, dar fără a avea la bază o teorie
economică.
Modelul econometric
 Modelul econometric: un model economic formulat astfel încât parametrii să poată fi
estimaţi dacă se face presupunerea că modelul este corect.
 Relaţiile statistice pe care se bazează modelul econometric:
 relaţii de identitate sau deterministe: sunt formulări logice cu privire la procesul economic
descris (exemplu: VN=VB - I );
 relaţii de comportament: au în vedere modificările tradiţiilor, atitudinilor, înclinaţiilor (sub
raportul satisfacţie/efort) (exemplu: C = a + bV );
 relaţii tehnologice: restricţiile impuse output-urilor în raport cu input-urile (exemplu: funcţia
Cobb Douglas: Q = IL1-, 01);
 relaţii instituţionale: conform unor reglementări impuse de lege (exemplu:amortizarea,
impozitul pe venit etc.).
Elemente introductive (2)

Joi, 4 Martie 2021


Modelarea economică

X  S  Y
 Modelele deterministe: y = f(x) (de exemplu: Q = wL) se utilizează frecvent în
practica economică în analiza pe factori a variaţiei, în timp sau spaţiu, a
fenomenelor social economice.

 Modelul econometric descrie legătura statistică sau stochastică dintre intrările


sistemului - factorii de influenţă X - şi ieşirile acestuia, variabilele rezultative Y:
Y = f(X)+U
Tipologia modelelor econometrice
1. după numărul factorilor luaţi în considerare
 modele unifactoriale: se fundamentează pe ipoteza că în rândul factorilor de influenţă ai variabilei
rezultative y există un factor determinant x, ceilalţi factori cu excepţia acestuia având o influenţă
întâmplătoare (exprimată prin intermediul variabilei reziduale u) sau fiind invariabili în perioada
analizată
y = f(x)+u
 modele multifactoriale: elimină deficienţa modelului unifactorial, însă trebuie ca numărul
factorilor luaţi în considerare să nu fie foarte mare pentru a nu fi mult prea complex, dificil de
estimat etc.
y = f(x1,x2,...,xp)+u
2. după forma legăturii dintre variabila rezultativă şi variabilele cauză
 modele liniare: dacă legătura este liniară
 modele neliniare: dacă legătura este neliniară
Tipologia modelelor
econometrice
3. după includerea factorului timp în model
 modele statice: dependenţa variabilei endogene y faţă de valorile
variabilei exogene xj se realizează în aceeaşi perioadă de timp:
y = f(x1t,...,xjt,...,xkt) + ut
 modele dinamice:
 introducerea variabilei timp ca o variabilă explicativă
y = f(xt,t) + ut
 autoregresive : variabila rezultativă cu valori decalate este una din
variabilele explicative
y = f(xt,yt-k) + ut
 model cu decalaj: variabila explicativă x îşi exercită influenţa asupra
variaţiei variabilei rezultative pe mai multe perioade de timp:
y = f(xt,xt-1,... xt-k) + ut
Tipologia modelelor
econometrice

4. Numărul de ecuaţii din model


 modele cu o singură ecuaţie: toate modelele prezentate anterior
 modele cu ecuaţii multiple: sunt formate dintr-un sistem de ecuaţii

 Forma structurală a unui model cu ecuaţii multiple este:

 Y1 + b12Y2 + ... + b1nYn + c11 X 1 + c12 X 2 + ... + c1m X m = U 1


b Y + Y + ... + b Y + c X + c X + ... + c X = U
 21 1 2 2n n 21 1 22 2 2m m 2

 
bn1Y1 + bn 2Y2 + ... + Yn + cn1 X 1 + cn 2 X 2 + ... + cnm X m = U n

Yi , i = 1, n variabile rezultative sau endogene


variabile
X j, j =1,m explicative sau exogene
Sintetizarea datelor primare

 sinteza tendinţei centrale


1 n
 media: x i =  xki
n k =1
 sinteza numerică a variabilităţii
1 n
 dispersia variabilei xi este s =
2

n − 1 k =1
i ( xki − x i ) 2

 abaterea standard sau abaterea medie pătratică: s i = s 2


i

 sinteza numerică a legăturii de tip liniar


 covarianţa: exprimarea variaţiilor simultane a două variabile liniar dependente
1 n
sij = 
n − 1 k =1
( xki − x i )( xkj − x j )

Dacă cele două variabile coincid sii=si2


sij
 coeficientul de corelaţie Pearson
rij =  [−1,1]
si s j
Rafinarea datelor

 Curățarea datelor (purificarea datelor) primare este necesară pentru asigurarea:


consistenţei; relevanţei; comparabilităţii
 Se realizează prin:
 recalcularea datelor după metodologii care au ieşire date comparabile;
 interpolare sau completarea datelor omise;
 extrapolarea: completarea datelor omise la capetele seriilor de timp;
 ajustarea datelor, netezirea datelor.
REGRESIE SI CORELATIE LINIARA

8
Regresia – scurt istoric al termenului

 Sir Francis Galton(1822-1911) – spirit enciclopedic al perioadei


victoriene, fiind cel care a introdus termenii de regresie şi corelaţie
statistică
 Originea regresiei ca metodă statistică se află în studiile sale de genetică
aplicată în studiul plantelor- 1877
 Plantînd boabe dintr-un anumit soi de mazăre dulce a observat că există
o legătură liniară între diametrele acestor boabe şi diametrele boabelor
recoltate de la noile plante. El a numit iniţial panta acestei drepte
“coefficient of reversion”, schimbîndu-i apoi numele în “coefficient of
regression”.
 Termenul de regresie provine de la descoperirile sale în domeniul
eredităţii: în general, progeniturile indivizilor geniali au abilităţi care îi
aşază mai degrabă la nivelul mediei; de asemenea, înalţimea copiilor
proveniţi din taţi foarte înalţi se apropie mai mult de înălţimea medie
decît înălţimea taţilor.

9
Modele

 Un model este o reprezentare a unui anumit fenomen


 Model matematic - o reprezentare matematică a unui fenomen
 De cele mai multe ori un model descrie legăturile existente între două sau mai
multe variabile
 În general, sînt două clase de modele:
 Modele deterministe
 Modele probabiliste

10
 Modele deterministe
 Modele probabiliste
 Exprimă o relaţie exactă între
variabile ◼ Componenta
 Teoretic, eroarea de previziune deterministă
este nulă
◼ Componenta aleatoare
◼ Eroarea de previziune
 Exemplu:
este nenulă
Principiul al doilea al mecanicii
newtoniene: ◼ Componenta aleatoare
F = m.a poate fi datorată
factorilor obiectivi, ce
nu sînt incluşi în model
◼ Exemplu: Volumul
vînzărilor=10 *
Cheltuielile cu
publicitatea +
Componenta 11
aleatoare
Tipuri de modele probabiliste

Modele
Probabilistic
Probabilistic
probabiliste
Models
Models

Modele de
Regression
Regression Modele de
Correlation
Correlation Alte
Other
Other
regresie
Models
Models corelatie
Models
Models Models
Models
modele

12
Regresia – metodă de modelare a legăturilor
dintre variabile

 În general, orice fenomen este rezultatul acţiunii unuia sau mai multor factori
 Exprimarea matematică:

Y = f ( X 1 ,..., X n ) + 

Variabila Variabile Variabila


dependentă independente reziduală
(variabila (variabile
endogenă) exogene/explicative) 13
Exemplu: Legea lui Keynes privind legătura
dintre venit şi consum

 Suma cheltuită pentru consum depinde de:


 mărimea venitului pe de o parte
 alte obiective în funcţie de circumstanţe (de exemplu
investiţiile)
 alte nevoi subiective
 „O persoană este dispusă de regulă şi în medie să îşi crească
consumul pe măsura creşterii venitului dar nu în aceeaşi
măsură”
dC
0 1
dV

 Modelul de regresie: C=+V+ , unde 0<<1 .


14
Clasificarea modelelor de
regresie
1 Variabilă Modele 2+ Variabile
explicativă de regresie explicative

Simple Multiple

Non- Non-
Linear Linear
Linear Linear

15
Tipuri de modele de regresie

Legătură liniară directă Legătură neliniară

Legătură liniară inversă Absenţa vreunei legături

16
Modelul de regresie liniară simplă

17
Exemplu
practic
 Există o legătură între
suprafaţa unor apartamente
din zona centrală şi preţul de
închiriere a acestora?
 Selectăm aleator 25 de astfel
de apartamente la care
urmărim valorile celor două
variabile X – suprafaţa(m2) şi
Y – chiria lunară(RON).

18
Regresia folosind EXCEL
Accesăm meniul TOOLS>DATA ANALYSIS>REGRESSION

19
Regresia folosind EXCEL
Selectăm valorile variabilelor

20
21
Corelograma(Scatter plot)

 Graficul punctelor de coordonate (Xi,Yi), i=1,n.

2500

2000
Chiria(RON)

1500

1000

500

0
0 50 100 150 200 250
Suprafata(m2) 22
Modelul de regresie liniară simplă

 Pe baza corelogramei este rezonabil să presupunem că media


variabilei Y depinde de X printr-o relaţie liniară:

 Atunci modelul de regresie liniară simplă este dat de relaţia


următoare:
Y intercept (termenul constant)
Variabila
de
Yi =  0 +  1 X i +  i perturbaţie

Variabila
Variabila independentă
dependentă Panta dreptei de 23

(răspuns) (explicativă)
regresie
Regresie liniara (2)
Joi, 11 Martie 2021

1
Media şi dispersia variabilei dependente

Dacă presupunem că media şi dispersia lui  sînt 0 şi 2,


atunci media lui Y pentru o valoare particulară a lui X
este dată de relaţia:

Dispersia lui Y pentru o valoare particulară a lui X


este dată de relaţia:

2
• La nivelul populaţiei regresia se reduce la exprimarea
mediei condiţionate a lui Y:

unde 1 are semnificaţia unui coeficient de


elasticitate: arată modificarea lui Y la o modificare cu
o unitate a lui x.
• De asemenea, variabilitatea lui Y pentru o valoare
particulară x este determinată de dispersia variabilei
reziduale, 2.
• Există o distribuţie a valorilor lui Y pentru fiecare x
şi dispersia acestei distribuţii este constantă pentru
3
orice x.
Distribuţia condiţionată a lui Y

Dreapta de regresie
Y

X
4
Modelul de regresie liniară la
nivelul populaţiei
Y Yi =  0 + 1X i +  i Valoarea
observată

i = Eroarea

 =  0 + 1X i
YX
(E(Y))
X
Valoarea 5
observată
Modelul de regresie liniară la
nivelul eşantionului
Yˆi = ˆ0 + ˆ1 X i

Yi = Valoarea estimată a lui Y pentru observaţia i

Xi = Valoarea lui X pentru observaţia i

̂ 0 = Estimatorul termenului liber 0

ˆ1
= Estimatorul pantei 1
6
Estimarea parametrilor modelului de regresie
 Metoda celor mai mici pătrate(M.C.M.M.P.) –
Ordinary Least Squares(OLS sau LS)
 Presupunem că avem n perechi de observaţii (x1,
y1), (x2, y2), …, (xn, yn).
 Ideea este să minimizăm distanţa dintre valorile
estimate şi valorilen reale 2
( )
n
L =  Yi − Yˆi =  ˆ i2 = min
i =1 i =1
 Ne reamintim că deci

Yˆi = ˆ0 + ˆ1 xi

7
Ilustrare grafică
n
LS m inim izează  ˆ
i =1
i
2
= ˆ + ˆ + ˆ + ˆ
1
2 2
2
2
3
2
4

Y Y 2 =  0 +  1 X 2 +  2
^4
^2
^1 ^3
  
Yi =  0 +  1X i
X 8
 Condiţiile de minim:

 Simplificînd, obţinem sistemul de ecuaţii


normale

9
Estimatorii modelului de regresie

cov(X , Y )
b1 = 2
sx
b 0 = y − b1 x

10
Notaţii

 Valoarea estimată:
 Valoarea reziduală(reziduul):

11
Estimatorul dispersiei modelului

 Dacă notăm suma pătratelor erorilor de


regresie

atunci un estimator al varianţei variabilei


reziduale este

12
Proprietăţile estimatorilor modelului de regresie
− ˆ0 şi ˆ1 sînt estimatori nedeplasaţi ai parametrilor  0 şi 1
E ( ˆ ) =  şi E ( ˆ ) = 
0 0 1 1

-Dispersiile celor doi estimatori sînt date de relaţiile

ˆ  1 x 2

V( 0 ) =   +
2

 n S xx 
 2
V(ˆ1 ) =
S xx
n
unde S xx =  ( xi − x ) 2 şi  2 este dispersia variabilei reziduale
i =1

-Estimatorii ˆ0 şi ˆ1 urmează o distribuţie normală


13
Distribuţia estimatorului pantei de regresie

Y Sample 1 Line
All Possible
Sample Slopes
Sample 2 Line
 Sample 1: 2.5
Population Line
 Sample 2: 1.6
X
 Sample 3: 1.8
 Sample 4: 2.1
Sampling Distribution : :
S^1 Very large number of
sample slopes

1 ^
1
14
Eroarea standard a estimatorilor
n

i
e 2

Întrucît varianţa reziduală  2 se estimează prin ˆ 2 = i =1


putem avea o estimare
n−2
a erorii standard a celor doi estimatori:
2
V ( ˆ)
 S ˆ 2
-SE ( ˆ1 ) = 1
= xx
=
df n−2 S xx
 1 x2 
  + 
2

V ( ˆ
 )  n S xx   1 x 2

ˆ
-SE (  0 ) = 0
= = ˆ  + 
2

df n−2  n S xx 

Erorile standard vor fi folosite la testarea semnificaţiei parametrilor


modelului de regresie 15
Intervale de încredere pentru parametrii
modelului

 Pentru termenul
ˆ0 − t / 2,n −2 SEliber(intercept)
( ˆ0 )   0  ˆ0 + t / 2, n −2 SE ( ˆ0 )

 1 x2   1 x 2

ˆ0 − t / 2,n −2 ˆ  +   0  ˆ0 + t / 2,n −2 ˆ  + 
2 2

 n S xx   n S xx 
 Pentru panta dreptei de regresie(slope)
ˆ1 − t / 2,n−2 SE ( ˆ1 )  1  ˆ1 + t / 2,n−2 SE ( ˆ1 )
 x 2
  x 2

ˆ1 − t / 2,n−2 ˆ
ˆ    1  1 + t / 2,n−2 ˆ  
2 2

 S xx   S xx 
unde n este estimatorul dispersiei modelului.
e 2
i
ˆ 2 = i =1

n−2
16
Teorema Gauss-Markov
 Estimatorii obţinuţi prin metoda celor mai mici
pătrate sînt B.L.U.E. i.e. orice alt estimator liniar
are o dispersie mai mare decît cei obţinuţi prin
MCMMP.
Conform OLS, estimatorul pantei este o combinaţie liniară de valorile variabilei dependente:
n n n n

 ( y − y)( x − x)  y ( x − x) − y  ( x − x)  y ( x − x)
i i i i i i i n
ˆ1 = i =1
n
= i =1
n
i =1
= i =1
n
=   i yi
 ( x − x)
i =1
i
2
 ( x − x)
i =1
i
2
 ( x − x)
i =1
i
2 i =1

n n n n
Fie  =  qi yi =  0  qi + 1  qi xi +  qi i un alt estimator liniar.
'

i =1 i =1 i =1 i =1
n n
Pentru ca E( ) = 1 , e necesar ca  qi = 0 şi  qi xi = 1.
'

i =1 i =1
n n
Rezultă  =  qi i + 1 , deci varianţa sa este V( ) = 
' ' 2
q . 2
i
i =1 i =1
n
Fie vi = q −i  i , atunci qi =  i + vi şi avem V( ) =  ' 2
 (
i =1
i + vi ) 2 =
n n n
= 2
 (
i =1
i
2
+ 2 i vi + v ) = 
2
i
2
 (
i =1
i
2
+v )  2
i
2

i =1
i
2
= V ( ˆ1 ).*** QED 17
Exemplu-chiria ca funcţie de suprafaţă

 Panta dreptei de regresie este pozitivă, deci există


o legătură directă între chirie şi suprafaţa
apartamentelor.
 În plus, dacă chiria creşte cu o unitate(1 m2) ,chiria
va creşte cu 10.640 lei.
 Doar panta dreptei de regresie este semnifcativ
diferită de zero.
 P-value – probabilitatea ipotezei ca parametrul
estimat să fie egal cu zero; dacă P-value este mai
mic decît pragul de semnificaţie atunci respingem
această ipoteză.
18
Analiza varianţei pentru modelul de regresie

 Dacă între X şi Y nu există nici o legătură,


atunci putem face predicţii privind valoarea
medie a lui Y pentru orice valoare a lui X
 Dacă există o legătură între X şi Y, în ce măsură
cunoaşterea valorilor lui X poate explica
abaterea variabilei dependente de la media sa?
 Abaterea totala = abaterea explicata +
Abaterea reziduala

ˆ ˆ
(Y i - Y ) = ( Y i - Y ) + (Y i - Y i )
19
Descompunerea variaţiei

Y 
SSE =(Yi - Yi )2
_
SST = (Yi - Y)2

 _
SSR = (Yi - Y)2 _
Y

X
X Xi
20
ANOVA pentru regresie

 (Y i
− Y )2
=  ˆ
(Yi − Y ) +
2
 ˆ
(Y i − Y i ) 2

SST = SSR + SSE


SST = Total Sum of Squares
_
Măsoară variaţia valorilor observate Yi în jurul mediei Y

SSR = Regression Sum of Squares


Măsoară variaţia explicată de modelul de regresie

SSE = Error Sum of Squares


Măsoară variaţia ce poate fi atribuită altor factori, diferiţi
21
de variabila explicativă X
Excel Output (selecţie)

22
Coeficientul de determinaţie R2
 Este o măsură a proporţiei varianţei explicate de
model n n

SSR  i
( ˆ
y − y ) 2
i
e 2

R =
2
= i =1
= 1− i =1
  0,1
SST  ( y − y)
i
i
2
 ( y − y)
i
i
2

 R2 este afectat de creşterea numărului de


parametri; de aceea pentru modele cu multi
parametri se calculează R2 ajustat, care are
aceeaşi interpretare.
n −1  n −1 
R = 1 − (1 − R )
2 2
 1 − ,1
n − k −1  n − k −1 
adj
23
Exemplu-chiria ca funcţie de suprafaţă

•Modelul explică 72.23% din variaţia chiriei pentru apartamentele din


zona centrală

Standard Error : n

i
e 2

ˆ = i =1

n−2
24
Observaţii

 R2 este adesea folosit pentru a alege cel


mai bun model din punctul de vedere al
varianţei explicate.

 Comparaţiile de acest fel trebuie făcute


între modele de aceeaşi natură.

25
Foarte important!!
 Pentru modele de regresie fără termen liber, de tipul

y = x + R2 nu mai are semnificaţia de proporţie a


varianţei explicate.
 Exemplu: considerăm două astfel de modele

 y1 = 1 x1 + 1
 , unde y2i = y1i +  şi x2i = x1i + 
 y2 =  2 x2 +  2

 Deşi ar părea că modelul al doilea este mai performant, nu


sînt argumente pentru a susţine această ipoteză
26
Coeficientul de determinaţie şi coeficientul
de corelaţie liniară

Y R2 = 1, r = +1 Y R2 = 1, r = -1
^=b +b X
Yi 0 1 i
^=b +b X
Yi 0 1 i
X X
R 2 = .8, r = +0.9
Y Y R2 = 0, r = 0

^=b +b X
Y ^=b +b X
Y
i 0 1 i i 0 1 i
X X27
Tabelul ANOVA
Source of Sum of Squares df Mean F
Variation Square
n
SSR MSR
Regression SSR =  ( yˆi − y ) 2
k-1 MSR=
i =1 k −1 MSE
n n
SSE
Error SSE =  ( yi − yˆi ) =  ei 2
2
n-k MSE=
i =1 i =1 n−k
SST =  ( yi − y ) 2 SST
Total n-1
i n −1

SSR
Testul k-numărul de parametri ai
F = k − 1 ~ Fk −1, n − k modelului
SSE
n−k
este folosit la verificarea validităţii modelului. Un model este valid dacă proporţia
varianţei explicate prin model este semnificativă. Ipoteza nulă pentru testul F in cazul
acesta este cea de model nevalid. 28
Excel Output

SUMMARY OUTPUT

Regression Statistics
Multiple R 0.85
R Square 0.72
Adjusted R Square 0.71
Standard Error 194.70
Observations 25

ANOVA
df SS MS F Significance F
Regression 1 2267827.07 2267827.07 59.82347359 0.00
Residual 23 871898.93 37908.64913
Total 24 3139726
29
REGRESIA MULTIPLĂ

 Joi, 18 martie 2021

1
Regresie multipla
Coeficienti de
regresie
Variabila eroare

y = b0 + b1x1+ b2x2 + …+ bkxk + e

Variabila
Variabile Independente
Dependenta

2
Forma generală a modelului

Modelul regresiei multiple se prezintă sub forma


ecuaţiei:
yi = b 1x1i + b 2 x2i + … + bkxki + ei.

În cazul acestei ecuaţii de regresie se identifică urmãtoarele


variabilele:
– grupul de variabile exogene sau independente, ce se
reprezintă sub forma variabilei vectoriale X = (X1, X2, …, Xk ).

Pentru fiecare moment/ caz, ce va fi simbolizat prin


indicele t, vom avea seria de valori x1t, x2t, …, xkt; pentru fiecare
variabilă ansamblul datele înregistrate pentru n momente vor fi
reprezentate prin vectorul coloană xi cu i=1,…k.
3
Forma generală matriceală a modelului

 x11 x1k   
 y1   k   e1   
  x12 x2    b1 
Y =   , X = , e =  , b = 
   
y   
 n  
k  e n   
 x1n xn   bk 

Y = Xb + e

4
Estimarea parametrilor prin MCMMP
Minimizăm suma pătratelor erorilor de ajustare:
S ( bˆ ) =  ei2 =  ( yi − bˆ1 x1i − bˆ2 x2i − ... − bˆk xki ) 2 =
i i
( y
i
i
ˆ ' x )2 .
−b i

Vom folosi scrierea matriceală:


 e1 
 
n e
S ( bˆ ) = e 2
= (e1 e2 ... en )   2  = e 'e
.
i =1
i
 
 
 en 

Minimizarea S se realizează în raport cu parametrii modelului de regresie b̂ . Astfel,


vom avea:
[min] S ( bˆ ) = e ' e = (Y − X bˆ ) '(Y − X bˆ ) = Y ' Y − 2bˆ ' X ' Y + bˆ ' X ' X bˆ .

În dezvoltarea ultimei expresii s-a luat în considerare faptul că bˆ ' X ' Y este un scalar
real.

5
Estimarea parametrilor prin MCMMP
Derivînd în raport cu bˆ avem:
S (bˆ ) [Y 'Y − 2bˆ ' X 'Y + bˆ ' X ' X bˆ ] [ bˆ ' X ' X bˆ ]
= = −2 X ' Y + = −2 X 'Y + 2 X ' X bˆ = 0 .
bˆ bˆ bˆ
Din ipoteza V matricea X’X este nesingulară, deci estimatorul vectorului parametrilor
modelului de regresie multiplă este:

bˆ = ( X ' X )−1 X 'Y .


Cum
S ( bˆ ) ˆ  2 ˆ
S(b)
= −2 X ' Y + 2 X ' X b atunci ˆ ˆ = 2X' X .
bˆ b b'

Ultima expresie este pozitiv definită, deci soluţia b̂ este optimă.

*Pentru mai multe detalii vezi Green, Econometric Analysis, Cap.2 şi 6.


6
Interpretarea parametrilor
Pentru a interpreta semnificaţia parametrilor modelului de regresie considerăm
modelul:
yi = bˆ1x1i + bˆ2 x2i + ... + bˆk xki .
Atunci, dacă x2, … xk sunt constante se obţine următoarea egalitate:
y i = bˆ1 x1i ,
Rezolvând ecuaţia de mai sus se obţine că estimatorul parametrului b1 este rata
marginală de substituţie a variabilei endogene în raport cu variabila exogenă X1:
ˆ y i
b1 = .
x1i
Coeficientul b̂ 1 arată cu câte unităţi creşte sau se micşorează
caracteristica Y, dacă caracteristica X1 se modifică cu x1i unităţi,
în condiţiile în care celelalte caracteristici
X2, …, Xp rămân constante.

În cazul în care variabilele endogene sunt necorelate, atunci


semnul coeficientului fiecărei variabile din modelul multiplu de
regresie coincide cu semnul coeficientului din modelul simplu de
regresie de analiză al variabilei endogene funcţie de fiecare
variabilă exogenă în parte. 7
Exemplu: Stabilirea locatiei unui hotel (1)

⚫ O companie hotelieră doreşte construirea


unui nou hotel.
⚫ Managementul doreşte să stabilească locaţia
probabil cea mai profitabilă.
⚫ Profitabilitatea unei locatii depinde de factori
cum sunt:
 Competiţia
 Cunoaşterea pieţei

 Generatori de cerere

 Elemente de demografie

 Calitatea elementelor fizice din zonă 8


Exemplu (2)
Marja
Profitabilitatea

Cunoaşterea
Competiţia Clienţii Comunitatea Elemente fizice
pieţei

Camere Apropiere Spaţii Gară, Venitul Dist. Oraş


de birouri aeroport etc.
Numarul de Venitul
Distanta pana Distanţa până în centru
hoteluri/ moteluri/ median al
la cel mai apropiat gospodariilor
pensiuni/ camere
hotel
pe o rază de 5 km

9
Exemplu (3)
⚫ Se folosesc date pentru un esantion de
100 hoteluri care apartin aceluiaşi lanţ, si
se foloseste urmatorul model :
Marja =b0 + b1Camere + b2Apropiere + b3Birouri +
b4G/Aerop. + b5Venit + b6Dist_oraş+e

Hotel Marja Camere Apropiere Birouri G/Aerop. Venit Dist_oras


1 55,5 3203 0,1 549 8 37 12,1
2 33,8 2810 1,5 496 17,5 39 0,4
3 49 2890 1,9 254 20 39 12,2
4 31,9 3422 1 434 15,5 36 2,7
5 57,4 2687 3,4 678 15,5 32 7,9
6 49 3759 1,4 635 19 41 4

10
Exemplu (4)

Regression Statistics
Multiple R 0,724611
R Square 0,525062
Adjusted R Square
0,49442 Marja = 72.455 - 0.008*Camere -1.646*Apropiere
Standard Error
5,512084 + 0.02*Birouri +0.212*G/Aerop
Observations 100
- 0.413*Venit + 0.225*Dist_oraş
ANOVA
df SS MS F Significance F
Regression 6 3123,832 520,6387 17,13581 3,03E-13
Residual 93 2825,626 30,38307
Total 99 5949,458

Coefficients
Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 72,45461 7,893104 9,179483 1,11E-14 56,78049 88,12874
Camere -0,00762 0,001255 -6,06871 2,77E-08 -0,01011 -0,00513
Apropiere -1,64624 0,632837 -2,60136 0,010803 -2,90292 -0,38955
Birouri 0,019766 0,00341 5,795594 9,24E-08 0,012993 0,026538
G/Aerop. 0,211783 0,133428 1,587246 0,115851 -0,05318 0,476744
Venit -0,41312 0,139552 -2,96034 0,003899 -0,69025 -0,136
Dist_oras 0,225258 0,178709 1,260475 0,210651 -0,12962 0,580138 11
Exemplu (5)
• Utilizarea modelului
⚫ Predictie pentru un hotel cu
urmatoarele caracteristici:
 3815 camere în raza de 5 km,
 Cel mai apropiat competitor la 3.4 km,

 476 sute de metri patrati de birouri,

 24,500 flux gara/ aeroport,

 $39,000 venitul median al gospodăriilor,

 3.6 km distanţă de centrul oraşului.

Marja = 72.455 - 0.008(3815) -1.646(3.4) + 0.02(476)


+0.212(24.5) - 0.413(39) + 0.225(3.6) = 37.1%
12
Variabile calitative
 În multe situaţii din viaţa reală, una sau mai
multe variabile independente sunt calitative.
 O variantă de includere a variabilelor
calitative în modelele de regresie este prin
utilizarea variabilelor indicator (“dummy”).
 O variabilă indicator (I) poat sa ia una dintre
cele două valori (binare), “zero” sau “unu”.

1 prima
1 dacă
dacă dacă
dateletemperatura
1 dacăcondiţie
sunt
e licenţiat
culese aînfost
e satisfăcutăsubde10
înainte
Finanţe o
2000
I=
00 dacă
dacă atemperatura
0 dacă
dacădoua
edatele
licenţiat aînfost
condiţie
sunt de 10
altceva
eculese o sau mai mult
satisfăcută
după
decât 2000
Finanţe

13
Exemplu (1)

 Consideram ca pretul este


determinat si de culoarea masinii.
 Consideram trei culori :
⚫ Alb
⚫ Argintiu I1 = 1 daca culoarea este alba
0 pentru alta culoare
⚫ Alte culori
I2 = 1 daca culoarea este argintie
0 pentru alta culoare

14
Exemplu (2)

⚫ Folosim modelul
y = b0 + b1(Kilometraj) + b2I1 + b3I2 + e

Pret Kilometraj I-1 I-2


5318 37388 1 0 Alba
5061 44758 1 0
5008 45833 0 0 Alta culoare
5795 30862 0 0
5784 31705 0 1
5359 34010 0 1 Argintie
. . . .
. . . .
15
Exemplu (3)
SUMMARY OUTPUT

Regression Statistics
Multiple R 0.835482
R Square 0.69803
Adjusted R Square
0.688594
Standard Error
142.271
Observations 100

ANOVA
df SS MS F Significance F
Regression 3 4491749 1497250 73.97095 7.22E-25
Residual 96 1943141 20241.05
Total 99 6434890

Coefficients
Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 6350.323 92.16653 68.90053 1.5E-83 6167.374 6533.272
Odometer -0.02777 0.002369 -11.7242 3.14E-20 -0.03247 -0.02307
I-1 45.24098 34.08443 1.327321 0.187551 -22.4161 112.8981
I-2 147.738 38.18499 3.869007 0.000199 71.94135 223.5347 16
Testarea ipotezelor statistice

 Joi, 25 martie 2021

1
Concepte (1)
 Ipoteză statistică = ipoteza care se face cu privire la
parametrul unei repartiţii sau la legea de repartiţie pe
care o urmează anumite variabile aleatoare.
 Ipoteză nulă (H0) = ipoteza care se consideră a priori
adevărată.
 Ipoteză alternativă (H1) = o ipoteză care contrazice
ipoteza nulă. Ea va fi acceptată doar când există
suficiente dovezi în favoarea acesteia.
 Dacă ipoteza nulă constă în afirmaţia că parametrul θ
al unei distribuţii este egal cu o anumită valoare θ0:
⚫ ipoteză alternativă simplă: θ = θ1
⚫ ipoteză alternativă compusă:   { 1 , 2 ,..., k } 2
Concepte (2)
 Testul statistic este utilizat drept criteriu de acceptare
sau de respingere a ipotezei nule
 Regiunea critică, Rc = valorile numerice ale testului
statistic pentru care ipoteza nulă va fi respinsă.
⚫ este astfel aleasă încât probabilitatea ca ea să conţină testul
statistic, când ipoteza nulă este adevărată să fie α, cu α mic
(α=0.01 etc).
⚫ Dacă valoarea calculată a testului statisticic se află în
regiunea critică Rc, ipoteza H0 se respinge
⚫ regiunea critică este delimitată de valoarea critică, C –
punctul de tăietură în stabilirea acesteia.

3
Concepte (3)
 Eroare de genul întâi = eroarea pe care o facem eliminînd o ipoteză nulă,
deşi este adevărată.
 Riscul de genul întâi (α) = probabilitatea comiterii unei erori de genul
întâi; se numeşte nivel sau prag de semnificaţie.
 Nivelul de încredere al unui test statistic este (1-α) iar în expresie
procentuală, (1-α)100 reprezintă probabilitatea ca rezultatele să fie
adevărate.
 Eroare de genul al doilea = eroarea pe cere o facem acceptînd o ipoteză
nulă, deşi este falsă.
 Probabilitatea (riscul) comiterii unei erori de genul al doilea este β.
 Puterea testului statistic este (1-β).
 P-value=cel mai mic nivel de semnificaţie la care poate fi respinsă ipoteza
nulă.

4
Concepte (4)
 Ipoteza alternativă poate avea una din trei forme (pe care le vom exemplifica
pentru testarea egalităţii parametrului „media colectivităţii generale“, μ cu
valoarea μ0)
⚫ test bilateral:
H0: μ = μ0
H1: μ ≠ μ0 (μ < μ0 sau μ > μ0)
⚫ test unilateral dreapta:
H0 : μ = μ 0
H1: μ > μ0
⚫ test unilateral stânga:
H0: μ = μ0
H1 : μ < μ 0
5
Regiunea critică

− z / 2 μ z / 2 μ z − z μ
a) b) c)

Regiunea critică pentru a) test bilateral; b) test unilateral dreapta; c) test unilateral stînga

6
Concepte (5)

 Erorile în testarea ipotezelor statistice


Decizia de Ipoteza adevărată
acceptare H0 H1
H0 Decizie corectă Eroare de tip II
(probabilitate 1-α) (risc β)
H1 Eroare de tip I Decizie corectă
(risc α) (probabilitate 1-β)

 α= P(respingere H0 ‫ ׀‬H0 este adevărată)=P(eroare de tip I)


 β= P(acceptare H0 ‫ ׀‬H0 este falsă)=P(eroare de tip II)

7
Concepte (6)

Legătura dintre probabilităţile α şi β

8
Etapele verificării ipotezelor
statistice

⚫ Identificarea ipotezelor ce trebuie testate


⚫ Identificarea testului statistic
⚫ Specificarea nivelului de semnificaţie
⚫ Stabilirea regulii de decizie
⚫ Culegerea datelor şi realizarea calculelor
⚫ Luarea deciziei statistice
⚫ Aplicarea deciziei statistice în lumea concretă

9
Efectuarea testului statistic
 Condiţia esenţială în verificarea ipotezelor statistice este
că variabila de interes urmează o repartiţie normală:

X N ( , 2 )
 Se extrage un eşantion aleator din respectiva populaţie
normală
x : ( x1 ,..., xn )
 Pe baza eşantionului se calculează valoarea estimatorului
parametrului populaţiei de interes şi apoi valoarea
testului
 Forma generală a testului statistic:
valoarea estimată - valoarea ipotetică
eroarea standard a estimatorului 10
Concepte (7)
 Se fac presupuneri despre populaţia sau populaţiile ce
sunt eşantionate (normalitate etc.).
 Se calculează apoi testul statistic şi se determină
valoarea sa numerică, pe baza datelor din eşantion.
 Se desprind concluziile: ipoteza nulă este fie
acceptată, fie respinsă, astfel:
⚫ dacă valoarea numerică a testului statistic cade în regiunea
critică (Rc), respingem ipoteza nulă şi acceptăm ipoteza
alternativă. Această decizie este incorectă doar în 100 α %
din cazuri;
⚫ dacă valoarea numerică a testului nu se află în regiunea
critică (Rc), se acceptă ipoteza nulă H0. 11
Testarea semnificaţiei parametrilor
modelului liniar de regresie (1)
H0 :  i = 0
H1 : i  0.
Dacă notăm  ii = [(X'X)–1ii] termenul (i, i) din matricea (X’X)–1,
atunci dacă sunt satisfăcute ipotezele pe care se fundamentează modelul
regresiei multiple vom avea următoarele două rezultate:
 −1 
i → N  i ,   ( X'X )ii  
ˆ 
  
iar
i − ˆi
zi = → N (0,1).
  ( X'X )ii 
−1
 

Cum în aplicaţiile practice nu cunoaştem  , atunci această statistică


nu poate fi utilizată în inferenţele statistice asupra parametrilor modelului de
12
regresie.
Testarea semnificaţiei parametrilor
modelului liniar de regresie (2)
Pentru definirea unei statistici operabile ţinem seama de faptul că:

=  ( X'X )ii  .
 −1
ˆ 2 2
ˆi e 
ˆi −  i
ti =
 e ( X ' X )ii  urmează o repartiţie Student cu n-k
Atunci −1
 
grade de libertate.
Vom formula deci ipotezele:
Ho: ˆi = 0
H1: ˆ ≠0
i
Decizia:
Dacă tcalc>ttab se alege H1 . Altfel, acceptam H0

13
Exemplu (1)

 Se cere să se construiască un model


de regresie care să analizeze modul
în care media de la examenul de
Bacalaureat, media anilor de liceu şi
genul candidatului au influenţat
rezultatele la admiterea ASE 2006.
 În acest scop s-a realizat un
eşantion selectat aleator de 50 de
candidaţi precum şi punctajul
maxim realizat de către aceştia
14
Exemplu (2)
 Modelul de regresie
Punctaj =  0 + 1 * Bac +  2 * Lic + 3 * Gen + 

 Avem n=50 observaţii (cazuri), k=3 variabile


independente (Bac, Liceu şi Gen)

 50 412, 49 427,53 14   2538 


   
412, 49 3433,82 3546, 72 117, 24 21249, 63
X 'X =  X 'Y =  
 427,53 3546, 72 3688, 43 116,98   22029, 03 
   
 14 117, 24 116,98 14   665 

15
Exemplu (3)
 2, 78 −0,16 −0,17 −0, 05 
 
−1  −0,16 0, 06 −0, 04 −0, 02 
(X ' X ) =  0   −51, 64 
 −0,17 −0, 04 0, 05 0, 02     
  
 −0, 05 −0, 02 0, 02 0,11  ˆ =  1  = ( X
2
' X )−1 X 'Y =
 6, 78 
5,57 
   
 3   −4,19 

Punctaj = −51, 64 + 6, 78* Bac + 5,57 * Lic − 4,19* Gen + 


1
 ( )
2

S 2 = S2 * diag ( X ' X ) S = y− y = 174,42


−1 2

n − k −1

 2, 78 
 
S  = 174, 42* 
2 0, 06  Punctaj = −51, 64 + 6, 78* Bac + 5,57 * Lic − 4,19* Gen + 
 0, 05 
  (22,02) (3,12) (3,05) (4,34)
 0,11
16
Exemplu (4) – Testarea semnificaţiei
parametrilor de regresie
Calculam valorile testului t
ˆi − 0
ticalc =

pe care le comparăm cu valorilte teoretice a repartiţiei Student cu n-k
grade de libertate.
t  ;n − k = t 0.05 ;47 = 2, 32
2 2

Vom formula deci ipotezele:


Ho: ˆi = 0
ˆ
H1:  i ≠0
Decizia:
Dacă tcalc>ttab se alege H1 . Altfel, acceptam H0

17
Exemplu (5) - Testarea semnificaţiei
parametrilor de regresie

În concluzie, cu excepţia parametrului ß3 ( corespunzător variabilei


Gen), toţi ceilalţi parametri de regresie au un prag de semnificaţie
suficient de bun.

Decizie: Analiza va fi refăcută cu eliminarea variabilei


Gen

18
Exemplu (6) - ANOVA

19
Ipotezele MCMMP

Joi, 1 Aprilie 2021


1
Ipotezele modelului de regresie (1)

1. Datele sunt obţinute corect şi fără erori


sistematice de observare. De asemenea numărul
de cazuri este suficient de mare.
2. Dispersia oricărei variabile independente Xi
este nenulă şi finită.
3. Liniaritatea modelului de regresie

Y i
= +  X i

2
Ipotezele modelului de regresie (2)
4. Variabilele independente Xi nu sunt puternic
corelate (nu prezintă multicoliniaritate).
Cazul ideal este acela in care coeficientul de
corelaţie dintre oricare două variabile
independente să fie nul. Existenţa coliniarităţii
face ca matricea (X’X) să nu fie inversabilă.
5. Variabilele independente sunt
nestochastice şi în eventualitatea în care am
repeta sondajul s-ar obţine aproximativ aceleaşi
valori.
6. Modelul de regresie este corect specificat (s-a
ales o funcţie potrivită) şi a rezultat un grad de
determinaţie suficient de mare.
3
Ipotezele modelului de regresie (3)
7. Erorile sînt normal distribuite cu
medie zero E(εi)=0 i.
8. Homoscedasticitatea (dispersie constantă).

9. Necorelarea erorilor E(εi εk)=0 (i<>k)


10. Necorelarea dintre oricare variabilă
independentă Xi şi variabila reziduală ε

4
Multicolinearitatea

 Este determinată de prezenţa corelării între


variabilele exogene  determinantul matricei X’X
este zero, deci aceasta nu este inversabilă.
 Problemele ce se pun în acest caz sunt:
1. Indicatori pentru semnalarea coliniarităţii
2. Înlăturarea efectului de multicoliniaritate

5
Indicatori pentru semnalarea
coliniarităţii (1)
 Coeficienţii de corelaţie din matricea de
corelaţie a variabilelor independente
inregistrează valori foarte ridicate (peste
0,85-0,90)
 Gradul de determinaţie se apropie de 1 în
condiţiile în care parametrii de regresie nu
trec testul t
 Dacă determinantul matricii (X’X) este
extrem de mic (în cazul coliniarităţii perfecte
el este egal cu 0)
6
Indicatori pentru semnalarea
coliniarităţii (2)
 Criteriul Klein
◼ se determină raportul de corelaţie Ry2 şi
coeficienţii liniari de corelaţie a variabilelor
exogene rx / x
i j
, ij.
◼ două variabile exogene Xi şi Xj sunt coliniare dacă:

R y2  rx2i / x j

◼ sunt identificate numai dependenţele liniare dintre


două variabile exogene.
7
Indicatori pentru semnalarea
coliniarităţii (3)
 Criteriul Belsley
◼ se calculează valorile proprii ale matricei X’X, deci soluţii ale
ecuaţiei: X’X-Ip=0.
◼ în cazul în care una sau mai multe valori proprii sunt zero
sau aproximativ zero, fenomenul de colinearitate este
semnificativ şi va afecta într-o bună măsură calitatea
estimatorilor.
max
(X ) =
◼ se calculează indicatorul: min
◼ dacă valorile acestui indicator sunt superioare lui 1 
colinearitatea
◼ o valoare cuprinsă între 20 şi 30 sau mai mare, pentru
datele reale, relevă o colinearitate puternică a variabilelor
exogene.
8
Înlăturarea efectului de
multicoliniaritate (1)
 Dacă putem suplimenta numărul de cazuri probabil că
această procedură va duce la diminuarea
multicolinearităţii
 În cazul în care regresia este una pe date culese în
timp (serii cronologice) dacă s-ar utiliza date
transversale am putea să ne aşteptăm ca variabilele
independente să fie mai puţin corelate între ele
 Dacă putem renunţa la o variabilă independentă
puternic corelată cu alta în condiţiile în care gradul de
determinaţie să nu se diminueze semnificativ cu
siguranţă efectul de multicoliniaritate s-ar manifesta
la dimensiuni mai reduse

9
Înlăturarea efectului de
multicoliniaritate (2)

 Estimarea prin partiţionarea matricei X în două


blocuri de variabile

◼ se consideră partiţionarea matricei în două submatrice ale


căror coloane sunt liniar independente: X=(Xm, Xp-m)
◼ se estimează parametrii modelului de regresie:
ym=Xmm+m

◼ se calculează apoi: y* = y − y m
◼ şi se estimează parametrii modelului liniar de regresie:
y*=Xrr+r

10
Autocorelarea erorilor

Joi, 8 Aprilie 2021


1
Autocorelarea erorilor

Problemele ce se pun în acest caz sunt:


1. Identificarea cauzelor de apariţie a
corelării erorilor
2. Testele statistice utilizate pentru
depistarea autocorelării
3. Metode de estimare a parametrilor în
cazul autocorelării

2
Cauzele de apariţie a autocorelării
erorilor (1)
 Absenţa uneia sau mai multor variabile
explicative importante
◼ neincluderea uneia sau mai multor variabile
explicative importante poate genera
autocorelarea erorilor.
◼ exemplu: y i = a + bx1i + cx 2i +  i
◼ variabila exogenă x3 este omisă  variabilele
reziduale sunt autocorelate şi reziduul va fi
explicitat prin intermediul acestei variabile
omise:  =  + x + u
i 3i i

3
Cauzele de apariţie a autocorelării
erorilor (2)

 Modelul de regresie nu este corect


specificat: fie modelul se exprimă sub
forma unei combinaţii liniare de variabile
în condiţiile în care o specificare corectă a
modelului trebuie să fie exprimată printr-o
combinaţie liniară de logaritmi de variabile
exogene etc.
 Au fost făcute transformări neadecvate
sau interpolări în cadrul seriei de date 4
Variabila reziduala este necorelata?
e(t-1) e(t)
-0.684 -0.623
-0.623 -0.712
Corelograma dintre e(t) şi e(t-1)
-0.712 0.080
0.080 0.042 2.5
0.042 -0.322
-0.322 1.370 2.0
1.370 -0.093
1.5
-0.093 -0.240
-0.240 -0.249 1.0
-0.249 0.281
0.281 0.532 0.5
0.532 0.035
0.0
0.035 0.873
-3 -2 -1 0 1 2 3
0.873 -0.165 -0.5
-0.165 -0.182
-0.182 -2.130 -1.0
-2.130 0.962
-1.5
0.962 -1.047
-1.047 0.086 -2.0
0.086 -0.121
-0.121 1.928 -2.5
1.928 1.130
-3.0
1.130 -2.308
-2.308 1.559
5
e(t-2) e(t)
-0.684 -0.712 Corelograma dintre e(t) şi e(t-2)
-0.623 0.080 2.5
-0.712 0.042
0.080 -0.322 2.0
0.042 1.370
1.5
-0.322 -0.093
1.370 -0.240 1.0
-0.093 -0.249
-0.240 0.281 0.5
-0.249 0.532
0.281 0.035 0.0
0.532 0.873 -3 -2 -1 0 1 2 3
-0.5
0.035 -0.165
0.873 -0.182 -1.0
-0.165 -2.130
-0.182 0.962 -1.5
-2.130 -1.047
-2.0
0.962 0.086
-1.047 -0.121 -2.5
0.086 1.928
-0.121 1.130 -3.0
1.928 -2.308
1.130 1.559 6
Independenta erorilor in timp
Tipuri de variabila reziduala care indica existenta autocorelatiei erorilor
In timp.

Residual Residual

+
+ ++
+
+ + +
+ + +
0 + 0 + +
+ Time Time
+ + + + + +
+
+
+ ++ +
+

7
Autocorelatie de ordinul I pozitiva
Autocorelatie de ordinul I pozitiva
+ Reziduri
+
+
+
0
Timp
+

+ +
+

Autocorelatie de ordinul I negativa


Autocorelatie de ordinul I negativa
Reziduri
+ +
+
0
+ + + Timp
+
8
Testele statistice utilizate pentru depistarea
autocorelării: Durbin Watson
 Variabila reziduală satisface:  i =  i −1 + u i
 Ipoteze: Ho: =0 H1: 0
n

 i i −1
( e − e ) 2

 Statistica testului: DW = i =2
n

e
2
i
i =1

Numărătorul statisticii va fi scris sub forma echivalentă:
n 2 n n n n n

 (e − e ) =  e
i =2
i i −1
i =2
2
i − 2 ei ei −1 +  e i −1 = 2 e − 2 ei ei −1 − e12 − en2 .
i =2 i =2
2

i =1
2
i
i =2

Atunci statistica d va fi:


e12 + en2
d = 2(1 − ρ1 ) − n
.
 ei2
i =1
Dacă seria de date este suficient de mare, vom neglija termenii
9
extremi din seria reziduurilor, obţinând:
d = 2 (1 − ρ1 ).
Testul Durbin-Watson (2)
 d1 şi d2 extrase din tabela Durbin Watson pentru
, k şi n:
◼ 0 < DW < d1  autocorelare pozitivă a erorilor
◼ d1  DW  d2  indecizie, recomandată acceptarea
autocorelării pozitive
◼ d2 < DW < 4-d2  erori independente
◼ 4-d2  DW  4-d1  indecizie, recomandată
acceptarea autocorelării negative
◼ 4-d1< DW <4  autocorelare negativă a erorilor

10
Decizia in cazul testului Durbin-Watson

Auto indecizie Indecizie Auto


Indepen Indepen
corelatie denta denta corelatie

0 d1 d2 2 4-d2 4-d1 4

11
Testul Durbin Watson
Testul Durbin-Watson pentru α= 5 %.
n k=1 k=2 k=3 k=4 k=5
d1 d2 d1 d2 d1 d2 d1 d2 d1 d2
15 1,08 1,36 0,95 1,54 0,82 1,75 0,69 1,97 0,56 2,21
20 1,20 1,41 1,10 1,94 1,00 1,68 0,90 1,83 0,79 1,99
30 1,35 1,49 1,28 1,57 1,21 1,65 1,14 1,74 1,07 1,83
40 1,44 1,54 1,39 1,60 1,34 1,66 1,29 1,72 1,23 1,79
50 1,50 1,59 1,46 1, 63 1,42 1,67 1,38 1,72 1,34 1,77
100 1,65 1,69 1,63 1,72 1,61 1,74 1,59 1,76 1,37 1,78

Sau:
https://web.stanford.edu/~clint/bench/dwcrit.htm
12
Metode de estimare a parametrilor în
cazul autocorelării (1)
 Erorile prezintă o autocorelare de un anumit ordin 
estimatorii parametrilor sunt nedeplasaţi şi consistenţi, dar
nu sunt eficienţi.
1. Se estimează parametrii modelului de regresie: Y=X+
prin metoda celor mai mici pătrate şi se obţine seria erorilor
(ei)i=1,n
2. Se consideră că erorile urmează un proces autoregresiv
de ordinul I:
n

e e
 i =  i −1 + u i
 i i −1
 = i =2
n

 i −1
e 2

i =2

13
Metode de estimare a parametrilor în
cazul autocorelării (2)

p   p  
3. yi =  0 +   j x ji +  i  yi −   yi −1 =  0 (1 −  ) +   j ( x ji −  x ji −1 ) +  i −   i −1
j =1 j =1

 * 

 yi = yi −  yi −1 p
 * 
y =  0 +   j x*ji + i
Notând: 
*
 x ji = x ji −  x ji −1 i
j =1
 
 0 =  0 (1 −  )

 i → N (0,  ) 2

4. Se estimează parametrii noului model.

14
Analiza variabilei reziduale în
modelarea econometrică

 Joi, 15 aprilie 2021


1
 Ipoteza că media erorilor este zero:
E(i)=0 i, este naturală atâta timp cât  este
văzută ca suma efectelor individuale, cu semne
diferite. Dacă media erorilor este diferită de zero, ea
poate fi considerată ca o parte sistematică a
regresiei: E()=   + x +  = (+) + x + (-)
media erorilor fiind acum nulă.
 Ipoteza de homoscedasticitate:
Var(i)=2 constantă i
Se consideră un model care descrie consumul unor
gospodării în funcţie de venitul acestora. În acest
caz, consumul gospodăriilor mari pot varia mult mai
mult faţă de consumul gospodăriilor cu venituri
mici. Deci ipoteza de homoscedasticitate nu este
respectată.
2
Exemplu de încălcare a ipotezei de
homoscedasticitate
Functia de consum
1200

1000

800
consum

600

400

200

0
200 300 400 500 600 700 800 900 1000
venit

3
 Necorelarea erorilor: E(ij)=0 ij
Această ipoteză nu implică faptul că yi şi yj sunt
necorelate, ci faptul că deviaţiile observaţiilor de la
valorile lor aşteptate sunt necorelate.
 Ipoteza de normalitate a erorilor i
N(0,2)
Este o ipoteză de lucru, tehnică, ce permite
obţinerea unor estimatori “buni”.
 Dacă ipotezele precedente sînt respectate,
vom obţine estimatori B.L.U.E. (Best
Linear Unbiased Estimators)

4
Variaţia erorilor în jurul dreptei de regresie

Valorile y sînt normal distribuite


în jurul dreptei de regresie.
f(e)
Pentru fiecare valoare x, dispersia
în jurul dreptei de regresie este
constantă.

Y
X2
X1
X Dreapta de regresie 5
Daca varianta este constanta avem
homoscedasticitate

+
^y
++
Residual
+ +
+ + + ++
+
+ + + +
+ ++ + +
+ +
+ + + ++ ++ +
+ + + y^ ++
+ + + ++ +
+ + + + +
+ +++
+ +++
+

6
Variabila reziduala are varianta constanta:
Homoscedasticitate/Heteroscedasticitate
◼ Daca este incalcata conditia variantei
constante suntem in cazul heteroscedasticitatii.

+
^y
++
Residual
+
+ + + ++
+
+ + + ++ + +
+ + + +
+ + + ++ +
+ + + + y^
+ + ++ +
+ + +
+ + ++
+ + ++

Imprastierea creste odata cu y


7
Testarea normalităţii (cu medie zero)
distribuţiei variabilei reziduale (1)
 Evident că pentru ca E(εi)=0 suma erorilor la puterea
întâi trebuie să fie nulă
 În ceea ce priveşte normalitatea distribuţiei o putem
testa cu ajutorul testului JB (Jarque şi Bera) care
presupune că în ipoteza că distribuţia este normală
valoarea calculată a testului urmează o repartiţie χ2
cu 2 grade de libertate
 Cele două ipoteze sunt:
H0 – erorile sunt normal distribuite
H1 – erorile nu sunt normal distribuite
 Un prag de semnificaţie acceptabil este unul mai mic
decât 0,3 sau 0,2
8
Testarea normalităţii (cu medie zero)
distribuţiei variabilei reziduale (1)
 Decizia
◼ Dacă valoarea testului JB calculată este inferioară valorii
tabelare 2 ,2 vom accepta ipoteza H0; altfel alegem
ipoteza H1
 Valoarea statisticii JB se calculează cu formula:
 ( Cas )2 ( Cbolt − 3)2 
JB = n  + 
 6 24 
unde

Cas este coeficientul de asimetrie al variabilei reziduale şi Cbolt


este coeficientul e boltire al aceleiaşi variabile

9
Asimetria şi boltirea (recapitulare)
Coeficienţii lui Pearson
32 4
Cas = 1 = 3 Cbolt = 2 = 2
2 2
unde: unde:

 ( ) ( )
2
i −  
4
 −
2 =  2
= 4 =
i

n n
(momentul centrat de ordin 2)
(momentul centrat de ordinul 4)

 ( )
3
 i −
3 =
n
(momentul centrat de ordin 3) În Excel =kurt(…)
În Excel =skew(…) 10
Exemplu (1)
 La modelul prezentat la cursul anterior (în care era studiată
dependenţa dintre punctajul obţinut la admiterea ASE şi
media examenului de Bacalaureat, media anilor de liceu
precum şi genul candidaţilor distribuţia erorilor este
următoarea: 12

10

2 Std. Dev = 12,80


Mean = -,0

0 N = 50,00
-30,0 -20,0 -10,0 0,0 10,0 20,0
-25,0 -15,0 -5,0 5,0 15,0

11
VAR00001
Exemplu (2)
 Valoarea statisticii JB :

 ( Cas )2 ( Cbolt − 3)2   ( −0,51)2 ( −0,1446 − 3)2 


JB = n  +  = 50  +  = 22, 7
 6 24   6 24 

Cum valoarea tabelară a distribuţiei Hi pătrat cu 2


grade de libertate pentru un nivel de semnificaţie
de 0,01 este 9,21, inferioară statisticii JB calculate
vom alege ipoteza H1 conform căreia nu avem de-a
face cu o distribuţie normală a rezidurilor.

12
Homescedasticitatea

Joi, 22 aprilie 2021


1
Homoscedasticitatea
u
 Y=X+
 E ( ) = 0
 x
  w1 0  0
 0
 2
w1  0 
Var (  ) =  
   
  

 0 0  w1 

 Problemele ce se pun în acest caz sunt:


1. Testele statistice utilizate pentru depistarea
heteroscedasticităţii
2. Metode de estimare a parametrilor în cazul
heteroscedasticităţii
2
Testele statistice utilizate pentru depistarea
heteroscedasticităţii - Testul White (1)
1. Se estimează parametrii modelului de regresie:
Y=X+ prin metoda celor mai mici pătrate şi se obţine
seria erorilor (ei)i=1,n
2. Se explicitează seria (ei2)i=1,n în raport cu una sau
mai multe variabile exogene şi se defineşte modelul
de regresie:

k k
a) e =  a j x j +  b j x 2j + v
2

j =1 j =1

b) ei2 = a1 x1i + a2 x2i + b1 x12i + b2 x22i + c1 x1i x2i + vi

3
Testele statistice utilizate pentru depistarea
heteroscedasticităţii - Testul White (2)
3. Ipotezele testului:
 H0: a1=...=ak=b1=...=bk=0  model homoscedastic
 H1: a1  0 sau bj  0  model heteroscedastic
4. Statistica testului: LM=nR2→2;k-1

5. Decizia: Daca LM<2;k-1 se acceptă H0 altfel, acceptăm H1

 Observaţie:
◼ o creştere a lui r conduce la diminuarea puterii testului
◼ pentru un număr mare de variabile exogene se recomandă
modelul a)
◼ pentru un număr moderat de variabile exogene se recomandă
modelul b)

4
Metode de estimare a parametrilor în
cazul heteroscedasticităţii (1)
 În cazul în care avem un număr suficient de mare
de valori putem împărţi datele în două serii şi
realiza modele pentru fiecare dintre ele separat

 În cazul în care heteroscedasticitatea este indusă


de o variabilă exogenă într-o manieră
multiplicativă:
 i =   x ji ,
2 2 2

 Fenomenul de heteroscedasticitate se elimină prin


transformarea modelului:
yi x1i x pi i
= 1 + ... + p +
x ji x ji x ji x ji 5
Metode de estimare a parametrilor în
cazul heteroscedasticităţii (2)
 Notând:
yi  x1i x pi  i
y =
* x =  ,..., 
*
i  = *
i
i
x ji  x ji x ji  x ji
 Modelul devine:
y = x  +
*
i
*
i
*
i

 După estimarea parametrilor acestui model


transformat se revine în modelul iniţial cu
estimatorii.

6
Invitatie – CEBSS (1):
 Vom audia o prezentare cu multa modelare
econometrica
 Cine? Liana Razmerita si Kai Hockerts
(Copenhagen Business School)
 Joi 22 aprilie 2021 orele 14:00-15:00
 Zoom link:
https://us02web.zoom.us/j/83387907164
 Zoom Meeting ID: 833 8790 7164
 Title: “Modeling Collaborative Intentions and
Behavior in Digital Environments: The Case of a
Massive Open Online Course (MOOC)” (based
on joint work with Kathrin Kirchner and Chee-
7

Wee Tan)
Invitatie CEBSS (2)
 Abstract
Modern management education promotes active learning and
peer interaction through group work regarding it as a critical
aspect of the learning process. Given the rise of Massive Open
Online Courses (MOOCs) it is imperative to comprehend how
collaboration can be fostered in such digital learning
environments. Synthesizing theories on individual cognition
and collective interaction, we advance a research model of
individual and communal beliefs about collaboration as salient
drivers of collaborative intentions.

8
Invitatie CEBSS (3)
 Continuare Abstract
Analytical results indicate that attitudes toward collaboration at
the outset of the course are predicted by collaborative outcome
expectancy and communal support expectancy, which in turn
are precipitated on participants’ perceived ability to work in
groups (collaborative process efficacy) and peer influence
(communal influence). Additionally, we show that collaborative
intentions influence collaborative behavior and its outcomes. In
particular, we find that group work engagement contributes to
three outcomes: a higher course retention of participants,
increased production of novel ideas and finally a better learning
experience. The models are validated with survey data collected
from a MOOC course. Findings from our study unravel individual
and communal factors affecting engagement in collaborative
processes and show the impact of collaboration on learning and
behavior within online learning environments. 9
Prognoze cu ajutorul
modelelor de regresie

Joi, 6 mai 2021


1
Predicţia folosind modelul de regresie

 1. Tipuri de predicţii
◼ Estimări punctuale
◼ Estimări pe intervale de încredere

 2. Care e obiectul predicţiei?


◼ Media populaţiei E(Y) pentru o valoare
particulară a lui X
◼ Valoarea individuală (Yi) pentru o valoare
particulară a lui X

2
Factori care afectează lungimea intervalului de încredere

 1. Nivelul de încredere (1 - )
◼ Creşterea nivelului de încredere duce la
creşterea intervalului de încredere
 2. Dispersia datelor (σ2)
◼ Creşterea dispersiei duce la creşterea
intervalului de încredere
 3. Volumul eşantionului
◼ Creşterea volumului eşantionului duce la
micşorarea intervalului de încredere
 4. Distanţa lui Xp faţă de mediaX
◼ Creşterea acestei distante duce la creşterea
intervalului de încredere 3
Distanţa lui Xp faţă de mediaX

ine
le 1L Dispersie
m p
_ Sa mai mare
decît la X1
Y Sample 2
Line

X
X1 X X2
4
Intervale de predicţie hiperbolice

^
 Xi
^
^= 0 + 1
Yi

_ X
X XP 5
Intervale de încredere pentru
parametrii de regresie multifactorială
ˆi − t / 2;n −kˆ ˆ  i  ˆi + t / 2;n −kˆ ˆ
i i

Unde eroarea standard a ficărui estimator


provine din:

ˆ 2ˆ =  e2 ( X'X )ii 


−1
i  

De obicei se construiesc intervale de încredere


pentru parametrii de regresie utilizând un prag de
semnificaţie =0.05
6
Exemplu rezultate calculate cu
ajutorul Excel (1)
 Modelul de regresie
Punctaj = ˆ0 + ˆ1 * Bac + ˆ2 * Lic + ˆ3 * Gen + 

 Avem n=50 observaţii (cazuri), k=4 parametri de


regresie.

7
Exemplu rezultate calculate cu
ajutorul Excel (2)
Intervalul de încredere pentru parametrul ßi
(coeficientul variabelei media examenului de
Bacalaureat)
Valoarea tabelară a distribuţiei Student
corespunzătoare este:
t0,05;50−4 = 2, 013
Intervalul de încredere va fi:
ˆi − t / 2;n −kˆ ˆ  i  ˆi + t / 2;n −kˆ ˆ
i i

6, 78 − 2, 013  3,12  1  6, 78 + 2, 013  3,12


0,50  1  13, 07
8
Interval de încredere pentru media valorilor y
pentru valori prestabilite ale variabilelor
independente

yˆ − t / 2;n − kˆ yˆ  E ( yˆ )  yˆ + t / 2;n −kˆ yˆ

Unde eroarea standard a predicţiei pentru media


valorilor y pentru valorile prestabilite (xp1, xp2,
..., xpk) ale variabilelor independente:

1 
( ) ( X'X )
−1
( )
'
ˆ yˆ =  e  + x pi − xi x pi − xi 
n 

9
Exemplu (1)
 Pentru modelul de regresie: Punctaj = ˆ0 + ˆ1 * Bac + ˆ2 * Lic + ˆ3 * Gen + 

să se estimeze un interval de încredere (cu un prag


de semnificaţie =0,05) pentru punctajul mediu al
candidaţilor de gen masculin care aveau la
Bacalaureat media 8,50 şi care aveau media anilor
de liceu 8,00.
(x pi )
− xi = (1 − 1 8,5 − 8, 2498 8 − 8,5506 1 − 0, 28 ) =
= ( 0 0, 2502 −0,5506 0, 72 )
 2, 78 −0,16 −0,17 −0, 05 
 
− 0,16 0, 06 −0, 04 −0, 02
 0  (X ' X ) = 
−1 
 −0,17 −0, 04 0, 05 0, 02 
   
(x ) − −
0, 2502
=   
' 0, 05 0, 02 0, 02 0,11
− xi
pi
 −0,5506  10
 
 0, 72 
Exemplu (2)
 Eroarea standard de predicţie:
1 
( ) ( X'X ) ( x
−1
)
'
ˆ yˆ =  e  + x pi − xi pi − xi  =
n 
 2, 78 −0,16 −0,17 −0, 05   0 
  
1 − 0,16 0.06 −0, 04 −0, 02 0, 2502
= 13, 2079 + ( 0 0, 2502 −0,5506 0, 72 )   =
50  −0,17 −0, 04 0, 05 0, 02   −0,5506 
  
 −0, 05 −0, 02 0, 02 0,11  0, 72 
 0 
 
0, 2502
13, 2079 0, 02 + ( 0, 0215 0, 0195 −0, 0234 0, 0617 )   = 13, 2079 0, 02 + 0, 0622 = 3, 7865
 −0,5506 
 
 0, 72 
Intervalul de încredere pentru media punctajelor la
admitere ale candidaţilor este:
yˆ − t / 2;n − kˆ yˆ  E ( yˆ )  yˆ + t / 2;n −kˆ yˆ 11
Exemplu (3)
unde t0,05;50 −4 = 2,103
iar yˆ = −51, 64 + 6, 78*8,5 + 5,57 *8 − 4,19*1 = 46,37

în final ajungem la:

yˆ − t / 2;n − kˆ yˆ  E ( yˆ )  yˆ + t / 2;n −kˆ yˆ


46,37 − 2, 013  3, 7865  E ( yˆ )  46,37 + 2, 013  3, 7865
38, 75  E ( yˆ )  53,99

12
Interval de încredere pentru o valoare punctuală a
lui y pentru valori prestabilite ale variabilelor
independente

yˆ − t / 2;n − kˆ yˆ − y  y  yˆ + t / 2;n − kˆ yˆ − y

Unde eroarea standard a predicţiei punctuale


pentru media valorilor y pentru valorile
prestabilite (xp1, xp2, ..., xpk) ale variabilelor
independente:

1 
( ) ( X'X ) ( x
−1
)
'
ˆ yˆ − y =  e 1+  + x pi − xi pi − xi 
n 

13
Exemplu (4)
 Să se estimeze punctual (cu un prag de semnificaţie
=0,05) punctajul pe care îl va obţine un candidat
de gen masculin, cu media la Bacalaureat 8,5 şi
media anilor de liceu 8.
Eroarea standard a predicţiei punctuale va fi:
1 
ˆ yˆ − y =  e 1+  + ( x p − xi ) ( X'X ) (x )
' −1
pi − xi  = 13, 2079 1 + 0, 02 + 0, 0622 = 13, 739
n i

Intervalul de încredere pentru predicţia punctuală va fi:

yˆ − t / 2;n − kˆ yˆ − y  y  yˆ + t / 2;n − kˆ yˆ − y


46,37 − 2, 013 13, 739  y  46,37 + 2, 013 13, 739
14

18, 72  y  70 (din calcule :74, 03)


Introducere în analiza seriilor
de timp

Joi, 13 Mai 2021

1
Argumente
◼ Timpul este o coordonată esenţială a
existenţei umane.
◼ Realitatea economică şi socială se
localizează în timp şi spaţiu.
◼ În general, fenomenele economice nu
au caracter static, manifestîndu-se în
cadrul unei evoluţii temporale.

2
Definiţie şi exemple
• Definiţia 1. Fie [0, T ] un orizont de timp,
( , K , P ) un spaţiu de probabilitate şi ( X t )t
u n p r o c e s s t o c h a s t i c .

Vom numi serie de timp (serie cronologică –

time series) o realizare a procesului


stochastic ( X t )t .

• Definţia 2. O serie de timp ( X t )t[0,T ]


reprezintă o mulţime de observaţii
e f e c t u a t e l a d i f e r i t e m o m e n t e d e t i m p

asupra unei variabile aleatoare X.


3
Staţionaritate
• Definiţia 3. Serie staţionară în medie :
E (Yt ) =  ,  t  [0, T ] .

Fig. 1 Graficul unei serii staţionare


4
Staţionaritate
• Definiţi O serie de timp este staţionară a 4 .

în sens larg dacă:


– M e d i a s e r i e i
( X t )t =1,n e s t e c o n s t a n t ă p e o r i c e

p e r i o a d ă d e t i m p ;

– M a t r i c e a d e c o r e l a ţ i e a v e c t o r u l u i a l e a t o r

( X t1 + , X t 2 + ,..., X t n + ) n u d e p i n d e d e
 .

• Definiţia 5 O serie de timp care prezintă o .

a n u m i t ă t e n d i n ţ ă d e e v o l u ţ i e s e n u m e ş t e

n e s t a ţ i o n a r ă .

5
Staţionaritate

Figura 2. Serii nestaţionare cu t r e n d l i n i a r

Obs : În general, orice serie temporală poate


f i s t a ţ i o n a r i z a t ă , p r i n p r o c e d e e s p e c i f i c e .

6
Procedee de staţionarizare

◼ Dacă seria este nestaţionară în medie, se


calculeză diferenţele de ordinul întîi.

X t = X t − X t −1
◼ Dacă seria este nestaţionară în dispersie, se
calculează seria logaritmată.

Yt = log( X t )

7
Yt = 3 + t +  t ,  t WN (0,50)
800

600

400

200

-200

-400
100 200 300 400 500

Fig. 3 Graficul unei serii nestaţionare în medie


8
Yt =  t −  t −1

600

400

200

-200

-400

-600
100 200 300 400 500

DIF

Fig. 4 Graficul seriei diferenţiate 9


X t = 2 + 20t t , ( t )t WN (6, 4)

120000

100000

80000

60000

40000

20000

0
100 200 300 400 500

XT

10
Yt = ln( X t )t

12

11

10

4
100 200 300 400 500

LNXT
11
Clasificarea seriilor de timp

◼ După natura intervalului de timp:


- de momente (serii de stoc)
- valoarea determinată prin însumarea termenilor nu are
semnificaţie concretă
- e.g. populaţia României măsurată la recensăminte

- de intervale(serii de flux)
- hibride
12
Clasificarea seriilor de timp

◼ După proprietăţile mulţimii de valori:


- Serii de timp exprimate sub forma mărimilor
absolute: e.g. PIB

- Serii de timp definite printr-o succesiune de


mărimi relative: e.g. PIB/locuitor

- Serii de timp formate din mărimi medii: e.g.


Productivitatea muncii
13
Comparabilitatea în timp
◼ Trebuie avută în vedere omogenitatea seriei de
timp analizate.
Rata inflaţiei în România

300.00%

250.00%

200.00%

150.00%

100.00%

50.00%

0.00%
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
00
01
02
03
04
05
19
19
19
19
19
19
19
19
19
19
19
19
19
19
19
19
19
20
20
20
20
20
20
14
Indicatorii seriilor temporale

- Utilizare – compararea a două sau mai


multe serii cronologice
◼ Indicatori absoluti
◼ Indicatori relativi
◼ Indicatori medii

15
Indicatori medii

◼ Modificarea medie absolută:  =


YT − Y1

T −1
◼ Indicele mediu de dinamică: YT
I = T −1
Y1
◼ Ritmul mediu al dinamicii:
R = I −1

16
Nivelul mediu al seriei
– se calculează pentru serii cu termeni însumabili
T

Y t
- pentru serii de flux: Y= t =1

T
t1 t 1 + t 2 + ...+ t n-1 + t n + t n
Y 0 +Y 1 Y n -1 Yn
- pentru serii de stoc: Y= 2 2 2 2 , unde t1 ,.., tn  este
t 1 + ...+ t n
mulţimea momentelor de timp

17
Figura 5. Schema de determinare a mediei cronologice
Nivelul mediu al seriei
- se calculează pentru fiecare perioadă de timp, cuprinsă între două
momente succesive, nivelul mediu al caracteristicii;
– se determină apoi media aritmetică ponderată :
n

Y
i =1
i ti
Y= n
.
t
i =1
i

Data Stocul Durata între Stocul mediu pe fiecare


Yt momente (zile) perioadă Y t
(buc.)
01.01.2005 200 48 (200 + 320)/2
18.02.2005 320 62 (320 + 100)/2
20.04.2005 100 56 (100 + 140)/2
8.06.2005 140 92 (140 + 250)/2
10.09.2005 250 36 (250 + 300)/2
16.10.2005 300 74 (300 + 140)/2
01.01.2005 140 - -

48 62+48 56+62 92+56 36 + 92 74 + 36 74


200 +32 +100 +140 + 250 + 300 + 140
Y= 2 2 2 2 2 2 2
48+62+56+92+36+74
18
Componentele unei serii
cronologice

◼ Trendul
◼ Componenta sezonieră
◼ Componenta ciclică
◼ Componenta aleatoare

19
Fazele unui ciclu economic

20
Componentele seriilor de timp

◼ Modelul aditiv: Yt = Yˆt + St + Ct +  t


- dacă amplitudinea oscilaţiilor este constantă de-a lungul
timpului

◼ Modelul multiplicativ: Yt = Yˆt * St * Ct *  t


- dacă amplitudinea oscilaţiilor este variabilă de-a lungul
timpului

21
Trendul

◼ Metode mecanice
- metoda modificării medii absolute
- metoda indicelui mediu de dinamică
- metoda mediilor mobile
◼ Metode analitice
- funcţie liniară de gradul I
- funcţie parabolică
- funcţie exponenţială
22
Metoda modificării medii absolute

◼ Se foloseşte cînd diferenţele a oricăror doi termeni


consecutivi sînt constante şi egale cu 
◼ Ecuaţia trendului:

Yt = Y1 + (t − 1), t = 1..T


◼ Se determină suma pătratelor erorilor de ajustare
T
SSE =  (Yt − Yt ) 2

t =1

23
Exemplu
Volumul vînzărilor de apă minerală în România (mii cases)

14,000
12,000
10,000
8,000
6,000
4,000
2,000
0
0 0 0 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 5 5 5 5 6
pr0 ul0 ct0 an0 pr0 ul0 ct0 an0 pr0 ul0 ct0 an0 pr0 ul0 ct0 an0 pr0 ul0 ct0 an0 pr0 ul0 ct0 an0
A J O J A J O J A J O J A J O J A J O J A J O J

Yt = 3041 + 65.46(t − 1), t = 1..70


SSE = 514370020.6 24
Metoda indicelui mediu
◼ Se foloseşte cînd rapoartele oricăror doi termeni
succesivi sînt constante şi egale cu I
◼ Ecuaţia trendului:

Yt = Y1 ( I )t −1 , t = 1..T

◼ Se determină suma pătratelor erorilor de ajustare


T
SSE =  (Yt − Yt )2
t =1

25
Trendul-funcţie liniară de timp
◼ Modelul: 
Yt = o + 1t + t  
◼ Presupunem îndeplinite ipotezele modelului liniar
de regresie
◼ Estimatorii parametrilor modelului se obţin prin
M.C.M.M.P. ca soluţii ale sistemului:

 = t
 Yt *  t 2
−  Yt t *  t
 ˆ0 n + ˆ1  t =  Yt
t t t
 n t − ( t )
0 2 2
 t t 
 
t t

 ˆ0  t + ˆ1  t =  Yt t  n  Yt t −  t *  Yt
2

 t t t
 1 = t t t

 n t 2 − ( t ) 2
 t t 26
Exemplu
Volumul vînzărilor de apă minerală în România (mii cases)

14,000
12,000
10,000
8,000
6,000
4,000 Yt = 102.4t + 3542.6
2
2,000 R = 0.5673

0
Ja 00

Ja 01

Ja 02

Ja 03

Ja 04

Ja 05
A 01

A 02

A 03

A 04

A 05

6
O 00

O 01

O 02

O 03

O 04

O 05
Ju 0

Ju 1

Ju 2

Ju 3

Ju 4

Ju 5

n0
0

0
l

l
n

n
ct

ct

ct

ct

ct

ct
pr

pr

pr

pr

pr

pr
A

T
SSE =  (Yt − Yt ) 2 = 228126582.8 1 case=5.618 litri
t =1 27
Predicţia pe baza trendului
◼ Întotdeauna pentru estimarea trendului va fi ales
acel model care minimizează suma pătratelor
erorilor de ajustare
◼ Pe baza modelului liniar putem realiza predicţii:
- Volumul vînzărilor pentru februarie 2006:

Y71 = 3524.64 + 102.4*71 = 10812.97

- - Volumul vînzărilor pentru martie 2006:

Y72 = 3524.64 + 102.4 * 72 = 10915.37

28
Metoda mediilor mobile
◼ Se foloseşte pentru filtrarea componentei sezoniere
şi a componentei aleatoare k+ p
1
◼ Media mobilă de ordinul p : Y p = Yt , k = 0, T − p.
p t =k +1
◼ Date lunare → p=12
◼ Date trimestriale → p=4

29
30
Media mobilă de ordinul 12
Volumul vînzărilor de apă minerală în România(mii cases) Actual
Forecast

14,000

12,000
10,000

8,000
6,000

4,000
2,000

r00 l00 t00 n01 r01 l01 t01 n02 r02 l02 t02 n03 r03 l03 t03 n04 r04 l04 t04 n05 r05 l05 t05 n06
p u c p u c p u c p u c p u c p u c
A J O Ja A J O Ja A J O Ja A J O Ja A J O Ja A J O Ja

31
Staționaritatea seriilor de timp.
Modele de tip AR(I)MA.
Metodologia Box-Jenkins

Joi, 20 mai 2021

1
Staţionaritatea unei serii de timp
◼ Proprietăţile unei serii staţionare:
◼ Are media constantă de-a lungul timpului(i.e. nu prezintă
trend)
◼ Are dispersie constantă de-a lungul timpului
◼ Corelaţia de-a lungul timpului depinde de legătura dintre
Yt şi Y la lagul k, (Yt-k) şi nu depinde de alte variabile
◼ Cum recunoaştem o serie staţionară?
◼ Analiza grafică
◼ Evoluţia funcţiei de autocorelaţie(ACF) şi autocorelaţie
parţială(PACF)
◼ Testul Dickey-Fuller

2
Funcţia de autocorelaţie-ACF

◼ Măsoară corelaţia între valorile seriei la diverse


distanţe temporale.

Y (k ) =
 (Y − Y )(Y − Y ) Cov(Y , Y
t t −k
= t t −k )
 (Y − Y )
t
2
 2
Y

◼ Graficul funcţiei de autocorelaţie pentru diverse lag-


uri k se numeşte corelogramă.

3
◼ Seriile nestaţionare au ACF care converge
“încet” spre zero
◼ În general, se consideră că dacă după 5 paşi
valoarea ACF este mai mare decît 0.7, atunci
seria este nestaţionară.
◼ Seriile staţionare au ACF care converg rapid
spre zero.

4
Funcţia de autocorelaţie parţială-PACF
◼ Măsoară corelaţia între Yt şi Yt-k fără a ţine cont de
corelaţiile dintre Yt şi Yt-1, Yt-2....
◼ De exemplu, există o corelaţie între Yt şi Yt-1 care
este măsurată prin ACF(1); de asemenea, există o
corelaţie între Yt-1 şi Yt-2 care este măsurată tot de
ACF(1). Dar corelaţia dintre Yt şi Yt-2, dincolo de cea
măsurată prin ACF(1) sau ACF(2) este dată de
PACF(2)
◼ Coeficienţii de autocorelaţie parţială se obţin prin
modele de regresie

5
Ipoteza de rădăcină unitară-Unit Root

◼ Seriile nestaţionare se spune că au rădăcină


unitară
◼ Ipoteze:
H0: seria are rădăcină unitară şi este nestaţionară
H1: seria este staţionară
◼ Dacă respingem ipoteza nulă, putem accepta
staţionaritatea.

6
Testul Dickey-Fuller(Unit Root Test) (1)
◼ Presupunem următorul model de serie temporală:

Yˆt = ˆ0 + ˆYt −1 + ˆ1t +  t


◼ Dacă |ρ|=1, atunci seria nu este staţionară
❑ Dacă ß1 este semnificativ diferit de zero (din punct de vedere
al testului t) atunci staţionaritatea se obţine eliminând
componenta trend
❑ Dacă ß1 nu este semnificativ diferit de zero (din punct de
vedere al testului t) atunci staţionaritatea se obţine cu diferenţe
de ordinul 1 sau 2

7
Testul Dickey-Fuller(Unit Root Test) (2)

◼ Dacă |ρ|<<1, atunci seria prezintă următoarele


elemente:
❑ Dacă ß1 este semnificativ diferit de zero (din punct de
vedere al testului t) atunci staţionaritatea se obţine
eliminând componenta trend
❑ Este staţionară dacă ß1 nu este semnificativ diferit de
zero (din punct de vedere al testului t) şi dacă ρ este
semnificativ diferit faţă de zero

8
Modele Auto Regresive (AR)

Sunt acele modele cu evoluţii datorate realizărilor anterioare.

◼ Model autoregresiv de ordinul 1: (AR1)


Yˆt = ˆ0 + ˆ1Yt −1 +  t

◼ Model autoregresiv de ordinul 2: (AR2)


Yˆt = ˆ0 + ˆ1Yt −1 + ˆ2Yt −2 +  t

◼ Model autoregresiv de ordinul p: (ARp)


Yˆt = ˆ0 + ˆ1Yt −1 + ˆ2Yt −2 + ... + ˆ pYt − p +  t
9
Modele de medie mobilă (în engleză
Moving Average) (MA)
◼ Sunt acele modele care presupun că nivelul
fenomenului urmează unei acţiuni compensatorii în
vederea contracărării unor “acţiuni” din afara
sistemului.
◼ Se consideră că nivelul fenomenului din perioada t
depinde de erorile din trecut (erori în sensul abaterii
faţă de normal, sau faţă de medie) aşa încât
devierea (sau devierile) accidentală este urmată de
o redresare.
◼ Eroarea sau componenta reziduală (ut) este
presupusă a fi un zgomot alb (“white noise”).
❑ Zgomot alb – o componentă pur aleatoare de medie zero şi
dispersie finită dar diferită de zero

10
Modele de medie mobilă (MA)
◼ Model de medie mobilă de ordinul 1: (MA1)

Yˆt = Y + ˆ1ut −1 + ut
◼ Model de medie mobilă de ordinul 2: (MA2)
Yˆt = Y + ˆ1ut −1 + ˆ 2ut −2 + ut

◼ Model de medie mobilă de ordinul q: (MAq)

Yˆt = Y + ˆ1ut −1 + ˆ 2ut −2 + ... + ˆ q ut − q + ut

11
Modele ARMA (Auto Regressive
Moving Average)
◼ Modelează fenomenele sau procesele când sunt
prezente ambele categorii de evoluţii (AR şi MA).
◼ Pentru p=1 şi q =1 vom avea ARMA (1,1)
Yˆt = ˆ0 + ˆ1Yt −1 + ˆ1ut −1 + ut
◼ Pentru p=2 şi q =2 vom avea ARMA (2,2)
Yˆt = ˆ0 + ˆ1Yt −1 + ˆ2Yt − 2 + ˆ1ut −1 + ˆ 2ut − 2 + ut
Media lui Y este inclusă în model prin intermediul
parametrului ß0

12
Modele ARIMA (Auto Regressive Integrated Moving
Average) ARIMA (p,d,q)

◼ Sunt acele modele ARMA aplicate pe serie


cronologică ce includea iniţial componenta trend.
Componenta trend a fost eliminată prin diferenţe
de ordinul 1 sau 2.
◼ În primul caz vom avea ARIMA de ordinul 1
(integrate de ordinul 1 – s-au calculat diferenţe de
ordinul 1) ; Yt = Yt − Yt −1

◼ În al doilea caz vom avea ARIMA de ordinul 2


(integrate de ordinul 2 – sau calculat diferenţe de
ordinul 2).  2Yt = Yt − Yt −1

13
Metodologia Box-Jenkins

◼ Identificarea-urmăreşte determinarea gradului


polinomului autoregresiv, p şi a gradului polinomului
de medie mobilă, q

◼ Estimarea parametrilor

◼ Teste pentru validarea modelului

Observaţie:
Seria trebuie să fie staţionarizată înainte de
aplicarea metodologiei Box-Jenkins.

14
Cum identificăm parametrii p şi q?
◼ Studiem comportamentul ACF şi PACF
Model acf  X () pacf  X ()

AR(p) Se amortizează tinzînd la Se anul ează du pă

zero întîrzierea p

MA(q) Se anulează după Se amortizează tinzînd la


întîrzierea q zero

A R M A ( p, q) Se am orti zeaz ă ti nzî nd l a Se am orti zeaz ă ti nzî nd l a

zero zero

15
ACF şi PACF pentru AR(1) şi MA(1)

16
Estimarea parametrilor de regresie

◼ Pentru AR se foloseşte MCMMP


◼ Pentru MA, ARMA sau ARIMA se folosesc
procedee iterative ce presupun apelarea la
procedeul matematic de dezvoltare în serie
Taylor
◼ Urmare a dificultăţilor de calcul manual se
folosesc produse software specializate
(SPSS, Statistica, E-Views etc.)

17
Teste pentru verificarea modelelor

◼ Testele clasice t şi F
◼ Testul Lying-Box presupune calculul statisticii Q care
urmează o distribuţie Hi pătrat
n
Q = n(n + 2) n −1 k  k2
k =1

◼ Criteriul Akayke se foloseşte pentru alegerea între


mai multe modele de regresie. Se alege acel model
de regresie pentru care AIC (testul Akayke) este

( )
minim
 2
uij
AIC j = ln n j + n j
2k j

18
MODELE CU ECUAŢII
SIMULTANE

Joi, 27 Mai 2021


Istoric (1)
 Modelarea macroeconomică cantitativă a
apărut la sfârşitul anilor ’30 în Europa,
propagându-se apoi puternic în Statele
Unite.
 Primul model macro-econometric
complet a fost construit în anul 1936 de
către Timbergen pentru economia Ţărilor
de Jos. În anul 1939, pornind de la
modelul Timbergen, Lawrence Klein a
construit şi primul model pentru Statele
Unite.
2
Istoric (2)
 Evoluţia modelării macro-econometrice cunoaşte
trei perioade:
◼ anii ’40 - mijlocul anilor ’50: perioadă de „tatonare” a
modelării macroeconometrice. În anul 1955 a fost
elaborat modelul Klein-Goldberger, care poate fi
considerat a sta la baza majorităţii modelelor ulterior
elaborate în Statele Unite;
◼ mijlocul anilor ’50 - sfârşitul anilor ’60: perioadă
acoperită de modelul lui Brookings cu cele 272 de ecuaţii
ale sale. Este o perioadă importantă pentru activitatea
de specificare şi estimare pe care o implică.
◼ sfârşitul anilor ’60 - prezent: perioadă caracterizată de o
accelerare a fenomenului de modelare macroeconomică.

3
Istorie şi prezent
 În Statele Unite există 12 modele
macroeconomice mari, publice sau
private, cu care se lucrează în prezent.
 În Europa nu s-a atins încă acest nivel,
dar mişcarea s-a dezvoltat cu un decalaj
de 5-10 ani faţă de Statele Unite.
Modelarea este mult mai dificilă pentru
economiile europene deoarece acestea
sunt mult mai dependente de exterior.

4
Prezentare generală (1)
 Exemplu
 Un model clasic de sistem cu ecuaţii multiple este
modelul echilibrului de piaţă:
- ecuaţia cererii: qd =  1 p +  2 y +  d
- ecuaţia ofertei: q s = 1 p +  s
- echilibrul: qd = qs = q
 Aceste ecuaţii sunt structurale, adică ele
derivă din teorie şi fiecare descrie un aspect
particular al economiei. Varabilele preţ şi
cantitate sunt denumite variabile endogene iar
venitul este o variabilă exogenă.
5
Prezentare generală (2)
 Un model cu ecuaţii multiple descrie fie
totalitatea tipurilor de relaţii econometrice
- de comportament, de identitate,
instituţionale sau tehnologice, sau doar o
parte dintre acestea.
 Un model cu ecuaţii multiple se
elaborează sub formă structurală, adică el
reprezintă transpunerea formală a teoriei
economice referitoare la procesul
economic investigat prin intermediul unui
sistem de ecuaţii.
6
Mod de prezentare
 Forma structurală a unui model cu ecuaţii
simultane este forma iniţială a modelului
rezultată în urma etapei de specificare şi
reprezintă structura (elemente şi conexiuni)
procesului descris.

 Specificarea unui model econometric reprezintă


alegerea variabilelor endogene, stabilirea
numărului de ecuaţii în forma structurală,
alegerea numărului de variabile factoriale
considerate determinante pentru evoluţia
fiecăreia dintre variabilele endogene, stabilirea
fiecărei ecuaţii de regresie, definirea relaţiilor de
identitate dacă acestea există.
7
Specificarea unui model econometric
cu ecuaţii simultane (1)
  11 y1t +  21 y 2t + ... +  n1 y nt + 11 x1t + ... +  m1 xmt =  1t
 y +  y + ... +  y +  x + ... +  x = 
 12 1t 22 2 t n 2 nt 12 1t m 2 mt 2t

 
 1n y1t +  2 n y 2t + ... +  nn y nt + 1n xnt + ... +  mn xmt =  nt

8
Specificarea unui model econometric
cu ecuaţii simultane (2)
 Notând:  1  12   1n   11 12  1n 
   
 
 =  21
1   2n  şi 
B =  21
 22   2n 
       
   
    m 2   mn 
 n1  n 2  1   m1

 y1t   x1t 
 
  1t 
 
y t =    , xt =    şi  t =  
y  x   
 nt   mt 
 nt 
 Forma structurală sub formă matriceală se
scrie:
y + x B =
'
t
'
t t
'
9
Specificarea unui model econometric
cu ecuaţii simultane (3)
 Dacă  este o matrice superior triunghiulară
modelul are forma:
 y1t = f1 ( xt ) +  1t
y = f (y , x ) + 
 2t 2 1t t 2t

 
 y mt = f m ( y1t , y 2t ,..., y m−1,t , xt ) +  mt
 A rezolva un model definit prin relaţia anterioară
presupune estimarea celor n(n-1) parametri  şi nm
parametri . Aplicarea metodei celor mai mici
pătrate fiecărei ecuaţii conduce la estimatori
deplasaţi nesemnificativi.
10
Forma redusă a modelului
econometric cu ecuaţii simultane
 Forma redusă presupune exprimarea tuturor
variabilelor endogene ale modelului în funcţie
de variabilele exogene ale acestuia.
 Forma redusă este:

y + x B =  
'
t
'
t
−1
t
' −1

 Condiţia este ca matricea  să fie inversabilă


 În urma aplicării metodei celor mai mici
pătrate formei reduse se obţin nm estimatori
aij pentru elementele matricei A=-B-1. 11
Exemplu (1)

12
Exemplu (2)

13
Identificarea modelului (1)
 Etapa de identificare presupune revenirea
la forma structurală plecând de la forma
redusă deoarece modelul are semnificaţie
economică numai în această formă.
 Această operaţie presupune estimarea
parametrilor matricelor  şi B în număr de
n(n-1)+nm plecând de la cei nm
parametri ai matricei A.
 Există trei cazuri.

14
Identificarea modelului (2)
1. În matricele  şi B există n(n-1) termeni nuli,
adică numărul ecuaţiilor (nm) este egal cu
numărul necunoscutelor (n(n-1)+nm). În acest
caz sistemul este unic determinat.
2. În matricele  şi B numărul termenilor nuli este
mai mare decât n(n-1), deci modelul are mai
multe ecuaţii (nm) decât necunoscute (n(n-
1)+nm). În acest caz sistemul este
supraidentificat.
3. În matricele  şi B numărul termenilor nuli este
mai mic decât n(n-1), deci modelul are mai
puţine ecuaţii (nm) decât necunoscute (n(n-
1)+nm). În acest caz sistemul este
nonidentificabil.
15
Identificarea modelului (3)
 În practică pentru determinarea identificării
sistemului se studiază fiecare ecuaţie în parte:
◼ dacă numărul variabilelor absente din ecuaţie = numărul
variabilelor endogene - 1 atunci ecuaţia este corect
identificată
◼ dacă numărul variabilelor absente din ecuaţie > numărul
variabilelor endogene - 1 atunci ecuaţia este supra
identificată
◼ dacă numărul variabilelor absente din ecuaţie < numărul
variabilelor endogene - 1 atunci ecuaţia este
nonidentificată

 Un model cu o singură ecuaţie nonidentificată este


nonidentificabil în ansamblul său. Dacă are o
ecuaţie supraidentificată el este în ansamblul său
supraidentificat. Modelul este unic determinat dacă
fiecare ecuaţie este corect identificată. 16
Metode de estimare a parametrilor
 Dacă modelul structural este recursiv, adică forma
structurală coincide cu forma redusă, se poate
aplica metoda celor mai mici pătrate sau metoda
verosimilităţii maxime fiecărei ecuaţii a modelului.
Metoda regresiei indirecte
 Această metodă presupune estimarea fiecărei
ecuaţii din forma redusă a unui model unic
determinat prin metoda celor mai mici pătrate.
Plecând de la aceşti estimatori sunt estimaţi
parametrii formei structurale.
Metoda celor mai mici pătrate în două faze
 Această metodă poate fi aplicată pentru
estimarea modelelor unic identificate sau
supraidentificate. 17
Metoda celor mai mici pătrate în
două faze
Faza 1. Fiecare variabilă endogenă a modelului se
regresează în funcţie de variabilele exogene ale
modelului. Se estimează parametrii prin metoda
celor mai mici pătrate şi se calculează valorile
ajustate ale variabilelor endogene.
Faza 2. În ecuaţiile formei structurale ale modelului
în care variabilele endogene apar ca exogene se
vor introduce valorile estimate în faza 1. Se
estimează parametrii modelului structural prin
metoda celor mai mici pătrate.
Observaţie: În cazul în care modelul structural este
nonidentificabil nu este posibilă estimarea
parametrilor şi se recurge la o respecificare a
acestuia. 18
Exemplu: Modelul static al lui Keynes

Ecuaţia 1:
numărul variabilelor absente = 1
numărul variabilelor endogene - 1 = 2-1 = 1
1 = 1 deci ecuaţia este corect identificată
19
Modelul static al lui Keynes (2)
Ecuaţia 2:
Fiind vorba despre o identitate înseamnă că
starea modelului este dată doar de starea primei
ecuaţii.
Deci modelul este corect identificat.

 În acest caz estimarea modelului poate fi făcută cu


ajutorul:
1. metodei regresiei indirecte aplicată ecuaţiilor
modelului sub formă redusă;
2. metodei celor mai mici pătrate în două faze.

20
Modelul static al lui Keynes (3)
Metoda regresiei indirecte:

21
Modelul static al lui Keynes (4)
Metoda celor mai mici pătrate în două faze:

Faza 1:
În prima fază este estimată variabila endogenă Vt,
care în a doua ecuaţie este exogenă, în funcţie de
variabila exogenă a modelului:
Vt =  + I t + wt
Faza 2:
În faza a doua este estimat consumul în funcţie de
variabila endogenă Vt estimată în prima fază.
Astfel vor fi estimaţi prin metoda celor mai mici
pătrate parametrii ecuaţiei: 
Ct = a + b V t + u t 22
Exemplu: Modelul dinamic al lui Keynes

Ecuaţia 1:
numărul variabilelor absente = 3
numărul variabilelor endogene - 1 = 3-1 = 2
3 > 2 deci ecuaţia este supraidentificată
23
Modelul dinamic al lui Keynes (2)
Ecuaţia 2:
numărul variabilelor absente = 2
numărul variabilelor endogene -1 = 3-1 = 2
2 = 2 deci ecuaţia este corect identificată

Deci modelul este supra identificat.

 În acest caz estimarea modelului poate fi făcută


doar cu ajutorul metodei celor mai mici pătrate
în două faze.

24
Modelul dinamic al lui Keynes (4)
Metoda celor mai mici pătrate în două faze:

Faza 1:
În prima fază este estimată variabila endogenă Vt, care în a
doua ecuaţie este exogenă, în funcţie de variabilele exogene
ale modelului:
Vt =  + Vt −1 + Gt + wt
Faza 2:
În faza a doua sunt estimate primele două ecuaţii ale modelului
în care sunt introduse valorile estimate ale variabilei
endogene Vt estimate în prima fază.
Astfel vor fi estimaţi prin metoda celor mai mici pătrate
parametrii ecuaţiilor: : 
Ct = a0 + a1 V t + ut
 25
I t = b0 + b1 V t + b2Vt −1 + u 2

You might also like