You are on page 1of 14

REGRESIA MULTIFACTORIALĂ

Modelul multifactorial de regresie


liniară
Ipotezele modelului de regresie liniară
Estimarea parametrilor modelului de
regresie
Testarea validităţii modelului de
regresie. Metoda ANOVA

1
Modelul multifactorial de regresie liniară

 Se umăreşte crearea unui model matematic, model care să descrie


legătura dintre factorii cauzali (exigeni) {xi}i=1,k şi factorul de efect
(de ieşire, endogen) notat y

y  f(x1 ,..., x k )
 Funcţia f pote modela diverse tipuri de relaţii între variabila
endogenă şi cele exogene (relaţii funcţionale, de regresie, de tip
comportamental, tehnologic sau instituţional)
 Se porneşte de la studiul fenomenului economic ce face obiectul
analizei şi identificarea relaţiei cauză efect între variabilele
economice
 Ca sursă de informaţii existenţa, direcţia şi forma legăturii dintre
variabile poate fi corelograma sau diagrama de împrăştiere.

2
Modelul multifactorial de
regresie liniară
În economie, modelele multifactoriale au o arie vastă de
aplicare, acestea putând fi utilizate în mai multe situaţii şi
sub diverse forme, ca, de exemplu:
• modelarea consumului
C = f (V, P, N) + e
unde:
C = consumul unui produs sau grupe de produse;
V = venitul pe familie;
P = preţul produsului sau indicele preţurilor grupei
de produse;
N = numărul membrilor unei familii.
3
Modelul multifactorial de regresie liniară
Modelul liniar multifactorial, la nivelul colectivităţii generale, are forma:

yi   0  1 xi1   2 xi 2  ...   k xik   i cu i  1, N


unde:
 N reprezintă numărul unităţilor statistice observate din colectivitatea
generală
  0 reprezintă termenul liber (intercepţia)
  j ( j  1, k ) reprezintă panta care arată legătura condiţionată dintre yi şi xij
 xi1 , xi12 ,...xik reprezintă valorile celor m variabile factoriale înregistrate la
unitatea statistică i
 yi reprezintă nivelul variabilei dependente la unitatea de observaţie i din
colectivitatea generală
 i reprezintă nivelul variabilei reziduale la unitatea statistică i

4
Modelul multifactorial de regresie liniară
La nivelul colectivităţii generale (cu N elemente) modelul este:

y1   0  1 x11   2 x12  ...   k x1k   1


y2   0  1 x21   2 x22  ...   k x2 k   2
............
y N   0  1 x N 1   2 x N 2  ...   k x Nk   N
sau, sub formă matriceală:

Y  X  

5
Modelul multifactorial de regresie liniară
Relaţia (1), sub formă matriceală, devine:
Y = X·β + E (2)
unde:  y 1 
 
y2  vectorul coloană al variabilei endogene (yi)
Y  
 , de dimensiune (N, 1);
 
y 
 N 
i  1, N
1 x 11 x 1k 
 
1 x 21 x 2 k matricea variabilelor exogene (xj)
 
X  1 x 23 x 3 k  , de dimensiune
 
  j  0,1,.....k
(n, k + 1);
1 x N 1 x Nk 
 
6
Modelul multifactorial de regresie
liniară
 0 
 
  1  vectorul coloană al parametrilor (β )
  j j  0, m
   2 
de dimensiune (k + 1, 1);
 
 
 k 
 1 
 
 2 
    3  vectorul coloană al variabilei aleatoare,
  de dimensiune (n, 1).
 
 

 N
7. Regresia simplă 7
Estimarea parametrilor modelului

 Fie acum un eşation din populaţia totală, eşantion de


dimensiune n:

X  {xij }i 1,n; j 1,k si Y  { yi }i 1,n

 Modelul de regresie liniară multifactorială în eşantion este:

yi  b0  b1 xi1  b2 xi 2  ...  bk xik   i cu i  1, n


 Unde bj sunt estimatorii lui  j iar
yˆ i  b0  b1 xi1  b2 xi 2  ...  bk xik cu i  1, n

este componenta predictibilă

8
Estimarea parametrilor modelului
Modelul bifactorial este:

yi  b0  b1 xi1  b2 xi 2   i cu i  1, n
Sistemul de ecuaţii pentru determidarea estimatorilor b0, b1 şi b2 este:

 n n n

nb0  b1  xi1  b2  xi 2   yi
 n i 1 n i 1 i 1
 n n

 b0  xi1  b1  xi1  b2  xi1 xi 2   xi1 yi


2

 in1 i 1
n
i 1
n
i 1
n
b
 0  1  i1 i 2  2  i 2   xi 2 yi
2
xi2 b x x b x
 i 1 i 1 i 1 i 1

9
IPOTEZELE PENTRU ESTIMAREA PARAMETRILOR MODELULUI
MULTIFACTORIAL

Aplicarea M.C.M.M.P. în cazul unui model multifactorial se


fundamentează pe câteva ipoteze şi anume:
• I1: Variabilele y, x1,… xk nu sunt afectate de erori de măsură.
• I2: Variabila aleatoare (reziduală) ε este de medie nulă M(ε 1)=
M(ε 2) = …= M(ε n) = 0, iar dispersia ei este constantă şi
independentă de variabilele exogene Xj - ipoteza de
homoscedasticitate a erorilor.
• I3: Valorile variabilei reziduale ε sunt independente, respectiv nu
există fenomenul de autocorelare a erorilor, cov (ε 1, ε n) = 0.
• I4: Legea de probabilitate a variabilei reziduale este legea
normală de medie zero şi de abatere medie pătratică  ε.
• În afara acestor ipoteze care sunt aceleaşi şi în cazul unui
model unifactorial, există o ipoteză specifică modelului
multifactorial şi anume - I5: Variabilele exogene Xj sunt
independente între ele, formând un sistem de vectori liniari
independenţi. În caz contrar apare fenomenul de
multicoliniaritate care implică imposibilitatea calculării matricei
inverse, precum şi a estimării parametrilor. 10
Verificarea semnificaţiei parametrilor
modelului multifactorial
• Estimatorul dispersiei variabilei reziduale se determină ca:

 t t
( y  ˆ
y ) 2

se2  t 1
unde: k reprezintă
n  k  1 numărul variabilelor independente
considerate, iar (n-k-1) reprezintă numărul gradelor de
libertate.
estimaţiile dispersiilor parametrilor
unde:
s 2 cijs=
2 elementul (j+1) situat pe diagonala principală a
u  c ij
b̂ j (b j ) j 0,k
matricei inverse (X’X) ,
-1

j  0, k
11
Verificarea semnificaţiei parametrilor
modelului multifactorial
• Vom verifica dacă parametrii bj sunt semnificativ diferiţi de

zero : H 0 : b j  0 b  b j  0 ;
j

H1 : b j  0, j  0, m.
Dacă volumul eşantionului este mare (n>30), vom utiliza
testul z: b j  b bj  0
z j

sb j sb j

• Pentru un prag de semnificaţie  vom respinge ipoteza


nulă (H0) când z > z/2 sau z < – z/2 şi vom concluziona că
este foarte improbabil ca estimatorii b j să provină dintr-o
bj  0
populaţie pentru care . 12
Verificarea semnificaţiei parametrilor
modelului multifactorial
• Dacă volumul eşantionului este mic n  30 vom utiliza
testul t:
b j  b bj  0
tb j  j
 ,
sb j sb j

statistică ce urmează o distribuţie Student, t, cu (n – k-1)


grade de libertate.
• Regiunea critică este dată de: tb j  t 2;n  k 1
• Intervalul de încredere pentru parametrii bj este:
b j  t / 2,n  k 1  sb j  b j  b j  t / 2,n  k 1  sb j
13
Verificarea semnificaţiei modelului
multifactorial
• Verificarea semnificaţiei modelului econometric
multifactorial se face cu ajutorul metodei analizei
dispersionale sau a variaţiei (ANOVA) şi a testului Fisher-
Snedecor (F). Metoda se aplică în aceeaşi manieră ca şi
în cazul modelului unifactorial, unde k reprezintă numărul
variabilelor exogene . k  2
• De asemenea, testarea semnificaţiei raportului de
corelaţie R y x j se face după aceleaşi principii ca şi în cazul
modelului unifactorial.

7. Regresia simplă 14

You might also like