You are on page 1of 5

Modelul de regresie multifactorială (bifactorială

)
Problemă rezolvată
Din activitatea unei firme se cunosc următoarele date pentru perioada 2000-2009:
Anul

Producţia fizică(mii buc)

2000
2001
2002
2003
2004
2005
2006
2007
2008
2009

20
24
28
32
34
40
40
42
44
46

Număr de salariaţi
1000
1200
1400
1100
1500
1700
1900
1900
2000
2100

Capitalul fix (mii lei
preţuri comparabile)
4000
4200
4400
4600
4600
4200
4600
4800
4800
5000

Presupunând că între cele 3 variabile există o dependenţă liniară, se cere:
1. să se estimeze parametrii modelului de regresie
2. să se determine erorile reziduale
3. să se măsoare intensitatea legăturii dintre producţie şi cele două variabile
4. să se testeze validitatea modelului de regresie folosit
Rezolvare:
1. Notăm cu :
y=producţia
x1=număr de salariaţi
x2=capitalul fix
Ecuaţia de regresie este de forma:
ˆ =a0+a1x1+a2x2
y
ˆ =valorile ajustate sau teoretice ale variabilei y în funcţie de cele două
unde y
variabile factoriale x1 şi x2.
Determinarea parametrilor modelului de regresie de face cu ajutorul MCMMP
(sistemul de ecuaţii normale este dat in cursul predat sau in cel tipărit, iar a0,a1 şi a2 se
calculează prin metoda substituţiei sau a determinanţilor):

Anul

2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
Total

y productia
(mii buc)y

20
24
28
32
34
40
40
42
44
46
350

a0= -23,13
a1= 1,67
a2= 0,70

x1numar
salariati

10
12
14
11
15
17
19
19
20
21
158

x2capitalul
fix(sute de
mii lei
pcomp)

40
42
44
46
46
42
46
48
48
50
452

xi1^2

100
144
196
121
225
289
361
361
400
441
2638

xi2^2

1600
1764
1936
2116
2116
1764
2116
2304
2304
2500
20520

xi1*xi2

400
504
616
506
690
714
874
912
960
1050
7226

xi1*yi

200
288
392
352
510
680
760
798
880
966
5826

xi2*yi

800
1008
1232
1472
1564
1680
1840
2016
2112
2300
16024

1017 3.2235 34. x 2 = 2 = 1 − 67.2235 5. puternică.0508 Iar s x1.0123 -1.130352 67.699702 7 . producţia va creşte cu 0.000151 1.6527 -2. rezultă că între cele 3 variabile sxistă o legătură directă.46522 -0.13+1. rezultatele sunt prezentate mai jos: ei=yi.77875 145.832145 0.1504 73.89 = 0. producţia creşte cu 1.67x1+0.7 mii bucăţi (700 bucăţi). la o creştere cu 100 a numărului de salariaţi.y^i -1.5203 638.51683 80. 4. foarte apropiat de 1.9877 47.049952 27.6527 26.14802 27.06318 349.4444 0.91222 -0.056997 34.83775 55.70x2 În concluzie. iar n=10 67.00076 ei^2 2.76126 40.40036 -3.53478 34. iar la o creştere a capitalului fix cu 100 000 lei. unde k=2. Erorile sau valorile reziduale sunt ei=yiy productia (sute mii buc)y 20 24 28 32 34 40 40 42 44 46 350 an 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 Total y^i 21.23874 -0. x 2 = k k 2 2 10 2 se = SSE = n − k −1 ∑( y − yˆ ) 1 i i n − k −1 2 = .731417 5.9992 ˆi y .Deci.89792 (yiymediu)^2 225 121 49 9 1 25 25 49 81 121 706 (y^iymediu)^2 178.91222 42.95.602952 0.1017 SSR ∑ = 1 = = 319.06318 0.72951 0.91003 19.14802 4.89 = 9. 2.95381 14. yˆ = -23. Testarea validităţii modelului de regresie Se stabilesc cele 2 ipoteze: H0: modelul nu este valid H1: modelul este valid şi se calculează testul F 2 s Fcalc= s x1.31552 43.31552 0.40036 31. x 2 2 = e 10 (y ˆ i − y i) 2 638.95435 53.761728 9.95 706 Deoarece R=0.099553 0. Pentru măsurarea intensităţii legăturii dintre producţie şi cele două variabile folosim raportul de corelaţie multiplă: ( yˆ i − y i) ∑ 1− ∑( y i − y i ) 2 R y / x1.93819 0.67 mii bucăţi.

950698 R Square 0. 2. 7 = 4.7 = e Fα Deoarece Fcalc=32.2 Atunci s Fcalc= s x1.74 F 0. 7 adică = 4.163 = 32. apoi Data Analysis şi apoi Regression şi se va deschide următoarea fereastră: Rezultatele obţinute cu ajutorul Excel-ului sunt: SUMMARY OUTPUT Regression Statistics Multiple R 0.114434 Observations 10 . x 2 2 319.k . 2.74 respingem ipoteza nulă şi acceptăm alternativa.876349 Standard Error 3. deci modelul este valid.n −k −1 0.05. Rezolvarea prin EXCEL: Se introduc valorile variabilei rezultative y în celulele A2-A11 Se introduc valorile variabilei x1 în celulele C2-C11 Se introduc valorile variabilei x2 în celulele D2-D11 Se selectează din meniul principal opţiunea Tools.903827 Adjusted R Square 0.05.89 9.9 > F Se compară Fcalc cu .

051 9.876495 Explicaţii la rezultatele obţinute: SUMMARY OUTPUT Regression Statistics 0.672178 0.65277 2 26.73763 0.496841 1.14809 4.0% -66.73763 2.69970 2 t Stat Intercept -23.606727 2.0% Upper 95.87634 Adjusted R Square 9 3.14809 4 27.238677 -0.114434.23099 9 X Variable 2 0.465133 -0.27936 X Variable 1 1.40043 -3.903827 arată că 90% din variaţia producţiei este explicată de model (depinde de variaţia celor 2 factori cauzali – numărul de personal si capitalul fix) Abaterea medie pătratică a erorilor se=3.950698 arată că între cele 3 variabile există o legătură puternică directă.00388 3 Lower 95% 0.3156 9 43.47319 P-value 0.76132 7 40.012221 -1.8928 7 Significanc eF 0.22358 5.1021 Residual Total 7 9 67.22358 6 34.ANOVA df SS MS Regression 2 638.051 F 32.98778 10 47.1021 MS 319.11443 Standard Error 4 Observations 10 • • • Multiple R=0.91229 -0.359 20.395221 -1.06326 F 32.359 20. În cazul în care acest indicator este 0 înseamnă că toate punctele sunt pe dreapta de regresie ANOVA df Regression SSR 2 SS 638.65277 -2.06326 Residuals -1.91229 8 42.41223 RESIDUAL OUTPUT Predicted Observation Y 1 21.20076 1.95069 Multiple R 8 0.47319 1.000276 .53487 5 34.000276 Upper 95% Lower 95.606727 -0.3156 0.89287 Significance F 0.24613 6 0.40043 3 31.08865 -66.08865 0.26564 4.1352 18.90382 R Square 7 0.876495 0.89792 706 Coefficient s Standard Error 319.701653 0. R Square sau R2=0.

Întrucât F=32. Termenul líber este punctul in care varabilele explicative (factoriale) sunt nule.27936 X Variable 1 1.606727 2. Intervalul de încredere pentru acest parametru este 0.08865 -66.0% -66.73763 ≤ α1 ≤ 2.699702 În acest tabel este calculat testul F pentru validarea modelului de regresie.496841 1.606727.672178 mii bucăţi).0% Upper 95.672178.876495 Intercept este termenul liber.08865 0. iar P-value este 0. a0=-23.20076> 0.41223. faptul că limita inferioară a intervalului de încredere ( − 0. Deoarece ta2= 1.00388 3 Lower 95% 0. iar P-value este 0.359 ≤ α0 ≤ 20.26564.05).672178 0. Coefficient s Standard Error t Stat Intercept -23.359 20. iar limita superioară este pozitivă indică faptul că parametrul din colectivitatea generală este aproximativ zero. producţia va creşte cu 701 bucăţi (0.05 înseamnă că acest coeficient este semnificativ. Deoarece ta0=-1. iar P-value este 0.73763 0.26564 4. iar limita superioară este pozitivă indică faptul că parametrul din colectivitatea generală este aproximativ zero.89287.47319 P-value 0.20076 1. Deoarece ta1= 4.359 20.701653 0. De altfel.1352 18.47319 ≤ α 2 ≤ 1.246136 > 0. producţia va creşte cu 1672 bucăţi (1. Coeficientul a1 este 1.89792 706 9.05 înseamnă că acest coeficient este nesemnificativ.24613 6 0.003883< 0.000276 (valoare mai mică decât pragul impus de 0.73763 2. faptul că limita inferioară a intervalului de încredere ( − 66. ceea ce înseamnă că la creşterea capitalului fix cu 100 mii lei (atenţie la unitatea de măsură in care s-au făcut calculele).08865 pentru acest parametru este negativă.1352.606727 -0.23099 9 X Variable 2 0. Coeficientul a2 este 0.876495 0.41223 Upper 95% Lower 95. De altfel.47319 1.701653.05 înseamnă că acest coeficient este nesemnificativ. putem concluziona că modelul este valid şi poate fi utilizat pentru analiza dependenţei dintre cele trei variabile.395221 -1.Residual SSE Total 7 9 67. .230999. iar Significance F=0. ceea ce înseamnă că la creşterea numărului de salariaţi cu 100 (atenţie la unitatea de măsură in care s-au făcut calculele).701653 mii bucăţi).876495 ) pentru acest parametru este negativă.