Proiect econometrie: regresia liniara simpla; regresia liniara

multipla

a. Realizarea şi interpretarea regresiei unifactoriale
¸ )
i i
x f y =
Nr. mediu salariaţi din agricultură,vânătoare şi silvicultură = f (PIB)
1.Să se reprezinte grafic datele
2.Să se determine modelul de regresie pe baza datelor din eşantion
3.Să se verifice validitatea modelului de regresie pentru un nivel de semnificaţie 0,05.
4.Să se testeze semnificaţia parametrilor modelului de regresie, pentru un nivel de
semnificaţie 0,05.
5.Să se măsoare intensitatea legăturii dintre variabile folosind coeficientul de corelaţie şi
raportul de corelaţie, testând semnificaţia acestora pentru un nivel de semnificaţie 0,05.
6.Ce pondere din variaţia variabilei efect este explicată de variatia variabilei cauză?



1)Construirea şi comentarea graficului
Graficul construit, denumit corelogramă, ne indică existenţa, forma şi direcţia legăturii
dintre cele două variabile:
Corelograma dintre nr. mediu salariaţi din agricultură,vânătoare şi silvicultură
şi PIB

Evidenţiază legătura directă (punctele sunt plasate pe direcţia primei bisectoare)

2)Estimarea parametrilor modelului liniar de regresie (a, b)
Aplicarea modelului liniar de regresie presupune utilizarea ecuaţiei de regresie liniară:
i i
bx a y = Ö
Parametrii a şi b se determină cu ajutorul metodei celor mai mici pătrate:
¸ ) ¸ ) ÷ ÷
¿ ¿
min min Ö
2 2
i
i i
i
i i
bx a y y y aplicarea ei conducând la
obţinerea sistemului de ecuaţii normale:
±
±
°
±
±
¯
®
=
=
¿ ¿ ¿
¿ ¿
= = =
= =
n
i
i i
n
i
i
n
i
i
n
i
i
n
i
i
y x x b x a
y x b na
1 1
2
1
1 1
, unde n=14 judete
Pentru a rezolva sistemul vom folosi următorul tabel în care sunt prezentate valorile
intermediare:
PIB
i
x

Nr mediu
salariati in
agricultura

i
y

2
i
x

i i
y x

࢟ෝ=1447,66296+0,0772879
2*
i
x
11488,9 2423 131994823 27837605 2335,616144
4976,4 1546 24764557 7693514,4 1832,278565
18020,9 1842 324752837 33194498 2840,460838
7012,7 1407 49177961,3 9866868,9 1989,659957
5341,6 2181 28532690,6 11650030 1860,504113
3883,6 920 15082349 3572912 1747,818326
8000,7 3891 64011200,5 31130724 2066,020422
14160,4 2608 200516928 36930323 2542,090822
3540,4 1682 12534432,2 5954952,8 1721,293112
5248,1 1399 27542553,6 7342091,9 1853,277693
9440,8 3188 89128704,6 30097270 2177,322755
9026,3 1643 81474091,7 14830211 2145,286912
10091 2581 101828281 26044871 2227,575361
85707,2 8100 7345724132 694228320 8071,794177

i
x

195939
σ
i
y
ൌ3541
1
σ
2
i
x
ൌ849
7065541
σ
i i
y x =940374191
σ࢟ෝ ൌ16591,38072

Sistemul de ecuaţii normale devine:
°
¯
®
=
=
940374191 8497065541 195939
35411 195939 14
b a
b a

, unde
66296 . 1447
195939 8497065541 14
94037191 195939 8497065541 35411
2
1
2
1
2
1 1 1 1
2
=


=
¦
'
+

'

=
A
A
=
¿ ¿
¿ ¿ ¿ ¿
= =
= = = =
n
i
n
i
i i
n
i
n
i
n
i
n
i
i i i i i
a
x x n
y x x x y
a

07728792 . 0
195939 8497065541 14
35411 195939 940374191 14
2
1
2
1
2
1 1 1
=


=
¦
'
+

'

=
A
A
=
¿ ¿
¿ ¿ ¿
= =
= = =
n
i
n
i
i i
n
i
n
i
n
i
i i i i
b
x x n
y x y x n
b
Deci:
i i
x y = 07728792 . 0 66296 . 1447 Ö

Interpretare: b = + 0.07728792
-b> 0, deci între nr. mediu de salariati si PIB există o legătură directă
-la creşterea cu o unitate a PIB , Nr mediu de salariati se măreşte cu 0.07728792

3) 1.H
0
: modelul nu este valid statistic
2.H
1
: modelul este valid statistict
3.Ştiind că pragul de semnificaţie este 05 , 0 = ¬ şi 1 = k (există un singur factor de
influenţă) se stabileşte:
4.1.valoarea critică:
75 , 4
12 ; 1 ; 05 , 0 2 ; 1 ; 1 ; ;
= = = =

F F F F
n k n k tabelar ¬ ¬

4.2.regiunea de respingere: dacă
1 ; ;
>
k n k c
F F
¬
, atunci H
0
se respinge
5.Determinarea statisticii testului (
calculat
F
) are la bază relaţia:
30 , 46
72 , 1
64 , 79
2
2
/
= = =
e
x y
s
s
F

Pentru determinarea statisticii testului F se foloseşte următorul algoritm de calcul:

36 . 2529
14
35411
15
15
1
= = =
¿
= i
i
y
y salariati in medie in agricultura vanatoare si silvicultura

-
-SS - Sum of Squares - suma pătratelor = varianţa

SST=SSR + SSE
SSR= ¸ ) 34375693 Ö
1
2
2
/
= = A
¿
=
n
i
i x y
y y
SS= ¸ ) 65 . 7156280 Ö
1
2 2
= = A
¿
=
n
i
i i e
y y
SST=
¸ ) 41531977
1
2
2
= = A
¿
=
n
i
i y
y y



-df - degree of freedom - grade de libertate

k = 1
n ± k ± 1 = 12
n ± 1 = k + (n ± k ± 1) = 1 + 12 = 13


-MS - media pătratelor = dispersia corectată

MS = SS : df
34375693
1
34375693
2
2
/
= =
A
=
k
s
x
x y

72 . 596356
1 1 14
65 . 7156280
1
2
2
=

=

A
=
k n
s
e
e





-F --- testul F

64 . 57
72 . 596356
34375693
2
2
/
= = =
e
x y
s
s
F


6.Concluzie:
Deoarece
calculat
F (57.64) >
1 ; ; k n k
F
¬
(4,75)
0
H se respinge, deci
1
H este adevărată,
prin urmare, modelul este valid.


Rezolvarea punctului aplicaţiei cu ajutorul programului informatic EXCEL
SUMMARY
OUTPUT


Regression Statistics

Multiple R
0,9097
76

R Square
0,8276
92
Adjusted R
Square
0,8133
33
Standard
Error
772,24
14
Observatio
ns 14


ANOVA

df SS MS F
Significa
nce F

Regression 1
3437569
7
34375
697
57,64
284
0,00000
6

Residual 12 7156281
59635
6,7

Total 13
4153197
7


Coeffic Standard t Stat P- Lower Upper Lower Upper
ients Error value 95% 95% 95,0% 95,0%
Intercept
1447,6
63 250,7895
5,772
422
0,000
088
901,239
4919
1994,0
86
901,239
5
1994,08
6
PIB xi
0,0772
88 0,01018
7,592
288
0,000
006
0,05510
8061
0,0994
68
0,05510
8
0,09946
8



Pentru aplicarea testului F se completează tabelul:
Sursa
variaţiei
df

(degree of
freedom)
(grade de
libertate)
SS

(Sum of Squares)
(suma pătratelor=
varianţa)
MS

=SS : df
(media
pătratelor
= dispersia
corectată)
F

(Statistica testul
F
sau
calculat
F )
Significance
F
(probabilitate
a critică)
Regressio
n (variaţia
datorată
regresiei)
k

1
SSR=
¸ )
¿
=
= A
n
i
i x y
y y
1
2
2
/
Ö
34375696.56
k
s
x y
x y
2
/ 2
/
A
=
=
34375696.56
Testul
F=
2
/ x y
s /
2
e
s

F = 57,64284


0,000006<
0,05
(resping H
0
±
model valid)
Residual
(variaţia
reziduală)
n-k-1

12
SS=
¸ )
¿
=
= A
n
i
i i e
y y
1
2 2
Ö
7156280,651

1
2
2

A
=
k n
s
e
e
=
596356.7

Total
(variaţia
totală)
n-1

13
SST=41531977.21
¸ )
¿
=
= A
n
i
i y
y y
1
2
2
=
SST=SSR + SSE
1
2
2

A
=
n
s
y
y

Notă: k ± reprezintă numărul variabilelor factoriale (în cazul modelului unifactorial k = 1).

Interpretare rezultate din tabelul 2 ANOVA:
În acest tabel este calculată statistica testului F pentru validarea modelului de regresie.
Modelul de regresie construit (
i i
x y 07728792 . 0 66296 . 1447 Ö = ) este valid şi poate fi
utilizat pentru analiza dependenţei dintre cele două variabile, întrucât:
-
calculat
F (57.64) >
1 ; ; k n k
F
¬
(4,75),
-Significance F (probabilitatea critică) este 0,000006 mai mică decât pragul de
semnificaţie ¸ ) 05 , 0 = ¬ .

4.Să se testeze semnificaţia parametrilor modelului de regresie, pentru un nivel de
semnificaţie 0,05
Ecuaţia de regresie - la nivelul colectivităţii generale este:
i i i
x y I F ¬ =
- la nivelul eşantionului este:
i i i
e bx a y =
Testarea semnificaţiei parametrului ¬:
H
0
: ¬

= 0 (¬ nu este semnificativ statistic)
H
1
: ¬

= 0, (i ¬ este semnificativ statistic)
Deoarece n = 14 30 avem eşantion de volum redus şi pentru testare vom utiliza testul
t.
Ştiind că pragul de semnificaţie este 05 , 0 = ¬ şi 1 = k (există un singur factor de
influenţă) se stabileşte:
Valoarea critică:

179 , 2
12 ; 5 , 0 2 14 ; 5 , 0
2 ;
2
1 ;
2
= = = =


BILATERAL BILATERAL
n k n
t t t t
¬ ¬

j regiunea de respingere: dacă
2 ;
2

>
n
calc
t t
¬
,
sau
2 ;
2

>
n
a
t t
¬
atunci H
0
se
respinge
Determinarea statisticii testului ( t
calculat
) are la bază relaţia :
a a a
a
a calculat
s
a
s
a
s
a
t t =

=

= =
0
µ

i
x
i
y
i

=1447,66296+0,0
7728792*
i
x ¸ )
2
Ö
i i
y y
2
i
x ¸ )
2
x x
i

11488,9 2423 2335,616144 7635,938274 131994823 6283760,468
4976,4 1546 1832,278565 81955,41683 24764557 81346744,29
18020,9 1842 2840,460838 996924,0441 324752837 16202693,92
7012,7 1407 1989,659957 339492,625 49177961,3 48761492,94
5341,6 2181 1860,504113 102717,6133 28532690,6 74892460,25
3883,6 920 1747,818326 685283,181 15082349 102253413,6
8000,7 3891 2066,020422 3330550,462 64011200,5 35939341,57
14160,4 2608 2542,090822 4344,019696 200516928 27144,86905
3540,4 1682 1721,293112 1543,948648 12534432,2 109312106,2
5248,1 1399 1853,277693 206368,2223 27542553,6 76519508,54
9440,8 3188 2177,322755 1021468,493 89128704,6 20746594,75
9026,3 1643 2145,286912 252292,1423 81474091,7 24694369,85
10091 2581 2227,575361 124908,9757 101828281 15246236,96
85707,2 8100 8071,794177 795,5684498 7345724132 5142547407
σ
i
x 195
939
σ
i
y 35411 σ
i
yÖ 16591,38072
σ ¸ )
2
Ö
i i
y y ൌ
7156280,651
σ
2
i
x 8497065
541
σ ¸ )
2
x x
i
57
54773276


a = 1447,66296
b= 0,07728792
¸ )
78 . 250
5754773276 14
8497065541
24 . 772
2
2
=

=

=
¿
¿
x x n
x
s s
i
i
e a


¸ )
24 . 772
12
651 . 7156280
2
Ö
2 1
1
2
2 2
= =

=

A
=

A
=
¿
=
n
y y
n k n
s
n
i
i i
e e
e

64 . 13995
14
195939
14
14
1
= = =
¿
= i
i
x
x
Statistica testului: 772 . 5
78 . 250
66296 . 1447
= = = =
a
a calc
s
a
t t
Concluzia:
-deoarece
2 ; 2 /
>
n calc
t t
¬
( 179 , 2 772 . 5 > ) , deci H
0
se respinge
,
ceea ce însemnă că
¬ este semnificativ diferit de zero (¬ nu este semnificativ statistic)

Testarea semnificaţiei parametrului F :
H
0
: F = 0 (panta F este zero, adică F nu este semnificativ diferit de zero, deci F nu
este semnificativ statistic)
H
1
: F = 0, (panta F nu este diferită de zero, adică F este semnificativ diferit de zero,
deci F este semnificativ statistic)
Deoarece n = 14 30 avem eşantion de volum redus şi pentru testare vom utiliza testul t.
Ştiind că pragul de semnificaţie este 05 , 0 = ¬ şi 1 = k (există un singur factor de
influenţă) se stabileşte:
-valoarea critică:
179 , 2
12 ; 5 , 0 2 15 ; 5 , 0
2 ;
2
1 ;
2
= = = =


BILATERAL BILATERAL
n k n
t t t t
¬ ¬
-regiunea de respingere: dacă
2 ;
2

>
n
calc
t t
¬
sau
2 ;
2

>
n
b
t t
¬
atunci H
0
se respinge
Determinarea statisticii testului ( t
calculat
) are la bază relaţia:
b b b
b
b calc
s
b
s
b
s
b
t t =

=

= =
0 µ

b = 0,07728792
¸ )
0101 . 0
54773276
24 . 772
1
2
= =

=
¿
=
n
i
i
e
b
x x
s
s


Statistica testului este: 59 . 7
0101 . 0
07728792 , 0
= = = =
b
b calc
s
b
t t
Concluzia:
-deoarece
2 ; 2 /
>
n calc
t t
¬
( 179 , 2 59 . 7 > ) , deci H
0
se respinge
,
ceea ce însemnă că H
1
se acceptă, deci F este semnificativ diferit de zero ( F este semnificativ statistic)


Rezolvarea punctului aplicaţiei cu ajutorul programului informatic EXCEL


Coeffici
ents
Standard
Error t Stat
P-
value
Lower
95%
Upper
95%
Lower
95,0%
Upper
95,0%
Interc
ept
1447,66
296
250,78953
85
5,772
422
0,000
088
901,2394
919
1994,08
6 901,2395 1994,086
PIB
xi
0,07728
792
0,0101797
93
7,592
288
0,000
006
0,055108
061
0,09946
8 0,055108 0,099468


Interpretarea rezultatelor din tabelul 3:
Coeficienţii (parametrii) ecuaţiei de regresie liniară ( a=1447,66296 şi b=0,07728792)
ne conduc la scrierea următoarei funcţii de regresie liniare:
i i
x y 07728792 , 0 66296 . 1447 Ö = ,
în care:
Intercept este termenul liber, deci coeficientul a pentru

care s-a stabilit valoarea -
1447.66296 Termenul liber este punctul în care variabila explicativă (factorială) este 0,
deci acel punct în care dreapta de regresie intersectează axa Oy.
Se observă că parametrul ¬ este semnificativ statistic deoarece:
- pragul critic P-value
a
= 0.000088 < pragul de semnificaţie 05 , 0 = ¬
- limita inferioară a intervalului de încredere (lower 95% = 901.2395) este cu
acelasi semn ca limita superioară a intervalului (upper 95% = 1994.086);
.
Se observă că parametrul F este semnificativ statistic deoarece:
- pragul critic P-value
b
= 0,00006 < pragul de semnificaţie 05 , 0 = ¬ ;
- limita inferioară a intervalului de încredere (lower 95% = + 0,055108061 are
acelaşi semn cu limita superioară a respectivului interval (upper 95% = +
0,099468);

5. Să se măsoare intensitatea legăturii dintre variabile folosind coeficientul de corelaţie
şi raportul de corelaţie, testând semnificaţia acestora pentru un nivel de semnificaţie
0,05.

Interpretare rezultate din tabelul SUMMARY OUTPUT:
Regression Statistics
Multiple R 0,90977595
R Square 0,82769227
Adjusted R
Square 0,81333329
Standard Error 772,241362
Observations 14

R= 0,90977595: raportul de corelaţie arată că între PIB si nr.mediu al salariatilor
din agricultura vanatoare si silvicultura este una puternica
R
2
=0,780786: coeficientul de determinaţie indică faptul că 78% din variaţia
numărului mediu de salariati este explicată de PIB.
Abaterea medie pătratică a erorilor
e
s = 772.241362, prin valoarea sa destul de
mare, evidenţiază că punctele empirice ( y ) sunt plasate destul de departe de dreapta
de regresie (în cazul în care acest indicator este zero înseamnă că, toate punctele sunt
plasate pe dreapta de regresie).


Testarea semnificaţiei coeficientului de corelaţie:
- 0 :
0
= p H (coeficientul de corelaţie al colectivităţiii, nu diferă semnificativ de zero, deci
nu este semnificativ statistic);
- 0 :
1
= p H (coeficientul de corelaţie al colectivităţii diferă semnificativ de zero, deci
este semnificativ statistic);

Ştiind că pragul de semnificaţie este 05 , 0 = ¬ şi 1 = k (există un singur factor de
influenţă) se stabileşte:
j valoarea critică:

782 , 1
12 ; 5 , 0 2 14 ; 5 , 0 2 ; 1 ;
= = = =
UNILATERAL UNILATERAL n k n
t t t t
¬ ¬

j regiunea de respingere: dacă
1 ;
>
k n calculat
t t
¬
atunci H
0
se respinge
Determinarea statisticii testului ( t
calculat
) are la bază relaţia:
4 . 16
90 , 0 1
12 90 , 0
1
2
2 2
=

=

= =
r
n r
s
r
t
r
calculat


Concluzie:
Deoarece ¸ ) ¸ ) 782 , 1 4 . 16
1 ;
>
k n calculat
t t
¬

0
H se respinge, deci
1
H este adevărată, prin
urmare coeficientul de corelaţie al coletivitatii, diferă semnificativ de zero, deci este
semnificativ statistic.


Raportul de corelaţie -- se utilizează atât în cazul legăturilor liniare, cât şi în situaţia
celor de tip neliniar

Măsurarea intensităţii legăturii cu raportul de corelaţie R presupune aplicarea relaţiei:

¸ )
¸ )
9097 , 0
Ö
1
2
1
2
=

=
¿
¿
=
=
n
i
i
n
i
i
y y
y y
R

Testarea semnificaţiei raportului de corelaţie:
- se stabileşte ipoteza nulă 0 :
0
= R H (raportul de corelaţie al colectivităţii nu diferă
semnificativ de zero, deci nu este semnificativ statistic);
- se stabileşte ipoteza alternativă 0 :
1
= R H ( raportul de corelaţie al colectivitatii diferă
semnificativ de zero, deci este semnificativ statistic);

Ştiind că pragul de semnificaţie este 05 , 0 = ¬ şi 1 = k (există un singur factor de
influenţă) se stabileşte:
j valoarea critică: 75 , 4
12 ; 1 ; 05 , 0 2 ; 1 ; 1 ; ;
= = = =

F F F F
n k n k tabelar ¬ ¬

j regiunea de respingere: dacă
1 ; ;
>
k n k c
F F
¬
, atunci H
0
se respinge
Determinarea statisticii testului (
c calculat
F F = ) are la bază relaţia:
58 . 58
1
12
83 , 0 1
83 , 0 1
1
2
2
=

=

=
k
k n
R
R
F
c

Concluzie:
Deoarece ¸ ) 75 , 4 ) 58 . 58 (
12 ; 1 ; 05 , 0
F F
calc
> , atunci
0
H se respinge, deci
1
H se acceptă, ceea ce
înseamnă că raportul de corelaţie al colectivităţii diferă semnificativ de zero, deci este
semnificativ statistic.
6.Ce pondere din variaţia variabilei efect este explicată de variatia variabilei
cauză?
R
2
=0,780786: coeficientul de determinaţie indică faptul că 78% din variaţia
numărului mediu de salariati este explicată de PIB.



b)Realizarea şi interpretarea regresiei multifactoriale:
¸ )
i i i i
x x x f y
3 2 1
, , =
Număr mediu salariaţi din agricultură,vânătoare şi silvicultură =
f (Câştig salarial din agricultură,vânătoare şi silvicultură, PIB, Populaţie)
o Să se determine modelul de regresie pe baza datelor din eşantion
o Să se verifice validitatea modelului de regresie pentru un nivel de semnificaţie
0,05.
o Să se testeze semnificaţia parametrilor modelului de regresie, pentru un nivel de
semnificaţie 0,05.
o Să se măsoare intensitatea legăturii dintre variabile folosind raportul de corelaţie,
testând semnificaţia acestuia pentru un nivel de semnificaţie 0,05.
o Ce pondere din variaţia variabilei efect este explicată de variatia variabilelor?

a)
SUMMARY OUTPUT

Regression Statistics
Multiple R 0,911637
R Square 0,831083
Adjusted R
Square 0,780407
Standard Error 837,5841
Observations 14
ANOVA

df SS MS F
Significance
F
Regression 3 34516506 11505502 16,40019 0,000345
Residual 10 7015471 701547,1

Total 13 41531977


Coefficie
nts
Standard
Error t Stat
P-
value
Lower
95%
Upper
95%
Lower
95,0%
Upper
95,0%
Interce
pt 394,4146
2517,35
2
0,1566
78
0,878
616
-
5214,59
6003,4
24 -5214,59
6003,42
4
PIB xi 0,079079
0,05275
2
1,4990
92
0,164
739
-
0,03846
0,1966
17 -0,03846
0,19661
7
Castig
salarial 1,161858
2,60219
2
0,4464
92
0,664
755
-
4,63619
6,9599
02 -4,63619
6,95990
2
Populat
ia -0,23098
2,60940
6
-
0,0885
2
0,931
213 -6,0451
5,5831
42 -6,0451
5,58314
2


RESIDUAL OUTPUT


Observation
Predicted Nr mediu salariati
in agricultura yi Residuals
1 2288,104 134,8956
2 1687,201 -141,201
3 2914,467 -1072,47
4 1981,885 -574,885
5 1944,105 236,8948
6 1720,118 -800,118
7 2227,596 1663,404
8 2615,782 -7,78176
9 1582,574 99,42605
10 1796,071 -397,071
11 2025,508 1162,492
12 2295,521 -652,521
13 2288,679 292,3209
14 8043,389 56,61098

In vederea contruirii functiei de regresie vom completa urmatprul tabel
Coefficients Coeficienţii
Intercept 394.4146 0
b termen liber
PIB 0.079079 1
b coeficient de regresie (primul factor)
Castig salarial 1.161858 2
b coeficient de regresie (al doilea factor)
Populatia -0.23098 3
b coeficiente de regresie(al treilea factor)

Modelul de regresie este deci
i i i x x x
x x y
2 1 , , ,
. 161858 . 1 . 079079 . 0 394.4146 Ö
3 2 1
= -0.23098ݔ
ଷ௜

b) Să se verifice validitatea modelului de regresie pentru un nivel de semnificaţie 0,05.

Tabel 2 ----
ANOVA
df
(grade de
libertate)
SS (varianţa)
(suma
pătratelor)
MS
(media
patratelor)
(dispersia
corectată)
F(calculat) Significance F
Regression
(variaţia
k df =
1

2
/ x y
A
k
s
x y
x y
2
/ 2
/
A
=
Testul 0.000345
datorată
regresiei)
3 34516506 11505502
F=16.4001
9
F=
2
/ x y
s /
2
e
s
< 05 , 0 = ¬
(se respinge H
0

±
Modelul este
valid)

Residual
(variaţia
reziduală)
1
1
= k n df
10
2
e
A
701547.1
1
2
2

A
=
k n
s
e
e
701547.1
Total
(variaţia
totală)
2 1 1
df df df =
1
1
= n df
13
e x y y
A A = A
/
2

41531977



H
0
: modelul nu este valid statistic
H
1
: modelul este valid statistict
Ştiind că pragul de semnificaţie este 05 , 0 = ¬ şi 3 = k (există trei factori de influenţă) se
stabileşte:
j valoarea critică:
71 . 3
10 ; 3 ; 05 , 0 1 3 ; 3 ; 1 ; ;
= = = =

F F F F
n k n k tabelar ¬ ¬

j regiunea de respingere: dacă
1 ; ;
>
k n k c
F F
¬
, atunci H
0
se respinge
Determinarea statisticii testului (
calculat
F ) are la bază relaţia:
40019 . 16
1 . 701547
11505502
2
2
/
= = =
e
x y
s
s
F

Decizia: deoarece
calculat
F (16.40019) >
1 ; ; k n k
F
¬
(3.71)
0
H se respinge, deci
1
H este
adevărată, prin urmare, modelul este valid.

c) Să se testeze semnificaţia parametrilor modelului de regresie, pentru un nivel de
semnificaţie 0,05.
Tabel
3

Coefficie
nts
Standard
Error t Stat P-value Lower 95% Upper 95%

(Abaterea
medie
patratica)
Testul t
Limita inf. a
intervalului de
incredere
Limita sup. a
intervalului
de incredere
Interc
ept
b
0
=
394.414
6
0
b
s

2517.352
0
0
0
b
b
s
b
t =
0,156678

0,878616>0,05
coeficientul b
0
nu este
semnificativ
-5214.59


6003.424


PIB
b
1
=
0.07907
9
1
b
s
0.052752
1
1
1
b
b
s
b
t =

1.499092

0,164739>0,05
coeficientul b
1
nu este
semnificativ
-0.03846


0.196617


Castig
salaria
l
b
2
=1.161
858
2
b
s

2.602192
2
2
2
b
b
s
b
t =
0.446492

0,664755>0,05
coeficientul b
2

nu este
semnificativ
-4.63619

6.959902


Popul
atia
3
b =-
0.23098
3 b
s
2.609406
3
3
3
b
b
s
b
t =
-0.08852
0,931213>0,05
coeficientul b
3

nu este
semnificativ
-6.0451

5.583142


I. Testarea semnificaţiei parametrului
0
F :
H
0
:
0
F = 0 (panta
0
F este zero, adică
0
F nu este semnificativ diferit de zero, deci
0
F
nu este semnificativ statistic)
H
1
:
0
F = 0, (panta
0
F nu este diferită de zero, adică
0
F este semnificativ diferit de zero,
deci
0
F este semnificativ statistic)
Deoarece n = 14 30 avem eşantion de volum redus şi pentru testare vom utiliza testul t.
Ştiind că pragul de semnificaţie este 05 , 0 = ¬ şi 3 = k (există trei factori de influenţă) se
stabileşte:
j valoarea critică:
228 . 2
10 ; 5 , 0 4 14 ; 5 , 0
4 ;
2
1 ;
2
= = = = =


BILATERAL BILATERAL
n k n
critic
t t t t t
¬ ¬

j regiunea de respingere: dacă
4 ;
2

>
n
calc
t t
¬
sau
4 ;
2
0

>
n
b
t t
¬
atunci H
0

se respinge
Statistica testului este: 156678 . 0
0
0
0
= = =
b
b calc
s
b
t t
Decizia:
Se observă că parametrul
0
F nu este semnificativ statistic deoarece:
i. din compararea statisticii testului cu valoarea testului critic (tabelar sau teoretic) rezultă
că: ¸ ) ¸ ) ¸ ) 228 , 2 156678 , 0 228 , 2
0 critic b critic
t t t ;
ii. pragul critic P-value
0
b = 0,878616 > 05 , 0 = ¬ pragul de semnificaţie
iii. limita inferioară a intervalului de încredere (lower 95% = -5214.5) este cu semn contrar
faţă de limita superioară a intervalului (upper 95% = +6003.424);

II. Testarea semnificaţiei parametrului
1
F :
H
0
:
1
F = 0 (panta
1
F este zero, adică
1
F nu este semnificativ diferit de zero, deci
1
F
nu este semnificativ statistic)
H
1
:
1
F = 0, (panta
1
F nu este diferită de zero, adică
1
F este semnificativ diferit de zero,
deci
1
F este semnificativ statistic)
Deoarece n = 14 30 avem eşantion de volum redus şi pentru testare vom utiliza testul t.
Ştiind că pragul de semnificaţie este 05 , 0 = ¬ şi 3 = k (există trei factori de influenţă) se
stabileşte:
j valoarea critică:
j
228 , 2
10 ; 5 , 0 4 14 ; 5 , 0
4 ;
2
1 ;
2
= = = = =


BILATERAL BILATERAL
n k n
critic
t t t t t
¬ ¬
j regiunea de respingere: dacă
4 ;
2

>
n
calc
t t
¬
sau
4 ;
2
1

>
n
b
t t
¬ atunci H
0
se
respinge
Statistica testului este: 499092 . 1
1
1
1
== = =
b
b calc
s
b
t t
Decizia:
Se observă că parametrul
1
F nu este semnificativ statistic deoarece:
iv. din compararea statisticii testului cu valoarea testului critic (tabelar sau teoretic) rezultă
că: ¸ ) ¸ ) 228 , 2 499092 . 1
critic c
t t ;

v. pragul critic P-value
0
b = 0,164739> 05 , 0 = ¬ pragul de semnificaţie
vi. limita inferioară a intervalului de încredere (lower 95% = -0.03846) este cu semn diferit
fata de limita superioară a intervalului (upper 95% = +0.03546);

III. Testarea semnificaţiei parametrului
2
F :
H
0
:
2
F = 0 (
2
F este zero, adică
2
F nu este semnificativ diferit de zero, deci
2
F nu este
semnificativ statistic)
H
1
:
2
F = 0, (
2
F nu este diferit de zero, adică
2
F este semnificativ diferit de zero, deci
2
F este semnificativ statistic)
Deoarece n = 14 30 avem eşantion de volum redus şi pentru testare vom utiliza testul t.
Ştiind că pragul de semnificaţie este 05 , 0 = ¬ şi 3 = k (există trei factori de influenţă) se
stabileşte:
j valoarea critică:
228 , 2
10 ; 5 , 0
4 ;
2
1 ;
2
= = = =

BILATERAL
n k n
critic
t t t t
¬ ¬
j regiunea de respingere: dacă
4 ;
2

>
n
calc
t t
¬
sau
4 ;
2
2

>
n
b
t t
¬
atunci H
0
se
respinge
Statistica testului este: 446942 . 0
2
2
2
= = =
b
b calc
s
b
t t
Decizia:
Se observă că parametrul
2
F nu este semnificativ statistic deoarece:
vii. din compararea statisticii testului cu valoarea testului critic (tabelar sau teoretic) rezultă
că:
¸ ) ¸ ) ¸ ) 228 , 2 446942 . 0 228 , 2
2 critic b critic
t t t
viii. pragul critic P-value
2
b = 0,664755 > 05 , 0 = ¬ pragul de semnificaţie
ix. limita inferioară a intervalului de încredere (lower 95% = - 4.63619) este cu semn contrar
faţă de limita superioară a intervalului (upper 95% = + 6.959902);

IIV. Testarea semnificaţiei parametrului
3
F :
H
0
:
3
F = 0 (
3
F este zero, adică
3
F nu este semnificativ diferit de zero, deci
3
F nu
este semnificativ statistic)
H
1
:
3
F = 0, (
3
F nu este diferit de zero, adică
3
F este semnificativ diferit de zero, deci
3
F este semnificativ statistic)
Deoarece n = 14 30 avem eşantion de volum redus şi pentru testare vom utiliza testul t.
Ştiind că pragul de semnificaţie este 05 , 0 = ¬ şi 3 = k (există trei factori de influenţă) se
stabileşte:
j valoarea critică:
228 , 2
10 ; 5 , 0
4 ;
2
1 ;
2
= = = =

BILATERAL
n k n
critic
t t t t
¬ ¬
j regiunea de respingere: dacă
4 ;
2

>
n
calc
t t
¬
sau
4 ;
2
2

>
n
b
t t
¬
atunci H
0
se
respinge
Statistica testului este: 8852 . 0
3
3
3
= = =
b
b calc
s
t t
b

Decizia:
Se observă că parametrul
3
F nu este semnificativ statistic deoarece:
x. din compararea statisticii testului cu valoarea testului critic (tabelar sau teoretic) rezultă
că:
¸ ) ¸ ) ¸ ) 228 , 2 8852 . 0 228 , 2
2 critic b critic
t t t
xi. pragul critic P-value
2
b = 0,931213 > 05 , 0 = ¬ pragul de semnificaţie
xii. limita inferioară a intervalului de încredere (lower 95% = - 6.0451) este cu semn contrar
faţă de limita superioară a intervalului (upper 95% = + 5.583142);


d)Să se măsoare intensitatea legăturii dintre variabile folosind raportul de corelaţie,
testând semnificaţia acestuia pentru un nivel de semnificaţie 0,05.
SUMMARY OUTPUT

Regression Statistics
Multiple R 0,911637
R Square 0,831083
Adjusted R
Square 0,780407
Standard Error 837,5841
Observations 14

Din tabel avem Multiple R (Raportul de corelaţie): 911637 , 0 = R ceea ce înseamnă că
legătura dintre numărul mediu salariaţi din agricultură,vânătoare şi silvicultură ,
câştigul salarial din agricultură,vânătoare şi silvicultură, PIB si populaţie este una
puternica

Testarea semnificaţiei raportului de corelaţie:
Ipoteza nulă 0 :
0
= R H (raportul de corelaţie al colectivităţii nu diferă semnificativ de zero,
deci nu este semnificativ statistic);
Ipoteza alternativă 0 :
1
= R H ( raportul de corelaţie al colectivităţii diferă semnificativ
de zero, deci este semnificativ statistic);

Ştiind că pragul de semnificaţie este 05 , 0 = ¬ şi 3 = k (există trei factori de influenţă) se
stabileşte:
j valoarea critică:

71 . 3
10 ; 3 ; 05 , 0 4 ; 3 ; 1 ; ;
= = = =

F F F F
n k n k tabelar ¬ ¬
j regiunea de respingere: dacă
1 ; ;
>
k n k c
F F
¬
, atunci H
0
se respinge
Determinarea statisticii testului (
c calculat
F F = ) are la bază relaţia:
92 . 4
831083 , 0 1
831083 , 0 1
1
2
2
=

=

=
k
k n
R
R
F
c

Concluzie:
Deoarece ¸ ) 71 . 3 ) 92 . 4 (
10 ; 3 ; 05 , 0
F F
c
> , atunci
0
H se respinge, deci
1
H se acceptă, ceea
ce înseamnă că raportul de corelaţie al colectivităţii din care s-a extras eşantionul de 14
unităţi, diferă semnificativ de zero, deci este semnificativ statistic.

e) Ce pondere din variaţia variabilei efect este explicată de variatia variabilelor?
SUMMARY OUTPUT

Regression Statistics
Multiple R 0,911637
R Square 0,831083
Adjusted R
Square 0,780407
Standard Error 837,5841
Observations 14


COEFICIENTUL DE DETERMINAŢIE (R Square -
2
R ) ne indică pondrea de influenţă a
factorului ( x ) în variaţia rezultatului ( y )
R SQUARE - 831083 , 0
2
= R ne arată că, 83.108% reprezintă influenţa celor 3 factori
asupra variaţiei nr mediu de salariati.

xi
Nr. mediu salaria i din agricultur ,vân toare i silvicultur = f (PIB)

1.S se reprezinte grafic datele 2.S se determine modelul de regresie pe baza datelor din e antion 3.S se verifice validitatea modelului de regresie pentru un nivel de semnifica ie 0,05. 4.S se testeze semnifica ia parametrilor modelului de regresie, pentru un nivel de semnifica ie 0,05. 5.S se m soare intensitatea leg turii dintre variabile folosind coeficientul de corela ie i raportul de corela ie, testând semnifica ia acestora pentru un nivel de semnifica ie 0,05. 6.Ce pondere din varia ia variabilei efect este explicat de variatia variabilei cauz ?

1)Construirea i comentarea graficului Graficul construit, denumit corelogram , ne indic existen a, forma i direc ia leg turii dintre cele dou variabile: Corelograma dintre nr. mediu salaria i din agricultur ,vân toare i silvicultur i PIB

Eviden iaz leg tura direct (punctele sunt plasate pe direc ia primei bisectoare)

b) Aplicarea modelului liniar de regresie presupune utilizarea ecua iei de regresie liniar : Ö y i ! a  bxi Parametrii a i b se determin cu ajutorul metodei celor mai mici p trate: § .2)Estimarea parametrilor modelului liniar de regresie (a.

y i i Ö 2  y i min  § .

7 14160.7 5341.322755 2145.3 10091 85707.9 4976.1 9440.504113 1747.6 920 15082349 3891 64011200.4 3540.5 2608 200516928 1682 12534432. unde n=14 judete 2 ± § xi  b § xi ! § xi y i a ± i !1 i !1 i !1 ° Pentru a rezolva sistemul vom folosi urm torul tabel în care sunt prezentate valorile intermediare: Nr mediu salariati in agricultura PIB xi 11488.9 7012.616144 1832.8 9026.9 30097270 14830211 26044871 694228320 =1447.794177 2423 131994823 1546 24764557 1842 324752837 1407 49177961.286912 2227.575361 8071.38072 Sistemul de ecua ii normale devine: .278565 2840.0772879 2* x i 2335.460838 1989.020422 2542.090822 1721.9 11650030 3572912 31130724 36930323 5954952.818326 2066.4 18020.4 33194498 9866868.6 8000.66296+0.659957 1860.2 xi yi xi2 x i yi 27837605 7693514.8 7342091.2 1399 27542553.277693 2177.3 2181 28532690.6 1643 81474091.6 3883.7 2581 101828281 8100 7345724132 yi 195939 3541 1 xi2 849 7065541 x i y i =940374191 16591.6 3188 89128704.y i i  a  bx i min 2  aplicarea ei conducând la n n ® na  b§ xi ! § y i ± ± ob inerea sistemului de ecua ii normale: ¯ n i !1 n i !1 n .293112 1853.4 5248. unde 14 ® ™ a  b ™195939 ! 35411 ¯ a ° ™195939  b ™ 8497065541 ! 940374191 .

36 salariati in medie in agricultura vanatoare si silvicultura 14 . 05. tiind c pragul de semnifica ie este E ! 0.regiunea de respingere: dac 5.Determinarea statisticii Fc " FE .H0: modelul nu este valid statistic 2.07728792 3) 1. deci între nr. k .05 i k ! 1 (exist un singur factor de influen ) se stabile te: 4. mediu de salariati si PIB exist o leg tur direct -la cre terea cu o unitate a PIB .12 ! 4.07728792 -b> 0.n 2 ! F0.a! (a ! ( § yi ™ § xi2  § xi ™ § xi yi i !1 i !1 i !1 n ¨ n ¸ n§ x 2i © § xi ¹ ª i !1 º i !1 i !1 2 n n n n ! 35411 ™ 8497065541  195939 ™ 94037191 ! 1447.66296 14 ™ 8497065541  1959392 b! (b ! ( n§ xi yi  § xi ™ § yi i !1 i !1 n n n ¨ ¸ n § xi2  © § xi ¹ i !1 ª i !1 º n n i !1 2 ! 14 ™ 940374191  195939 ™ 35411 ! 0.2. k .1.H1: modelul este valid statistict 3.64 ! 46.1.valoarea critic : Ftabelar ! FE .66296  0.30 1.75 4. Nr mediu de salariati se m re te cu 0.07728792 14 ™ 8497065541  1959392 Deci: Ö yi ! 1447.07728792 ™ xi Interpretare: b = + 0.72 Pentru determinarea statisticii testului F se folose te urm torul algoritm de calcul: y! §y i !1 15 i 15 ! 35411 ! 2529.1. n k 1 ! FE . atunci H0 se respinge testului ( Fcalculat ) are la baz rela ia: F! s2/ x y s 2 e ! 79. n  k 1 .

-SS .Sum of Squares .suma p tratelor = varian a SST=SSR + SSE 2 Ö SSR= ( y / x ! § y i  y i !1 n .

! 34375693 2 Ö SS= (2e ! § .

y i  y i 2 ! 7156280.65 i !1 n 2 SST= ( y ! § y i  y i !1 n .

degree of freedom .grade de libertate k=1 n ± k ± 1 = 12 n ± 1 = k + (n ± k ± 1) = 1 + 12 = 13 -MS .media p tratelor = dispersia corectat MS = SS : df s 2 y/x (2x 34375693 ! ! ! 34375693 k 1 (2e 7156280. ! 41531977 2 -df .72 n  k 1 14  1  1 2 e .65 s ! ! ! 596356.

24 Error 14 Observatio ns 14 ANOVA df Regression Residual Total 1 12 13 Coeffic SS MS 3437569 34375 7 697 59635 6.64 596356.64) " FE . modelul este valid.testul F F! s 2/ x y se2 ! 34375693 ! 57.7 7156281 4153197 7 Standard t Stat F 57.9097 Multiple R 76 0. deci H 1 este adev rat .75)   H 0 se respinge. Rezolvarea punctului aplica iei cu ajutorul programului informatic EXCEL SUMMARY OUTPUT Regression Statistics 0.64 284 Significa nce F 0. prin urmare. k .00000 6 P- Lower Upper Lower Upper .72 6.8133 Square 33 Standard 772. nk 1 (4.Concluzie: Deoarece Fcalculat (57.-F --.8276 R Square 92 Adjusted R 0.

0994 68 95.239 5 0.000 088 0.772 422 7.05510 8 95.239 4919 0.0772 88 Error 250.592 288 value 0.0 86 0.6 63 0.05510 8061 95% 1994.08 6 0.7895 0.09946 8 Pentru aplicarea testului F se completeaz tabelul: MS df SS =SS : df (degree of freedom) (grade de libertate) Regressio n (varia ia datorat regresiei) (Sum of Squares) (suma p tratelor= varian a) (media p tratelor = dispersia corectat ) 2 sy/ x ! F Significance F (Statistica testul (probabilitate F a critic ) sau Fcalculat ) Sursa varia iei k SSR= Ö (2y / x ! § yi  y i !1 n .000 006 95% 901.Intercept PIB xi ients 1447.01018 5.0% 901.0% 1994.

56 SS= 34375696. 2 (2y / x k = 1 34375696.56 Testul 2 F= s y / x / se2 n-k-1 Residual (varia ia rezidual ) 12 Ö 2 (2e ! § .

7 F = 57.000006< 0.64284 n-1 Total (varia ia total ) SST=41531977.y i  y i i !1 n (2e = s ! n  k 1 2 e 0.21 (2y ! § y i  y = 2 i !1 n .651 596356.05 (resping H0 ± model valid) 7156280.

2 sy ! (2y n 1 13 SST=SSR + SSE Not : k ± reprezint num rul variabilelor factoriale (în cazul modelului unifactorial k = 1). Interpretare rezultate din tabelul 2 ANOVA: .

75). -Significance F (probabilitatea critic ) este 0. k .Fcalculat (57.66296  0.07728792 x i ) este valid i poate fi utilizat pentru analiza dependen ei dintre cele dou variabile. întrucât: . nk 1 (4.64) " FE . Ö Modelul de regresie construit ( y i ! 1447.000006 mai mic decât pragul de semnifica ie .În acest tabel este calculat statistica testului F pentru validarea modelului de regresie.

278565 2840.616144 1832. (i E este semnificativ statistic) Deoarece n = 14 t. tiind c pragul de semnifica ie este E ! 0.460838 Ö . pentru un nivel de semnifica ie 0. sau are ta " tE 2 .5 BILATERAL. n 2 atunci H0 se rela ia : respinge Determinarea statisticii testului a  Qa a  0 a t calculat ! t a ! ! ! sa sa sa Ö yi tcalculat ) la baz xi 11488.n k 1 ! tE 2 j .la nivelul e antionului este: Testarea semnifica iei parametrului E: H0 : E = 0 (E nu este semnificativ statistic) H1 : E { 0.179 t calc " t E 2 .9 4976.05 Ecua ia de regresie .S se testeze semnifica ia parametrilor modelului de regresie. ! 0.9 yi 2423 1546 1842 =1447.05 i influen ) se stabile te: Valoarea critic : 30 avem e antion de volum redus i pentru testare vom utiliza testul yi ! E  F xi  I i yi ! a  bxi  ei k ! 1 (exist un singur factor de tE 2 .66296+0.la nivelul colectivit ii generale este: .05 .n  2 regiunea de respingere: dac ( .5 BILATERAL. E 4.12 ! 2.0 7728792* xi 2335.14 2 ! t 0.n 2 ! t 0.4 18020.

y i  yi 2 7635.938274 81955.41683 996924.0441 xi2 131994823 24764557 324752837 .

92 .29 16202693.468 81346744.x  x 2 i 6283760.

7012.9757 795.948648 206368.1423 124908.3 10091 85707.2 1407 2181 920 3891 2608 1682 1399 3188 1643 2581 8100 1989.2223 1021468.090822 1721.625 102717.659957 1860.7 5341.1 9440.322755 2145.4 3540.38072 339492.181 3330550.794177 Ö yi 16591.277693 2177.6 8000.293112 1853.5684498 Ö .493 252292.6133 685283.6 3883.020422 2542.504113 1747.8 9026.575361 8071.462 4344.7 14160.4 5248.286912 2227.818326 2066.019696 1543.

25 102253413.57 27144.6 35939341.3 28532690.7 101828281 7345724132 xi2 8497065 541 48761492.y i  yi 2 7156280.85 15246236.2 27542553.96 5142547407 xi 195 939 .86905 109312106.2 76519508.651 49177961.94 74892460.5 200516928 12534432.75 24694369.6 15082349 64011200.6 81474091.54 20746594.6 89128704.

07728792 s a ! se §x n§ .66296 b= 0.x  x 57 2 i yi 35411 54773276 a = 1447.

78 14 ™ 5754773276 Ö 2  yi ! se ! 14 ( ( ! ! n  k 1 n2 2 e 2 e § .24 ™ n 8497065541 ! 250.x  x 2 i i 2 ! 772.

64 14 Statistica testului: t calc ! t a ! Concluzia: -deoarece t calc " t E / 2.651 ! 772. deci H0 se respinge .y i !1 i n2 7156280.66296 ! ! 5. deci F nu este semnificativ statistic) .772 250. adic F nu este semnificativ diferit de zero.24 12 x! §x i !1 i 14 ! 195939 ! 13995.n  2 a 1447.78 sa ( 5. ceea ce însemn c E este semnificativ diferit de zero (E nu este semnificativ statistic) Testarea semnifica iei parametrului F : H0 : F = 0 (panta F este zero.179 ) .772 " 2.

24 54773276 § .H1 : F { 0.n  2 -regiunea de respingere: dac t calc " t E sau tb " t E 2 .07728792 sb ! se !  x 2 b  Qb b  0 b ! ! sb sb sb 772.179 2 . n  k 1 ! tE 2 . k ! 1 (exist un singur factor de pragul de semnifica ie este E ! 0.05 i influen ) se stabile te: -valoarea critic : t E 2 .n 2 ! t 0 . (panta F nu este diferit de zero. adic F este semnificativ diferit de zero. 12 ! 2. deci F este semnificativ statistic) Deoarece n = 14 tiind c 30 avem e antion de volum redus i pentru testare vom utiliza testul t.152 ! t 0 .5 BILATERAL .n  2 atunci H0 se respinge Determinarea statisticii testului ( tcalculat ) are la baz rela ia: t calc ! tb ! b = 0.5 BILATERAL .

772 422 7.66 296 0.08 088 919 6 0.099468 .000 0.59 0.07728 792 Standard Error 250. deci F este semnificativ diferit de zero ( F este semnificativ statistic) Rezolvarea punctului aplica iei cu ajutorul programului informatic EXCEL Interc ept PIB xi Coeffici ents 1447.2395 0.x i !1 n ! 0.592 288 PLower Upper value 95% 95% 0.0% 1994.78953 85 0.n 2 b 0.0101 i Statistica testului este: t calc ! t b ! Concluzia: -deoarece t calc " tE / 2.2394 1994.086 0. ceea ce însemn c H1 se accept .0% 901. deci H0 se respinge .0101797 93 t Stat 5.055108 Upper 95.59 " 2.09946 006 061 8 Lower 95.000 901.0101 sb ( 7.055108 0.07728792 ! ! 7.179 ) .

mediu al salariatilor din agricultura vanatoare si silvicultura este una puternica R2 =0.66296 Termenul liber este punctul în care variabila explicativ (factorial ) este 0. Se observ c parametrul F este semnificativ statistic deoarece: pragul critic P-value b = 0.07728792) Ö ne conduc la scrierea urm toarei func ii de regresie liniare: y i ! 1447. limita inferioar a intervalului de încredere (lower 95% = + 0.66296 i b=0.00006 < pragul de semnifica ie E ! 0. eviden iaz c punctele empirice ( y ) sunt plasate destul de departe de dreapta    . Interpretare rezultate din tabelul SUMMARY OUTPUT: Regression Statistics Multiple R 0. S se m soare intensitatea leg turii dintre variabile folosind coeficientul de corela ie i raportul de corela ie.82769227 Adjusted R 0.90977595 R Square 0. 5.055108061 are acela i semn cu limita superioar a respectivului interval (upper 95% = + 0. Abaterea medie p tratic a erorilor se = 772. deci coeficientul a pentru care s-a stabilit valoarea 1447.780786: coeficientul de determina ie indic faptul c 78% din varia ia num rului mediu de salariati este explicat de PIB.099468).Interpretarea rezultatelor din tabelul 3: Coeficien ii (parametrii) ecua iei de regresie liniar ( a=1447. testând semnifica ia acestora pentru un nivel de semnifica ie 0.05 limita inferioar a intervalului de încredere (lower 95% = 901.241362.05.241362 Observations 14 R= 0. deci acel punct în care dreapta de regresie intersecteaz axa Oy.81333329 Square Standard Error 772.07728792 xi .086).2395) este cu acelasi semn ca limita superioar a intervalului (upper 95% = 1994. Se observ c parametrul E este semnificativ statistic deoarece: .66296  0. prin valoarea sa destul de mare. în care:  Intercept este termenul liber.90977595: raportul de corela ie arat c între PIB si nr. pragul critic P-value a = 0.05 .000088 < pragul de semnifica ie E ! 0.

4 sr 1 r2 1  0.782 regiunea de respingere: dac tcalculat " tE .n  k 1 ! tE . nu difer semnificativ de zero.n  2 ! t 0.H 0 : V ! 0 (coeficientul de corela ie al colectivit iii. deci este semnificativ statistic). deci nu este semnificativ statistic). pragul de semnifica ie este E ! 0.de regresie (în cazul în care acest indicator este zero înseamn c .90 2 Concluzie: Deoarece t calculat . n k 1 atunci H0 se respinge Determinarea statisticii testului ( tcalculat ) are la baz rela ia: j t calculat ! r r n  2 0. 12 ! 1. Testarea semnifica iei coeficientului de corela ie: .90 ™ 12 ! ! ! 16. 5 UNILATERAL . toate punctele sunt plasate pe dreapta de regresie). .H 1 : V { 0 (coeficientul de corela ie al colectivit ii difer semnificativ de zero. 5 UNILATERAL .14  2 ! t 0.05 i influen ) se stabile te: tiind c j k ! 1 (exist un singur factor de valoarea critic : tE .

4 " tE . . n  k 1 .

. difer semnificativ statistic. deci este urmare coeficientul de corela ie al coletivitatii. Raportul de corela ie -. prin semnificativ de zero.782 16 1   H 0 se respinge.se utilizeaz atât în cazul leg turilor liniare. cât i în situa ia celor de tip neliniar M surarea intensit ii leg turii cu raportul de corela ie R presupune aplicarea rela iei: . deci H 1 este adev rat .

R! Ö § .

y n i y y 2 § .

1. k .y i !1 i !1 n ! 0.se stabile te ipoteza alternativ H1 : R { 0 ( raportul de corela ie al colectivitatii difer semnificativ de zero. pragul de semnifica ie este E ! 0. 1.05. 12 .n 2 ! F0 . k . deci nu este semnificativ statistic).05 i influen ) se stabile te: tiind c j j k ! 1 (exist un singur factor de valoarea critic : Ftabelar ! FE . n k 1 .12 ! 4.1. deci este semnificativ statistic).se stabile te ipoteza nul H 0 : R ! 0 (raportul de corela ie al colectivit ii nu difer semnificativ de zero. n  k 1 ! FE .05. .9097 2 i Testarea semnifica iei raportului de corela ie: . atunci H0 se respinge Determinarea statisticii testului ( Fcalculat ! Fc ) are la baz rela ia: Fc ! Concluzie: Deoarece Fcalc (58.75 regiunea de respingere: dac Fc " FE .58) " F0 .

4.83 1 1 R b)Realizarea i interpretarea regresiei multifactoriale: yi ! f .Ce pondere din varia ia variabilei efect este explicat de variatia variabilei cauz ?  R2 =0. ceea ce înseamn c raportul de corela ie al colectivit ii difer semnificativ de zero. deci H 1 se accept .75 . atunci H 0 se respinge. 6.58 2 k 1  0. faptul c 78% din varia ia R2 n  k 1 0.83 12 ™ ! ™ ! 58.780786: coeficientul de determina ie indic num rului mediu de salariati este explicat de PIB. deci este semnificativ statistic.

x 2 i . x3i Num r mediu salaria i din agricultur .x1i .vân toare i silvicultur = .

23098 t Stat 0.664 755 0.05.f (Câ tig salarial din agricultur .1566 78 1.0451 -6.59 0.878 616 0.5831 42 Upper 95. testând semnifica ia acestuia pentru un nivel de semnifica ie 0.000345 10 7015471 701547.60940 6 -0.60219 1.931 213 Lower 95% 5214. PIB.35 2 394.911637 R Square 0.4 24 -5214.1966 17 -0.95990 2 5. pentru un nivel de semnifica ie 0.vân toare i silvicultur .4990 92 0.05275 0. o S se testeze semnifica ia parametrilor modelului de regresie. Popula ie) o S se determine modelul de regresie pe baza datelor din e antion o S se verifice validitatea modelului de regresie pentru un nivel de semnifica ie 0.59 0. o S se m soare intensitatea leg turii dintre variabile folosind raportul de corela ie.40019 0.5841 Observations 14 ANOVA Significance df SS MS F F 3 34516506 11505502 16.03846 6.4464 92 0.0451 RESIDUAL OUTPUT Predicted Nr mediu salariati in agricultura yi Observation Residuals .161858 2 2.4146 0.0% 6003.9599 02 -4.164 739 0.63619 5.58314 2 -6.05.780407 Standard Error 837.079079 2 2.831083 Adjusted R Square 0.0% 6003.1 13 41531977 Regression Residual Total Coefficie nts Interce pt PIB xi Castig salarial Populat ia Standard Error 2517. o Ce pondere din varia ia variabilei efect este explicat de variatia variabilelor? a) SUMMARY OUTPUT Regression Statistics Multiple R 0.19661 7 6.05.0885 2 Pvalue 0.63619 Upper Lower 95% 95.03846 4.42 4 0.

467 1981.079079 1.201 -1072.118 1663.574 1796.389 134.521 292.i ! 394.23098 Coeficien ii b0 termen liber b1 coeficient de regresie (primul factor) b2 coeficient de regresie (al doilea factor) b3 coeficiente de regresie(al treilea factor) Modelul de regresie este deci Ö y x1 .104 1687.885 1944.596 2615.118 2227.1 2 3 4 5 6 7 8 9 10 11 12 13 14 2288.201 2914.4146 0. x2 .05.079079.47 -574.521 2288.782 1582. MS df Tabel 2 ---ANOVA (grade de libertate) SS (varian a) (suma p tratelor) (media patratelor) (dispersia corectat ) s 2 y/x F(calculat) Significance F Regression (varia ia df 1 ! k (2y / x ! (2y / x k Testul 0.4146  0.404 -7.161858 -0.071 2025.3209 56.492 -652.8948 -800. x3 .105 1720.508 2295.885 236.42605 -397.23098 b) S se verifice validitatea modelului de regresie pentru un nivel de semnifica ie 0.161858.x 2i -0.x1i  1.78176 99.071 1162.000345 .679 8043.8956 -141.61098 In vederea contruirii functiei de regresie vom completa urmatprul tabel Coefficients Intercept PIB Castig salarial Populatia 394.

05 i k ! 3 (exist trei factori de influen ) se stabile te: j valoarea critic : Ftabelar ! FE . c) S se testeze semnifica ia parametrilor modelului de regresie.10 ! 3. atunci H0 se respinge ( Determinarea F! 2 sy/ x Fcalculat ) are la baz rela ia: s 2 e ! 11505502 ! 16.05. n k 1 . deci H 1 este adev rat .71 j regiunea de respingere: dac statisticii testului Fc " FE . n k 1 (3.05 (se respinge H0 ± Modelul valid) este df 1 ! n  k  1 10 ( 2 e s e2 ! 701547.n 31 ! F0 .datorat regresiei) Residual (varia ia rezidual ) Total (varia ia total ) 3 34516506 11505502 F=16. prin urmare. k .1 ( n  k  1 F= s 2 / s 2 y/ x e 701547.71)   H 0 se respinge. 3.4001 9 < E ! 0.3. Coefficie Standard t Stat P-value Lower 95% Upper 95% nts Error Tabel 3 (Abaterea medie patratica) Limita inf. modelul este valid. k . k .1 Decizia: deoarece Fcalculat (16.40019) " FE . a intervalului de incredere .05.1 2 e df 1 ! df 1  df 2 (2y ! ( y / x  ( e df1 ! n  1 13 41531977 H0: modelul nu este valid statistic H1: modelul este valid statistict tiind c pragul de semnifica ie este E ! 0. pentru un nivel de semnifica ie 0. n k 1 ! FE .40019 701547. a Testul t intervalului de incredere Limita sup.

23098 sb3 2. deci F 0 nu este semnificativ statistic) H1 : F 0 { 0.05 coeficientul b0 nu este semnificativ 0.446492 Popul atia b3 =0.959902 0.n  4 ! t0.59 6003.63619 6.602192 tb2 ! b2 sb 2 0.05 -4.583142 -0. (panta F 0 nu este diferit de zero.03846 coeficientul b1 nu este semnificativ 0.n k 1 ! tE 2 .878616>0. deci F 0 este semnificativ statistic) Deoarece n = 14 30 avem e antion de volum redus i pentru testare vom utiliza testul t.664755>0.156678 PIB b1= 0.352 tb0 ! b0 sb 0 0.07907 9 t b1 ! s b1 0. Testarea semnifica iei parametrului F 0 : H0 : F 0 = 0 (panta F 0 este zero. adic F 0 nu este semnificativ diferit de zero.161 858 sb2 2.05 -0.144 ! t0. adic F 0 este semnificativ diferit de zero.228 .414 6 sb0 2517.05 i k ! 3 (exist trei factori de influen ) se stabile te: j valoarea critic : tcritic ! t E 2 . 10 ! 2.609406 t b3 b ! 3 s b3 coeficientul b3 nu este semnificativ -6.08852 I.0451 5.931213>0.5 BILATERAL.499092 Castig salaria l b2=1.164739>0.196617 -5214.05 coeficientul b2 nu este semnificativ 0.052752 b1 sb1 1.5 BILATERAL.424 0. tiind c pragul de semnifica ie este E ! 0.Interc ept b0= 394.

n  4 sau tb 0 " t E 2 .j regiunea de respingere: dac se respinge t calc " t E 2 .156678 sb 0 Se observ c parametrul F 0 nu este semnificativ statistic deoarece: i.n 4 atunci H0 Statistica testului este: t calc ! t b 0 ! Decizia: b0 ! 0. din compararea statisticii testului cu valoarea testului critic (tabelar sau teoretic) rezult c :  t critic .

 2.228 t b 0 .

156678 t critic .0.

adic F 1 nu este semnificativ diferit de zero.05 pragul de semnifica ie iii.5 BILATERAL.10 ! 2. deci F1 este semnificativ statistic) Deoarece n = 14 30 avem e antion de volum redus i pentru testare vom utiliza testul t.5) este cu semn contrar fa de limita superioar a intervalului (upper 95% = +6003.424). Testarea semnifica iei parametrului F1 : H0 : F1 = 0 (panta F 1 este zero. ii.228 j regiunea de respingere: dac respinge tcalc " t E 2 . pragul critic P-value b0 = 0. n  k 1 ! tE 2 .2. din compararea statisticii testului cu valoarea testului critic (tabelar sau teoretic) rezult 1 c : t c .14 4 ! t 0.5 BILATERAL.05 i k ! 3 (exist trei factori de influen ) se stabile te: j j valoarea critic : t critic ! t E 2 . deci F 1 nu este semnificativ statistic) H1 : F1 { 0.228 .n 4 ! t 0. limita inferioar a intervalului de încredere (lower 95% = -5214. adic F 1 este semnificativ diferit de zero.499092 s b1 Se observ c parametrul F 1 nu este semnificativ statistic deoarece: iv.n 4 atunci H0 se Statistica testului este: t calc ! t b1 ! Decizia: b1 !! 1.n  4 sau tb1 " t E 2 .878616 > E ! 0. II. tiind c pragul de semnifica ie este E ! 0. (panta F1 nu este diferit de zero.

.499092 t critic .

228 .2. .

adic F 2 este semnificativ diferit de zero. n  k 1 ! tE 2 .5 BILATERAL . din compararea statisticii testului cu valoarea testului critic (tabelar sau teoretic) rezult c :  t critic . III. deci F 2 este semnificativ statistic) Deoarece n = 14 30 avem e antion de volum redus i pentru testare vom utiliza testul t.228 regiunea de respingere: dac respinge t calc " t E 2 . adic F 2 nu este semnificativ diferit de zero.164739> E ! 0.v.03846) este cu semn diferit fata de limita superioar a intervalului (upper 95% = +0. Testarea semnifica iei parametrului F 2 : H0 : F 2 = 0 ( F 2 este zero.n 4 atunci H0 se Statistica testului este: t calc ! t b 2 ! Decizia: b2 ! 0. limita inferioar a intervalului de încredere (lower 95% = -0.05 pragul de semnifica ie vi.n 4 ! t 0 . pragul critic P-value b0 = 0.03546). ( F 2 nu este diferit de zero. tiind c pragul de semnifica ie este E ! 0.n  4 sau tb 2 " t E 2 . deci F 2 nu este semnificativ statistic) H1 : F 2 { 0.446942 sb 2 Se observ c parametrul F 2 nu este semnificativ statistic deoarece: vii.05 i k ! 3 (exist trei factori de influen ) se stabile te: j valoarea critic : t critic ! t E 2 j . 10 ! 2.

228 t b 2 . 2.

446942 t critic .0.

deci F 3 nu este semnificativ statistic) . Testarea semnifica iei parametrului F 3 : H0 : F 3 = 0 ( F 3 este zero.228 viii.63619) este cu semn contrar fa de limita superioar a intervalului (upper 95% = + 6.2. IIV.664755 > E ! 0. pragul critic P-value b2 = 0.05 pragul de semnifica ie ix. adic F 3 nu este semnificativ diferit de zero.4.959902). limita inferioar a intervalului de încredere (lower 95% = .

n 4 ! t 0 . 10 ! 2. din compararea statisticii testului cu valoarea testului critic (tabelar sau teoretic) rezult c :  t critic .05 i k ! 3 (exist trei factori de influen ) se stabile te: j valoarea critic : t critic ! t E 2 j . deci F 3 este semnificativ statistic) Deoarece n = 14 30 avem e antion de volum redus i pentru testare vom utiliza testul t. n  k 1 ! tE 2 .H1 : F 3 { 0. tiind c pragul de semnifica ie este E ! 0. adic F 3 este semnificativ diferit de zero.8852 Se observ c parametrul F 3 nu este semnificativ statistic deoarece: x.5 BILATERAL .n 4 atunci H0 se Statistica testului este: t calc ! t b 3 ! Decizia: b 3 sb 3 ! 0. ( F 3 nu este diferit de zero.228 regiunea de respingere: dac respinge t calc " t E 2 .n  4 sau tb 2 " t E 2 .

228 t b 2 . 2.

 0.8852 t critic .

583142).05 pragul de semnifica ie xii.780407 Square Standard Error 837.228 xi. testând semnifica ia acestuia pentru un nivel de semnifica ie 0. SUMMARY OUTPUT Regression Statistics Multiple R 0.6.911637 R Square 0. pragul critic P-value b2 = 0.2.5841 Observations 14 . d)S se m soare intensitatea leg turii dintre variabile folosind raportul de corela ie.0451) este cu semn contrar fa de limita superioar a intervalului (upper 95% = + 5.05.931213 > E ! 0. limita inferioar a intervalului de încredere (lower 95% = .831083 Adjusted R 0.

3.10 ! 3. k .Din tabel avem Multiple R (Raportul de corela ie): R ! 0. deci nu este semnificativ statistic).n4 ! F0. Ipoteza alternativ H1 : R { 0 ( raportul de corela ie al colectivit ii difer semnificativ de zero. k . atunci H0 se respinge Determinarea statisticii testului ( Fcalculat ! Fc ) are la baz rela ia: Fc ! Concluzie: Deoarece Fc (4.71 j regiunea de respingere: dac Fc " FE .911637 ceea ce înseamn c leg tura dintre num rul mediu salaria i din agricultur .05 i k ! 3 (exist trei factori de influen ) se stabile te: j valoarea critic : Ftabelar ! FE . 3.05. PIB si popula ie este una puternica Testarea semnifica iei raportului de corela ie: Ipoteza nul H 0 : R ! 0 (raportul de corela ie al colectivit ii nu difer semnificativ de zero.05. câ tigul salarial din agricultur .92) " F0 .vân toare i silvicultur . n k 1 . deci este semnificativ statistic).3 . nk 1 ! FE . tiind c pragul de semnifica ie este E ! 0.vân toare i silvicultur . 10 .

deci H 1 se accept .3. atunci H 0 se respinge.831083 ™ ! ™ ! 4.911637 R Square 0.92 2 k 1  0. ceea ce înseamn c raportul de corela ie al colectivit ii din care s-a extras e antionul de 14 unit i.831083 1 R e) Ce pondere din varia ia variabilei efect este explicat de variatia variabilelor? SUMMARY OUTPUT Regression Statistics Multiple R 0.780407 Square . difer semnificativ de zero. R2 n  k 1 0.831083 Adjusted R 0.71 . deci este semnificativ statistic.

83.R 2 ! 0.Standard Error 837. .5841 Observations 14 COEFICIENTUL DE DETERMINA IE (R Square .R 2 ) ne indic pondrea de influen factorului ( x ) în varia ia rezultatului ( y ) a R SQUARE .831083 ne arat c .108% reprezint influen a celor 3 factori asupra varia iei nr mediu de salariati.

Sign up to vote on this title
UsefulNot useful