Professional Documents
Culture Documents
140
f(x) = 0 x + 19.95
R² = 0.8
Nr mediu salariati (mii persoane)
120
100
80
60
Linear ()
40
20
0
0 20000 40000 60000 80000 100000
PIB
Corelograma evidenţiază legătura directă -punctele sunt plasate pe direcţia primei bisectoare- şi
liniară -dreapta de regresie are panta pozitivă- dintre numarul mediu de salariati si PIB.
2
B.) Sa se determine modelul de regresie pe baza datelor din esantion
Modelul de regresie are în vedere stabilirea funcţiei de regresie.
y=a+bx
Standard
Coefficients Error t Stat P-value Lower 95% Upper 95%
ANOVA
Significanc
df SS MS F eF
11963.3160
Regression 1 11963.31606 6 44.22508618 3.61022E-5
270.509728
Residual 11 2975.607015 7
Total 12 14938.92308
Interpretare:
Deoarece F=44.22508618, iar Significance F este 0.00000361( valoare mai mica de 0,05), modelul de
regresie este valid si poate fi folosit pentru analiza dependentei dintre cele 2 variabile.
3
MS
df (media
SS (varianţa)
(grade de patratelor) F(calculat) Significance F
(suma pătratelor)
libertate) (dispersia
1. corectată)
Regression 2
2 Δy/ x
(variaţia df 1 =k Δ y/ x s 2y / x= Testul
datorată 1
k
11963.31606
regresiei) 11963.31606 2
F=
s y/ x / 3.61022E-05
2
se
< α=0,05
2
Residual 2 Δe
df 1 =n−k −1 Δe 2
se =
(variaţia
11
n−k −1 44.22508618 ( H0 se accepta –
reziduală) 2975.607015 Modelul este
270.5097287
valid)
H0
: modelul nu este valid: numarul mediu de salariati nu este influentat de PIB
2. H1: modelul este valid : numaru mediu de salariati este influentat de PIB
3. Datele permit aplicarea testului Fisher
α = 0.05
4. 4.1. Fα;k;n-k-1=F0.05;1;11= 4.84
4.2. Daca Fc > Fα;k;n-k-1 => H0 se respinge
5. Statistica testului
S 2y/ x 11963.31606
Fc = 2 = = 44.22508618
Se 270.5097287
6. Decizia
Deoarece Fc (44.22508618)> Fα;k;n-k-1 (4.84)=> H0; modelul este valid: numarul mediu
de salariati este influentat de PIB
4
D.) Sa se testeze semnificatia parametrilor modelului de regresie, pentru un nivel de
semnificatie de 0,05.
Standard
Coefficients Error t Stat P-value Lower 95% Upper 95%
Coefficient Standard
s Error t Stat P-value Lower 95% Upper 95%
(Abaterea Limita inf. a Limita sup. a
medie Testul t intervalului de intervalului
patratica) incredere de incredere
a
ta= 0.004148671<0,05
Interce a= sa sa 7.717349333
a+t α /2 ; n−2⋅s a
coeficientul a
pt 19.9519713 5.55870262 a−t α /2; n−2⋅s a
3.58932158 este semnificativ 32.18659327
5
b 3.61022E-05<0,05
t b=
b= sb sb coeficientul b b−t α /2; n−2⋅s b b+t α /2 ; n−2⋅s b
PIB
0.001439276 0.000216426 6.65019444
este 0.000962925 0.001915627
7 semnificativ
Intercept este termenul liber, deci coeficientul a =.19.9519713 Termenul liber este
punctul în care variabila explicativă (factorială) este 0. Deci numarul mediu de salariati, PIB este
persoane. Deoarece
t b =6.650194447, iar pragul de semnificaţie P-value este 3.61022E-05<
5
0,05 înseamnă că acest coeficient este semnificativ. Intervalul de încredere pentru acest
6
E.) . Să se măsoare intensitatea legăturii dintre variabile folosind coeficientul de corelaţie
şi raportul de corelaţie, testând semnificaţia acestora pentru un nivel de semnificaţie
0,05.
Intensitatea legăturii dintre cele două variabile se poate stabili atât prin aplicarea coeficientului
de corelaţie liniară, dar şi cu ajutorul raportului de corelaţie.
Regression Statistics
Multiple R 0.894882763
R Square 0.800815159
Adjusted R Square 0.782707446
Standard Error 16.44717996
Observations 13
1. H0: R=0 raportul de corelatie al colectivitatii din care s-a extras esantionul de 13 unitati
difera semnificativ de 0, deci nu este semnificativ statistic.
2. H1 : R ≠ 0 raportul de corelatie din care s-a extras esantionul de 8 unitati difera seminificativ
de 0, deci este seminificativ statistic.
3. α = 0.05 ; n<30 datele permit aplicarea testului Fisher
4. α=0.05
Fα;k;n-k-1 = F0.05;1;11= 4.84
Daca: Fc>Fα;k;n-k-1 atunci H0 se respinge.
5. Statistica testului
R2 n−k−1
2
⋅ =
Fc= 1−R k 44.22508618
6. Decizia:
Deoarece Fc (44.22508618) > Fα;k;n-k-1(4.84) atunci H0 se respinge, deci H1 se accepta, ceea ce
inseamna ca raportul de corelatie al colectivitatii din care s-a extras esantionul de13 unitati
difera semnificativ de 0, deci este seminificativ statistic.
n ∑ x i y i−∑ xi⋅∑ y i
r=
2 2
√ [ n∑ x −(∑ x ) ][ n ∑ y −(∑ y ) ]
2
i i
2
i i
7
Judete PIB Nr mediu al x 2i y 2i xiyi
xi salariatilor din
industria
prelucratoare yi
Ilfov 10091,0 26 10184442724 676 2623868
Mun.Bucuresti 85707,2 132 7345724132 17424 11313350
Arges 12536,9 58 785140.2 3364 785140.2
Calarasi 3174,2 13 10075545.64 169 41264.6
Dambovita 8257,4 28 68184654.76 784 231207.2
Giurgiu 2647,1 5 7007138.41 25 13235.5
Ialomita 3345,7 121
11 11193708.49 36802.7
Prahova 16255,8 4489
67 264247782.5 1089132
Teleorman 4796,4 1960
14 23005452.96 67149.6
Arad 10064,4 1601
51 101292147.4 513284.4
Caras-Severin 5353,2 400
20 28656750.24 107064
Hunedoara 8740,1 1296
36 76389348.01 314643.6
Timis 18838,0 5329
73 354870244 1375174
TOTAL ∑ x i=281634.3
∑ yi =¿534 2 2
∑ x i y i=185113
∑x i= ∑y i =35874
18475874768 16
r=0.894882763 > 0 ceea ce inseamna ca intre PIB si nr mediu al salariatilor exista o legatura
directa puternica
r r √ n−2
= =
tc =
s r √ 1−r 2
9.25
t0.05;11=2.201
8
n
R=
√ ∑ ( ^y i − y )2
i=1
n
∑ ( yi− y )
i=1
2
=
0.894
R=0.891 arata ca intre PIB si numarul mediu de salariati exista o legatura directa foarte puternica.
R=r=0.894 => o legatura liniara foarte puternica si directa intre cele 2 variabile.
F.) Ce pondere din variaţia variabilei efect este explicată de variatia variabilei cauză?
Δ2y / x ∑ ( ^y i− y ) 2
Δ 2e i=1
R2 = =1− = n
Δ2y Δ2y
∑ ( y i− y ) 2
i=1 = 0.800815159 ne arata ca, 80,08% reprezinta influenta
factorului PIB asupra numarului mediu al salariatilor.
ANOVA
Significanc
df SS MS F eF
4582.27167 36.5223110 2.29141E-
Regression 3 13746.81502 4 9 05
125.464997
Residual 9 1129.184979 6
Total 12 14876
9
Intercept -70.9135363 27.55095236 -2.57390508 0.029995025 -133.23812 -8.588942208
Salariu 0.068193234 0.027318599 2.496220033 0.034072495 0.00639427 0.129992199
PIB -0.000359321 0.000669363 -0.53681055 0.604412949 -0.0018735 0.001154883
0.147886467
Populatie 0.069328115 0.034717552 1.996918289 0.076934081 -000920844 4
RESIDUAL OUTPUT
Predicted Nr mediu salariati (mii
Observation persoane) Residuals
1 33.19855293 -7.19855293
2 135.4765302 -3.476530228
3 60.58957548 -2.58957548
4 16.47724581 -3.477245805
5 40.19783852 -12.19783852
6 16.35755485 -11.35755485
7 12.56977957 -1.56977957
8 68.06487249 -1.064872495
9 19.96078097 -5.960780968
10 31.89398018 19.10601982
11 13.32227531 6.677724688
12 29.58979489 6.410205113
13 55.30121877 16.69878123
A.) Să se determine modelul de regresie pe baza datelor din eşantion
Modelul de regresie are în vedere stabilirea funcţiei de regresie
^y x =b 0 +b 1 x 1 i +b 2 x 2 i
1, x 2, i
Coeficienţii
Coefficients
b0 termen liber – NU ARE INTERPRETARE ECONOMICA; ne arată că
10
populatiei ,numarul salariaţilor va cunoaşte o creştere de 0.069328115
persoane.
ANOVA
df SS MS F Significance F
4582.27167 36.5223110
Regression 3 13746.81502 4 9 2.29141E-05
125.464997
Residual 9 1129.184979 6
Total 12 14876
4. 4.1.
Ftabelar =F α; k ; n−k−1=F α; 3 ;n−3−1=F0 ,05; 3; 8 = 3.86
4.2.
F c >F α; k; n−k−1 , atunci H0 se respinge
s 2y /x
F= =36 .52
5. s2e
6. Decizia: deoarece
F calculat (36.52231109) F α; k; n−k−1 (3.86) H 0 se respinge, deci
11
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept -70.9135363 27.55095236 -2.57390508 0.029995025 -133.23812 -8.588942208
Salariu 0.068193234 0.027318599 2.496220033 0.034072495 0.00639427 0.129992199
PIB -0.000359321 0.000669363 -0.53681055 0.604412949 -0.0018735 0.001154883
0.147886467
Populatie 0.069328115 0.034717552 1.996918289 0.076934081 -0.00920844 4
b0
t b0 = 0.029995025<0,
b0= sb 0 05
Interce sb -133.23812 -8.588942208
0
pt -
27.55095236 - coeficientul b0 b0 −t α /2 ; n−3⋅s b0 b0 +t α /2; n−3⋅sb 0
70.9135363 2.5739050
este semnificativ
8
0.034072495<0,
b1 05
b1= t b1 = 0.00639427 0.129992199
sb s b1
Sal. 1 coeficientul b1 b1−t α/2; n−3⋅sb 1 b1 +t α /2 ; n−3⋅s b 1
mediu 0.06819323
brut
0.027318599 2.4962200
4 este
33
semnificativ
b2
b2= t b2 = 0.604412949>0,
sb 2 05
0.001154883
sb -0.0018735
PIB - 2 b2 +t α /2; n−3⋅s b 2
0.00035932 0.000669363 - coeficientul b2 b2 −t α /2; n−3⋅sb 2
1 0.5368105
nu este semnificativ
5
12
b3 0.076934081>
B3= t b3 =
Popula s b3 sb 3 0,05 -0.00920844 0.1478864674
tie 0.06932811
0.034717552 coeficientul b3 b3 −t α /2; n−3⋅s b3 b3 +t α /2; n−3⋅s b 3
5 1.9969182
89 nu este semnificativ
H0 :
β 0 = 0 (panta β 0 este zero, adică β 0 nu este semnificativ diferit de zero, deci β 0 nu este
semnificativ statistic)
H1 :
β 0 0, (panta β 0 nu este diferită de zero, adică β 0 este semnificativ diferit de zero, deci β 0 este
semnificativ statistic)
Deoarece n = 13 30 avem eşantion de volum redus şi pentru testare vom utiliza testul t.
|t calc|>t α |t b 0|>t α
;n−4 ; n−4
regiunea de respingere: dacă 2 sau 2 atunci H0 se respinge
b0 -70 . 9135363
t calc=t b 0 = = = - 2,5739
Statistica testului este: sb 0 27 .55095236
Decizia:
Se observă că parametrul
β 0 este semnificativ statistic deoarece:
i. din compararea statisticii testului cu valoarea testului critic (tabelar sau teoretic) rezultă că:
= -133.23812≤ β 0 ≤ −8 . 588942208 ;
13
II. Testarea semnificaţiei parametrului
β1 :
H0 :
β1 = 0 (panta
β1 este zero, adică
β1 nu este semnificativ diferit de zero, deci
β1 nu este
semnificativ statistic)
H1 :
β 1 0, (panta β 1 nu este diferită de zero, adică β 1 este semnificativ diferit de zero, deci β 1 este
semnificativ statistic)
Deoarece n = 13 30 avem eşantion de volum redus şi pentru testare vom utiliza testul t.
Ştiind că pragul de semnificaţie este α=0, 05 şi k=3 (există trei factori de influenţă) se
stabileşte:
t critic= t α =t α =t 0,5BILATERAL ;13−4 =t 0,5 BILATERAL ; 9=2 , 262
; n−k−1 ; n−4
valoarea critică: 2 2
|t calc|>t α |t b 1|>t α
;n−4 ;n−4
regiunea de respingere: dacă 2 sau 2 atunci H0 se respinge
b1 0 .068193234
t calc=t b 1= = =2. 4962
Statistica testului este: s b 1 0 . 027318599
Decizia:
Se observă că parametrul
β 1 este semnificativ statistic deoarece:
iv. din compararea statisticii testului cu valoarea testului critic (tabelar sau teoretic) rezultă că:
0 . 00639427≤ β 1 ≤ 0 , 129992199 ;
H0 :
β 2 = 0 ( β 2 este zero, adică β 2 nu este semnificativ diferit de zero, deci β 2 nu este semnificativ
statistic)
14
H1 :
β 2 0, ( β 2 nu este diferit de zero, adică
β2 este semnificativ diferit de zero, deci
β2 este
semnificativ statistic)
Deoarece n = 13 30 avem eşantion de volum redus şi pentru testare vom utiliza testul t.
|t calc|>t α |t b 2|>t α
;n−4 ;n−4
regiunea de respingere: dacă 2 sau 2 atunci H0 se respinge
b2 -0 .000359321
t calc=t b 2= = =−0 .53681
Statistica testului este: sb 2 0. 000669363
Decizia:
Se observă că parametrul
β 2 nu este semnificativ statistic deoarece:
vi. din compararea statisticii testului cu valoarea testului critic (tabelar sau teoretic) rezultă că:
t b2 (−0 . 52681 ) <t critic ( 2 , 262 )
limita inferioară a intervalului de încredere (lower 95% =-0.001873525)nu are acelasi semn ca limita
superioară a intervalului (upper 95% =0.001154883); intervalul de încredere este
−0 . 001873525≤ β 2 ≤ 0 . 001154883 .
H0 :
β3 = 0 ( β3 este zero, adică
β3 nu este semnificativ diferit de zero, deci
β3 nu este
semnificativ statistic)
H1 :
β 3 0, ( β 3 nu este diferit de zero, adică
β3 este semnificativ diferit de zero, deci
β3 este
semnificativ statistic)
Deoarece n = 13 30 avem eşantion de volum redus şi pentru testare vom utiliza testul t.
15
t critic= t α =t α =t 0,5BILATERAL ;13−4 =t 0,5 BILATERAL ; 9=2 , 262
; n−k−1 ; n−4
valoarea critică: 2 2
|t calc|>t α |t b 3|>t α
;n−4 ;n−4
regiunea de respingere: dacă 2 sau 2 atunci H0 se respinge
b3 0 . 069328115
t calc=t b 2= = =1 .996918
Statistica testului este: sb 3 0,034717552
Decizia:
Se observă că parametrul
β3 nu este semnificativ statistic deoarece:
vii. din compararea statisticii testului cu valoarea testului critic (tabelar sau teoretic) rezultă că:
t b3 ( 1 . 996918 ) <t critic ( 2 , 262 )
Regression Statistics
Multiple R 0.961297825
R Square 0.924093508
Adjusted R Square 0.898791344
Standard Error 11.20111591
Observations 13
Din tabel avem Multiple R (Raportul de corelaţie): R=0,961297825 ∈ ( 0,95;1 ) ceea ce
înseamnă că legătura dintre vânzări, număr vânzători şi suprafaţă comercială este foarte puternică.
Ipoteza nulă 0 H : R=0(raportul de corelaţie al colectivităţii din care s-a extras eşantionul de 10
unităţi, nu diferă semnificativ de zero, deci nu este semnificativ statistic);
16
Ipoteza alternativă
H : R≠0
1 ( raportul de corelaţie al colectivităţii din care s-a extras
eşantionul de 10 unităţi, diferă semnificativ de zero, deci este semnificativ statistic);
valoarea critică:
Ftabelar =F α ; k ; n−k−1=F α; 3 ;n−3−1 =F0 ,05; 3; 9 =3.86
regiunea de respingere: dacă
F c >F α; k; n−k−1 , atunci H se respinge
0
R 2 n−k −1 0 , 9612978252 9
F c= ⋅ = ⋅ =71. 631
1−R2 k 1−0 , 9612978252 3
Concluzie:
Deoarece c
F (71.631)>F 0 ,05; 1 ; 13 ( 3,86 ) , atunci H 0 se respinge, deci H 1 se acceptă,
ceea ce înseamnă că raportul de corelaţie al colectivităţii din care s-a extras eşantionul de 13 unităţi,
diferă semnificativ de zero, deci este semnificativ statistic.
variaţia rezultatului ( y )
2
R SQUARE - R =0, 924093508 ne arată că, 92,40% reprezintă influenţa celor 3 factori
(castiga salarial, PIB, Populatie) asupra numarului mediu de salariati.
17