You are on page 1of 8

UNITATEA DE NVARE 5

Modelul liniar de regresie multifactorial



APLICAIE rezolvat - regresie liniar multipl
1. Se cunosc urmtoarele date privind vnzrile la produsul alimentar A, nregistrate n 10 uniti
comerciale:
Numrul curent al
unitii comerciale
Vnzri
(buci)
Numr vnztori
(persoane)
Suprafaa
comercial (mp)
1 22 7 98
2 20 5 90
3 23 8 110
4 26 9 130
5 30 12 140
6 32 15 145
7 45 22 156
8 50 25 160
9 52 32 164
10 60 40 175
Se cere:
1. S se determine modelul de regresie pe baza datelor din esantion i s se interpreteze parametrii
acesteia;
2. S se verifice validitatea modelului de regresie pentru un nivel de semnificaie 0,05;
3. S se arate cum se stabilesc( sau s se determine) intervalele de ncredere pentru parametrii
modelului liniar de regresie;
4. S se testeze semnificaia parametrilor modelului de regresie, pentru un nivel de semnificaie 0,05;
5. S se msoare intensitatea legturii dintre variabile folosind coeficientul de corelaie i raportul de
corelaie, testnd semnificaia acestora pentru un nivel de semnificaie 0,05;
6. Ce pondere din variaia variabilei efect este explicat de variatia variabilei cauz?

Rezolvare:
Notm cu :
Y - variabila vnzri.
X
1
- variabila numrul vnztorilor,
X
2
- variabila suprafaa comercial
y
i
= f ( x
1i ,
x
2i
)
Vnzri = f ( numr vnztori, suprafa comercial )
i i i
e y y + =
Numrul curent al
unitii comerciale
Vnzri
(buci)
Y
i
Numr vnztori
(persoane)
X
1i
Suprafaa
comercial (mp)
X
2i

1 22 7 98
2 20 5 90
3 23 8 110
4 26 9 130
5 30 12 140
6 32 15 145
7 45 22 156
8 50 25 160
9 52 32 164
10 60 40 175
Rezolvare folosind EXCEL:
1. Introducei datele din tabel ncepnd din celula A1.
2. Apsai Tools-Data Analysis i Regression.
3. La Input Y Range selectai A1:A11. La Input X Range selectai B1:E11. Selectai Labels.
4. Dac dorii s calculai valorile reziduale, selectai Residuals. Apsai OK.


Se obin rezultatele:

SUMMARY OUTPUT
Regression Statistics
Multiple R 0,989430469
R Square 0,978972653
Adjusted R Square 0,97296484
Standard Error 2,377677944
Observations 10
ANOVA
df SS MS F Significance F
Regression 2 1842,426533 921,2133 162,94991 1,34817E-06
Residual 7 39,57346682 5,653352
Total 9 1882

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 4,702902918 6,18676278 0,760156 0,4719829 -9,926466387 19,332272
Numar vanzatori
(persoane) 0,974543752 0,151386668 6,437448 0,0003545 0,616571165 1,3325163
Suprafata comerciala
(mp) 0,104112437 0,061427843 1,694874 0,133923 -0,04114133 0,2493662


RESIDUAL OUTPUT
Observation
Predicted
Vnzari
(bucati) Residuals
1 21,72772804 0,272271963
2 18,94574103 1,054258965
3 23,95162104 -0,951621037
4 27,00841353 -1,008413534
5 30,97316916 -0,973169163
6 34,41736261 -2,417362606
7 42,38440568 2,61559432
8 45,72448669 4,275513315
9 52,9627427 -0,962742698
10 61,90432952 -1,904329524






1 S se determine modelul de regresie pe baza datelor din esantion i s se interpreteze parametrii
acesteia

Modelul de regresie are n vedere stabilirea funciei de regresie

i i i x x
x b x b b y
2 2 1 1 0 , ,
2 1
+ + =

Coefficients
Coeficienii
Intercept 4,702902918 0
b termen liber
Numar vanzatori
(persoane) 0,974543752
1
b coeficient de regresie (primul factor)
Suprafata comerciala
(mp) 0,104112437
2
b coeficient de regresie (al doilea factor)

i i i x x
x x y
2 1 , ,
1041 , 0 9745 , 0 7029 , 4
2 1
+ + =

0
b termen liber NU ARE INTERPRETARE ECONOMICA; ne arat c funcia de regesie y intersecteaz axa Oy
n punctul 4,7029;
9754 , 0
1
+ = b , ceea ce nsemn c creterea numrului de vnztori cu unul, vnzarea va crete cu 0,9745
buci;
1041 , 0
2
+ = b ne arat c, la o cretere cu 1 mp a suprafeei comerciale, vnzarea va nregistra o cretere
cu 0,1041 buci.

2 S se verifice validitatea modelului de regresie pentru un nivel de semnificaie 0,05.

ANOVA
df SS MS F Significance F
Regression 2 1842,426533 921,2133 162,94991 1,34817E-06
Residual 7 39,57346682 5,653352
Total 9 1882

Tabel 2 ----
ANOVA
df
(grade de
libertate)
SS (variana)
(suma ptratelor)
MS
(media
patratelor)
(dispersia
corectat)
F(calculat) Significance F
Regression
(variaia
datorat
regresiei)
k df =
1

2
2
/ x y
A
1842,426533
k
s
x y
x y
2
/ 2
/
A
=
921,2133
Testul

F=162,94991
F=
2
/ x y
s /
2
e
s
1,34817E-06
este
6
10 34817 , 1


este
0,00000134817
< 05 , 0 = o
(se respinge H
0

Modelul este valid)

Residual
(variaia
rezidual)
1
1
= k n df
7
2
e
A
39,57346682
1
2
2

A
=
k n
s
e
e
5,653352
Total (variaia
total)
2 1 1
df df df + =
1
1
= n df
9
e x y y
A + A = A
/
2

1882


H
0
: modelul nu este valid statistic (mprtierea valorilor
t
y datorate factorului timp nu difer
semnificativ de mprtierea acelorai valori datorate ntmplrii)
H
1
: modelul estevalid statistict
tiind c pragul de semnificaie este 05 , 0 = o i 2 = k (exist doi factori de influen) se stabilete:
+ valoarea critic: 96 , 4
7 ; 2 ; 05 , 0 1 2 ; 2 ; 1 ; ;
= = = =

F F F F
n k n k tabelar o o

+ regiunea de respingere: dac
1 ; ;
>
k n k c
F F
o
, atunci H
0
se respinge
Determinarea statisticii testului (
calculat
F ) are la baz relaia: 9499 , 162
6533 , 5
2133 , 921
2
2
/
= = =
e
x y
s
s
F

Decizia: deoarece
calculat
F (162,9499) >
1 ; ; k n k
F
o
(4,96)
0
H se respinge, deci
1
H este adevrat,
prin urmare, modelul este valid.


7. S se arate cum se stabilesc( sau s se determine) intervalele de ncredere pentru parametrii
modelului liniar de regresie


Lower 95%
(limita inferioara)
Upper 95%
(limita superioara)
Intercept

-9,926466387
0 1 ; 2 / 0 b k n
s t b
o



19,332272
0 1 ; 2 / 0 b k n
s t b +
o


Numar vanzatori
(persoane)

0,616571165
1 1 ; 2 / 1 b k n
s t b
o



1,3325163
1 1 ; 2 / 1 b k n
s t b +
o


Suprafata
comerciala (mp)

-0,04114133
2 1 ; 2 / 2 b k n
s t b
o



0,2493662
2 1 ; 2 /
2
b k n
s t b +
o



Upper Lower s s |
Interval de ncredere pentru
0
| :
0 1 ; 2 / 0 0 0 1 ; 2 / 0 b k n b k n
s t b s t b + s s
o o
|
0 3 ; 0 0 0 3 ; 0 b n BILATERAL b n BILATERAL
s t b s t b + s s
o o
|
0 7 ; 5 , 0 0 0 0 7 ; 5 , 0 0 b BILATERAL b BILATERAL
s t b s t b + s s |
18676278 , 6 365 , 2 702902918 , 4 18676278 , 6 365 , 2 702902918 , 4
0
+ s s |
332272 , 19 926466387 , 9
0
s s |
Interval de ncredere pentru
1
| :

1 1 ; 2 / 1 1 1 1 ; 2 / 1 b k n b k n
s t b s t b + s s
o o
|
1 3 ; 1 1 1 3 ; 1 b n BILATERAL b n BILATERAL
s t b s t b + s s
o o
|
1 7 ; 5 , 0 1 1 1 7 ; 5 , 0 1 b BILATERAL b BILATERAL
s t b s t b + s s |
151386668 , 0 365 , 2 974543752 , 0 151386668 , 0 365 , 2 43752 9745 , 0
1
+ s s |
3325163 , 1 616571165 , 0
1
s s |

Interval de ncredere pentru
2
| :
2 1 ; 2 / 2 2 2 1 ; 2 / 2 b k n b k n
s t b s t b + s s
o o
|
2 3 ; 2 2 2 3 ; 2 b n BILATERAL b n BILATERAL
s t b s t b + s s
o o
|
2 7 ; 5 , 0 2 2 2 7 ; 5 , 0 2 b BILATERAL b BILATERAL
s t b s t b + s s |
061427843 , 0 365 , 2 104112437 , 0 061427843 , 0 365 , 2 104112437 , 0
2
+ s s |
2493662 , 0 04114133 , 0
2
s s |


1 S se testeze semnificaia parametrilor modelului de regresie, pentru un nivel de semnificaie 0,05.

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 4,702902918 6,18676278 0,760156 0,4719829 -9,926466387 19,332272
Numar vanzatori
(persoane) 0,974543752 0,151386668 6,437448 0,0003545 0,616571165 1,3325163
Suprafata comerciala
(mp) 0,104112437 0,061427843 1,694874 0,133923 -0,04114133 0,2493662


Tabel 3

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%

(Abaterea medie
patratica)
Testul t
Limita inf. a
intervalului de
incredere
Limita sup. a
intervalului de
incredere
Intercept b
0
= 4,7029
0
b
s
6,18676278
0
0
0
b
b
s
b
t =
0,760156

0,4719829>0,05
coeficientul b
0
nu este semnificativ
-9,926466387
0 3 ; 2 / 0 b n
s t b
o


19,332272
0 3 ; 2 / 0 b n
s t b +
o


Nr.vnz. b
1
= 0,9745
1
b
s
0,151386668
1
1
1
b
b
s
b
t =

6,437448

0,0003545<0,05
coeficientul b
1
este
semnificativ
0,616571165
1 3 ; 2 / 1 b n
s t b
o


1,3325163
1 3 ; 2 / 1 b n
s t b +
o


Supraf.
Com.
b
2
=0,1041
2
b
s
0,06142784
2
2
2
b
b
s
b
t =
1,694874

0,133923>0,05
coeficientul b
2

nu este semnificativ
-0,04114133
2 3 ; 2 / 2 b n
s t b
o

0,2493662
2 3 ; 2 / 2 b n
s t b +
o




I. Testarea semnificaiei parametrului
0
| :
H
0
:
0
| = 0 (panta
0
| este zero, adic
0
| nu este semnificativ diferit de zero, deci
0
| nu este
semnificativ statistic)
H
1
:
0
| = 0, (panta
0
| nu estediferit de zero, adic
0
| este semnificativ diferit de zero, deci
0
| este
semnificativ statistic)
Deoarece n = 10 < 30 avem eantion de volum redus i pentru testare vom utiliza testul t.
tiind c pragul de semnificaie este 05 , 0 = o i 2 = k (exist doi factori de influen) se stabilete:
+ valoarea critic: 365 , 2
7 ; 5 , 0 3 10 ; 5 , 0
3 ;
2
1 ;
2
= = = = =


BILATERAL BILATERAL
n k n
critic
t t t t t
o o

+ regiunea de respingere: dac
3 ;
2

>
n
calc
t t
o
sau
3 ;
2
0

>
n
b
t t
o
atunci H
0
se respinge
Statistica testului este: 760156 , 0
186766278 , 6
702902918 , 4
0
0
0
= = = =
b
b calc
s
b
t t
Decizia:
Se observ c parametrul
0
| nu este semnificativ statistic deoarece:
din compararea statisticii testului cu valoarea testului critic (tabelar sau teoretic) rezult c:
( ) ( ) ( ) 365 , 2 7602 , 0 365 , 2
0 critic b critic
t t t < < ;
pragul critic P-value
0
b = 0,4719829 > 05 , 0 = o pragul de semnificaie
limita inferioar a intervalului de ncredere (lower 95% = - 9,926466387) este cu semn contrar fa de
limita superioar a intervalului (upper 95% = + 19,332272); intervalul de ncredere este
332272 , 19 926466387 , 9
0
s s | ;

II. Testarea semnificaiei parametrului
1
| :
H
0
:
1
| = 0 (panta
1
| este zero, adic
1
| nu este semnificativ diferit de zero, deci
1
| nu este
semnificativ statistic)
H
1
:
1
| = 0, (panta
1
| nu estediferit de zero, adic
1
| este semnificativ diferit de zero, deci
1
| este
semnificativ statistic)
Deoarece n = 10 < 30 avem eantion de volum redus i pentru testare vom utiliza testul t.
tiind c pragul de semnificaie este 05 , 0 = o i 2 = k (exist doi factori de influen) se stabilete:
+ valoarea critic: 365 , 2
7 ; 5 , 0 3 10 ; 5 , 0
3 ;
2
1 ;
2
= = = = =


BILATERAL BILATERAL
n k n
critic
t t t t t
o o

+ regiunea de respingere: dac
3 ;
2

>
n
calc
t t
o
sau
3 ;
2
1

>
n
b
t t
o
atunci H
0
se respinge
Statistica testului este: 437448 , 6
151386668 , 0
974543752 , 0
1
1
1
= = = =
b
b calc
s
b
t t
Decizia:
Se observ c parametrul
1
| este semnificativ statistic deoarece:
din compararea statisticii testului cu valoarea testului critic (tabelar sau teoretic) rezult c:
( ) ( ) 365 , 2 4374 , 6
critic c
t t > ;

pragul critic P-value
0
b = 0,0003545 < 05 , 0 = o pragul de semnificaie
limita inferioar a intervalului de ncredere (lower 95% = + 0,616571165) este cu acelai semn ca
limita superioar a intervalului (upper 95% = + 1,3325163); intervalul de ncredere este
3325163 , 1 616571165 , 0
1
+ s s + | ;

III. Testarea semnificaiei parametrului
2
| :
H
0
:
2
| = 0 (
2
| este zero, adic
2
| nu este semnificativ diferit de zero, deci
2
| nu este
semnificativ statistic)
H
1
:
2
| = 0, (
2
| nu este diferit de zero, adic
2
| este semnificativ diferit de zero, deci
2
| este
semnificativ statistic)
Deoarece n = 10 < 30 avem eantion de volum redus i pentru testare vom utiliza testul t.
tiind c pragul de semnificaie este 05 , 0 = o i 2 = k (exist doi factori de influen) se stabilete:
+ valoarea critic: 365 , 2
7 ; 5 , 0 3 10 ; 5 , 0
3 ;
2
1 ;
2
= = = = =


BILATERAL BILATERAL
n k n
critic
t t t t t
o o

+ regiunea de respingere: dac
3 ;
2

>
n
calc
t t
o
sau
3 ;
2
2

>
n
b
t t
o
atunci H
0
se respinge
Statistica testului este: 694874 , 1
061427843 , 0
104112437 , 0
2
2
2
= = = =
b
b calc
s
b
t t
Decizia:
Se observ c parametrul
2
| nu este semnificativ statistic deoarece:
din compararea statisticii testului cu valoarea testului critic (tabelar sau teoretic) rezult c:
( ) ( ) ( ) 365 , 2 694874 , 1 365 , 2
2 critic b critic
t t t < <
pragul critic P-value
2
b = 0,1339 > 05 , 0 = o pragul de semnificaie
limita inferioar a intervalului de ncredere (lower 95% = - 0,04114133) este cu semn contrar fa de
limita superioar a intervalului (upper 95% = + 0,2493662); intervalul de ncredere este
2493662 , 0 04114133 , 0
2
s s |


2 S se msoare intensitatea legturii dintre variabile folosind cu indicatorul adecvat, testnd
semnificaia acestora pentru un nivel de semnificaie 0,05.

SUMMARY OUTPUT
Regression Statistics
Multiple R 0,989430469
R Square 0,978972653
Adjusted R Square 0,97296484
Standard Error 2,377677944
Observations 10

Din tabel avem Multiple R (Raportul de corelaie): ( ) 1 ; 95 , 0 989430469 , 0 e = R ceea ce nseamn
c legtura dintre vnzri, numr vnztori i suprafa comercial este foarte puternic.

Testarea semnificaiei raportului de corelaie:
Ipoteza nul 0 :
0
= R H (raportul de corelaie al colectivitii din care s-a extras eantionul de 10 uniti,
nu difer semnificativ de zero, deci nu este semnificativ statistic);
Ipoteza alternativ 0 :
1
= R H ( raportul de corelaie al colectivitii din care s-a extras eantionul de
10 uniti, difer semnificativ de zero, deci este semnificativ statistic);

tiind c pragul de semnificaie este 05 , 0 = o i 2 = k (exist doi factori de influen) se stabilete:
+ valoarea critic: 96 , 4
7 ; 2 ; 05 , 0 1 2 ; 2 ; 1 ; ;
= = = =

F F F F
n k n k tabelar o o

+ regiunea de respingere: dac
1 ; ;
>
k n k c
F F
o
, atunci H
0
se respinge
Determinarea statisticii testului (
c calculat
F F = ) are la baz relaia:
93 , 162
2
7
97897 , 0 1
97897 , 0
2
7
998943 , 0 1
98943 , 0 1
1
2
2
2
2
=

=
k
k n
R
R
F
c

Concluzie:
Deoarece ( ) 96 , 4 ) 93 , 162 (
13 ; 1 ; 05 , 0
F F
c
> , atunci
0
H se respinge, deci
1
H se accept, ceea ce
nseamn c raportul de corelaie al colectivitii din care s-a extras eantionul de 10 uniti, difer
semnificativ de zero, deci este semnificativ statistic.





3 Ce ponderedin variaia variabilei efect este explicat de variatia variabilei cauz?



Coeficientul de determinaie (R SQUARE -
2
R ) ne indic pondrea de influen a factorului ( x ) n variaia
rezultatului ( y )
R SQUARE - 978972653 , 0
2
= R ne arat c, 97,897% reprezint influena ambilor factori (numr
vnztori i suprafa) asupra variaiei vnzrilor.


OBSERVAIE !

Tabelul RESIDUAL OUTPUT cuprinde informaii privind

RESIDUAL OUTPUT

Predicted Vnzari
(bucati)
Residuals

y
i i i
y y e =
Observation
1 21,72772804 0,272271963
2 18,94574103 1,054258965
3 23,95162104 -0,951621037
4 27,00841353 -1,008413534
5 30,97316916 -0,973169163
6 34,41736261 -2,417362606
7 42,38440568 2,61559432
8 45,72448669 4,275513315
9 52,9627427 -0,962742698
10 61,90432952 -1,904329524




SUMMARY OUTPUT
Regression Statistics
Multiple R 0,989430469
R Square 0,978972653
Adjusted R Square 0,97296484
Standard Error 2,377677944
Observations 10

You might also like