You are on page 1of 6

Recapitulare

1. Analiza de regresie

1.1. Pentru un magazin s-au cules date privind Numărul de spoturi publicitare
difuzate şi Numărul vizitatorilor timp de 15 zile.
X=nr spoturi și y=nr vizitatori

ANOVA
df SS(variații MS(dispersii) F
)
Regression MSR=SSR/K-
=k-1=2-1 3907,80 1=3907,804 166,28
Residual MSE=SSE/N-
=n-k 305,53 k
Total Coefficients
=n-1 Standar
4213,339 t Stat Lower 95% Upper 95%
d Error
Intercept a→termenul 0,80732
liber=2,30 2,83623 8 -3,83 8,43
Nr. spoturi b→coeficient
ul de 0,39356
regresie=5,09 7 13,05 4,224632 5,925131

MSR=SSR/k-1 → MSR=SSR

Se cere:

a) Calculați și interpretați coeficientul de determinare (1p).


R^2=SSR/SST sau 1-SSE/SST
SST=SSE+SSR → SSE=SST-SSR
R^2=3907,80/4213,33=0,92 (92%)
INTERPRETARE R^2: x îl influențează pe y în proportie de 92%

EROAREA STANDARD→ radical din MSE= radical din 23,50= +/- 4,8
MSE=305,53/14=23,50
INTERPRETARE: În medie, nr.estimat al vizitatorilor se abate de la nr.real cu +/-
4,8.
b) Testați validitatea modelului pentru un prag de semnificaţie α=0.05 (Fcritic=4,7) (1p).
TESTUL F
ETAPELE
1. IPOTEZELE
H0→ ipoteza nulă: beta=0 → modelul este invalid

H1 → ipoteza alternativă: beta este diferit de 0→ modelul este valid

2. Fcalculat=MSR/MSE=3907,80/23.50=166,28
3. DECIZIA (regiunea de respingere)
+Dacă F calculat în modul > F critic → resping Ho, accept H1 → modelul este valid
++Dacă F calculat în modul < F critic → accept H0, resping H1 → modelul este invalid
166,28 > 4,7 → resping H0, accept H1, modelul este valid.
Interpretare +: Cu o probabilitate de 95%, garantăm că avem suficiente argumente
să susținem H1.
Interpretare ++: Cu o probabilitate de 95%, nu avem suficiente dovezi să susținem
H1.

c) Calculați și interpretați coeficientul de regresie (tcritic=2,160) (2p).


T calculat=t statistic=a/sa → a=t calculat*sa=0,81*2,84=2,30
Sa=eroarea standard a lui a
LOWER (alfa): a-t critic*sa=2,30-2,160*2,84= -3,83
UPPER (alfa): a+tcritic*sa=2,30+2,160*2,84= 8,43
a-t critic*sa <=alfa<= a+tcritic*sa→ interval de încredere

t calculat=t statistic=b/sb=5,09/0,39= 13,05


LOWER (beta): b-tcritic*sb → 4,22=b-2,160*0,39→ b= (+)5,09
UPPER(beta): b+tcritic*sb
A este termenul liber care este nesemnificatif din p.d.v. economic, deci nu are
interpretare economica.
Interpretare coeficient de regresie(adică b): La cresterea lui x cu o unitate, y se
modifică cu b.
La fiecare spot publicitar în plus, nr. De vizitatori creste cu 5,09.
Interpretare UPPER: Cu o probabilitate de 95%, ne așteptăm ca fiecare spot
publicitar să ne aducă în plus între 4,22 și 5,93.
Interpretare LOWER: Cu o probabilitate de 95%, ...

d) Găsiţi intervalul de încredere pentru termenul liber pentru un prag de semnificaţie α=0.05
(tcritic=2,160) (2p).
Trebuie să verificăm dacă alfa (termenul liber) este sau nu este semnificativ din
punct de vedere statistic. → testul t
1. IPOTEZE
H0: alfa=0

H1: alfa diferit de 0

2. Testul t calculat=a/sa=0,81
3. DECIZIA (regiunea de respingere)
Dacă t calculat în modul> t critic → resping H0,accept H1→ alfa este semnificativ
Dacă t calculat în modul < t critic → accept H0, resping H1 → alfa nu este
semnificativ
0,81 < 2,160→ accept H0, resping H1 → alfa nu este semnificativ

e) Estimaţi numărul de vizitatori în cazul difuzării a 5 spoturi publicitare (1p).


ECUAȚIA DE AJUSTARE → y ajustat= a+b*xi→ y ajustat=2,30+5,09*5=28 de
vizitatori
Xi=5 spoturi publicitare

2.2. Pornind de la Profitul anual (zeci mii Euro) şi Investiţiile în pregătirea personalului
(mii Euro) realizate de 15 firme, s-a estimat următorul model linear de regresie:

ANOVA
df SS MS F
Regression 1 …………… 479,7429 …
Residual …. 13,99044 ……………
Total …. ……………

CoefficientsStandard t Stat Lower 95% Upper


Error 95%
Intercept …………….. 0,723108 ……………… 8,789856 11,91422
Investiţii în pregătirea 1,729426 …………… 21,1135 …………… 1,906384
personalului (mii Euro) .

Se cere:
a) Completați tabelul ANOVA (1p).
b) Calculați și interpretaţi eroarea standard a estimaţiei (abaterea standard a reziduurilor)
(1p).
c) Interpretați coeficientul de regresie și găsiți intervalul său de încredere, pentru un prag de
semnificaţie α=0.05 (tcritic=2,160) (2p).
d) Testaţi semnificaţia termenului liber pentru un prag de semnificaţie α=0.05
(tcritic=2,160) (2p).
e) Estimaţi profitul pe care ar putea să-l obţină o firmă care investeşte 3 (mii euro) în
pregătirea personalului (1p).

1.3. Pentru a analiza legătura dintre produsul intern brut (mii $) şi exporturi (mii $) au fost
selectate aleator 40 de ţări, iar rezultatele prelucrării datelor în Excel se prezintă astfel:

SUMMARY OUTPUT
Regression Statistics
Multiple R 0,285446
R Square 0,08148
Adjusted R Square 0,057308
Standard Error ………..
Observations 40

ANOVA
df SS MS F
Regression 1 1124,804 1124,804 3,370879
Residual …. 12679,95 ………..
Total …. …………

Standard Lower Upper


Coefficients t Stat
Error 95% 95%
Intercept ………… 5,883819 ……… -2,44158 21,38076
Exporturi 0,252996 ……….. 1,835995 ……… 0,531953
(mii $)

Se cere:
a. Completaţi spaţiile libere.
b. Calculaţi şi interpretaţi eroarea standard a estimaţiei.
c. Găsiţi intervalul de încredere pentru coeficientul de regresie, pentru un prag de semnificaţie
α=0.05. Este acesta semnificativ?
d. Testaţi validitatea modelului pentru acelaşi prag de semnificaţie.
e. Interpretaţi termenul liber şi testaţi semnificaţia acestuia pentru α=0.05.
f. Cât de puternică este legaătura dintre cele două variabile?

3. Ipoteze clasice ale modelului de regresie

3.2. În urma prelucrării unor date a rezultat un model bifactorial de regresie caracterizat prin:
R2=0,501; JB (Testul Jarque-Bera)=0,885; d=0,67 (Testul Durbin-Watson); F (Testul White)=12,
03; rx1,x2=0,725

Să se verifice ipotezele de coliniariate (folosind Criteriul Klein), neautocorelare a erorilor,


homoscedasticitate și normalitate a erorilor cunoscând d 1 = 0,98; d2 = 1,54; Significance F (p-
value)=0,003; χ2=5,99 şi să se interpreteze rezultatele.
3.3. Verificaţi ipoteza de independenţă a factorilor pentru un model de regresie bifactorial cu
ajutorul factorului de inflaţie (FI), dacă rezultatele regresiei dintre cei doi factori X 1 și X2 (care
urmează a fi incluși într-un model de regresie ca variabile independente) se prezintă astfel
(prelucrările au fost făcute în Excel, folosind funcţia Regression):

SUMMARY OUTPUT
Regression Statistics
Multiple R 0.6596
R Square 0.4351
Adjusted R 0.3916
Square
Standard Error 2.0131
Observations 15

3.4. Folosind Testul White, verificaţi ipoteza de homoscedasticitate pentru un model de regresie
liniar multifactorial, pe baza rezultatelor regresiei auxiliare dintre seria reziduurilor şi
variabilele independente:

SUMMARY OUTPUT
Regression Statistics
Multiple R 0.5506
R Square 0.3032
Adjusted R
Square 0.1638
Standard Error 0.5790
Observations 31

ANOVA
Significance
df SS MS F
F
Regression 5 3.6462 0.7292 2.1754 0.0892
Residual 25 8.3807 0.3352
Total 30 12.0270

Coefficient Standard P- Lower Upper


t Stat
s Error value 95% 95%
Intercept -1.5957 7.0183 -0.2274 0.8220 -16.0501 12.8587
x1 1.6067 1.7112 0.9390 0.3567 -1.9175 5.1310
x12 -0.1796 0.1300 -1.3815 0.1793 -0.4473 0.0881
x2 -2.8448 2.2204 -1.2812 0.2119 -7.4179 1.7283
x22 0.2056 0.2695 0.7629 0.4527 -0.3495 0.7607
x1*x2 0.3123 0.1998 1.5631 0.1306 -0.0992 0.7239
3.5. Aplicaţi testul Durbin Watson pentru a verifica ipoteza de independenţă a erorilor pe
următorul şir de date care se referă la seria reziduurilor unui model de regresie liniar
multifactorial:

et -1.01 -0.05 0.93 -1.89 0.67 -1.25 0.80 -1.80 1.72 1.88

4. Serii cronologice

În tabelul de mai jos sunt reprezentate valorile pentru Sosirile turiștilor în structuri de
primire turistică (milioane persoane), în România, perioada 2016 – 2018, înregistrări
trimestriale.

Perioada Sosiri turiști (milioane)


T1 2016 1.9
T2 2016 2.6
T3 2016 4.1
T4 2016 2.4
T1 2017 2.1
T2 2017 3
T3 2017 4.4
T4 2017 2.6
T1 2018 2.2
T2 2018 3.1
T3 2018 4.7
T4 2018 2.8
a) Reprezentaţi grafic datele sub formă de cronogramă şi indicaţi tipul modelului (aditiv
sau multiplicativ).
b) Determinaţi trendul prin metoda mediilor mobile.
c) După eliminarea trendului din seria iniţială calculaţi şi interpretaţi devierile sezoniere.
d) După eliminarea trendului din seria iniţială calculaţi şi interpretaţi indicii de
sezonalitate.
e) Eliminaţi din seria iniţială componenta sezonieră (măsurată prin metoda cea mai
potrivită, conform graficului) pentru a obţine o serie cronologică ajustată sezonier.

You might also like