You are on page 1of 17

UNIVERSITATEA ROMÂNO-AMERICANĂ 2014-2015

Aplicație +Ghid proiecte analiză econometrie - Conf. univ. dr. Din Marilena Aura

Econometrie
Exemplu de aplicație (pag. 7 – 15) + ghid empirical paper
În cele ce urmează vă prezint un ghid pentru proiectele la econometrie (Empirical Paper).
De remarcat că munca voastră trebuie să se finalizeze cu două livrabile:
1. Lucrarea – redactată în Word, după planulși standardele de expunere, redactare
și comunicare indicate mai jos, salvată cu numele Variabila Y vs variabila X.
2. Fișierul de lucru (Workfile Excel sau Eviews)
Atenție:
Nu se așteaptă nimeni la rezultate de cercetare științifică, ci la o abordare la nivel ul
cunoștințelor predate la curs.
Data limită de transmitere a proiectelor: decembrie 2014 (se transmit la și de pe adresele
de e-mail ale universită
ții ... @profesor.rau.ro. , precizați nume și prenume pentru
identificare; subiectul e-mailului va conține de asemenea nume, prenume, specializarea și
grupa).

Plan lucrare
Tema proiectului:
Exemplu “Analiza relației de legătură dintre veniturile realizate de o firmă şi taxele
plătite de către aceasta”
Autor: nume şi prenume, specializare, grupa
Rezumat: Pe câteva rânduri se va descrie contribuţia studentului la dezvoltarea temei şi
concluziile desprinse în urma elaborării şi validării modelului econometric construit.
(rezumatul se completează ultimul, după definitivarea analizei)
Exemplu Scopul lucrării de față este de a determina dacă și în ce proporție veniturile
(mii euro) realizate de o firmă pot fi considerate ca factor explicativ pentru taxele
plătite (mii euro) de către aceasta. Se știe că ecuaţia regresiei nu va stabili în nici un
caz relaţia de cauzalitate, ci numai modelul teoretic propus pentru a explica variaţia
variabilei studiate, care, în cazul nostru este nivelul taxelor plătite.
Pentru aceasta se probează pe unșantion
e
de 2 0 de ani ipoteza conform căreia
veniturile medii anuale realizate de firmă (exprimate în mii euro) influențează direct
nivelul mediu anual al taxelor plătile (exprimate în mii euro). Totodată, se dorește a
se previziona pentru o probabilitate de 95% nivelul taxelor care trebuie plătite dacă
venitul total realizat de firmă atinge valoarea de 40 mii euro.
(La Rezumat revenim după ce am terminat lucrarea; la început nu știm exact la ce
eșantion ne vom stabili, pentru câte variabile explicative, câte modele...)

Cuvinte cheie: (maximum cincișase cuvinte reprezentative pentru sub iect)
De exemplu: taxe, venit, model de regresie liniară, predicția taxelor
1

4) predicția variabilei dependente „taxe” în funcţie de variabila „venit” ca variabilă independentă/explicativă. asupra variabilei dependente (rezultative) studiate.1 Scopul studiului De exemplu: Este cunoscut faptul că printre obiectivele unui manager se află probleme legate de optimizarea planificării resurselor financiare. dr. I. 5) explicarea efectului pe care îl are variabila independentă (explicativă) aleasă. cu scopul de a identifica. foarte pe scurt.5 Explicaţii despre organizarea lucrării Câte secțiuni și ce se tratează în fiecare. respectiv „taxe”. I.UNIVERSITATEA ROMÂNO-AMERICANĂ 2014-2015 Aplicație +Ghid proiecte analiză econometrie . 3) validarea rezultatelor prin teste specifice pentru a vedea în ce măsură rapoartele de tip „Output” răspund la întrebarea de cercetare formulată. specifica și valida un model econometric pe baza căruia managerul să poată predicționa nivelul taxelor de plătit.Conf. I.3 Formularea obiectivelor De exemplu: Prin acest studiu econometric s-a urmărit: 1) determinarea relațiilor de legătură între variabila „taxe” ca variabilă dependentă și variabila „venit” ca variabilă independentă/explicativă. ARGUMENTAŢIA ECONOMICĂ (pentru a evidenția motivele alegerii acestui subiect/de ce ar putea interesa studiul din lucrare) De exemplu: Tema de ță fa referitoare la efectul veniturilor realizate asupra impoziltelor și taxelor de plată ale unei firme este utilă pentru analiza economicofinanciară a firmei. INTRODUCERE I. Din Marilena Aura I. II. Lucrarea de față fundamentează un studiu empiric privind legătura dintre variabilele venit și taxe. „venit”. Managerul este interesat să estimeze nivelul taxelor care se vor plăti dacă veniturile realizate de firmă vor atinge o anumită valoare. univ.4 Rezultate așteptate De exemplu: Ne așteptăm ca din concluziile desprinse pe baza analizei econometrice a modelului specificat să se confirme ipoteza conform căreia nivelul taxelor de plătit este explicat de o relație de legătură directă între acesta și variabila „venit” realizat. pentru optimizarea planificării bugetare a 2 . 2) construirea unui model econometric liniar pentru a analiza în ce măsură acesta poate răspunde la întrebarea de cercetare formulată. la nivelul înregistrări lor realizate de o firmă pe perioada anterioară de 20 de ani. I. În acest sens.2 Formularea întrebării de cercetare De exemplu: Analiza econometrică din lucrarea de ță fa își propune să răspundă pe baza analizei datelor empirice la întrebarea aflată sub cercetare „Care este influenţa pe care o au veniturile realizate de firmă asupra nivelului taxelor de plată?”.

Conf. 3 Sursele mass media nu sunt potrivite cu misiunea acestui proiect. alte teorii economice) dacă se pretează la tema aleasă. Popescu [2006] susţine că …” Citarea întreagă. asupra cursului valutar. II. etc.1 Scurtă recenzie pe aceeaşi temă 1 (literature review) Cine ce și cum a mai abordat ceva asemănător? L a ce concluzii au ajuns ei? Cum arătă diversele modele asociate? De exemplu. fie aceeaşi relaţie de dependenţă dintre variabile. proiectul va fi realizat cu mijloace proprii. se va trece la referinţe bibliografice. teoria producției. univ. 1 2 3 . Plagiatul este interzis și pedepsit prin lege. se va urmări valorificarea lucrărilor lecturate în propriul proiect. „în lucrarea sa. nivelul taxelor de plată pentru alte valori de venituri pe care planifică să le realizeze. dr. Prin urmare. METODOLOGIA CERCETĂRII (pentru a descrie metoda de cercetare utilizată.1 Selectarea metodei de cercetare Recenzia nu va depăşi o pagină. Dacă tema aleasă este inspirată de articole recenzate. Se va folosi stilul Chicago2 ca format standard de referinţe bibliografice. Se pot prezenta texte sau articole care tratează fie aceeaşi întrebare. atunci se specifică acest lucru (citare corectă a autorilorși an ului) și se face trimitere prin note de subsol la sursa articolului (link). editură. sursele de date) III. datele proprii de observaţie și interpretări proprii ale rezultatelor. Se va explica în acest fel intenţia studentului de a verifica concluziile obţinute de el însuşi prin comparaţie cu rezultatelr recenzate. managerul poate predicţiona pe baza modelului validat. cu titlul articolului. pentru citări se va folosi notaţia nume [an]. chiar dacă tema aleasă/întrebarea de cercetare este inspirată de articole recenzate.2 Analiza critică și valorificare Se pot relata diferite teorii economice întâlnite (teoria consumatorului. După o muncă de documentare în prealabil. colectarea seriilor de date care exprimă valorile observate ale variabilelor. teorii pe care studentul le poate aplica în constuirea modelului său. selectarea variabilelor. în cadrul teoriilor microeconomice se pot găsi studii ale comportamentului economic al firmei care tratează problematica veniturilor vs impozite și taxe. Din Marilena Aura întreprinderii. III. sau chiar alţi factori de influenţă asupra variabilei dependente propusă a fi studiată. (Un tabel care ține con trei coloane: Autori [an]/Scopul cercetării-tema studiată/Rezultate-concluzii obținute). De asemenea se trece la bibliografie 2 articolul recenzat. fără a utiliza pasaje de la al ți autori necitate corespunzător . Se va întocmi un sumar cu ceea ce studentul a lecturat din alte resurse 3 în demersul său de a documenta ştiinţific întrebarea aleasă. printr-o analiză critică.UNIVERSITATEA ROMÂNO-AMERICANĂ 2014-2015 Aplicație +Ghid proiecte analiză econometrie . De exemplu. descrierea lor. II.

III. ambele variabile. calea Eurostat> Statistics > Statistics by theme>National accounts (including GDP) > Data > Main tables> poți găsi nu doar indicatorul și datele gata de exportat în orice fel de fișier. dacă cum este cazul. fiecare dată observată poate fi realizarea unei variabile la un moment dat de timp. Nu este cazul pentru tema de față.2 Selectarea variabilelor Se motivează alegerea variabilelor modelului (variabila dependentă aleasă pentru a fi explicată și respectiv variabilele independente/explicative. inclusiv excel. „produc ția unei companii”. Aici ne punem problema într-un singur sens: cum afectează veniturile realizate asupra variației taxelor. Y – variabila dependentă: „Taxe” exprimată prin volumul mediu anual al tuturor tipurilor de taxe de plătit. De exemplu: Metoda propusă în această lucrare pentru a răspunde întrebării aflate sub cercetare este analiza unui model econometric unifactorial pentru date crosssection (chiar dacă seriile de date sunt ținute ob pentru o perioadă de 20 de ani. la nivelul firmei. Datele (valori observate ale variabilelor) sunt colectate șanti în e oane (selecții) din colectivități generale (populații statistice).4 Colectarea seriilor de date Ce fel de date s-ar putea folosi ca să exprime semnifica ția variabilelor alese? (indicatori economici existenți sau procente/ponderi calculate) Este locul unde se oferă informaţii despre seriile de date utilizate. se va descrie procedeul de obţinere a datelor. „PIB-ul unei țări”. Ratașomajului se calculează după formula: [(numărul de persoane neangajate)/( numărul de persoane în câmpul muncii)] X 100. Se va menţiona momentul de timp (dacă datele sunt cross section) sau perioada de timp (dacă sunt serii de timp). Din Marilena Aura Analiză uni/multifactorială pentru date cross-sectional/serii de timp/panel (recomandare: date cross section). într-o analiză pe date cross section. ordinea istorică a lor este neimportantă. Exemplu: Din punct de vedere economic.Conf. Se denumesc variabilele modeluluiși abrevierile lor. dr. cum ar fi „venitul personal”. dar poți găsi și definiția acestuia și ce variabilă măsoară. venit și tax e pot fi considerate variabile de interes în calitate de variabile dependente. III. precum şi de formare a eşantionului. „v ânzările unei firme dintr-un sector economic”. III. 4 . Această secțiune este potrivită pentru teme macroeconomice. măsurată prin mii euro. De exemplu. la portalul Eurostat. X – variabila independentă/explicativă: „Venituri” exprimată prin veniturile totale anuale realizate de firmă. univ. Se vor preciza eventualele limitări. indicatorul „rata deșomaj” exprimă numărul de persoane neangajate ca procent din populația aflată în câmpul muncii. Ca o sugestie. alese pentru a explica). măsurată prin mii euro.3 Descrierea variabilelor Se definesc variabilele şi indicatorul statistic care le măsoară. Astfel.UNIVERSITATEA ROMÂNO-AMERICANĂ 2014-2015 Aplicație +Ghid proiecte analiză econometrie . deci nu se consideră serii de timp).

pe baza relației de dependență de tip liniar dorită a+bx. Recomandare: Pentru seriile de date necesare lucrării la econometrie.aspx BNR www. specificat și definit funcţionale 3) . 3 Unele teorii sunt bine fundamentate economic.europa. data și link). Demographic & Financial Data http://www. univ. la aleger e: i) selectarea seriilor de date dintr-o bază de date pentru care se indică sursa de (nume. Diferența esențială între cross section și serii de timp este că datele de tip serii de timp au ordonare fixă în timp și sunt indexate în ordinea derulării timpului. Din Marilena Aura Atenție: pentru date de tip cross section. Acestea se adună cu valorile calculate pentru partea deterministă a modelului.asp 2 Vezi imaginea de la anexa 1 la acest ghid.oecd.insse. http://stats. III.ec.org .imf.UNIVERSITATEA ROMÂNO-AMERICANĂ 2014-2015 Aplicație +Ghid proiecte analiză econometrie .europa. Înainte de redactarea lucrării se vor încerca mai multe specificări ale modelului şi de asemenea mai multe serii de date care exprimă variabilele alese. 1 Exemple de surse de date: EUROSTAT http://epp. respectiv baze de date sau observate din sondaje asupra populaţiei cercetate.org http://www.5 Surse de date 1 Se descrie modul în care au fost selectate valorile observate din colectivitatea generală.eurostat. de medie zero și abatere medie pătratică 1). III. iar pentru datele de tip serii de timp.worldbank. 5 . unde valorile variabilei x se aleg în prealabil.eu/portal/page/portal/statistics/themes http://www. datele sunt istorice.bnr. aveți două posibilități.alegerea formei Răspunsul la întrebarea aflată sub cercetarea econometrică a datelor empirice trebuie să se bazeze pe teoria economică şi pe date de observare.ec. Aici se vor povesti pe scurt diferitele încercări de identificare și specificare a funcţiei de regresie pentru a putea face un comentariu asupra alegerii finale a modelului.org / Free Economic. observate la diferite intervale de timp/frecvența lunar.oecd.org Fondul Monetar Internaţional http://www. Sugerez pentru temele care se referă la date macro.com/freelunch/default. astfel 2: Pentru setul de date corespunzătoare variabilei y se generează valorile variabilei aleatoare u (numere independente aleatoare derivate din distribuția normală și normată. utilizarea bazei de date a Comisiei Europene EUROSTAT > Statistics > Statistics by theme ii) generarea seriilor de date care să corespundă unei legături de dependen ță de tip liniar y=a+bx+u utilizând instrumentul de analiză Generator de numere aleatoare (Random Number Generation) din Data Analysis. trimestrial. etc.un.ien.Conf. cum ar fi funcţia câstig pentru care se utilizează forme functionale semilogaritmice.ro Institutul Naţional de Statistică Institutul de Economie Naţională www.6 Prezentarea teoretică a analizei propuse (Se va prezenta pe scurt modelul identificat. datele colectate corespund aceluia și moment de timp.ro UNdata http://data.eu/ http://epp.ro/Baza-de-date-interactiva-604. dr. anual.economy.org/ OECD Banca Mondială http://www.eurostat.

missing data.1 Specificarea modelului econometric ce descrie legătura dintre cele două variabile Se va reprezenta grafic legătura dintre venit (x) și nivelul taxelor (y) pentru cele 20 de perechi de date (xi.1 Se analizează seriile de date pentru toate variabilele observate Se alcătuiește un tabel care să ofere sumarul statisticilor (Summary Statistics: max. 1 6 . 3 Seriile de Date se găsesc în fi șierul Excel atașat.yi) 3 prin corelogramă sau diagrama norului de puncte: 240 200 Y 160 120 80 40 0 10 20 30 40 50 60 70 80 X Pura intuiţie sau bunul simţ nu sunt motive suficiente pentru includerea sau excluderea variabilelor în model 2 Datele și analiza vor fi disponibile într-un fişier Excel sau Eviews denumit identic cu wordul.precizarea mijloacelor de realizare .Conf. ANALIZA DATELOR (Analiza pe baza datelor empirice 2 .2. Teoria poate ajuta şi la verificarea autocorelării sau heteroscedasticităţii ca parte a procesului de generare a datelor.denumirea fiecăreia din etapele de analiză econometrică parcurse .scopul fiecărei etape . pentru a putea fi verificate. min. cu aceeași denumire. and SD values) pentru fiecare variabilă adusă în discuţie şi se interpretează valorile calculate. Se folosesc facilităţile grafice pentru validarea/legitimarea datelor/interpretarea datelor – outliers.este partea principală a lucrării ) IV. average.interpretarea rezultatelor . Se reprezintă histogramele. La definirea modelului şi identificarea sa.UNIVERSITATEA ROMÂNO-AMERICANĂ 2014-2015 Aplicație +Ghid proiecte analiză econometrie .Totodată aici se poate încerca propunerea unui alt factor de influenţă. se va explica apariţia termenului rezidual prin existența unor presupuse variabile neobservate în această etapă. Din Marilena Aura Teoria economică este principalul ghid în orientarea alegerii variabilelor care sunt relevante pentru întrebarea formulată 1. verificând mai multe variante de alegere. mai ales pentru distribuţiile asimetrice.2 Se detaliază etapele analizei La fiecare etapă se urmăresc pas cu pas punctarea cu claritate a următoarelor aspecte: .concluziile desprinse IV. IV. IV. dr. univ.

2.2997 euro.UNIVERSITATEA ROMÂNO-AMERICANĂ 2014-2015 Aplicație +Ghid proiecte analiză econometrie . 4201 + 2. taxele cresc în medie cu 2.1 ⋅ aˆ + 31991. Modelul de regresie este: yi = α + β xi + ε i . Din Marilena Aura Din grafic se poate observa că distribuţia punctelor (xi. β – parametrii modelului.1 733.5 733. univ. slope).5 2 ˆ ⇔ min ∑ ( yi − yˆ i ) ⇔ min ∑ yi − aˆ − bx  i =i 1 =i 1 68864 733. deci se poate presupune că modelul econometric care descrie legătura dintre cele două variabile este un model liniar: y =E (Y | X ) =α + β x + ε . În partea superioară a tabelului 1. se pot verifica estimările punctuale pentru coeficienții regresiei (în coloana coefficient. iar X este pentru estimatorul coeficientului de regresie. Ca regulă generală. Observație: Punctul de intercep ț ie (interception) aˆ = .2 Estimarea parametrilor modelului Pentru estimarea parametrilor modelului de regresie utilizăm metoda celor mai mici pătrate. nu putem determina valoarea lui yˆ pentru o valoare x care are o valoare mult prea diferită de valorile din eș antion corespunzatoare lui x (intervalul în care ia valori seria de date pentru x nu conține pe zero). 4201 iar ecuaţia de regresie este: yˆ = −6. unde α . C este pentru estimatorul punctual intercept. 2997 . Se observă că β > 0 (slope/panta dreptei) ceea ce confirmă ipoteza din teoria economică asupra unei legături directe între cele două variabile: creșterea veniturilor atrage creșterea taxelor de plătit.1 68864 ˆ = 2.1⋅ bˆ = 2 20 20 1557. respectiv coeficientul de regresie estimat punctual bˆ =2. aˆ =y − b ⋅ x =−6. Deoarece eșantionul nostru nu include ani cu 0 euro venit înregistrat. Tabel 1 Tabelul coeficienților din Summary output generat de Eviews Dependent Variable: Y Method: Least Squares Sample: 1991 2010 7 . yi) poate fi aproximată cu o dreaptă.1 31991. taxa este de -6.6.53 aˆ = −6.4201 euro. IV. 4201 20 733.2997 sugerează că la fiecare 1000 euro înregistraţi ca venit pe an.53 ⋅ bˆ = Atunci avem că: ( ∑ yi ∑ xi ∑ xi yi = n ∑ xi 2 ∑ xi ∑ xi n = bˆ Deci ) 20 1557. dr.4201 este punctul în care dreapta de regresie intersecteaza axa Oy. i = 1.Conf. 20 iar ecuaţia de regresie estimată este: ˆ yˆ = aˆ + bx i i Metoda celor mai mici pătrate presupune minimizarea erorilor prin minimizarea sumei pătratelor reziduurilor: 20 ⋅ aˆ + 733. 2997 x ˆ b = 2. acest lucru însemnand că atunci cand x = 0 (nu există venit). nu avem nici o bază pentru a-l interpreta pe aˆ . 2997 Interpretare: Panta dreptei (slope).

799204379 Intercept -6. n−2 2 estimator nedeplasat al dispersiei reziduurilor σ ε .353374888 -0. Din Marilena Aura Included observations: 20 Variable Coefficient Std. 4201 • se calculează statistica testului t: tcalculat = = = −0.420142 2.420142 9.0000 R-squared Adjusted R-squared S. 23 20 2 ∑ xi − x i =1 ( ) Testăm semnificaţia parametrului α din modelul corespunzător colectivită ții statistice pentru un prag de semnificație α = 0.834344 16. respectiv α şi cu dispersia egală cu: n   xi2   ∑ x2 . dr. n respectiv β şi cu dispersia egală cu: 2 sb= se2 ⋅ ˆ 1 n ∑ ( xi − x ) unde se2 = ∑ ( yi − yˆi ) 2 i =1 2 este un n−2 i =1 ∑ ( yi − yˆi ) i = 16.233865325 9.35 8 . Error t-Statistic Prob.259 -83.233865 -0.567358 8.000000 Tabel 2 Tabelul coeficienților din Summary output generat de Excel P-value Lower 90.833395 1.299690 0.6864 0.705227496 x(venit) IV.6394893 9.E.D.Conf.833395 0.2996902 0. of regression Sum squared resid Log likelihood Durbin-Watson stat 0. = sε2 = 0.843063 0.894152806 2.73363 5040. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) 77.3 Verificarea semnificaţiei parametrilor modelului de regresie pentru α = 0. parametrul bˆ estimat pe baza selecției este o variabilă aleatoare care urmează o repartiţie normală cu media egală cu parametrul corespunzător pentru populația statistică.11373 8.353375 2.69566 0.5012 0.1 Din teorie știm că parametrul aˆ estimat pe baza selecției este o variabilă aleatoare care urmează o distribuție normală cu media egală cu parametrul corespunzător pentru populația statistică.87500 41.2. 68 saˆ 9.UNIVERSITATEA ROMÂNO-AMERICANĂ 2014-2015 Aplicație +Ghid proiecte analiză econometrie .489529 Mean dependent var S. Prin= urmare se 2 ∑ xi 2 saˆ = sε ⋅ 2 ∑ ( xi − x ) 2 i i = sbˆ 9.0% Upper 90. univ.16E-08 1.73 .666931 96.35 .0% Coefficients Standard Error t Stat 9.1: • se stabilesc ipoteza nulă: H0: α = 0 și ipoteza alternativă: H1: α ≠ 0 aˆ −6. C X -6.501209 -22.67358 1. 2 21 2 i = 1 = saˆ = se se n + n n  ∑ ( xi − x )2  ∑ ( xi − x )2  i 1= i 1 =   Analog.686398 9.

Analog testăm semnificaţia parametrului β : • se stabilesc ipoteza nulă: H0: β = 0 și ipoteza alternativă: H1: β ≠ 0 bˆ 2. 216 (adevărat) 9 . adică pentru un risc asumat de 10%. 4152 < xi < 36.11373 < yi < 77.n − 2 bˆ 2. decidem că estimatorul aˆ provine dintr-o colectivitate cu α = 0. sx x = = = = 36. 655 + 3 ⋅16. adică pentru un risc asumat de 10%.875 + 3 ⋅ 41.05 înseamnă că coeficientul de regresie este semnificativ statistic.101 ⋅ 0. dr.18 =2.101 tα 2 .83 sbˆ 0. sy = y i == = = 77.n − 2 Deoarece tcalculat =0. 44 = 41. Intervalul de încredere pentru parametrul β este: bˆ − t ⋅ s ≤ β ≤ bˆ + t ⋅ s . Ipoteza 1.11373 19 36. 23 ≤ β ≤ 2.2.900 (adevărat) 77.UNIVERSITATEA ROMÂNO-AMERICANĂ 2014-2015 Aplicație +Ghid proiecte analiză econometrie . 4152 19 2 32116.18 = 2.5 1 . 74 = 16.yi) pentru verificarea următoarelor relaţii:  x − 3sx < xi < x + 3sx   y − 3s y < yi < y + 3s y Unde mediile și dispersiile de selecție se calculează cu formulee cunoscute: n 20 ∑ xi ∑ xi 733. deci α nu este semnificativ diferit de zero.18 = 2. 655 − 3 ⋅16.101 ⋅ 0.101 . 299 + 2. Variabilele observate nu sunt afectate de erori de măsurare Această ipoteză se verifică cu “regula celor 3 σ ”: x ∈ ( x ± 3σ x ) şi y ∈ ( y ± 3σ y ) . 299 − 2. Din Marilena Aura • se compară tcalculat cu valoarea critică tabelată pentru un test bilateral: = t0. 466 < yi < 201.875 20 20 Atunci avem că: n n ∑ ( xi − x ) i =1 = n −1 2 ∑ ( yi − y ) i =1 = n −1 5119.1 (mai mare decât pragul de semnificație ales) înseamnă că acest coeficient este nesemnificativ statistic.50 > 0. 2997 • se calculează statistica testului t: tcalculat = = = 9.875 − 3 ⋅ 41.n − 2 bˆ α /2. putem decide că estimatorul bˆ provine dintr-o colectivitate cu parametrul β semnificativ diferit de zero.05.05.16E-08<0. 4152 ⇔ −12.1 =i 1 =i 1 655 . Se utilizează datele de selecție (xi. 23 se compară tcalculat cu tα • 2 . 23 ⇔ 1.Conf.05.18 iar probabilitatea p-value este 1. adică α /2.4 Verificarea ipotezelor metodei celor mai mici pătrate Pentru verificarea ipotezelor de fundamentare a metodei celor mai mici patrate se vor folosi mai multe procedee şi teste de diagnostic. iar probabilitatea p-value este 0.5906 < xi < 85. = 20 20 n 20 ∑ yi 1557.816 ≤ β ≤ 2. 782 IV.101 Deoarece tcalculat > t0.68 < t0.05. univ.n − 2 = t0.11373 ⇔ −45.

coeficientul de aplatizare (kurtosis) măsoară boltirea distributiei.21 (curba distribuției rezidurilor are eșantionul pentru reziduuri S =  i =1 3 n   2  ∑ ( ei − e ) n   i =1  0. 21 − 0 o coadă mai „voluminoasă” la dreapta).831134 40 S .Conf. Ipoteza normalităţii erorilor implică faptul că metoda celor mai mici pătrate este o metodă de estimare optimală. univ.489201 0. adica: ε t  → N (0.56E-14 0. 8 Series: RESID Sample 2001 2020 Observations 20 7 6 Mean Median Maximum Minimum Std. dr. Statistica testului =0. Dev.975255 33. cât de aplatizată sau ascuţită este distribţia faţă de distribuţia normală. σ ε ) . de medie nulă şi p abatere medie patratică σ ε .UNIVERSITATEA ROMÂNO-AMERICANĂ 2014-2015 Aplicație +Ghid proiecte analiză econometrie .94338 -29.28732 0. iar în Momentul teoretic este S =   3 n   (σ 2 ( X ) ) 2  n  3  ∑ ( ei − e ) n   =0.213892 2. K . adică echivalentă metodei verosimilităţii maxime. fiind atât consistentă cât şi eficientă. Skewness Kurtosis 5 4 3 2 1 Jarque-Bera Probability 0 -30 -20 -10 0 10 20 30 -2.369928 0. Ipoteza 2. 3 E 2 ( X − m )    ~ N  0. 6  . unde m = E ( X ) . de unde rezultă că ipoteza nulă H0 : S=0 este acceptată la un prag de semnificație de 10% și deci distribuția variabiei aleatoare eroare este simetrică.coeficientul de asimetrie (skewness) măsoară simetria distribuţiei în jurul mediei sale. Ipoteza normalităţii erorilor se testează prin compararea momentelor statistice din eşantion (asimetria și boltirea) cu momentele teoretice ale erorilor în ipoteza nulă a normalităţii.46963 16. mai exact legea de probabilitate a variabilei eroare ε t este legea normală.645 pentru un test bilateral. Din Marilena Aura şi deci ipoteza poate fi acceptată fără nici un dubiu. Valorile variabilei aleatoare eroare (disturbanţă) sunt normal distribuite. 10 .383 < τS = 6 20 zα /2 =1.

645 pentru un test bilateral.  . atunci respingem ipoteza nula H0 de normalitate a rezidurilor la un prag de semnificaţie de ( α ⋅ 100 )%.369928 24 6   6   24  Cele două ipoteze ale testului JB: H0: ε ~ N (0.369928 < χ 0. atunci cele două variabile sunt corelate şi deci nu sunt independente. 2 Cum statistica test Jarque-Bera = 0.605 pentru testul unilateral dreapta iar p-value = 0. S = 0 şi K = 3) H1: ε nu urmeaza o repartitie N (0. 2 11 . dr. Statistica Jarque-Bera (JB) este dată de suma pătratelor statisticilor anterioare.48 < 3 (curba distribu ției 0. În locul celor două teste anterioare pentru verificarea ipotezei de normalitate a erorilor se poate folosi un singur test. atunci ipoteza nulă H0 de normalitate a erorilor este acceptată la un prag de semnificaţie de 10%. Dacă valorile celor două variabile cresc(scad) concomitent. numit Jarque-Bera. unde m = E ( X ) iar în 2 2 n X σ ( )   ( ) n eșantionul pentru reziduuri K= ∑ ( ei − e ) 4 n i =1  n  2  ∑ ( ei − e ) n   i =1  2 =2. rezultă că ipoteza nulă H0 : K = 3 este acceptată la un reziduurilor este platikurtică). 2 2 Ipoteza 3.1) (JB = 0 i.6. care devine o variabilă distribuită după legea hi-pătrat: JB = τ S2 + τ K2  χα2 . 48 − 3 = -0.1) ( JB ≠ 0) Regula de decizie: • Daca JBcalculat > χα2 .Conf. cele două teste pentru verificarea simetriei și aplatiz ării conduc la acceptarea ipotezei de normalitate a erorilor. Din Marilena Aura  E ( X − m) 4   24   Momentul teoretic este K = ~ N  3. Cumulat. univ.47 și cum 24 20 <1. Depistarea heteroscedasticităţii (dispersia lui ε nu este aceeaşi pentru toate valorile lui x) se poate face prin procedeul grafic.2 =4.2 atunci ipoteza nulă H0 de normalitate este respinsă la un prag de semnificaţie de ( α ⋅ 100 )%.UNIVERSITATEA ROMÂNO-AMERICANĂ 2014-2015 Aplicație +Ghid proiecte analiză econometrie . adică se construieşte corelograma ce conţine valorile variabilei independente x pe axa OX şi ale variabilei reziduale ε pe axa OY.831134 > 0.e.1. Statistica testului τK = τK prag de semnificatie de 10% ceea ce înseamnă că aplatizarea curbei de distribu ție a erorilor coincide cu cea pentru distribuț ia normală. • Daca p-value < α . Variabila aleatoare eroare ε este de medie nulă E (ε ) = 0 şi aceeaşi dispersie constantă σ pentru toate valorile lui x (ipoteza de homoscedasticitate).2  n   n  2 1 1 JB=  S  +  ( K − 3) = n  S 2 + ( K − 3)  = 0.

• testul Durbin-Warson..= k 1.. et . n . adică se testează doar dacă există o legătură dintre o eroare şi cea de dinaintea sa:= ε t ρε t −1 + vt . ∀t . deci putem accepta ipoteza că erorile sunt independente. t < k .. Testul Durbin – Watson se foloseşte pentru a testa autocorelarea de prim ordin. dr. Verificarea acestei ipoteze se poate face prin: • metoda grafică (corelograma). Ipoteza 4. Valorile variabilei reziduale sunt necorelate. Din Marilena Aura 40 30 RESID 20 10 0 -10 -20 -30 10 20 30 60 50 40 70 80 X Deoarece graficul punctelor prezintă o evoluţie oscilantă putem accepta ipoteza că variabila factorială x şi cea reziduală sunt independente. : 40 30 RESID 20 10 0 -10 -20 -30 0 40 80 120 160 200 240 Y Pe graficul din imagie se observă că distribuţia erorilor este oscilantă.e. iar pe axa OY valorile variabilei reziduale și se cercetează dacă există o relaţie între valorile curente ale erorilor estimate la momentul t. unde vt ~ N (0. Pentru a testa autocorelarea prin metoda grafică se construieşte corelograma trecându-se pe axa OX valorile variabilei rezultative yi.Conf. i. şi valorile precedente et −1 . sunt independente între ele. σ v2 ) Pentru testarea ipotezei de necorelare a erorilor cu ajutorul testului Durbin-Watson: 12 .. adică nu sunt autocorelate (seria reziduurilor nu traverseaza axa timpului de prea multe ori sau de prea puţine ori).UNIVERSITATEA ROMÂNO-AMERICANĂ 2014-2015 Aplicație +Ghid proiecte analiză econometrie . et −2 . univ. adică nu exista fenomenul de autocorelare a erorilor : Cov(et. ek) = 0.

26 ∑ et t =1 -1.15588E-08 Residual 18 5040. 41 1 = = 0. k.5 Testarea validităţii modelului de regresie • se stabilesc ipoteza nulă H0: modelul nu este valid și modelul este valid. 01 ∑ ( yˆi − y ) 27076. univ. 69 2 sε unde • ipoteza alternativă H1: 20 2 20 2 MSR 280.69 > F0. se calculează statistica test Durbin-Watson: ∑ (et − et −1 ) dcalc = t >2 2 2 t ∑e t ≥1 = 7508.87 = 1. 26 se compară d cu cele două valori dL şi dU din tabelul testului Durbin-Watson pentru pragul de semnificaţie α = 0.0144 Total 19 32116. deci modelul este valid.18 .25 = sε2 MSR = i =1 = = 280. independen ţă +1. n-k-1 = F0. 48 5040.69566 1. Din Marilena Aura • se stabilesc ipoteza nulă H0: variabila reziduală nu este autocorelată H 0 : ρ = 0 și • ipoteza alternativă H1: variabila reziduală este autocorelată H 1 : ρ ≠ 0 . IV.1.59 ⇒ erorile sunt independente.05 pentru numărul variabilelor exogene k = 1 şi pentru n = 2 0 dL: = 1. 1.14 r1 t == n 2 5040.48 < 2. dU = 1. Tabel 3 Tabelul ANOVA din Summary output generat de Excel df SS MS F Significance F Regression 1 27076.UNIVERSITATEA ROMÂNO-AMERICANĂ 2014-2015 Aplicație +Ghid proiecte analiză econometrie .014 n − k −1 18 se compară Fcalculat cu Fα.41 şi cum d 2 < d calc < 4 − d 2 ⇔ 1.20.2.18 96. adică sunt independente. k 1 ∑ ( yi − yˆi ) 5040.1.28 şi cum Fcalc = 96. • sx2 MSE 27076.41 < 1. dr.259363 280.4375 13 .17814 27076.Conf.18 și pvalue (significance F)< α (tabel 1 și tabel 3) ⇒ se respinge ipoteza nulă şi se acceptă alternativa.14 este apropiat de 0 putem aprecia că r1 =  0. Tot pentru testarea ipotezei privind autocorelarea erorilor poate fi utilizat şi coeficientul de autocorelaţie de ordinul I: • n ∑ et ⋅ et −1 709. autocorelaţie strict negativă  Deoarece r1=0. autocorelaţie strict pozitivă  valorile variabilei reziduale nu sunt autocorelate.18 2 i =1 sx MSE = = = = 27076. 18 = 8.18 se calculează statistica test F: Fcalculat = = = = 96.1.

Coeficientul de determinare (a calităţii ajustării) R-squared (R2) este un indicator relativ pentru măsurarea intensității legăturii dintre variabile şi deci cu cât punctele vor fi mai apropiate de linia de regresie estimată cu atât va fi mai bună “potrivirea” (goodness of fit).44 i =1 Deoarece R = r. apreciem că între cele două variabile există o legătură liniară.918 32116.2. Testarea semnificaţiei raportului de corelaţie: • se stabilesc ipoteza nulă H0: R nu este semnificativ statisticși ipoteza alternativă H1: R este semnificativ statistic.1.UNIVERSITATEA ROMÂNO-AMERICANĂ 2014-2015 Aplicație +Ghid proiecte analiză econometrie .26 = 0. Testarea semnificaţiei coeficientului de corelaţie pentru colectivitatea generală: • se stabilesc ipoteza nulă H0: ρ = 0 (ρ nu este semnificativ statistic)și ipoteza alternativă H1: ρ ≠ 0 (ρ este semnificativ statistic).6 Testarea intensității legăturii dintre cele două variabile și testarea semnificaţiei indicatorilor utilizaţi Intensitatea legăturii dintre cele două variabile se apreciază cu ajutorul: 1.918 ⋅ 18 • se calculează statistica test t:= tcalculat = = 9. 18 = 2. unde ρ . apreciem că între cele două variabile există o legătură liniară.9182 Fcalculat = ⋅ =⋅ = 94. raportului de corelaţie (coeficientul de determinare). Raportul de corelaţie R: ∑ (y i − yˆ i )2 R = 1 − i =1 ∑ (y i − y ) 2 = 1− 5040. Coeficientul de corelaţie: = r n ∑ xi yi − ∑ xi ⋅ ∑ yi i i i 0. coeficientului de corelaţie.9182 14 . Cum coeficientul de determinare este R 2 = 0. foarte puternică.918 = 2 2 n x2 − x  n y 2 − y  ∑ i  ∑ i ∑ i   ∑i i i i  i  ( ) ( ) Deoarece r = 0. 1. Din Marilena Aura IV.coeficientul de corelaţie la nivelul colectivităţii generale r n − 2 0.n −2 = t 0.84 .82 1− r2 1 − 0. deci coeficientul de corelaţie este semnificativ statistic. • se calculează statistica test F: n − k −1 R2 18 0.5 k 1 − R 2 1 1 − 0.9182 • se compară t calc cu t α. dr.918 → 1.3% din variaţia taxelor este explicată de variaţia veniturilor înregistrate.Conf. 2. directă. univ. 2.1.18 ⇒ respingem ipoteza nulă şi acceptăm alternativa. rezultă că intensitatea legăturii este mare.878 . respectiv că că 84. Deoarece tcalculat > t0.

18 ⋅17.733631 Observations 20 IV.05.16 ≤ yn +1 ≤ 85.n − k −1 ⋅ s yˆ n+1 ≤ yn +1 ≤ yˆ n +1 + tα /2.5679 − t0.7 Estimarea punctuală şi pe interval de încredere a taxelor care trebuie plătite dacă venitul este de 40 mii euro.n − k −1 ⋅ s yˆ n+1 adică unde 85.2.Conf. La sfârşitul părţii de analiză empirică a datelor se vor desprinde concluzii. Eviews. Se prezintă şi se interpretează rezultatele (Summary Output) asistate de unul din programele informatice. unde facilităţile grafice şi de calcul sunt relativ uşor de accesat.18 ⋅17. 01 1   = 294. IV. 655) 2  = + + 280. dacă se aplează butonul Help din meniu.05. 1 15 . 1. Pentru Excel. Pentru utilizarea software-ului Eviews.5679 + t0. Excel sau Minitab sunt unelte de lucru recomandate în acest proiect. Tabel 4 Tabelul Regression Statistics din Summary output generat de Excel Regression Statistics Multiple R 0.16 s 2yˆ n+= 1  xn +1 − x  1 sε 1 + + n  n ∑ xi − x i =1  2 ( ( ) )    1 (40 − 36. univ. un ghid de utilizare Eviews este disponibil în format pdf. dr. s-ar putea găsi că nu există nici o relaţie de dependenţă între variabilele presupuse a fi într-o relaţie de dependență.8343442 Standard Error 16. Deoarece Fcalc > F0.9181846 R Square 0. Se va raporta acest lucru care este destul de important pentru justificarea luării în considerare a unui alt factor de influenţă pentru variabila studiată.3 Se scrie raportul de cercetare 1. Pentru aceasta faceți clic pe Analiză date („Data Analysis”) din meniul Instrumente (Tools). este necesar să încărca ți programul de completare Analysis ToolPak (Excel Options.59 2 5119. accesați instrumentul de analizare a datelor „Analysis ToolPak”.UNIVERSITATEA ROMÂNO-AMERICANĂ 2014-2015 Aplicație +Ghid proiecte analiză econometrie . Pentru estimarea punctuală vom avea yˆ n +1 = −6. pentru o probabilitate de 95%.8430629 Adjusted R Square 0. 75   20   2 Deci intervalul de încredere pentru taxele plătite pentru un venit de 40 mii euro este: 41. Calculele se verifică rulând unul din programele informatice specifice (Eviews/Excel). Din Marilena Aura • se compară Fcalc cu .2997 ⋅ 40 = 85. Add-ins).4201 + 2. De exemplu. 77 (euro) ≤ yn +1 ≤ 129. chiar dacă acestea nu coincid cu cele aşteptate. În cazul în care comanda Analiză date nu este disponibilă.1. Calculele efectuate cu Eviews sau Excel vor fi disponibile într-un fişier atașat pentru a putea fi urmărite și verificate. deci raportul de corelaţie este semnificativ statistic.5679 euro Pentru estimarea pe interval de încredere vom avea: yˆ n +1 − tα /2. 18 = 8.36 (euro) .28 ⇒ se respinge ipoteza nulă şi se acceptă alternativa.

Welfare Benefits and Migration. V. V. 229–238. Se furnizează propriile concluzii şi răspunsul găsit la întrebare şi se compară cu eventualele rezultate descrise de alte articole. se reformulează întrebarea de cercetare. Care dintre rezultatele obținute ar putea genera o mai mare confidenţă şi cum s-ar extinde acestea la răspunsurile raportate în alte articolele similare? V. Rosenzweig and O. North Holland. Se va răspunde dacă ele sprijină sau vin în contradicţie cu teoria economică. Dacă este cazul. se va încerca adăugarea unui nou factor explicativ pentru a vedea în ce măsură se îmbunătăţeşte similitudinea modelului prin trecere la un model multifactorial. VI. CONCLUZII V. REFERINŢE BIBLIOGRAFICE Exemplu de scriere GREENWOOD. 1B. indiferent dacă acestea coincid sau nu cu răspunsurile întâlnite. Concluziile vor fi personale.AND J. M. univ. Din Marilena Aura Pentru un model valid. Vol. ca o continuare a acestui demers. rezultate din calcule statistice şi testări.4 Sugestii privind continuarea cercetărilor Se va sugera o viitoare cercetare asupra subiectului dezvoltat. Stark. ed. KENNAN. ANEXE Aici puteți pune calculele mai detaliate care conțin formule. pe intervale de prognoză.1 Se furnizează propriile concluzii Se reaminteşte subiectul. WALKER (2010): “Wages. estimarea valorilor probabile ale fenomenului studiat (simularea acestuia) în funcţie de posibile valori pe care le poate lua factorul economic. etc.J. 156.” in Handbook of Population and Family Economics.” Journal of Econometrics. R. V.3 Confirmarea rezultatelor Se vor compara rezultatele obţinute cu cele din literatura consultată. prognoza fenomenului în funcţie de valorile variabilei explicative.. sau tabelele (numerotate. respectiv întrebarea analizată.Conf. pentru a putea face trimitere la ele) 16 . (1997): “Internal Migration in Developed Countries. J. dr. dacă este cazul. by M.UNIVERSITATEA ROMÂNO-AMERICANĂ 2014-2015 Aplicație +Ghid proiecte analiză econometrie .2 Atingerea obiectivelor Se va urmări să se puncteze atingerea obiectivelor metodei econometrice din practica economică: explicarea variaţiei fenomenului considerat ca efect datorat variaţiei variabilei factor. R.

univ. dr.UNIVERSITATEA ROMÂNO-AMERICANĂ 2014-2015 Aplicație +Ghid proiecte analiză econometrie .Conf. Din Marilena Aura Anexa 1 17 .