You are on page 1of 25

Tema: Analiza statistică a legăturilor

dintre variabilele economice
1. Conceptul de legătură statistică
2. Tipuri de legături între variabilele
economice
3. Metode elementare de caracterizare a
legăturilor dintre variabile
4. Metoda regresiei
5. Indicatorii sintetici ai corelaţiei

1. Conceptul de legătură statistică
Asupra fenomenelor social-economice acţionează
un număr de factori principali şi secundari, esenţiali şi
neesenţiali, care se găsesc în legătură reciprocă.
Statistica, cu ajutorul unei game variate de
procedee şi metode, poate studia manifestarea
concretă a acestor legături, le poate exprima
cantitativ şi măsura intensitatea cu care se produc.
Legăturile dintre fenomenele şi procesele
economice diferă de legăturile care se stabilesc între
fenomenele din domeniul ştiinţelor tehnice şi ale
naturii. Pentru acest domeniu legăturile sunt
predominant cauzale, în sensul că unul din fenomene
determină în mod univoc (ce are un singur sens)
schimbarea celuilalt. În acest caz este vorba de o
legătură funcţională.

xp sunt factori care acţoinează împreună asupra variabilei rezultative şi între care există şi o componentă aleatoare. în care x1. . a celei de a doua. . unei valori din şirul caracteristicii-cauză îi corespunde o singură valoare din şirul caracteristicii-efect. .. de aceeaşi măsură. iar modificării cantitative a primei caracteristici îi corespunde o modificare cantitativă.În cadrul legăturilor funcţionale. x2. xp).. Astfel de legături se pot modela printr-o funcţie matamatică de forma: yi = f(x1. x2.. .. .

ci numai la nivelul întregului ansamblu. se consideră întîmplătoare. care nu pot fi verificate pentru fiecare caz în parte. endogenă sau efect). exogenă sau cauză) – exercită o anumită influenţă asupra unei alte caracteristici „y” – denumită caracteristică rezultativă (dependentă.Legăturile dintre fenomenele şi procesele economice apar ca legături statistice (stohastice). . datorită faptului că asupra caracteristicii dependente exercită influenţă şi alte caracteristici care. În cadrul legăturilor statistice. din punctul de vedere al legăturii dintre „x” şi „y”. Specific legăturilor din domeniul social-economic este faptul că legile care acţionează în cadrul acestora au caracter de legi statistice. unei valori a caracteristicii factoriale „x” îi corespunde o distribuţie de valori a caracteristicii rezultative „y”. Particularitatea acestui tip de legătură constă în fapul că: o caracteristică „x” – denumită caracteristică factorială (independentă.

. După numărul caracteristicilor care se iau în studiu: –legături simple. cînd se consideră că există o singură caracteristică factorială cu caracter esenţial care determină o caracteristică rezultativă. Tipuri de legături între variabilele economice Criteriile de clasificare a legăturilor statistice dintre variabilele socio-conomice: 1. legătura dintre suprafaţa comercială (x) şi valoarea desfacerilor (y)). –legături multiple. cînd se iau în studiu şi se interpretează mai mult de două caracteristici factoriale.2. iar ceilalţi factori sunt cu acţiune constantă interpretaţi ca factori reziduali (de exemplu.

3. iar cele între caracteristici calitative – asocieri statistice.2. legătura între studii şi ocupaţie). cînd creşterii valorii unei caracteristici factoriale îi rezultative. Legăturile dintre caracteristicile numerice se mai numesc şi corelaţii statistice. între valoarea încasărilor realizate la un hotel (y) şi numărul locurilor de cazare ale acestuia (x)). După felul de exprimare a caracterisricilor: – legături între variabilele statistice exprimate numeric. – legături inverse. După direcţia legăturilor: – legături directe. (de exemplu. cînd la creşterea (sau descreşterea) valorilor caracteristicii factoriale corespunde creşterea (sau descreşterea) valorii caracteristicii rezultative. (de exemplu. corespunde descreşterea caracteristicii . – legături între variabilele statistice exprimate prin cuvinte.

în acelaşi timp se modifică şi variabila rezultativă. După timpul cînd se produce legătura pot fi: – legături concomitente sau sincrone. . funcţie exponenţială etc. cînd se exprimă prin ecuaţia liniei drepte. – legături asincrone sau cu decalaj. pe măsură ce se modifică variabila factorială. După expresia analitică a legăturilor deosebim: – legături liniare. – legături neliniare sau curbilinii. la care variaţia caracteristicii rezultative se produce după scurgerea unei perioade de timp de la modificarea variabilei factoriale.4. cînd se exprimă prin ecuaţia unei curbe (parabolă. hiperbolă. la care.) 5.

3. – metoda grafică. – metoda tabelului de corelaţie. . – metoda grupărilor.Metode elementare de caracterizare a legăturilor dintre variabile Metode elementare sau simple de cercetare a legăturilor statistice sunt: – metoda seriilor paralele sau interdependente.

pentru sistematizarea datelor se recurge la metoda grupărilor. Seriile paralele se folosesc numai cînd avem un număr mic de unităţi observate. Prin compararea seriilor de valori astfel ordonate se poate stabili dacă există sau nu legătura între ele şi direcţia acesteia. în ordinea crescătoare sau descrescătoare a caracteristicii factoriale.Metoda seriilor paralele sau interdependente constă în aşezarea a două serii în paralel. În cazul unui număr mare de unităţi observate şi la care amplitudinea variaţiei este mare. .

calculaţi pe grupe). Prin compararea variaţiei caracteristicii factoriale cu aceea a caracteristicii rezultative (variaţie exprimată sub forma indicatorilor derivaţi. direcţia şi intensitatea ei. . se poate aproxima caracterul legăturii. iar pentru caracteristica rezultativă se calculează indicatorii derivaţi (mărimi relative sau medii) specifici fiecărei grupe. În cazul fenomenelor social-economice se recomandă ca. să se folosească grupe de intervale egale pentru fiecare dintre caracteristicile implicate în analiza de corelaţie. Studiul legăturii se realizează după ce unităţile colectivităţii se grupează în funcţie de caracteristica factorială. în general.Metoda grupărilor reprezintă un model de analiză capabil să surprindă aspectele esenţiale ale legăturilor dintre variabilele economice şi sociale.

Metoda se utilizează în cazul unui număr mare de observaţii. iar valorile caracteristicii rezultative în ordine descrescătoare în capetele rîndurilor. Dacă frecvenţele se repartizează pe întregul tabel fără nici o regularitate. Valorile caracteristicii factoriale se trec în ordine crescătoare în capetele coloanelor. cînd diagonala leagă unghiul stîng de jos al tabelului cu ungiul drept de sus legătura este directă. atunci sau nu există legătură. Se recomadă ca numărul grupelor formate după cele două caracteristici să fie aproximativ egal. Modul de aşezare a frecvenţelor în jurul diagonalei ne dă posibilitatea să apreciem intensitatea legăturii: concentrarea intensă a frecvenţelor în jurul diagonalei indică existenţa unei legături strînse între caracteristici. în care separarea pe grupe a unităţilor se face după variaţia ambelor caracteristici – factorială şi rezultativă. .Metoda tabelului de corelaţie constă în construirea unui tabel cu dublă intrare. În funcţie de modul de repartizare a frecvenţelor în tabelul de corelaţie se poate aprecia direcţia legăturii şi intensitatea ei. iar cînd uneşte ungiul stîng de sus cu ungiul drept de jos se apreciază că între cele două caracteristici există legătură în sens invers. În unele cazuri direcţia legăturii este dată de poziţia diagonalei în jurul căreia se grupează frecvenţele. iar intervalele de grupare la fel să fie egale. În rubricile formate la întretăierea acestora se înscriu frecvenţele cu care cele două caracteristici se încadrează în intervalele respective. sau aceasta este foarte slabă.

de aceea metoda grafică se mai numeşte „metoda norului de puncte”. Fiecare unitate observată purtătoare a celor două caracteristici corelate se reprezintă pe grafic printr-un punct. Reprezentarea grafică a legăturii în cîmpul de corelaţie are aspectul unui nor de puncte.Metoda grafică constă în construirea graficului de corelaţie – denumit şi corelogramă. valorile caracteristicii rezultative (y) sau intervalele respective. Metoda grafică este utilizată cu bune rezultate pentru alegerea funcţiei analitice care se studiază (în cazul regresiei şi corelaţiei). Procedura este următoarea: valorile caracteristicii factoriale (x) sau intervalele acesteia se trec pe abscisă. ce foloseşte sistemul axelor rectangulare. . respectiv primul lor cadran. iar pe ordonată.

x2. în care  reprezintă o eroare aleatoare (o variabilă reziduu). modelul teoretic se înlocuieşte cu modelul de dependenţă statistică: y = f(x1. xn” variabilele independente.. . . statistica foloseşte o serie de metode analitice: metoda regresiei şi metoda indicatorilor sintetici ai corelaţei. obţinem ecuaţia de regresie: y= f(x1. cu dispersia constantă şi media nulă. . xn) +.. deosebim: – regresie unifactorială sau simplă. – regresie multifactorială sau multiplă. dacă funcţa include mai mulţi factori. . x2 .. Notînd cu „y” variabila dependentă şi cu „x1.. În funcţie de numărul factorilor care influenţează caracteristică rezultativă (y). x2. Metoda regresiei Pentru a înlătura neajunsurile utilizării metodelor elementare în studiul legăturilor dintre fenomenele economice. Metoda regresiei constituie o metodă statistică de cercetare a legăturii dintre variabile cu ajutorul unor funcţii denumite funcţii de regresie.. .4.. xn) Datorită caracterului aleator al fenomenelor şi proceselor socialeconomice. dacă funcţia include un factor.

Regresia unifactorială descrie legătura dintre două variabile (y şi x). ca de exemplu: metoda verosimilităţii maxime. Modelul liniar. în care „a” şi „b” sunt coeficienţii (parametrii) ce urmează să fie ˆ calculaţi. Ecuaţia de regresie este: Y= f(x) + Cele mai cunoscute modele de regresie unifactorială sunt: 1. iar Yxi se citeşte „y ajustat cu xi ”. care presupune ca suma pătratelor abaterilor dintre ˆ valorile empirice (reale) „y” şi valorile teoretice (ajustate) Yxi să fie minimă. metoda celor mai mici pătrate etc.Yˆxi )2 = minim . cînd legătura dintre „y” şi „x” este liniară şi cînd aceste caracteristici variază în progresie aritmetică: yi =  + xi +  Acest model teoretic se estimează printr-o ecuaţie medie de tendinţă care se poate scrie astfel: Yˆxi = a + bxi . frecvent. se foloseşte MCMMP. adică: (yi . considerînd că ceilalţi factori au o acţiune constantă asupra caracteristicii dependente y. În practică. Parametrii „a” şi „b” se estimează cu ajutorul unor metode specifice oferite de statistică.

este valoarea lui „y” cînd „x” este egal cu zero. se obţine sistemul de ecuaţii normale: na + bxi = yi axi + bxi2 = yixi unde „n” reprezintă numărul unităţilor observate rezolvînd sistemul de ecuaţii obţinem valorile lui „a” şi „b”: y x x y x  a n x    x  i 2 i 2 i i i 2 i i b n  x i y i   xi  y i n  xi2    xi  2 Coeficientul „a” poate lua atît valori pozitive cît şi negative. . respectiv. reprezintă ordonata la origine. În funcţie de semnul coeficientului de regresie putem aprecia tipul de legătură: în cazul corelaţiei directe b0. În graficul de corelaţie coeficientul „b” indică panta liniei drepte. Coeficientul „b” denumit coeficient de regresie – arată măsura în care se modifică caracteristica dependentă în cazul în care caracteristica independentă se modifică cu o unitate.Înlocuind pe Yˆxi cu valoare sa obţinem: (yi – a . în cazul corelaţiei inverse b0 şi în cazul în care b=0 se apreciază că cele două variabile sunt independente.bxi)2 = minim Derivînd această sumă în raport cu derivatele parametrilor „a” şi „b”. anulând derivatele parţiale.

cu ajutorul cărora se ajustează seria empirică. . Modelul exponenţial. cînd legătura dintre cele două variabile este de formă exponenţială şi cînd variabila dependentă creşte în progresie aritmetică. se obţin prin antilogaritmare.2. modelul se poate transforma într-un model liniar de forma: log Y = log a + x * log b i Sistemul de ecuaţii normale este: nlog a + log bxi = log yi log axi +log bx i2= (xilog yi ) Cei doi parametri „a” şi „b”. iar variabila independentă creşte în progresie geometrică: yi =  x +  Cei doi parametri se estimează folosind modelul (funcţia de estimaţie): Yˆx = abx Prin logaritmare.

Modelul parabolic de gradul doi: yi =  + xi + xi2 +  Pentru estimarea parametrilor se foloseşte funcţia de estimaţie: Yˆxi = a + bxi + cx i2 +  Determinarea celor trei parametri ai ecuaţiei de regresie de tip parabolic se face folosind metoda celor mai mici pătrate. respectiv. determinînd minimul expresiei: (yi – a – bxi – cxi2)2 = minim Se obţine sistemul de ecuaţii normale: na + bxi + cxi2 = yi axi + bxi2 + cxi3= yixi axi2 + bxi3 + cxi4= yixi2 .3.

4. curba este descrescătoare. Modelul hiperbolic. cînd are loc o dependenţă inversă dintre cele două variabile (x – scade. curba este crescătoare. Modelul logaritmic: yi =  +  logxi +  ˆ Y Funcţia de estimaţie este: xi = a + b logxi Când a0 şi b0. se ajunge la următorul sistem de ecuaţii normale: na + blogxi = yi alogxi + b(logxi2) = yi logxi . y – creşte şi invers): yi =  + 1/xi *+  Funcţia de estimaţie este: =Yˆaxi+ 1/x *b. iar cei doi parametri rezultă din rezolvarea sistemului de ecuaţii normale: na + b1/xi = yi a1/xi + b1/xi2 = yi *1/xi 5. Folosind metoda celor mai mici pătrate. iar când a0 şi b0.

ai (i = 1.. unde: x1. Asemenea legături se pot exprima cu ajutorul ecuaţiei de regresie multiplă dată de relaţia: Y = f(x1. . . xp reprezintă caracteristicile independente sau factoriale....p) – sunt coeficienţii de regresie multiplă şi arată ponderea cu care influenţează fiecare caracteristică „x” asupra caracteristicii rezultative „y”.. x2. cu dispersia constantă şi media nulă. care se caracterizează prin influenţa unui număr mare de factori (variabile independente) asupra caracteristicii rezultative (variabila dependentă). x2..Regresia multifactorială descrie legături complexe între fenomenele economico-sociale. Cel mai utilizat model de regresie multifactorială este modelul liniar: yi =  0 +  1 x1 +  2x2 + … +  pxp +  Funcţia de estimaţie este: = a0 + a1 x1 + a2 x2 + .. consideraţi cu acţiune constantă. xp) +. + ap xp. Yˆxi unde: a0 – reprezintă coeficientul care exprimă influenţa factorilor neincluşi în model.  ..variabilă reziduu. .

....... – ap xp)2 = minim Prin derivare obţinem un sistem de ecuaţii normale cu „p” variabile factoriale şi „p+1” parametri......... a1 .. + apxp = yi a0 x1 + a1x12 + a2x2x1+ .......................... ap se calculează pe baza MCMMP....... respectiv: na0 + a1x1 + a2x2 + . a0 xp + a1x1xp + a2x2xp+ ............ fie semn negativ şi arată tipul de legătură (directă sau inversă) dintre variabila factorială „xi” şi variabila rezultativă „y”..... + apxp2 = yixp Coeficienţii de regresie pot avea fie semn pozitiv....... a2 ... în care: (yi – a0 – a1 x1 – a2 x2 .... + apxpx1= yi x1 ...Specific regresiei multiple liniare este faptul că variabila rezultativă „y” se modifică uniform în cazul în care variabilele factoriale „xi” se modifică cu o unitate. Parametrii a0 .... ............

Precizarea este valabilă atît pentru modelele de regresie unifactorială cît şi pentru modelele de regresie multifactorială. modelul exponenţial de mai sus se poate transforma într-un model liniar. Notă: Pentru a verifica care model este cel mai potrivit.Un alt model de regresie multifactorială este modelul exponenţial de forma: a Yˆxi  a0 x1a1 * x2a2 * .. . Se consideră ca cel mai adecvat modelul pentru care suma pătratelor abaterilor este cea mai mică.. * x p p Prin logaritmare. se calculează suma pătratelor abaterilor dintre valorile reale şi valorile ajustate (după modelele propuse).

y) – se obţine ca o medie aritmetică a produselor abaterilor variabilelor faţă de media lor: 1 n cov x. Indicatorii sintetici ai corelaţiei Printre indicatorii sintetici ai corelaţiei pot fi numiţi: – covarianţa.5. y     xi  x    yi  y  n i 1 Semnul indicatorului arată direcţia legăturii: (+) – legătură directă. Pe măsură ce intensitatea corelaţiei creşte şi covarianţa creşte. Covarianţa e nulă dacă variabilele sunt independente (lipsa legăturii de corelaţie).y)| nu are limită superioară. – raportul de corelaţie. (-) – legătură inversă. Astfel: | cov (x. simbolizat prin: cov (x. – coeficientul de corelaţie multiplă etc. În cazul unei legături funcţionale şi liniare valoarea absolută maximă covarianţei este egală cu produsul σx * σy . Valoarea sa absolută |cov (x. – coeficientul de corelaţie liniară simplă. Covarianţa.y)|= σx * σy .

adică satisface inegalităţile:  1  r  1 . putem vorbi de o legătură relativ 0. În cazul în care r = 0. Semnul semnifică tipul de legătură: semnul minus indică legătura inversă.95 .95  r  1 deterministă (funcţională) . există o legătură de intensitate medie. cu atît corelaţia rectilinie dintre variabilele „x” şi „y” este mai puternică.5  r  0.75  r  0. 0.2 . scade şi intensitatea legăturii dintre cele două variabile. există o legătură puternică 0. În practică se consideră că. dacă: . Cu cât coeficientul de corelaţie liniară simplă are valori mai apropiate de 1 sau –1. iar pentru r = 1 rezultă dependenţă funcţională între cele două variabile. nu există o legătură semnificativă.75 .2  r  0.Coeficientul de corelaţie liniară simplă măsoară numai intensitatea legăturii de tip liniar dintre două variabile „x” şi „y” : r  n  x n  xi y i  2 i x y    x   n  y    y   n   xi  x    yi  y  sau folosind covarianţa: 2 i r i i 2 2 i cov(xi . 0  r  0. yi )   xi   yi i i 1 n   xi   yi Coeficientul de corelaţie liniară simplă poate lua valori cuprinse între: –1 şi +1. variabilele sunt independente sau necorelate liniar.5 . semnul plus indică legătura directă. 0. există o legătură slabă. Pe măsură ce coeficientul de corelaţie se apropie de zero.

Notă: În cazul corelaţiei liniare. denumit şi coeficientul de corelaţie Pearson. cu atât legătura de corelaţie este mai puternică şi invers.Raportul de corelaţie. Cu cât valoarea raportului este mai apropiată de 1. ca un test de verificare a liniarităţii legăturii: r   . raportul de corelaţie este egal cu coeficientul de corelaţie liniară simplă luat în valoare absolută şi poate fi considerată această relaţie. măsoară atât intensitatea legăturilor liniare cât şi curbilinii (neliniare) dintre două variabile:    1  y yi  Yˆxi i  y  2 2 Raportul de corelaţie poate lua valori între 0 şi 1.

x p    1  y yi  Yˆx1 . Pătratul coeficientului de corelaţie multiplă este cunoscut în literatura de specialitate sub denumirea de coeficient de determinaţie multiplă (R2).. Rezultă relaţia: R2 + (1-R2) = 1 . Evident..x p i  y  2 2 Acest coeficient are întotdeauna valoare pozitivă şi este mai mare decît oricare coeficient de corelaţie simplă dintre variabilelele factoriale şi cea rezultativă.. El exprimă ponderea cu care influenţează concomitent caracteristicile factoriale. x2 . ponderea cu care influenţează asupra caracteristicii rezultative ceilalţi factori.Coeficientul de corelaţie multiplă măsoară intensitatea legăturii dintre o caracteristică rezultativă „y” şi două sau mai multe caracteristici factoriale „xi” (i = 1. incluse în model. asupra caracteristicii rezultative. x2 ... luat în valoare absolută. se obţine ca diferenţă între unitate şi R2.p): R y . x1 ... Se obţine astfel coeficientul de nedeterminaţie multiplă (1-R2). necuprinşi în model..