You are on page 1of 7

Curs 1

Statistica reprezintă o componentă esenţială în procesul de cunoaştere a condiţiilor de


manifestare probabilistică a fenomenelor socio-economice. Statistica este ştiinţa care, prin
propriul instrumentar, permite descrierea şi modelarea fenomenelor complexe, fenomene ce
aparţin unor procese de tip stochastic.

Statistica, ca orice ştiinţă, deţine propriile tehnici de investigare, aplicate în următorii


paşi:
1. Obţinerea datelor
2. Organizarea şi prezentarea datelor
3. Analiza datelor
4. Realizarea inferenţei (extinderea rezultatelor, realizarea previziunilor, luarea deciziilor).

Pasul 4 reprezintă obiectivul statisticii, adică realizarea inferenţei asupra populaţiei,


pe baza informaţiilor obţinute pe un eşantion reprezentativ extras aleator din respectiva
populaţie.

Concepte de bază
Pentru înţelegerea corectă a demersului statistic, desfăşurat în cei patru paşi, este
necesară definirea şi înţelegerea unor concepte de bază:
[1]. Populaţia statistică (colectivitatea generală) reprezintă o mulţime de elemente de
acelaşi tip, caracterizate de trăsături esenţiale comune şi care fac parte dintr-un grup ce
urmează a fi studiat.
Precizări
 Termenul de populaţie se referă o mulţime de obiecte, persoane, firme, opinii, proiecte etc.
 O populaţie statistică este, în general, finită, prin delimitarea sa în timp, spaţiu şi ca formă
organizatorică.
 Unele populaţii finite sunt atât de numeroase încât pot fi considerate infinite.
 Observarea elementelor unei populaţii, cu excepţia unor situaţii riguros argumentate, se face prin
intermediul cercetărilor parţiale pe bază de eşantion reprezentativ.

1
[2]. Eşantionul (colectivitate de selecţie, colectivitate parţială) reprezintă submulţimea de
elemente selectate dintr-o populaţie statistică care deţine aceleaşi trăsături esenţiale ce
caracterizează populaţia statistică din care a fost extras.
[3]. Unitatea statistică reprezintă elementul din populaţia statistică care deţine un
nivel/valoare pentru fiecare caracteristică observată în cadrul cercetării statistice.
[4]. Variabila/caracteristica statistică reprezintă trăsătura, însuşirea comună tuturor
elementelor unei populaţii ce înregistrează valori sau variante distincte pentru fiecare
unitate statistică din populaţia observată.
Tipologia variabilelor statistice determină utilizarea unor metode, tehnici diferite de
analiză. Pentru alegerea metodei adecvate este necesară clasificarea variabilelor în funcţie de
următoarele criterii:

i. Modul de exprimare ce împarte variabilele în două categorii:

A. Variabile nenumerice sau calitative ce descriu prin cuvinte o anumită trăsătură;


Exemple
Variabile nenumerice Variabile numerice
tipul de cultura un eşantion de loturi profitul unor firme,
agricole, productia medie la hectar pentru un eşantion de
nivelul ultimelor studii absolvite de un grup loturi agricole,
de persoane, numărul de angajaţi permanenţi ai unei societăţi
genul persoanei, agricole,
domeniul de activitate al unor firme etc. valoarea vânzărilor lunare,
media la examenul de bacalaureat etc.

B. Variabile numerice sau cantitative ce ce descriu prin cifre o anumită trăsătură şi


reprezintă rezultatul unui proces de numărare sau măsurare;

Variabile numerice pot fi cu variaţie discontinuă (variabilă discretă) sau cu cu variaţie


continuă (variabilă continuă):
Exemple
Variabile numerice discrete Variabile numerice continue
numărul membrilor unei familii, profitul unor firme,
numărul contractelor incheiate anual de un valoarea facturilor emise lunar de o firmă,
eşantion de firme dintr-un domeniu de media la examenul de bacalaureat,
activitate, greutatea unei persoane,
numărul angajaţilor pentru un eşantion de cifra de afaceri a unei firme,

2
firme etc. rata şomajului la nivel de judeţ,
înălţimea unei persoane etc.

În practică, continuitatea unor variabile poate să fie limitată de precizia măsurătorilor


(exemplu: vârsta în ani împliniţi). De asemenea, unele variabile, deşi discrete, au salturile
discontinuităţii atât de mici în raport cu ordinul de mărime al lor, încât pot fi considerate
continue (exemplu: populaţia unei ţări).

ii. Dimensiunea în care sunt definite, ce clasifică variabilele astfel:


A. Variabile de timp ce iau în considerare dimensiunea temporală;

B. Variabile de spaţiu ce iau în considerare dimensiunea teritorială;

C. Variabile atributive ce se referă la un atribut, altul decât timpul sau spaţiul.


Exemple
Variabile de timp Variabile de spaţiu Variabile atributive
anul înfiinţării unor firme, judeţul de reşedinţă al unor persoane, numărul salariatilor unei firme,
durata necesară pentru zona de amplasare a unor magazine genul persoanei,
prestarea unui serviciu etc. profesia unei persoane,
cifra de afaceri a unor agenţi
economici etc.

iii. Numărul variantelor înregistrate, ce împarte variabilele în două clase:


A. Variabile binare, alternative, numite şi variabile dummy în literatura de specialitate.
Aceste variabile pot avea două variante de răspuns după modelul adevărat/fals din logică.
B. Variabile nealternative ce pot înregistra mai mult de două variante/valori.
Exemple
Variabile alternative Variabile nealternative
genul persoanei (masculin/feminin), profitul unor firme,
mediul de rezidenţă (urban/rural), valoarea facturilor emise lunar de o anumită firmă,
starea civilă (căsătorit/necăsătorit) media la examenul de bacalaureat,
greutatea unei persoane,
cifra de afaceri a unei firme,
rata şomajului la nivel de judeţ,
înălţimea unei persoane etc.

Orice caracteristică nealternativă poate fi transformată într-una alternativă, printr-un proces


de dihotomizare: salariul mai mic de 4500 lei/mai mare de 4500 lei.

3
iv. Relaţia de cauzalitate ce clasifică variabilele în două categorii:
A. Variabile independente/cauzale/factoriale/exogene utilizate în modele pentru a
explica variaţiile, modificările valorilor altor variabile considerate a fi influenţate de
acestea.
B. Variabile dependente/efect/endogene utilizate în modele deoarece prezintă un anumit
interes, observat şi măsurat pentru a evalua efectele unei variabile independente.

Numărul, tipul şi maniera de înregistrare a valorilor variabilelor statistice generează


complexitatea datelor statistice.

Metodele de organizare, prelucrare şi analiză a datelor statistice depind atât de nivelul


de scalare utilizat pentru fiecare variabilă, cât şi de complexitatea datelor.

Tipuri de scale
Într-un sens larg, toate datele statistice sunt „măsurate” sau transpuse pe o scală de
măsurare, într-o formă sau alta. Măsurarea presupune, în anumite cazuri, asocierea unor
numere variantelor/ valorilor variabilei de interes, în concordanţă cu regulile prestabilite.
Indicatorii statistici calculaţi pentru o variabilă depind de nivelul de scalare utilizat.
În practică se utilizează trei niveluri de măsurare sunt utilizate (de la cea mai slabă la
cea mai puternică):
1. Scala nominală
2. Scala ordinală
3. Scala de raport.

Prelucrarea datelor statistice se va face în mod distinct, în funcţie de gradul de


„rafinament” al scalei.

1. Scala nominală (nominal, în engl.), numită şi scala denumirilor sau categoriilor


reprezintă cea mai simplă formă de măsurare. Ea clasifică unităţile statistice în grupe ai căror
membri diferă după caracteristica nenumerică, fără să implice existenţa unei gradări sau
distanţe între grupe.
Acest nivel de măsurare, specific variabilelor nenumerice, este un mod de clasificare şi
nu unul de aranjare de-a lungul unei axe. Numerele ataşate observaţiilor reprezintă eticheta
categoriei respective, fiind atribuite fiecărei categorii doar pentru a identifica unităţi similare
din interiorul unei categorii şi pentru a diferenţia aceste unităţi similare de elementele unei
alte categorii diferite.

4
2. Scala ordinală (ordinal, în engl.) este utilizată, ca şi scala nominală, pentru
măsurarea variabilelor de tip nenumeric (calitativ) ale căror variante de răspuns pot fi, de
această dată, ordonate. Unităţile pot fi înşiruite una relativ cu cealaltă şi se poate realiza,
astfel, o ierarhizare, dar distanţa între numerele acordate nu este obligatoriu egală. Numerele
pe scala ordinală nu reprezintă intervale egale pe scala de măsurare.

3. Scala de raport (scale, în engl.) sau proporţională se utilizează pentru măsurarea


variabilelor numerice, fiind scala care permite ca afirmaţiile făcute pe baza operaţiilor de
adunare, diferenţă, multiplicare sau divizare să aibă sens.

Exemple

Scala nominală Scala ordinală Scala de raport


ocupaţia persoanelor nivelul studiilor persoanelor (primare, greutatea (în kg),
genul persoanelor, gimnaziale, liceale, universtare), vârsta (în ani),
statutul marital, nivelul de cunoaştere al unei limbi salariul (în lei, EUR) etc.
marca autoturismului etc. străine (începător, mediu, avansat,
experimentat) etc.

Clasificarea datelor statistice


Uzual, se utilizează două criterii de clasificare a datelor statistice: numărul de
variabile utilizat în caracterizarea unui set de date, respectiv dimensiunea temporală la care
se referă datele.
În funcţie de numărul de variabile avem date uni, bi sau multivariate.
Datele univariate sunt cele caracterizate de o singură variabilă statistică,
înregistrându-se o singură valoare pentru fiecare unitate statistică.
Metodele statistice utilizate în cazul acestor date vor viza:
- Organizarea şi prezentarea datelor;
- Analiza trăsăturilor esenţiale ale setului de date: tendinţa centrală, variabilitatea
şi forma distribuţiei.

Datele bivariate sunt cele caracterizate prin intermediul a două variabile statistice
înregistrându-se câte două valori pentru fiecare unitate statistică.

5
Metodele statistice utilizate în cazul acestor date sunt, în primă fază, cele utilizate în
cazul datelor univariate, urmate de metode de analiză a legăturii sau dependenţei dintre cele
două variabile considerate.
Datele multivariate sunt cele care se referă la trei sau mai multe variabile statistice,
obţinând aşadar câte trei sau mai multe valori pentru fiecare unitate statistică. Acestor date li
se pot aplica metodele de analiză utilizate în cazul datelor uni sau bivariate, precum şi metode
complexe care constau în modele de analiză a dependenţei dintre mai multe variabile
statistice.
Exemplu: Pentru studenţii anului I ai facultăţii EAM, dintr-un anumit an universitar, valorile
înregistrate pentru variabile ca: genul, tipul liceului absolvit, mediul de provenienţă, media de
absolvire a liceului, media obţinută la bacalaureat, înălţime, greutatea, nivelul de cunoaştere al unei
limbi străine etc. Constituie un set de date multivariate.

În funcţie de dimensiunea temporală datele statistice pot fi:


 Date transversale (de tip profil, secvenţă sau secţiune) ce reprezintă rezultatul unor
măsurători efectuate la un anumit moment dat de timp asupra uneia sau mai multor variabile de
interes pentru populaţia studiată. Acest tip de date constituie „tăieturi informaţionale”
transversale în raport cu axa timpului (adică nu includ influenţa timpului asupra caracteristicilor
studiate), efectuate într-o populaţie statistică la un moment dat. Numărul observaţiilor concide, în
acest caz, cu numărul unităţilor statistice din colectivitatea studiată.
 Date longitudinale (de tip serii de timp sau serii cronologice) ce reprezintă rezultate
ale unor măsurători efectuate asupra caracteristicilor unităţilor populaţiei studiate, la momente
succesive sau la anumite intervale de timp, fiind clasificate în date de tip stoc sau de tip flux,
reprezentând „secţiuni informaţionale” longitudinale în raport cu axa timpului.
 Date de tip panel sunt combinaţii ale datelor de tip profil şi serii de timp şi
reprezintă rezultate ale măsurătorilor efectuate asupra caracteristicilor unităţilor statistice
dintr-un panel (eşantion fix), la anumite momente succesive de timp. Se obţin astfel, tăieturi
informaţionale transversale şi longitudinale în raport cu axa timpului, trăsătura principală a
acestor date fiind simultaneitatea.

[5]. Frecvenţa de apariţie a unei clase/valori reprezintă numărul de apariţii al acestei


clase/valori în eşantionul studiat.

6
[6]. Statistica descriptivă reprezintă un ansamblu de metode ce au drept scop obţinerea,
organizarea, prezentarea şi prelucrare datelor pentrua descrie aspectele esenţiale ale setului
de date.

[7]. Statistica inferenţială cuprinde totalitatea tehnicilor ce permit generalizări/estimări


pentru populaţia statistică, realizarea previziunilor sau luarea deciziilor pe baza rezultatelor
obţinute pe un eşantion.
Un exemplu sugestiv al modului în care putem să utilizăm statistica inferenţială este cazul în
care dorim să estimăm proporţia locuitorilor unui judeţ care sunt de acord cu o măsură
administrativă pe plan local. Trebuie să fie clar că, deoarece nu vom ancheta întreaga populaţie a
judeţului, ci doar un eşantion reprezentativ, nu vom putea afla această proporţie cu o certitudine de
100%. Acesta este un lucru pe care oricine utilizează metode statistice trebuie să îl înţeleagă. Un
eşantion este doar o mică fracţiune dintr-o colectivitate totală şi poate oferi concluzii corecte doar
într-un procent din cazuri, deci cu o anumită probabilitate situată sub 100%. Vom afla că
statisticienii pot controla această probabilitate şi o fixează, uzual, la 90%, 95% sau 99%.

[8]. Parametrul statistic reprezintă un indicator statistic descriptiv calculat pentru o populaţie
statistică.

[9]. Estimatorul reprezintă indicatorul statistic calculat la nivelul unui eşantion şi care
reprezintă aproximarea valorii adevărate şi necunoscute a unui parametru ce caracterizează
populaţia statistică.
Pentru a ne referi la toate aceste noţiuni într-un exemplu, să presupunem că primarul unui oraş
este interesat să cunoască percepţia locuitorilor privind nivelul de trai. Populaţia statistică este
reprezentată de totalitatea cetăţenilor cu domiciliul în oraşul respectiv. Eşantionul este alcătuit din
acele persoane care sunt selectate aleator să participe la studiu. Scopul cercetării este descrierea
diverselor caracteristici ale populaţiei statistice (parametrii: venitul mediu, numărul salariaţilor,
numărul persoanelor fără loc de muncă, numărul vârstnicilor aflaţi în întreţinerea familiei, vârsta
medie etc.). Acest scop poate fi atins folosind indicatorii statistici (estimatorii) obţinuţi pe baza
eşantionului de locuitori, pentru a estima diferitele caracteristici de interes ale populaţiei. Observăm
astfel că scopul major al statisticii inferenţiale este de a trage concluzii asupra parametrilor
populaţiei statistice, folosind valorile estimatorilor calculaţi pentru eşantion.

You might also like