You are on page 1of 4

Statistic curs 2

Sistematizarea datelor statistice

n acest curs vom vorbi despre:

prelucrarea primar a datelor

clasificarea statistic

gruparea statistic

centralizarea datelor

rezumarea datelor

De multe ori, n analiza statistic dispunem de o mas de informaii diverse, greu de


cuprins i asimilat. Pentru a deveni utile, informaiile culese necesit prelucrarea i
aducerea lor ntr-o form ct mai concis, dar care s reflecte ct mai fidel realitatea.
Alegerea celei mai bune metode de analiz trebuie s in seama de tipul datelor
culese, de felul n care au fost sistematizate acestea, precum i de adresantul studiului
(mediul academic, mediul de afaceri, publicul larg consumator etc.) i de scopul final al
cercetrii (la ce folosesc rezultatele).
Astfel, pentru a putea observa tendina de evoluie a fenomenului cercetat, legturile
dintre variabilele analizate etc., dup culegerea informaiilor statistice, este necesar
sistematizarea acestora sub form de serii de date i, ulterior, prelucrarea acestora
sub form de indicatori.
Sistematizarea datelor statistice presupune urmtoarele etape:

prelucrarea primar a datelor;

clasificarea datelor nregistrate;

gruparea datelor n funcie de una sau mai multe caracteristici;

centralizarea (colectarea) datelor observrii.

Prelucrarea datelor reprezint ansamblul metodelor, tehnicilor i operaiilor prin care


se determin, pornind de la datele primare o serie de indicatori statistici, se determin
legtura dintre variabile, tendine de evoluie etc.
Clasificarea datelor reprezint divizarea unei colectiviti n clase, n cadrul crora se
manifest asemnri foarte mari ntre elementele componente.
Condiiile pe care trebuie s le ndeplineasc clasificarea sunt:
1. omogenitatea formele de manifestare ale fenomenelor de mas sunt foarte
asemntoare la nivelul tuturor unitilor care compun o clas;
2. completitudinea fiecare unitate din colectivitate trebuie s fie obligatoriu

repartizat la una din clase;


3. unicitatea fiecare unitate trebuie s se gseasc ntr-o singur clas;
Gruparea statistic este procedeul de comprimare (restrngere) a volumului datelor
dup o caracteristic numeric (cantitativ) sau nominativ (calitativ). nsuirea care
st la baza mpririi colectivitii n grupe omogene poart numele de
caracteristic/variabil de grupare.
Gruparea datelor trebuie s porneasc de la o atent analiz a fenomenului/procesului
cercetat. Selectarea variabilei/variabilelor dup care se va realiza gruparea depinde
att de natura lor, de relaia dintre caracteristicile observate, ct i de scopul
cercetrii.
Dup numrul caracteristicilor puse la baza gruprii se disting: grupri simple i
grupri combinate, utiliznd concomitent mai multe caracteristici.
Dup coninutul caracteristicilor, gruprile simple i combinate pot fi: teritoriale,
cronologice sau atributive.
De exemplu, gruparea studenilor dintr-un amfiteatru n funcie de nota obinut la
un test conduce la obinerea a (cel mult) zece subcolectiviti deoarece, oficial, notele
acordate sunt valori ntregi de la 1 la 10. n realitatea empiric, unele note (variante)
pot lipsi, ntruct nici un student din acel amfiteatru n-a obinut, s zicem, nota 1 sau
2. Deci, numrul real de grupe va fi 8, corespunztor notelor (variantelor) observate n
colectivitate: de la 3 la 10.
Gruparea se poate face:
1. pe variante n cazul n care numrul valorilor pe care le nregistreaz o
variabil este mic;
2. pe intervale

egale cnd lungimea intervalelor care reprezint grupele este aceeai;

neegale cnd lungimea intervalelor de grupare difer;

deschise - cu una dintre limite nedefinit;

intervale inchise - cu ambele limite clar precizate.

Centralizarea datelor observrii (colectarea) const n strngerea la un centru de


prelucrare a tuturor formularelor i, pentru caracteristicile aditive, nsumarea
valorilor nregistrate, n scopul obinerii de indicatori totalizatori.
Exemple: totalul populaiei Romniei la terminarea recensmntului; totalul lunar al
exporturilor de mrfuri nregistrate la punctele vamale; totalul rspunsurilor primite
la una dintre ntrebrile unei anchete statistice etc.
Exist centralizri simple i centralizri pe grupe.

Centralizarea pe grupe presupune stabilirea prealabil a grupelor specifice


colectivitii observate i are drept scop cunoaterea mai detaliat a fenomenului sau
procesului, permind analiza structurii colectivitii. De exemplu: centralizarea
datelor recensmntului n funcie de mediul n care locuiesc subiecii: populaie
urban/populaie rural; gruparea datelor n funcie de numrul membrilor fiecrei
gospodrii sau n funcie de nivelul de instruire al capului familiei etc.
n statistic lucrm cu date nerezumate i date rezumate.
Necesitatea rezumrii datelor vine din clarificarea caracteristicilor comune ale
acestora i gruparea datelor n funcie de acestea.
Exemplu: Datele de mai jos arat numrul de studeni care particip la cercul de
economie n cadrul a 20 de ntlniri diferite organizate pe parcursul semestrului:
27, 27, 38, 24, 33, 23, 15, 33, 20, 28, 22, 29, 17, 21, 34, 25, 28, 30, 32, 34.
Pe baza acestor date nu ne putem forma o idee clar a valorilor. Dac, de exemplu,
cineva dorete s determine care este intervalul n care se situeaz cea mai mare
pondere a valorilor doar privindu-le i va fi destul de dificil s fac acest lucru.
n aceast situaie ar fi recomandat s rezumm aceste date. Pentru rezumarea
datelor construim urmtoarele distribuii:

distribuia de frecven

Clase

Frecvena absolut

Cel puin 15, dar sub 20

Cel puin 20, dar sub 25

Cel puin 25, dar sub 30

Cel puin 30, dar sub 35

Cel puin 35, dar sub 40

De cele mai multe ori la cercul de economie particip ntre 25 i 30 sau ntre 30 i 35
de studeni

distribuia de frecven relativ

Clase

Frecvena relativ

Cel puin 15, dar sub 20

2:20=0,10

Cel puin 20, dar sub 25

5:20=0,25

Cel puin 25, dar sub 30

6:20=0,30

Cel puin 30, dar sub 35

6:20=0,30

Cel puin 35, dar sub 40

1:20=0,05

n 30% de ntlniri ale cercului de economie particip ntre 25 i 30 de studeni sau

ntre 30 i 35 de studeni.

distribuia de frecven cumulativ

Clase

Frecvena cumulativ

Mai puin de 20

Mai puin de 25

Mai puin de 30

13

Mai puin de 35

19

Mai puin de 40

20

distribuia de frecven cumulativ relativ

Clase

Frecvena cumulativ relativ

Mai puin de 20

2:20 = 0,10

Mai puin de 25

7:20 = 0,25

Mai puin de 30

13:20 = 0,65

Mai puin de 35

19:20 = 0,95

Mai puin de 40

20:20 = 1