You are on page 1of 16

2 PREZENTAREA DATELOR STATISTICE Pagina 1 din 16

PREZENTAREA DATELOR STATISTICE

Funcia de baz a statisticii descriptive este prezentarea clar i concis a rezultatelor cercetrii. n acest capitol sunt expuse o serie de tehnici de organizare i prezentare rezumativ a datelor: procente, proporii, raporturi, rate, distribuii de frecvene, diagrame i grafice.

2.1 PROCENTE I PROPORII


Imaginai-v c suntei eful unui departament al unei mari companii de asigurri i c, dorind s prezentai directorului executiv al companiei o problem de personal cu care v confruntai, i spunei urmtoarele: Oamenii din departamentul meu nu sunt suficient de bine pltii. Dei din cei 154 de angajai permaneni ai companiei numai 37 sunt n departamentul meu, din cele 17832 de contracte de asigurare ncheiate n companie anul trecut, 7321 au fost aduse de angajaii din departamentul pe care l conduc. Probabil c dup o astfel de prezentare, directorul executiv ar schia o grimas de plictiseal i ar amna elegant discuia pentru o dat neprecizat. ntruct este vorba de compararea a cte dou numere (personalul departamentului fa de numrul total de angajai ai companiei i volumul de munc din departament fa de volumul total de munc din companie pe timp de un an), procentele i proporiile ar fi fost modaliti mai convingtoare de prezentare a informaiei. Definiiile matematice ale proporiei i procentului sunt urmtoarele: Formula 2.1 Formula 2.2
f Proporie ( p ) = n

Procent (%) =

f 100 n

n care f = frecvena sau numrul de cazuri n fiecare categorie n = numrul total de cazuri (numrul de cazuri din toate categoriile) Urmtorul tabel ilustreaz calcularea proporiilor i procentelor:

2 PREZENTAREA DATELOR STATISTICE Pagina 2 din 16 Tabelul 2.1 Opinia fa de interzicerea fumatului n locurile publice (date fictive)
Opinia Acord Dezacord Nu tiu/Nu rspund TOTAL Frecvena ( f ) 167 72 30 269 Proporia

0,621 0,268 0,111 1,000

Procentul % 62,1 26,8 11,1 100,0

Pentru a afla proporia cazurilor din prima categorie ( De acord cu interzicerea fumatului n locurile publice), notm c avem aici 167 de cazuri ( f = 167) fa de 269 de cazuri n eantion (n = 269). Astfel:
167 f Proporie ( p ) = = = 0, 621 n 269

Procednd la fel, aflm proporiile cazurilor din celelalte categorii. Rezultatele pot fi exprimate sub form de procente. Astfel, procentul de cazuri din cea de-a treia categorie (Nu tiu/Nu rspund) este Procent (%) =
f 30 100 = 100 = 11,1% n 269

Exprimarea rezultatelor prin procente i proporii este cu deosebire util atunci cnd dorim s comparm grupuri de mrimi diferite. S presupunem, de pild, c am adunat urmtoarele date privind dou universiti: Tabelul 2.2 Numrul de studeni nscrii pe specializri la dou universiti (date fictive)
Specializarea Drept tiine Economice Psihologie Sociologie TOTAL Universitatea A 103 82 137 93 415 Universitatea B 312 279 188 217 996

ntruct numrul total de studeni nscrii difer mult de la o universitate la alta, compararea numrului relativ de studeni nscrii pe specializri la cele dou universiti este greu de fcut numai pe baza frecvenelor. Care universitate, de pild, are cel mai mare numr relativ de studeni nscrii la specializarea Psihologie? Pentru a nlesni comparaiile de acest fel, calculm procentele de studeni nscrii pe specializri la cele dou universiti:

2 PREZENTAREA DATELOR STATISTICE Pagina 3 din 16 Tabelul 2.3 Procentul de studeni nscrii pe specializri la dou universiti (date fictive)
Specializarea Drept tiine Economice Psihologie Sociologie TOTAL Universitatea A (%) 24,8 19,8 33,0 22,4 100,0 (415) Universitatea B (%) 31,3 28,0 18,9 21,8 100,0 (996)

Procentele prezentate n acest tabel permit identificarea att a diferenelor, ct i a asemnrilor dintre cele dou universiti. De pild, Universitatea A are un procent mai mare de studeni nscrii la specializarea Psihologie, dei numrul absolut de studeni nscrii la acest profil este mai mic dect la Universitatea B, iar la specializarea Sociologie, procentele sunt aproape aceleai. Remarcai c sub fiecare coloan de procente am menionat totalul n date absolute sau, altfel spus, am menionat dimensiunea eantionului. n general, dac nu se menioneaz baza de comparaie, atunci procentele i proporiile nu ne spun nimic sau chiar ne pot induce n eroare. S presupunem, de pild, c o firm care produce buturi rcoritoare anun c ultimul su produs are cu 20% mai puine calorii. Problema este: 20% mai puin fa de ce? Fr menionarea bazei de comparaie, pretenia firmei respective este lipsit de sens. Unele reclame impresioneaz prin prezentarea unor proporii, cum ar fi Dou din trei persoane prefer marca X de produs mrcii Y. Ce ai gndi despre o astfel de reclam, dac ai afla c, de fapt, au fost chestionate doar trei persoane? Cunotinele de statistic i dovedesc utilitatea i n mai buna nelegere i evaluare a informaiilor statistice prezentate n presa scris sau pe posturile de radio i televiziune. O eroare care poate s apar n folosirea procentelor const din ncercarea de a aduna procentele ca i cum ar fi numere cardinale. S presupunem de pild, c productorul naional de energie electric anun creterea preului pe kilowatt cu 50%. Pentru justificarea acestei creteri, productorul arat c au crescut costurile de producie a energiei electrice, dup cum urmeaz: preul combustibilului folosit n termocentrale cu 10%, costurile investiiilor n retehnologizare cu 20% i cheltuielile cu fora de munc cu 10%, n total, o cretere a costurilor cu 50%. O astfel de justificare este greit. Doar o cretere cu 50% a tuturor costurilor ar justifica o cretere cu 50% a preului pe kilowatt. Revenind la exemplul dat la nceputul aceste seciuni, informaia prezentat directorului executiv al companiei ar fi fost mai convingtoare dac i-ai fi spus: Dei n departamentul meu lucreaz doar 24% din angajaii companiei, oamenii mei au adus 41% din contractele de asigurare ncheiate anul trecut n companie.

2 PREZENTAREA DATELOR STATISTICE Pagina 4 din 16

2.2 RAPORTURI I RATE


S considerm din nou tabelul 2.2. Ct de muli studeni sunt nscrii la tiine economice n comparaie cu cei nscrii la Psihologie n Universitatea B? Putem folosi frecvenele pentru a rspunde la aceast ntrebare, dar un rspuns mai uor de neles poate fi dat folosind un raport. Raporturile se calculeaz mprind frecvena cazurilor dintr-o categorie la frecvena cazurilor din alt categorie, permind astfel compararea categoriilor n termeni de frecven relativ. Definiia matematic a raportului este urmtoarea: Formula 2.3 Raport =
fi fj

n care f i = numrul de cazuri din categoria i f j = numrul de cazuri din categoria j Raportul ne spune exact n ce msur categoria i depete n numr de cazuri categoria j. n exemplul nostru, raportul studenilor nscrii la tiine Economice fa de cei nscrii la Psihologie n Universitatea B este: Raport =
fi 279 = = 1,48 fj 188

Aceasta nseamn c pentru fiecare student nscris la Psihologie exist 1,48 studeni nscrii la tiine Economice. Raporturile pot fi multiplicate cu 100 pentru a elimina virgulele. Astfel, raportul calculat mai sus poate fi prezentat ca 148, ceea ce nseamn c pentru fiecare 100 de studeni nscrii la psihologie exist 148 de studeni nscrii la tiine Economice. Ratele se calculeaz mprind numrul de cazuri reale (efective) la numrul de cazuri posibile pentru variabila de interes pe o anumit unitate de timp. De pild, rata brut a natalitii pentru o populaie se calculeaz mprind numrul de nscui vii la numrul total de persoane din acea populaie pe an, ctul astfel obinut fiind nmulit cu 1000. Se spune c rezultatul este exprimat n promile (0/00). Dac, de pild, ntr-un ora cu 7000 de locuitori s-au nregistrat ntr-un anumit an 100 de nscui vii, rata brut a natalitii este Rata brut a natalitii (0/00) =
100 1000 = 0,0143 1000 = 14,3 0/00 7000

Aceasta nseamn c pentru fiecare mie de locuitori au fost n acel an 14,3 nscui vii. Ca modaliti de a exprima frecvene relative, procentele, proporiile, raporturile i ratele sunt utile n special atunci cnd dorim s comparm diferite grupuri sau/i acelai grup n momente diferite.

2 PREZENTAREA DATELOR STATISTICE Pagina 5 din 16

2.3 DISTRIBUII DE FRECVENE


O distribuie de frecvene este o dispunere a valorilor unei variabile care arat cte cazuri sunt coninute n fiecare categorie a variabilei respective. Construirea unei distribuii de frecvene este, de regul, primul pas n orice analiz statistic. S presupunem c urmtoarele date reprezint scorurile obinute de 180 de subieci la un test de cunotine: Tabelul 2.4 Scoruri obinute la un test de cunotine
68 55 65 42 64 45 56 59 56 42 38 50 37 42 53 52 54 57 49 63 54 38 46 49 33 43 40 29 43 60 69 54 64 41 63 44 55 58 55 41 37 49 36 41 52 51 53 49 48 64 55 37 47 50 34 44 39 30 42 61 43 33 51 50 54 63 68 57 43 56 54 47 37 52 49 36 48 56 24 45 55 46 58 45 32 56 55 49 47 55 44 32 50 49 53 62 67 56 42 55 53 46 36 51 48 35 47 48 25 46 56 45 59 46 33 57 54 50 46 56 54 47 53 53 50 50 65 60 53 40 57 39 36 63 38 57 57 56 55 40 46 48 62 40 45 46 56 44 48 48 55 48 52 52 49 49 64 59 52 39 56 38 35 62 37 56 56 55 56 41 47 49 63 41 46 45 55 45 49 47

Datele brute din tabelul 2.4 sunt greu de urmrit i greu de neles. Sub supoziia c este vorba despre date de interval, putem construi o distribuie de frecvene listnd scorurile diferite n ordine cresctoare i nregistrnd frecvena de apariie a fiecrui scor. Distribuia de frecvene astfel obinut este urmtoarea: Tabelul 2.5 Distribuia de frecvene a scorurilor obinute la un test de cunotine
Scorul 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39
f

1 1 0 0 0 1 1 0 2 3 1 2 4 5 4 3

Scorul 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55

3 4 5 5 4 4 7 9 7 8 11 7 3 6 7 7 12

Scorul 56 57 58 59 60 61 62 63 64 65 66 67 68 69

14 6 2 3 2 1 3 5 4 2 0 1 2 1

2 PREZENTAREA DATELOR STATISTICE Pagina 6 din 16 De notat c aceast distribuie de frecvene red i informaia conform creia n eantionul considerat nu au fost obinute scorurile 26, 27, 28, 31 i 66, aflate ntre cel mai mic scor i cel mai mare scor. n distribuia de frecvene din tabelul 2.5 am inclus toate scorurile diferite cuprinse ntre cel mai mic scor i cel mai mare scor. Cu alte cuvinte, am clasificat datele ntr-un numr de grupuri sau clase egal cu numrul de scoruri distincte. Dup cum arat i acest exemplu, construirea unei distribuii n acest fel are drept rezultat o list destul de lung i nu tocmai clarificatoare. Atunci cnd numrul de scoruri distincte este mare, se opteaz pentru o prezentare mai compact (mai puin detaliat) a datelor, prin gruparea acestora n categorii mai largi, care, n cazul datelor de interval sau de raport, se numesc intervale de clas. n tabelul 2.6 se prezint o distribuie de frecvene pentru datele din tabelul 2.4, n care apar 10 intervale de clas, mrimea fiecrui interval fiind egal cu 5 uniti. Adugnd i o coloan de procente pentru scorurile din fiecare categorie fa de numrul total de scoruri vom spori claritatea prezentrii. Tabelul 2.6 Distribuia de frecvene a scorurilor obinute la un test de cunotine (mrimea intervalului = 5)
Intervale de clas 2024 2529 3034 3539 4044 4549 5054 5559 6064 6569 TOTAL
f

%
0,56 1,11 3,89 10,00 12,22 23,33 16,67 20,56 8,33 3,33 100,0

1 2 7 18 22 42 30 37 15 6 180

Distribuia de frecvene din tabelul 2.6 evideniaz predominana relativ a scorurilor din intervalele 4549 (23,33%) i 5559 (20,56%). Pe de alt parte, gruparea scorurilor n acest tabel conduce la o pierdere de informaie fa de prezentarea din tabelul 2.5. Nu tim, de pild, ci subieci au obinut, respectiv, scorurile 35, 36, 37, 38 i 39, ci doar c sunt 18 scoruri n intervalul 3539. Apoi, din tabelul 2.6 nu reiese c n eantionul considerat nu au fost obinute scorurile 26, 27, 28, 31 i 66. S mai notm c, la rigoare, se poate spune c n distribuia de frecvene din tabelul 2.5, mrimea fiecrui interval este egal cu o unitate. n general, regulile de construire a unei distribuii de frecvene pentru date de interval sau de raport n care se utilizeaz intervale de clas de mrime diferit fa de datele iniiale sunt urmtoarele:

2 PREZENTAREA DATELOR STATISTICE Pagina 7 din 16 1. Se decide asupra numrului de intervale de clas care vor fi utilizate. Numrul de intervale de clas nu trebuie s fie att de mare nct s nu permit sesizarea predominanei relative a anumitor grupri de scoruri, dar nici att de mic nct s conduc la pierderea unor informaii semnificative. De regul, se utilizeaz ntre 5 i 20 de intervale, n funcie de numrul de scoruri din mulimea iniial de date i de scopurile cercetrii. 2. n funcie de numrul de intervale de clas ales, se stabilete mrimea intervalelor de clas. n mod obinuit, pentru a se nlesni interpretarea distribuiei de frecvene, se folosesc intervale de clas de aceeai mrime. Mrimea unui interval de clas se stabilete mprind diferena dintre cel mai mare scor i cel mai mic scor din mulimea scorurilor date, numit amplitudine a mulimii respective1, la numrul intervalelor de clas i rotunjind rezultatul pn la un numr ntreg convenabil. 3. Se stabilete primul interval astfel nct s conin cel mai mic scor (limita sa inferioar s fie mai mic sau egal cu cel mai mic scor). Ultimul interval va fi acela care conine cel mai mare scor. Intervalele nu trebuie s se suprapun. 4. Se numr scorurile din fiecare interval de clas i se nregistreaz rezultatele ntr-o coloan etichetat f (frecvena). La sfritul acestei coloane se prezint numrul total de scoruri. Pentru mai mult claritate, se poate aduga o coloan de procente. S vedem cum au fost aplicate aceste reguli pentru construirea distribuiei de frecvene din tabelul 2.6. Scorul cel mai mare i scorul cel mai mic fiind, respectiv, 69 i 24, amplitudinea scorurilor este 69 24 = 45. Alegnd un numr de 10 intervale de clas, mrimea fiecrui interval de clas este 45 10 = 4,5 5. Primul interval, care trebuie s includ cel mai mic scor, poate fi oricare dintre urmtoarele: 2024, 2125, 2226, 2327, 2428 Fiecare dintre aceste intervale conine cinci scoruri2, inclusiv scorul 24, deci poate fi ales. n exemplul nostru am ales intervalul 2024. Ca atare, urmtorul interval este 25 29 .a.m.d. pn la ultimul interval, 6569, care conine cel mai mare scor. De notat c intervalele din tabelul 24 par a nu fi reciproc exclusive. n realitate lucrurile nu stau aa. Dac, dup intervalul 2024 ar fi urmat 2428, 2832 .a.m.d., am fi obinut intervale suprapuse dou cte dou. Scorul 24, de pild, ar fi fcut parte att din intervalul 2024, ct i din intervalul 2428. Intervalele de clas din tabelul 2.6 sunt exhaustive (acoper toate scorurile din mulimea iniial de scoruri) i reciproc exclusive (fiecare scor face parte dintr-un singur interval). Distribuiile de frecvene pentru date de interval sau de raport pot conine dou instrumente ajuttoare n prezentarea datelor: frecvene cumulate i procente cumulate. Frecvenele cumulate prezint numrul de cazuri dintr-un interval de clas i din toate intervalele de clas precedente, iar procentele cumulate prezint procentul de cazuri
1 2

Vvezi capitolul 3, 3.3.2. Aparent, fiecare interval acoper doar patru scoruri. Pentru a v convinge c nu este aa, numrai-le!

2 PREZENTAREA DATELOR STATISTICE Pagina 8 din 16 dintr-un interval de clas i din toate intervalele precedente3. Tabelul urmtor prezint o coloan de frecvene cumulate i o coloan de procente cumulate pentru distribuia de frecvene din tabelul 2.6. Tabelul 2.7 Distribuia de frecvene a scorurilor obinute la un test de cunotine
Intervale de clas
f fc

TOTAL

2024 2529 3034 3539 4044 4549 5054 5559 6064 6569

1 2 7 18 22 42 30 37 15 6 180

1 3 10 28 50 92 122 159 174 180

% 0,56 1,11 3,89 10,0 12,22 23,33 16,67 20,56 8,33 3,33 100,0

%c 0,56 1,67 5,56 15,56 27,78 51,11 67,78 88,34 96,67 100,0

Pentru a construi distribuia de frecvene cumulate din tabelul 2.7 ncepem cu primul interval de clas, 2024. Pentru acest interval, intrarea n coloana de frecvene cumulate este identic cu numrul de scoruri din interval, 1. Pentru intervalul imediat urmtor, 2529, se adun numrul de scoruri din interval, 2, cu numrul de scoruri din primul interval, 1, obinndu-se frecvena cumulat a intervalului, 3. Se procedeaz la fel pentru fiecare interval, adunnd frecvena din intervalul respectiv cu frecvena cumulat n intervalul imediat anterior. Evident, frecvena cumulat n ultimul interval de clas este egal cu numrul total de scoruri. Construirea coloanei de procente cumulate urmeaz acelai model aditiv cu cel folosit pentru frecvene cumulate. Astfel, pentru primul interval, intrarea n coloana de procente cumulate este identic cu procentul din interval. Pentru intervalul imediat urmtor, procentul cumulat este procentul scorurilor din interval plus procentul scorurilor din primul interval .a.m.d. pn la ultimul interval, n care, evident, procentul cumulat este egal cu 100%. De notat c aceleai rezultate se obin prin aplicarea formulei 2.2, n care f se nlocuiete cu fc pentru fiecare interval de clas, n fiind numrul total de scoruri. Frecvenele i procentele cumulate arat felul n care sunt distribuite cazurile n plaja de scoruri. De pild, tabelul 2.7 arat c o majoritate semnificativ de subieci din eantion 122, respectiv 67,78% au obinut scoruri mai mici de 55. Pn acum am considerat scorurile nregistrate la testul de cunotine ca fiind date discrete. Msurarea unei variabile produce date discrete, dac nregistrarea acestora se face n categorii reciproc exclusive (nesuprapuse). Pentru anumite scopuri 4, distribuia unei variabile msurabil la nivel de interval sau de raport trebuie construit ca o serie continu de categorii parial suprapuse. Pentru a obine o distribuie continu de scoruri ale unei astfel de variabile, se pornete de la limitele intervalele de clas stabilite iniial, numite limite stabilite i, pe baza acestora, se determin aa-numitele
3

Considernd, att pentru frecvenele cumulate, ct i pentru procentele cumulate, c intervalele de clas apar n tabel n ordine cresctoare. 4 De pild, cum vom vedea n seciunea urmtoare, pentru construirea unei histograme.

2 PREZENTAREA DATELOR STATISTICE Pagina 9 din 16 limite reale sau exacte. Pentru determinarea acestor limite, se mparte la doi distana aritmetic dintre intervalele de clas stabilite iniial, iar rezultatul astfel obinut se scade din fiecare limit inferioar stabilit i se adun la fiecare limit superioar stabilit. Tabelul 2.8 prezint rezultatele aplicrii aceste proceduri la intervalele de clas stabilite n tabelul 2.6. ntruct distana aritmetic dintre intervalele de clas din tabelul 2.4 este de o unitate, limitele reale se afl scznd 0,5 din fiecare limit inferioar i adunnd 0,5 la fiecare limit superioar. n tabelul 2.8 este adugat o coloan etichetat centre de interval. Centrele de interval sunt punctele situate exact la mijlocul unui interval i se afl mprind la doi suma limitelor inferioar i superioar ale intervalului5. De notat c centrele de interval sunt aceleai, indiferent dac folosim limite stabilite sau limite reale. Tabelul 2.8 Distribuia de frecvene a scorurilor obinute la un test de cunotine (incluznd limite reale i centre de interval)
Intervale de clas 2024 2529 3034 3539 4044 4549 5054 5559 6064 6569 TOTAL Limite reale 19,524,5 24,529,5 29,534,5 34,539,5 39,544,5 44,549,5 49,554,5 54,559,5 59,564,5 64,569,5 Centre de interval 22 27 32 37 42 47 52 57 62 67
f

1 2 7 18 22 42 30 37 15 6 180

Se poate observa c intervalele de clas cu limite reale se suprapun parial dou cte dou, astfel c distribuia apare ca fiind continu. Distribuiile de frecvene se pot construi i pentru variabile msurate la nivelele nominal sau ordinal. Pentru fiecare categorie a variabilei respective se numr cazurile i se prezint subtotalurile, precum i numrul total de cazuri ( n). S presupunem, de pild, c suntem interesai de msurarea variabilei nivel de colarizare pentru cei 180 de subieci care au rspuns la un test de cunotine i c decidem s folosim urmtoarea scal ordinal de msur: 1. nu a absolvit nici o coal; 2. a absolvit cel mult ciclul obligatoriu de nvmnt; 3. a absolvit cel mult liceul; 4. a absolvit cel mult cursuri postliceale, neuniversitare; 5. a absolvit cel mult cursuri universitare; 6. a absolvit cursuri post universitare. Folosind numerele de ordine ale categoriilor drept coduri (etichete), tabelul 2.9 ilustreaz construirea unei distribuii de frecvene pentru variabila menionat.

Centrele de interval sunt utile n construirea histogramelor.

2 PREZENTAREA DATELOR STATISTICE Pagina 10 din 16 Tabelul 2.9 Nivelul de colarizare pentru cei 180 de subieci
Nivel de colarizare 1 2 3 4 5 6 TOTAL
f

0 61 82 24 7 6 180

% 0 33,89 45,56 13,33 3,89 3,33 100,0

Adugarea unei coloane de procente pentru categorii aduce un spor de claritate a prezentrii. De notat c la nivelele nominal i ordinal, frecvenele cumulate i procentele cumulate sunt lipsite de sens. De asemenea, ntruct la aceste nivele categoriile sunt ntotdeauna discrete, nu are sens s se determine limitele de clas reale i centrele de interval. Singura coloan care poate fi adugat la distribuiile de frecvene pentru variabile la orice nivel de msur este coloana de procente.

2.4 DIAGRAME I GRAFICE


Diagramele i graficele sunt modaliti de prezentare vizual a datelor statistice i furnizeaz o imagine global a formei unei distribuii. Alegerea unei modaliti sau a alteia depinde, n principal, de nivelul de msur folosit i de scopurile cercetrii. Diagrame circulare O diagram circular este pur i simplu un cerc mprit ntr-un numr de sectoare egal cu numrul de categorii ale variabilei de interes, mrimea fiecrui sector fiind proporional cu procentajul de cazuri din categoria respectiv. Diagramele circulare pot fi folosite pentru variabile msurate la nivelele nominal i ordinal. S presupunem c am nregistrat statusul marital al celor 180 de subieci care au rspuns la un test de cunotine i c am obinut urmtoarele date: Tabelul 2.10 Statusul marital pentru cei 180 de subieci
Status marital Celibatar Cstorit Divorat TOTAL

63 90 27 180

% 35,0 50,0 15,0 100,0

Persoan care nu a fost niciodat cstorit

S construim o diagram circular pentru datele din acest tabel. ntruct circumferina unui cerc are 3600, vom aloca 1260 (35% din 3600) pentru prima categorie, 1800 (50% din 3600) pentru cea de-a doua categorie i 54 0 (15 % din 3600) pentru cea de-a treia categorie. Obinem urmtoarea diagram circular:

2 PREZENTAREA DATELOR STATISTICE Pagina 11 din 16 Figura 2.1 Statusul marital al celor 180 de subieci

Divorai 15% Cstorii 50% Celibatari 35%

Diagrama din figura 2.1 evideniaz vizual preponderena relativ a subiecilor cstorii i lipsa relativ a subiecilor divorai din eantionul considerat. Diagrame cu coloane i diagrame cu linii Diagramele cu coloane reprezint o alt modalitate de prezentare vizual a datelor statistice. Ca i diagramele circulare, diagramele cu coloane pot fi folosite pentru variabile msurate la nivelele nominal i ordinal. ntr-o astfel de diagram, categoriile variabilei de interes apar pe o ax orizontal (axa absciselor), iar frecvenele (relative) apar pe axa vertical corespunztoare (axa ordonatelor). Pe axa orizontal se construiesc attea coloane (dreptunghiuri) cu baze egale cte categorii sunt de prezentat. nlimea unei coloane este proporional cu frecvena (relativ) a cazurilor din categoria respectiv. ntruct la nivelele nominal i ordinal categoriile variabilelor sunt discrete, coloanele sunt separate ntre ele de o distan egal, de regul, cu din limea lor. Diagrama cu coloane din figura 2.2 prezint n procente fa de total statusul marital al subiecilor din tabelul 2.9. Figura 2.2 Statusul marital al celor 180 de subieci
60 50 40 Procent 30 20 10 0 Cstorii Celibatari Status m arital Divorai

2 PREZENTAREA DATELOR STATISTICE Pagina 12 din 16 Decizia de a utiliza o diagram circular sau o diagram cu coloane depinde de numrul de categorii ale variabilei de interes i de scopul cercetrii. Dac o variabil are mai mult de ase sau apte categorii, atunci este preferabil o diagram cu coloane, cci o diagram circular cu prea multe categorii devine prea aglomerat i deci greu de citit. Diagramele cu coloane sunt utile n special pentru a prezenta frecvenele (relative) pentru dou sau mai multe categorii ale unei variabile, cu scopul de a face unele comparaii. S presupunem, de pild, c dorim s facem o comparaie pe sexe a numrului de angajai ai unei firme care, n primele ase luni ale unui an, au apelat la serviciile centrului de consiliere psihologic al firmei. Figura 2.3 prezint datele (fictive) obinute. Figura 2.3 Numrul de angajai care au apelat la serviciile centrului de consiliere psihologic
30 25 Frecvena 20 15 10 5 0 ian feb mar apr mai iun Brbai Femei

Aceast diagram arat c, n timp ce numrul de angajai care au apelat la serviciile centrului de consiliere psihologic n perioada menionat a fost n cretere, numrul de apelani femei a crescut mai repede dect numrul de apelani brbai. Aceeai informaie este prezentat printr-o diagram cu linii n figura 2.4. Figura 2.4 Numrul de angajai care au apelat la serviciile centrului de consiliere psihologic
30 25 Frecvena 20 15 10 5 0 ian feb mar apr mai iun Brbai Femei

2 PREZENTAREA DATELOR STATISTICE Pagina 13 din 16 Ca i diagramele circulare i diagramele cu coloane, diagramele cu linii, ndeobte cunoscute sub denumirea de grafice, sunt larg folosite n massmedia pentru prezentarea diferitelor date statistice. Histograme i poligoane de frecvene Histogramele sunt modaliti de prezentare vizual a distribuiilor de frecvene pentru date de interval sau de raport, asemntoare diagramelor cu coloane. ntruct ntr-o histogram se folosesc limitele de clas reale ale intervalelor considerate, coloanele apar n contact dou cte dou. Figura 2.5 prezint o histogram pentru datele din tabelul 2.7. Figura 2.5 Histograma scorurilor obinute la un test de cunotine
45 40 35 Frecvena 30 25 20 15 10 5 0
19,5 24,5 29,5 34,5 39,5 44,5 49,5 54,5 59,5 64,5 69,5

Scoruri (limite reale)

n general, o histogram se construiete dup cum urmeaz: 1. Intervalele de clas sau scorurile se dispun pe axa orizontal (axa absciselor), utiliznd limite de clas reale. 2. Frecvenele se dispun pe axa vertical (axa ordonatelor). 3. Se construiete cte o coloan pentru fiecare interval, cu nlimea corespunztoare numrului de cazuri din interval i cu limea corespunztoare limitelor reale ale intervalului. 4. Se eticheteaz axele. Alt modalitate obinuit de prezentare vizual a distribuiilor de frecvene pentru variabile de interval sau de raport este poligonul de frecvene. Un poligon de frecvene utilizeaz centrele de interval i se construiete dup cum urmeaz:

2 PREZENTAREA DATELOR STATISTICE Pagina 14 din 16 1. Se plaseaz cte un punct n dreptul fiecrui centru de interval, la nlimea corespunztoare frecvenei din intervalul respectiv. 2. Punctele astfel obinute se unesc prin linii drepte. 3. Se nchide poligonul, considerndu-se cte un interval suplimentar cu frecvena zero la fiecare capt al distribuiei i unind prin linii drepte punctele extreme cu centrele de interval (aflate pe abscis) ale intervalelor suplimentare. 4. Se eticheteaz axele. Pentru simplificarea construciei, pe axa absciselor se pot marca direct centrele de interval, n locul limitelor de clas. Dei red aceeai informaie ca i histogramele, poligoanele de frecvene sunt utile pentru a da o imagine general a unei distribuii de frecvene. Figura urmtoare prezint un poligon de frecvene care red aceeai informaie ca i histograma din figura precedent. Figura 2.6 Poligonul de frecvene al scorurilor obinute la un test de cunotine
45 40 35 Frecvena 30 25 20 15 10 5 0 22 27 32 37 42 47 52 57 62 67 Scoruri (centre de interval)

Ogive Ogivele, numite i curbe cumulative ale frecvenelor sau poligoane de frecvene cumulate, prezint vizual frecvenele cumulate sau procentele cumulate ale unei distribuii O ogiv utilizeaz limitele de clas reale superioare ale intervalelor (LCRS) i se construiete dup cum urmeaz:

2 PREZENTAREA DATELOR STATISTICE Pagina 15 din 16 1. LCRS se dispun pe axa absciselor. 2. Frecvenele cumulate sau procentele cumulate se dispun pe axa ordonatelor. 3. Se plaseaz cte un punct n dreptul fiecrei LCRS, la nlimea corespunztoare frecvenei cumulate sau procentului cumulat n intervalul corespunztor acelei LCRS. 4. Punctele astfel obinute se unesc prin linii drepte. 5. Ogiva se nchide la stnga, extinznd o linie dreapt ctre limita de clas real inferioar a primului interval. 6. Se eticheteaz axele. Figura 2.7 prezint o ogiv pentru datele din tabelul 2.6. Figura 2.7 Ogiv pentru scorurile obinute la un test de cunotine
100 90 80 70 60 50 40 30 20 10 0 19,5 24,5 29,5 34,5 39,5 44,5 49,5 54,5 59,5 64,5 69,5 Scoruri (limite reale)

Dup cum vom vedea n capitolul 3, o ogiv poate fi utilizat pentru a afla diferite puncte de interes ntr-o distribuie de frecvene. n capitolul 11 vom folosi diagrame de mprtiere, numite i diagrame ale norilor de puncte sau scatergrame6, care sunt modaliti de prezentare vizual a corelaiei dintre dou variabile msurate la nivel de interval sau de raport.

De la substantivul din limba englez scatter, care nseamn mprtiere.

Procente cumulate

2 PREZENTAREA DATELOR STATISTICE Pagina 16 din 16 GLOSAR

You might also like