You are on page 1of 74

Capitolul 4

SERIILE DE DISTRIBUŢIE
A FRECVENŢELOR

Observaţiile înregistrate în prima fază a cercetării statistice sunt


supuse unui proces de sistematizare, de ordonare.
În urma grupării după caracteristici atributive se obţin serii de
distribuţie (repartiţie) a frecvenţelor pe intervale de valori (vezi tabelul
2.6.2) sau pe variante. Acestea oferă imaginea structurii colectivităţii, a
repartizării unităţilor ei după intervalele de valori sau variantele
caracteristicii de grupare.
Seria de distribuţie de frecvenţe este compusă din două şiruri de
date:
• primul şir cuprinde variantele caracteristicii sau intervalele de
valori;
• al doilea şir arată numărul unităţilor incluse în fiecare grupă
astfel formată (frecvenţa, efectivul).
În funcţie de natura caracteristicii de grupare, o serie de distribuţie
poate fi cantitativă sau calitativă, continuă sau discretă. Totodată, repartiţiile
pot fi teoretice, dacă reflectă o legitate matematică de repartiţie a
frecvenţelor, sau empirice, dacă rezultă în urma prelucrării datelor reale.
Repartiţiile empirice prezintă următoarele proprietăţi:
• omogenitatea termenilor: variantele individuale sunt de aceeaşi
natură şi cu valori apropriate, fiind determinate în cea mai mare
măsură de acţiunea aceloraşi factori esenţiali;
• variabilitatea valorilor individuale este dată de acţiunea mai
puternică a unor factori întâmplători, care determină abaterea
mărimilor individuale de la tendinţa centrală impusă de factorii
esenţiali;
• independenţa termenilor este efectul existenţei distincte a
unităţilor statistice în cadrul colectivităţii totale; fiecare unitate
este rezultatul unei manifestări individualizate, diferite a
fenomenului de masă;
• forma repartiţiei derivă din modalitatea specifică de combinare
a influenţelor factorilor esenţiali şi neesenţiali; există serii cu o
repartiţie relativ uniformă a frecvenţelor şi altele cu unul sau
STATISTICA

mai multe puncte de concentrare. Aceste concentrări ale


frecvenţelor apar fie în jurul tendinţei centrale, fie la unul sau
ambele capete ale seriei.
O analiză completă a seriilor de distribuţie a frecvenţelor se
bazează pe următorii indicatori:
• indicatori de nivel (nivel individual şi nivel totalizat sau valoare
centralizată) şi de frecvenţe (frecvenţe absolute, frecvenţe
relative şi frecvenţe cumulate);
• indicatori medii: media aritmetică, armonică, pătratică,
geometrică;
• indicatori medii de poziţie: mediană, cuartile, decile, modul;
• indicatori simpli şi sintetici ai variaţiei: amplitudinea variaţiei,
abateri individuale, abatere medie liniară, abaterea medie
pătratică (abaterea standard, abaterea tip), dispersia (varianţa),
coeficientul de variaţie;
• indicatori ai asimetriei;
• indicatori ai concentrării.
Acest sistem complex de indicatori este completat cu reprezentări
grafice (histogramă, poligonul frecvenţelor, poligonul frecvenţelor cumu-
late) care pun în evidenţă forma repartiţiei şi orientează analiza.
Scopul analizei şi particularităţile seriei de repartiţie studiate
determină indicatorii cei mai potriviţi pentru fiecare caz în parte.

4.1 INDICATORI DE NIVEL ŞI DE FRECVENŢE

În cazul datelor negrupate, indicatorii de nivel sunt chiar valorile


individuale ale unei caracteristici (xi unde i ia valori de la 1 la n). În cazul
seriilor de distribuţie unidimensionale, ca indicatori de nivel (xi unde i ia
valori de la 1 la k, în cazul unei distribuţii de frecvenţe cu k grupe) se
utilizează variantele în cazul grupării pe variante şi centrele de intervale
(calculate ca medie aritmetică simplă a limitelor fiecărui interval) în cazul
grupării pe intervale.
Nivelul totalizat al caracteristicii se calculează în mod diferit în
funcţie de tipul seriei.
Seriile de distribuţie a frecvenţelor

Pentru o serie de date negrupate, nivelul totalizat se obţine prin


n
însumarea tuturor valorilor individuale: ∑ xi .
i =1
Pentru date grupate se poate calcula nivelul totalizat al fiecărei
grupe şi pe total în funcţie de datele disponibile.
Dacă se cunosc valorile individuale din care s-a efectuat gruparea:
- nivelul totalizat al grupei:
ni
∑ xij unde ni este volumul grupei iar xij valorile
j =1 individuale din cadrul grupei respective;
- nivelul centralizat pe total:
k ni
∑ ∑ xij unde k este numărul de grupe.
i =1 j =1
În cazul în care nu se cunosc valorile individuale din cadrul
fiecărei grupe:
- nivelul totalizat al grupei:
xi ni unde ni este volumul grupei iar xi indicatorul de nivel al
grupei;
- nivelul centralizat pe total:
k
∑ x i ni unde k este numărul de grupe.
i =1

Indicatorii de nivel totalizat se pot reprezenta grafic prin diagrame


de volum al caracteristicii (pătrat, cerc, dreptunghi) a căror suprafaţă este
proporţională cu valoarea de reprezentat grafic sau prin diagrama prin
coloane nelipite.
Pentru seriile de distribuţie (repartiţie) se pot calcula următorii
indicatori de frecvenţe:
• frecvenţe absolute;
• frecvenţe relative;
• frecvenţe cumulate.
Frecvenţele absolute (ni) rezultă din operaţia de grupare a
unităţilor colectivităţii. Numărul unităţilor statistice care aparţin unei
grupe (clase) reprezintă frecvenţa grupei respective.
STATISTICA

Întrucât frecvenţele absolute se exprimă în unităţi concrete de


măsură (număr de muncitori, de firme, de persoane, de magazine etc.) nu
se pot compara între ele serii statistice.
Reprezentarea grafică a frecvenţelor absolute se face cu ajutorul
histogramei şi a poligonului frecvenţelor.
Vom exemplifica în continuare modul de construire a histogramei
şi a poligonului frecvenţelor pentru intervale de grupare egale, pe baza
datelor din tabelul următor:
Gruparea muncitorilor unei firme după nivelul dotării tehnice
Tabelul 4.1.1
Grupe de muncitori Număr de Frecvenţe absolute cumulate
după dotarea tehnică muncitori crescător descrescător
(mil. lei capital fix pe (ni) (Fia) (Fid)
muncitor)
0 1 2 3
1,5 - 2,0 14 14 150
2,0 - 2,5 18 32 136
2,5 - 3,0 30 62 118
3,0 - 3,5 48 110 88
3,5 - 4,0 25 135 40
4,0 - 4,5 15 150 15
Total 150 - -
Date convenţionale
Histograma pentru intervale egale se obţine construind un număr
de coloane egal cu numărul grupelor, având baze egale pe Ox (variaţia
este continuă) şi înălţimea dată de frecvenţele grupelor pe care le
reprezintă (figura 4.1.1).
60
Nr. muncitori

48
50
40
30
30 25
18
20 14 15

10
0
1,5 2 2,5 3 3,5 4 4,5
dotare tehnica (mil.lei/m)

Fig.4.1.1 Distribuţia muncitorilor după dotarea tehnică (histogramă)


Seriile de distribuţie a frecvenţelor

Acest tip de grafic pune în evidenţă forma de variaţie a


caracteristicii şi gradul de asimetrie a seriei.
Poligonul frecvenţelor corespunzător grupării pe intervale egale
este prezentat în figura nr. 4.1.2.
Frecvenţele relative arată importanţa relativă a fiecărei grupe,
punând în evidenţă structura colectivităţii. Folosirea acestui indicator
permite să se compare seriile empirice între ele sau cu distribuţiile
teoretice.

60
Nr. muncitori

50 48
40
30 30
25
20 18
14 15
10
0 0 0
1,5 2 2,5 3 3,5 4 4,5
dotare tehnica (mil.lei/m)

Figura 4.1.2 - Poligonul frecvenţelor

Se calculează cu relaţia:
ni ni
n*i = k
sau n*i(%) = k
⋅ 100
∑ ni ∑ ni
i =1 i =1

unde: ni - frecvenţa absolută a grupei i;


n*i - frecvenţa relativă a grupei i, exprimată sub formă de
coeficient;
*
ni(%() - frecvenţa relativă a grupei i, exprimată procentual;
STATISTICA

k
∑ ni - totalul frecvenţelor celor k grupe ale colectivităţii.
i =1
Rezultatele calculului frecvenţelor relative pentru seria statistică
din tabelul 4.1.1 sunt prezentate în tabelul 4.1.2.

Tabelul 4.1.2
Grupe de muncitori Frecvenţe Frecvenţe relative cumulate (%)
după dotarea tehnică relative (%)
(mil. lei capital fix (ni*) crescător descrescător
pe muncitor)
0 1 2 3
1,5 - 2,0 9,33 9,33 100,00
2,0 - 2,5 12,00 21,33 90,67
2,5 - 3,0 20,00 41,33 78,67
3,0 - 3,5 32,00 73,33 58,67
3,5 - 4,0 16,67 90,00 26,67
4,0 - 4,5 10,00 100,00 10,00
Total 100,00 - -

Reprezentarea grafică se poate mai face prin intermediul


diagramelor de structură: pătratul, cercul, semicercul, dreptunghiul.
Frecvenţele cumulate pot fi calculate în două modalităţi, în
funcţie de sensul în care se face însumarea frecvenţelor:
a) ascendent sau crescător (tabelul 4.1.1, coloana treia) - frecvenţa
cumulată a unei grupe i (Fia) este suma frecvenţelor primelor i intervale
ale seriei:
i
Fia = ∑ n j , j = 1, 2, ..., i.
j =1
Arată numărul total al unităţilor care au valoarea caracteristicii
mai mică sau egală cu limita superioară a intervalului i.
b) descendent sau descrescător (tabelul 4.1.1., coloana a patra)-
frecvenţa cumulată a unei grupe i este suma frecvenţelor intervalelor de la
i la k:
k
Fid = ∑nj
j =i

Indică numărul total al unităţilor statistice pentru care valoarea


caracteristicii este mai mare sau egală cu limita inferioară a intervalului i.
Seriile de distribuţie a frecvenţelor

Frecvenţele cumulate se pot calcula şi pe baza frecvenţelor


relative, conform formulelor precedente, în care se înlocuieşte nj cu nj*
(vezi tabelul 4.1.2, coloanele trei şi patru).
Reprezentarea grafică: poligonul frecvenţelor absolute cumulate
crescător (ascendent) şi descrescător (descendent) sunt date în figura 4.1.3
iar poligonul frecvenţelor relative cumulate în figura 4.1.4.

Figura 4.1.3 - Poligonul frecvenţelor absolute cumulate

frecvenţe 105
relative 90
cumulate 75 Crescator
(%) 60 Descrescator
45
30
15

0
1.5 2 2.5 3 3.5 4 4.5

dotare tehnică (mil. lei/m.)

Figura 4.1.4 - Poligonul frecvenţelor relative cumulate


4.2 INDICATORI MEDII

Statistica încearcă să redea ceea ce este tipic, comun şi general în


evoluţia fenomenelor şi proceselor economice. Variabilitatea deosebită a
acestora în formele lor individuale de manifestare impune găsirea unor
indicatori sintetici care să reunească valorile individuale, exprimând
printr-o măsură unică esenţa fenomenului.
Indicatorii medii răspund acestui deziderat, sintetizând ceea ce
este comun, tipic în manifestarea fenomenului considerat. Ei măsoară
influenţa cauzelor esenţiale, înlăturând variaţiile întâmplătoare în evoluţia
fenomenelor şi proceselor.
STATISTICA

Pentru ca indicatorii medii să aibă conţinut real şi să fie


reprezentativi pentru colectivitatea analizată este necesar să fie îndeplinite
câteva condiţii:
• omogenitatea colectivităţii;
• volum suficient de mare de date individuale;
• forma adecvată a indicatorului.
Media este un indicator al tendinţei centrale care arată nivelul la
care ar fi ajuns caracteristica dacă în toate cazurile individuale factorii
esenţiali şi neesenţiali ar fi acţionat constant. Este valoarea tipică pentru
reprezentarea unei colectivităţi, dar este posibil să nu coincidă cu nici una
din valorile individuale înregistrate de caracteristică în colectivitatea
respectivă.
Mediile se calculează utilizând toate valorile individuale şi se
exprimă în unitatea de măsură a caracteristicii considerate.
Se consideră că un indicator mediu este adecvat dacă răspunde
condiţiilor formulate de statisticianul G.U. Yule, sintetizate astfel:
• definire obiectivă;
• utilizarea tuturor valorilor individuale înregistrate;
• semnificaţie clară;
• simplitatea şi rapiditatea calculului;
• stabilitatea (în cazul utilizării mai multor eşantioane de acelaşi
volum extrase din aceeaşi colectivitate);
• posibilitatea utilizării la calcule algebrice.
Necesităţile diverse ale analizei statistice şi natura diferită a
caracteristicilor înregistrate au impus utilizarea practică a unor forme
variate de medii, dintre care mai frecvent întâlnite sunt:
• media aritmetică;
• media armonică;
• media pătratică;
• media geometrică.
Indicatorii medii se pot prezenta sub formă simplă, atunci când
datele sunt negrupate sau când frecvenţele tuturor grupelor sunt egale (se
simplifică) sau sub formă ponderată, atunci când frecvenţele diferă între
ele.
Seriile de distribuţie a frecvenţelor

4.2.1 Media aritmetică


Media aritmetică este rezultatul sintetizării într-o singură expresie
numerică a tuturor nivelurilor individuale observate, fiind obţinută prin
raportarea valorii totalizate a caracteristicii la numărul total al unităţilor.
Acest tip de medie este indicat îndeosebi atunci când fenomenul
supus cercetării înregistrează modificări aproximativ constante în
progresie aritmetică.
Fiind dată o caracteristică oarecare cu valorile x1, x2,...,xn, media
aritmetică este acea valoare tipică ce poate substitui fiecare valoare
individuală xi, i = 1,...,n, astfel încât:
n
∑ xi = n ⋅ x .
i =1

Rezultă de aici formula de calcul a mediei aritmetice simple:


n
∑ xi
i =1
x= .
n
În cazul în care fiecare valoare individuală xi are nu una, ci mai
multe apariţii în cadrul colectivităţii analizate, se aplică formula de calcul
a mediei aritmetice ponderate:
k
∑ xi ⋅ ni
i =1
x= k
,
∑ ni
i =1

unde:
ni - frecvenţa (numărul de apariţii) al variantei xi;
k - numărul de valori distincte.

În cazul în care unităţile nu sunt grupate pe variante, ci pe


intervale de variaţie, xi reprezintă centrul de interval. Centrul fiecărui
interval se determină ca medie aritmetică simplă între limita superioară şi
limita inferioară a intervalului respectiv.
STATISTICA

Se observă că indiferent de situaţie, nivelul totalizat al


caracteristicii se poate determina ca produs între nivelul mediu şi numărul
unităţilor:
n
∑ xi = x ⋅ n în cazul datelor negrupate;
i =1

k
∑ xi ni = x ⋅ n în cazul datelor grupate.
i =1
Astfel exprimat, nivelul totalizat se reprezintă grafic prin
dreptunghi.
Atunci când în locul frecvenţelor absolute folosim frecvenţe
relative ( n* = ni ⋅100 ) , formula anterioară devine:
i(%) k
∑ ni
i =1

k
∑ xi ⋅ n*i(%)
x = i =1
100
Un exemplu de calcul al mediei aritmetice ponderate utilizând atât
frecvenţele absolute, cât şi frecvenţele relative, este prezentat în tabelul
4.2.1. Vârsta medie este x = 479 / 24 = 19,96 ≈ 20 ani. Valoarea obţinută
este foarte reprezentativă datorită omogenităţii colectivităţii.

Calculul vârstei medii într-o grupă de studenţi


Tabelul 4.2.1
Vârsta Nr. studenţi xi ⋅ ni *
ni(%) x i n *i
(xi) (ni)
0 1 2 3 4
19 5 95 20,83 395,77
20 16 320 66,67 1333,40
21 2 42 8,33 174,93
22 1 22 4,17 91,74
Total 24 479 100,00 1995,84

4.2.2 Proprietăţile mediei aritmetice

Media aritmetică prezintă mai multe proprietăţi.


Seriile de distribuţie a frecvenţelor

1. Într-un şir de valori egale, media aritmetică este egală cu


acestea.
x1 = Κ = xi = Κ = x n = c , x = c
Demonstraţie:
n n
∑ xi ∑c
i =1 n⋅c
i =1
x= = =c =
n n n
2. Media aritmetică este cuprinsă în intervalul de variaţie al
caracteristicii pentru care se calculează. Aşadar:
xmin < x < xmax,
unde: xmin - valoarea minimă a caracteristicii înregistrate;
xmax - valoarea maximă.
Demonstraţie:

x=
∑ xi ⋅ ni
∑ ni
Dar ∑ i i >
x ⋅n ∑ xmin ⋅ ni unde
∑ ni ∑ ni
∑ xmin ⋅ ni = xmin ⋅ ∑ ni = x
min
∑ ni ∑ ni
Rezultă că x > xmin .
În mod analog se demonstrează că x < x max .
3. Media oscilează în jurul grupei cu frecvenţa cea mai mare, în
cazul distribuţiei de frecvenţe.
4. Suma algebrică a tuturor abaterilor individuale ale termenilor
seriei de la media lor aritmetică este nulă:
m
∑ ( xi − x ) ⋅ ni = 0 .
i =1

Demonstraţie:
STATISTICA

∑ (xi − x )⋅ ni = ∑ xi ⋅ ni − ∑ x ⋅ ni = ∑ xi ⋅ ni − x ⋅ ∑ ni =
= ∑ xi ⋅ ni −
∑ xi ⋅ ni ⋅ n = x ⋅ n − x ⋅ n = 0
∑ i ∑ i i ∑ i i
∑ ni
5. Dacă se măresc (micşorează) toate valorile individuale din care
se calculează media cu o constantă a, noua lor medie aritmetică se
măreşte (micşorează) cu aceeaşi valoare a.
Demonstraţie:
∑ (xi ± a ) ⋅ ni = ∑ xi ⋅ ni ± ∑ a ⋅ ni = x ± a ⋅ ∑ ni = x ± a .
∑ ni ∑ ni ∑ ni ∑ ni
6. Dacă se împart (înmulţesc) toate valorile individuale cu o
constantă h, media aritmetică se divide (multiplică) cu aceeaşi constantă h.
Demonstraţie:

 xi 
∑  ⋅ ni
1 ∑ xi ⋅ ni x
h = ⋅ =
∑ ni h ∑ ni h

∑ (h ⋅ xi ) ⋅ ni =
h ⋅ ∑ xi ⋅ ni
= h⋅ x
∑ ni ∑ ni
7. Dacă se divid toate frecvenţele cu o constantă g, media
aritmetică nu se modifică.
Demonstraţie:
 ni 1
∑ xi ⋅   ⋅ ∑ xi ⋅ ni
g = g =x
 ni  1
∑   ⋅ ∑ ni
g g

k 
Dacă înlocuim constanta g cu suma frecvenţelor seriei  ∑ ni 
 i =1 
obţinem formula de calcul a mediei aritmetice pe baza frecvenţelor
relative:
Seriile de distribuţie a frecvenţelor

 ni 
∑ xi ⋅  
 ∑ ni = ∑ xi ⋅ n*i = ∑ xi ⋅ n*i
 ni
∑ 

 ∑ n*i
 ∑ ni 

8. Media aritmetică determinată pentru suma a două variabile


independente este egală cu suma mediilor celor două variabile:
x+ y = x+ y,
unde:
x - media variabilei X;
y - media variabilei Z;
x + y - media sumei celor două variabile.
9. Media produsului între două variabile independente este egală
cu produsul mediilor celor două variabile:
x⋅ y = x⋅ y
Aceste proprietăţi sunt utilizate la calculul simplificat al mediei (5,
6, 7) şi pentru verificarea corectitudinii calculului (1, 2, 3).

4.2.3 Calculul simplificat al mediei aritmetice

Întrucât în viaţa economică reală datele individuale din care se


calculează media reprezintă deseori valori mari, cu zecimale, este utilă
aducerea şirului iniţial de valori într-o formă mai simplă, care să faciliteze
calculele.
Pentru aceasta, în calculul mediei aritmetice pentru serii de
distribuţie de frecvenţe pe intervale egale de grupare se poate utiliza
următoarea formulă de calcul simplificat:
STATISTICA

k  xi − a 
∑  ⋅ ni
i =1  h 
x= k
⋅k + a ,
∑ ni
i =1
unde: xi - centrele intervalelor de grupare (se calculează ca medie
aritmetică simplă a capetelor fiecărui interval);
ni - frecvenţa fiecărui interval i;
a - constantă egală cu valoarea centrului de interval care are
frecvenţa maximă;
h - mărimea intervalului de grupare;
k - numărul intervalelor de grupare.
Un exemplu de aplicare a acestei formule se regăseşte în tabelul
4.2.2.
Calcularea mediei vânzărilor lunare
în unităţile comerciale dintr-o localitate
Tabelul 4.2.2
Vânzări Nr. unităţi Centrul de xi − a xi − a
(mil. lei) (ni ) interval (xi ) ⋅ ni
h h
0 1 2 3 4
10 -14 10 12 -2 -20
14 - 18 30 16 -1 -30
18 - 22 40 20 0 0
22 - 26 20 24 1 20
Total 100 - - -30
Date convenţionale

Media vânzărilor este:


− 30
x= ⋅ 4 + 20 = 18,8 mil lei/unitate comercială.
100
Aplicarea formulei obişnuite de calcul (media aritmetică
ponderată) conduce la acelaşi rezultat.
Seriile de distribuţie a frecvenţelor

4.2.4 Media armonică

Media armonică a unui şir de valori xi, i = 1,...,n, se calculează din


1
valorile inverse   ale termenilor. Substituind valorile individuale cu
 xi 
media lor armonică ( xh ), ca valoare tipică a şirului, şi însumând termenii,
obţinem:
n 1 1
∑ = n⋅ .
i =1 xi xh
De aici rezultă formula de calcul a mediei armonice simple:
n
xh = n
.
1

i =1 xi

În cazul seriilor de distribuţie de frecvenţe se utilizează media


armonică ponderată:
k
∑ ni
i =1
xh = k
.
1
∑ ⋅ ni
i =1 xi

Dacă folosim frecvenţe relative, media armonică devine:


1 100
xh = k
sau xh = k
.
1 * 1 *
∑ ⋅ ni ∑ ⋅ ni(%)
i =1 xi i =1 xi

Fiind calculată din valorile inverse ale termenilor seriei, media


armonică este mai mică decât cea aritmetică, dacă valorile seriei sunt
pozitive.
Atunci când două variabile se află într-un raport de inversă
proporţionalitate, pentru una din variabile se va utiliza media aritmetică,
iar pentru cealaltă media armonică.
STATISTICA

Utilizarea mediei armonice este indicată în toate cazurile în care în


cadrul colectivităţii analizate predomină valorile mici. Fiind mai mică decât
media aritmetică, media armonică reprezintă mai bine aceste valori.
În practică, media armonică este frecvent folosită la calculul
preţului mediu şi al indicelui mediu al preţurilor.
Atunci când nu se cunosc frecvenţele absolute ni, ci produsele xini,
media armonică poate fi calculată cu relaţia:
k
∑ xi ⋅ ni
i =1
xh = k
.
1
∑ ⋅ xi ⋅ ni
i =1 xi

În acest caz, media armonică este egală cu media aritmetică, după


cum se poate demonstra cu uşurinţă:

xh =
∑ xi ⋅ ni = ∑ xi ⋅ ni = x .
1
∑ ⋅ xi ⋅ ni ∑ ni
xi
Pentru a ilustra aplicarea acestei forme a mediei armonice,
considerăm cazul unui agent economic care îşi procură materia primă de
la patru furnizori diferiţi. Din evidenţa curentă cunoaştem preţul mediu şi
valorea achiziţiilor pentru fiecare furnizor (tabelul 4.2.3).

Tabelul 4.2.3
Furnizor Preţ mediu Valoarea achiziţiei
(mii lei/kg) (mil. lei)
0 1 2
A 15,75 58,4
B 21,50 46,2
C 24,25 62,5
D 26,00 38,0
Total - 205,1
Date convenţionale
Seriile de distribuţie a frecvenţelor

Vom determina preţul mediu al materiei prime achiziţionate de


agentul economic utilizând formula anterioară de calcul a mediei
armonice:
205,1
xh = = 20 ,726 mii lei/kg.
1 1 1 1
⋅ 58,4 + ⋅ 46 ,2 + ⋅ 62 ,5 + ⋅ 38
15,75 21,5 24 ,25 26

4.2.5 Media pătratică

Se calculează din termenii seriei ridicaţi la pătrat. Dacă se


înlocuieşte fiecare valoare individuală ridicată la pătrat ( xi2 ) cu media
pătratică x p2 , într-un şir de n termeni şi se însumează termenii, rezultă:
n
∑ xi2 = n ⋅ x p2 ,
i =1

de unde obţinem formula de calcul a mediei pătratice simple:


n
∑ xi2
i =1
xp = .
n
Media pătratică ponderată este:
k
∑ xi2 ⋅ ni
i =1
xp = k
.
∑ ni
i =1

Folosind frecvenţe relative (ni* ) exprimate prin coeficienţi,


formula mediei pătratice ponderate devine:
k
xp = ∑ xi2 ⋅ n*i
i =1
STATISTICA

Fiind calculată din valorile individuale ridicate la pătrat, media


pătratică este întotdeauna mai mare decât cea aritmetică; de aceea,
folosirea acestui tip de medie este justificată îndeosebi în situaţiile în care
predomină valorile mari în cadrul colectivităţii pentru care se calculează
media. De asemenea, este indicată atunci când se acordă o atenţie
deosebită valorilor mari, cum este cazul calculului abaterii medii pătratice
(vezi paragraful 4.4.2) şi atunci când valorile caracteristicii sunt atât
pozitive, cât şi negative.
De exemplu, mărimea profitului anual obţinut de agenţii
economici dintr-un anumit domeniu de activitate se încadrează între 48 şi
576 milioane lei, cu o medie de 284 milioane lei. Dacă dorim să aflăm
care este abaterea medie a agenţilor economici de la acest profit mediu nu
vom calcula media aritmetică (ar fi nulă, conform proprietăţilor mediei),
ci media geometrică, neinfluenţată de semnul diferit al abaterilor.

4.2.6 Media geometrică

Dacă se înmulţesc toţi termenii unei serii statistice xi, i = 1,.., n şi se


înlocuieşte fiecare valoare individuală cu media lor geometrică x g , se
obţine:
x1 ⋅ x2 ⋅ .... ⋅ x n = x g ⋅ x g ⋅ ... ⋅ x g ,

de unde:
n
n
∏ xi = x g .
i =1

Rezultă formula de calcul a mediei geometrice simple:


n
x g = n ∏ xi .
i =1
Pentru seriile de distribuţie de frecvenţe se aplică formula de
calcul a mediei geometrice ponderate:
k
x g = ∑ ni ∏ xi ni .
i =1
Seriile de distribuţie a frecvenţelor

Calculul acestui tip de medie se poate realiza cu ajutorul


logaritmilor. Calculul nu este posibil dacă există valori negative sau nule.
Logaritmând, formula de calcul a mediei geometrice simple devine:
n
∑ lg xi
i =1
lg x g =
n
În cazul mediei geometrice ponderate, prin logaritmare obţinem:
k
∑ ni ⋅lg xi
i =1
lg x g = k
.
∑ ni
i =1
Media geometrică este mai mică decât media aritmetică, dar este
superioară celei armonice. Reprezintă mai bine valorile mici ale
caracteristicii.
Folosirea mediei geometrice este obligatorie în situaţiile în care
între termenii seriei nu este posibilă însumarea, ci produsul, cum este
cazul indicilor de dinamică.
De exemplu, cifra de afaceri a unui agent economic creşte cu 8 % în
primul semestru al anului 2000 şi cu 15 % în cel de-al doilea semestru.
Media aritmetică nu este indicată în acest caz (mărimi neînsumabile direct).
Vom calcula media geometrică a celor doi indici de dinamică semestriali,
deoarece între indici este posibilă relaţia de produs:
n

xg = n ∏x
i =1
i
= 1,08 ⋅ 1,15 = 1,114

Ritmul mediu de creştere pe cele două semestre a fost 11,4 %.


Media geometrică este indicată şi în cazul valorilor care au
tendinţă de creştere în progresie geometrică.
Tipul de medie cel mai utilizat în practică este media aritmetică. În
funcţie de particularităţile seriei statistice analizate, se mai pot calcula
alte medii.
STATISTICA

4.2.7 Media caracteristicii alternative

Caracteristica alternativă înregistrează numai două variante posibile


de manifestare. De exemplu, candidat admis/respins, produs bun/rebut, plan
de producţie realizat/nerealizat, persoană căsătorită/necăsătorită etc.
În practică, orice variabilă poate fi exprimată sub formă alternativă
dacă se împarte colectivitatea în două grupe după un anumit criteriu. În
cazul unei variabile calitative se consideră o modalitate ca fiind forma
directă de manifestare a caracteristicii iar toate celelalte modalităţi ca
opusul formei directe de manifestare a caracteristicii. Pentru variabilele
numerice cel mai frecvent se utilizează criteriul mediei, structurându-se
colectivitatea în unităţi cu valoarea caracteristicii sub/peste medie.
Alteori, în locul mediei se alege o valoare semnificativă a caracteristicii.
De exemplu, pornind de la distribuţia salariaţilor unei firme după numărul
anilor de şcolarizare, se poate trece la distribuţia alternativă de tipul
persoane cu/fără studii superioare.
În vederea satisfacerii necesităţilor de calcul, cele două variante
ale caracteristicii alternative pot fi codificate cu:
• "1" - variantă pozitivă, răspunsul afirmativ;
• "0" - variantă opusă, răspuns negativ.

Pentru calculul mediei aritmetice a caracteristicii alternative


utilizează formula mediei ponderate:
k
∑ xi ⋅ ni
i =1
x= k
,
∑ ni
i =1
unde k = 2.
Conform notaţiilor din tabelul 4.2.4, formula anterioară devine:
1 ⋅ M + 0 ⋅ (N − M ) M
p= = ,
N N
unde: M - frecvenţa (numărul) unităţilor care au varianta afirmativă;
N - volumul colectivităţii statistice.
Seriile de distribuţie a frecvenţelor

După cum rezultă din această relaţie, media caracteristicii


alternative este o mărime relativă de structură, care arată ponderea
unităţilor care îndeplinesc o anumită condiţie în total colectivitate.

Tabelul 4.2.4
Variante xi ni
0 1 2
• afirmativ 1 M
• negativ 0 N-M
Total - N

4.3 INDICATORI DE POZIŢIE

Din punctul de vedere al analizei statistice, pe lângă informaţiile


cu caracter sintetic privind valorile individuale, este important şi modul în
care sunt repartizate aceste valori.
Mediile se calculează pe baza tuturor valorilor individuale ale seriei,
ceea ce le face sensibile la valorile extreme, mai puţin semnificative.
Uneori, valorile extreme ale seriei sunt excesiv de îndepărtate de centrul
seriei, ceea ce afectează în mare măsură reprezentativitatea mediei. Alteori,
unităţile seriei au tendinţa de a se concentra la una din extremităţile seriei,
rezultând distribuţii asimetrice la dreapta sau la stânga.

Pentru aceasta se calculează indicatorii medii de poziţie (de


structură):
• mediana;
• cuartilele;
• decilele;
• modul.
STATISTICA

4.3.1 Mediana

Mediana este acea valoare a unei serii statistice ordonate crescător


sau descrescător, care împarte seria în două părţi egale. Aşadar, mediana
este valoarea din centrul seriei: jumătate din termeni sunt mai mici sau
egali cu mediana, jumătate sunt mai mari sau egali. Mediana este o
mărime care depinde în primul rând de numărul termenilor.
Pentru seriile simple, mediana este termenul din mijloc (dacă seria
are număr impar de termeni) sau se determină, în mod convenţional, ca
medie aritmetică simplă a celor două valori din centrul seriei, dacă
numărul termenilor este par.
Pentru seriile de distribuţie de frecvenţe, calculul medianei
parcurge următoarele etape:
a) Se identifică grupa în care este inclusă mediana care este acea
k
∑ ni + 1
i =1
grupă a cărei frecvenţă cumulată este prima mai mare decât ;
2
b) Se determină valoarea efectivă a medianei ţinând cont de
modalitatea de grupare a datelor.
În cazul în care distribuţia de frecvenţe s-a obţinut prin gruparea
pe intervale, mediana se determină cu ajutorul următoarei formule:
1 k  me−1
⋅  ∑ ni + 1 − ∑ ni
2
Me = x0 + hme ⋅  i =1  i =1 ,
nme
unde: Me - valoarea medianei;
me – indexul intervalului median;
x0 - limita inferioară a intervalului median;
hme - mărimea intervalului median;
nme - frecvenţa intervalului median;
me −1
∑ ni - suma frecvenţelor intervalelor anterioare celui median.
i =1
Mediana se exprimă în unitatea de măsură a caracteristicii
respective.
Seriile de distribuţie a frecvenţelor

Gruparea comunelor după numărul locuitorilor în anul 1994


Tabelul 4.3.1
Număr locuitori Număr Mărimea hi Frecvenţe
comune intervalulu k i = reduse
1000
(ni) i (hi) ni
nri =
ki
0 1 2 3 4
sub 999 40 1000 1 40
1000 - 1999 364 1000 1 364
2000 - 4999 1678 3000 3 560
5000 - 9999 575 5000 5 115
10000 şi peste 31 5000 5 6
Total 2688 - - -
Sursa: Anuarul statistic al României, anul 1995, pag.92.

De exemplu, utilizând datele din tabelul 4.3.1., se poate determina


valoarea mediană a numărului de locuitori pe o comună.
Se determină întâi locul medianei:
2688 + 1
locul me = = 1344,5 .
2
Cumulând succesiv frecvenţele din coloana 2 a tabelului 4.3.1.
până la obţinerea unui număr superior lui 1345, constatăm că mediana
(termenul cu numărul 1344,5) trebuie să se afle în intervalul 2000 - 4999.
Pentru calcularea medianei este necesară redefinirea intervalului
median (1999,5-4999,5).
Aplicăm în continuare formula de calcul a medianei:
1344,5 − ( 40 + 364 )
Me = 1999,5 + 3000 ⋅ ≅ 3681 locuitori.
1678
Rezultă că jumătate din comunele ţării au o populaţie sub 3681
locuitori, jumătate au o populaţie mai numeroasă.
În cazul datelor grupate pe variante, valoarea medianei este chiar
varianta a cărei frecvenţă cumulată este prima mai mare decât
1
(∑ ni +1) .
2
STATISTICA

Spre deosebire de medie, mediana nu este influenţată de valorile


extreme ale seriei; de aceea ea poate înlocui cu succes media atunci când
apar valori aberante.
Mediana poate fi determinată şi prin metoda grafică. Proiecţia pe
axa Ox a punctului de intersecţie a curbelor frecvenţelor cumulate
crescător şi descrescător reprezintă mediana.

4.3.2 Cuartile, decile, centile

Mediana face parte din familia cuantilelor. Acestea descriu poziţia


anumitor termeni în cadrul seriei statistice. Din acelaşi grup mai fac parte:
cuartilele, decilele şi centilele.
Cuartilele sunt 3 valori care împart seria statistică în 4 părţi egale
( Q1 ÷ Q 3 ) .
Decilele sunt mărimile care împart seria statistică în 10 părţi egale
(D1 ÷ D9 ) .
Centilele sunt mărimile care împart seria statistică în 100 de părţi
egale (C1 ÷C99) .
Decilele şi, mai ales, centilele se calculează doar pentru seriile
statistice cu număr mare de grupe şi cu amplitudine mare a variaţiei.
Aceşti indicatori sunt utilizaţi îndeosebi pentru seriile pronunţat
asimetrice.
Cuartilele, ca şi mediana, se determină pe baza valorilor ordonate
ale seriei statistice. Prima operaţie constă în localizarea celor trei cuartile.
Locul primei cuartile Q1 (cuartila inferioară):
1
lQ1 = (∑ ni + 1) .
4
Locul celei de a doua cuartile Q2, care este de fapt mediana:
2
lQ2 = (∑ ni + 1) = 1 (∑ ni + 1) .
4 2
Locul celei de a treia cuartile Q3 (cuartila superioară):
3
lQ3 = (∑ ni + 1) .
4
Seriile de distribuţie a frecvenţelor

Calculul efectiv al cuartilelor se face prin interpolare în cadrul


intervalului în care a fost localizată fiecare cuartilă, conform relaţiilor:
1 k  q1 −1
⋅  ∑ ni + 1 − ∑ ni
4
Q1 = x0 + d Q1 ⋅  i =1  i =1 ,
nQ1

Q2 = Me ,

3 k  q3 −1
⋅  ∑ ni + 1 − ∑ ni
4
Q3 = x0 + d Q3 ⋅  i =1  i =1 ,
nQ 3

unde: x0 - limita inferioară a intervalului în care se află Q1, respectiv Q3;


d Q1 , d Q3 - mărimea intervalului în care se situează cuartila
inferioară, respectiv superioară;
nQ1 , nQ3 - frecvenţa intervalului în care se află Q1, respectiv Q3;
q1 −1 q3 −1
∑ ni , ∑ ni - suma frecvenţelor intervalelor care preced intervalul
i =1 i =1
cuartilei inferioare, respectiv superioare.
Utilizând datele din tabelul 4.3.1, vom calcula în continuare
valoarea cuartilei inferioare şi a celei superioare.
Locul cuartilei inferioare:
2688 + 1
lQ1 = = 672,25
4
Rezultă că Q1 este localizată în intervalul (1999,5-4999,5).
Valoarea cuartilei inferioare:
672 ,25 − (40 + 364)
Q1 = 1999,5 + 3000 ⋅ ≅ 2479 locuitori.
1678
Acest rezultat ne arată că 25 % din comune au o populaţie sub
2479 locuitori, iar 75 % au o populaţie superioară acestui nivel.
STATISTICA

Locul cuartilei superioare:


3
Q3 = ⋅ (2688 + 1) = 2016,75 .
4
Q3 aparţine intervalului (1999,5-4999,5).
Valoarea cuartilei superioare:
2016,75 − 404
Q3 = 1999,5 + 3000 ⋅ ≅ 4883 locuitori.
1678
Un sfert din comune depăşesc 4883 de locuitori, în timp ce trei
sferturi din comune au sub 4883 locuitori.
Totodată, aceste rezultate arată că jumătate din comunele ţării au
între 2479 şi 4883 locuitori.
Decilele sunt în număr de nouă şi împart seria statistică ordonată
în 10 părţi egale, fiecare parte deţinând 10% din numărul unităţilor
colectivităţii. Decila a cincea este mediana.
Decilele se determină prin intermediul unor operaţii asemănătoare
celor folosite pentru mediană şi cuartile.
Locul unei decile oarecare Dj este dat de relaţia:
j k 
lD j = ⋅  ∑ ni + 1 , j = 1,..., 9.
10  i =1 
Valoarea decilei Dj:
j k  d j −1
⋅  ∑ ni + 1 − ∑ ni
10  i =1  i =1 ,
D j = x0 + d ⋅
nD j

unde: x0 - limita inferioară a intervalului în care se află decila j;


d - mărimea intervalului în care se află decila j;
n D j - frecvenţa intervalului în care se află decila j;
d j −1
∑ ni -află
frecvenţele intervalelor ce preced intervalul în care se
decila j
i =1
Seriile de distribuţie a frecvenţelor

4.3.3 Modulul

Modulul (modul sau dominanta) reprezintă valoarea cel mai frecvent


întâlnită în cadrul colectivităţii statistice analizate. El corespunde aşadar
frecvenţei maxime, ceea ce îl face uşor de identificat în cazul seriilor simple.
În seriile de intervale se stabileşte întâi intervalul modal (cel care are
frecvenţa maximă), apoi se determină valoarea efectivă a modulului, cu relaţia:
∆1
Mo = x0 + hm0 ⋅ ,
∆1 + ∆2
∆1 = nm0 − nm0 −1 ,

∆2 = nm0 − nm0 +1 ,
unde: Mo - modulul;
x0 - limita inferioară a intervalului modal;
nm0 - frecvenţa intervalului modal;
nm0 −1 - frecvenţa intervalului anterior;
nm0 +1 - frecvenţa intervalului următor;
hm0 - mărimea intervalului modal.

Se exprimă în unitatea de măsură a caracteristicii analizate.


Determinarea modulului se poate face şi pe cale grafică.
Pentru seriile de repartiţie pe variante, modulul este proiecţia pe axa Ox
a vârfului poligonului frecvenţelor.
Pentru seriile de repartiţie de frecvenţe, modulul se localizează în
intervalul corespunzător coloanei cu frecvenţă maximă. Din cele două vârfuri
superioare ale coloanei respective se trasează diagonale spre punctele de
intersecţie cu coloanele alăturate. Proiecţia pe Ox a punctului de intersecţie a
celor două diagonale este valoarea modulului.
Folosind datele din tabelul 4.3.1., putem calcula numărul cel mai
frecvent de locuitori într-o comună cu ajutorul modulului. Intervalul modal este
determinat pe baza frecvenţelor reduse (vezi coloana 4) deoarece seria are
intervale neegale şi este intervalul 1999,5 – 4999,5. Valoarea modulului este:
1314
M 0 = 1999,5 + 3000 ⋅ = 3630 locuitori.
2417
STATISTICA

∆1 = 1678 − 364 = 1314


∆2 = 1678 − 575 = 1103 .
În cazul unei serii de distribuţie a frecvenţelor obţinută prin gruparea pe
variante, valoarea modului este chiar varianta cu frecvenţa cea mai mare.
Dacă seria prezintă două frecvenţe maxime identice alăturate, se
defineşte un interval modal prin reunirea celor două intervale alăturate fără a
putea calcula valoarea exactă a modului.
Dacă seria prezintă două sau mai multe frecvenţe maxime nealăturate şi,
posibil, neegale, spunem că seria este bimodală, trimodală etc. şi se calculează
toate valorile modale.
Distribuţiile bimodale (cu două frecvenţe maxime) reprezintă o situaţie
rar întâlnită, care impune separarea unităţilor colectivităţii în două distribuţii de
frecvenţe.
De exemplu, o fabrică de încălţăminte care doreşte să-şi fixeze structura
producţiei în funcţie de mărimile cele mai solicitate, face un studiu al pieţei prin
sondaj. Dacă datele observării sunt înregistrate nediferenţiat în cadrul populaţiei,
distribuţia de frecvenţe va avea două valori modale: cea mai mică reprezintă
numărul la pantof preponderent la femei, iar cea mai mare indică mărimea cu
frecvenţă maximă la bărbaţi.
Media, mediana şi modulul caracterizează tendinţa centrală şi forma de
variaţie a caracteristicii. Ele coincid în cazul unei distribuţii perfect simetrice.
Pentru distribuţiile moderat asimetrice, între medie, mediană şi modul
există următoarea legătură:

(
x − Mo = 3 ⋅ x − Me )
Gradul de precizie al medianei şi modulului este mai redus decât al
mediei, întrucât nu includ în calcul toate valorile individuale. Cu toate acestea, în
anumite situaţii, ele pot înlocui media. De exemplu, modulul va fi preferat
mediei ca măsură a taliei la confecţii, iar mediana va reprezenta mai bine o serie
cu valori extreme excesiv de distanţate de restul valorilor.
Alegerea indicatorilor trebuie să corespundă esenţei fenomenului şi
particularităţilor distribuţiei analizate.
Seriile de distribuţie a frecvenţelor

4.4 INDICATORII VARIAŢIEI

Fenomenele şi procesele economice au un grad ridicat de


complexitate şi variabilitate datorită multitudinii de factori, direcţi şi
indirecţi, esenţiali sau întâmplători, care le influenţează. Din această
perspectivă, media, ca indicator al tendinţei centrale, poate să nu fie
întotdeauna expresia esenţei fenomenului. Acest lucru se întâmplă atunci
când colectivitatea pentru care este calculată media prezintă o mare
variaţie a valorilor individuale înregistrate; utilizarea exclusivă a mediei
în acest caz creează o imagine eronată a fenomenului analizat.
Media este reprezentativă pentru o colectivitate statistică doar
dacă este calculată din mărimi omogene, cu grad redus de variaţie. În
acest caz, variantele individuale ale caracteristicii au valori apropiate de
medie.
Pentru a verifica măsura în care se abat variantele de la medie se
calculează indicatorii variaţiei.
Indicatorii variaţiei asigură:
• verificarea gradului de omogenitate a colectivităţii şi implicit a
reprezentativităţii mediei;
• caracterizarea formei de repartiţie şi a variaţiei unei
caracteristici;
• testarea grupării corecte a datelor;
• separarea modului de acţiune a factorilor esenţiali de cei
întâmplători;
• compararea seriilor de repartiţie;
• aplicarea testelor statistice.
După complexitate şi numărul termenilor individuali implicaţi,
indicatorii variaţiei sunt incluşi în două categorii: simpli şi sintetici.

4.4.1 Indicatorii simpli ai variaţiei

Aceşti indicatori încearcă să caracterizeze gradul de împrăştiere a


termenilor unei serii statistice, utilizând numai două valori simultan.
Se determină sub forma unor mărimi absolute sau relative (prin
raportare la media seriei).
STATISTICA

Amplitudinea absolută a variaţiei reprezintă diferenţa dintre


valorile extreme ale caracteristicii înregistrate. Se determină cu formula:
A = xmax − xmin ,
unde: xmax, xmin - valoarea cea mai mare, respectiv cea mai mică
înregistrată de caracteristica statistică în cadrul seriei
respective.

Rata şomajului pe ţări*


Tabelul 4.4.1
Ţara Rata şomajului (%)
0 1
Austria 6,8
Belgia 13,0
Bulgaria 16,4
Canada 11,2
Rep. Cehă 3,5
Rep. Coreea 2,8
Danemarca 12,4
Elveţia 4,5
Finlanda 17,5
Franţa 11,61
Fosta RDG 5,8
Fosta RFG 8,2
Italia 11,5
Japonia 2,5
Norvegia 5,5
Olanda 15,7
Polonia 5,5
Regatul Unit 10,2
România *) 10,9
Spania 16,6
S.U.A. 6,7
Suedia 8,7
Turcia 7,9
Ungaria 12,1
* Notă: 1994
Sursa: Anuarul statistic al României, anul 1995.
Seriile de distribuţie a frecvenţelor

Considerând seria statistică prezentată în tabelul 4.4.1,


amplitudinea variaţiei este:
A = 17,5 - 2,5 = 15%.
Unitatea de măsură este cea a caracteristicii pentru care se
calculează.
În cazul în care variaţia caracteristicii este sistematizată pe
intervale de grupare, amplitudinea absolută a variaţiei se calculează ca
diferenţă între limita superioară a ultimului interval şi limita inferioară a
primului interval:
A = x L − xl
Amplitudinea variaţiei prezintă dezavantajul utilizării exclusive a
valorilor extreme care pot fi depărtate de masa variantelor caracteristicii.
De aceea, pentru a aprecia mai bine ce reprezintă distanţa valorilor
extreme, comparativ cu ceea ce este tipic, caracteristic pentru variabila
înregistrată, se calculează amplitudinea relativă a variaţiei, cu formula:
A
A% = ⋅ 100 ,
x
unde: x - media aritmetică a caracteristicii.
Se exprimă în procente.
Amplitudinea relativă a variaţiei permite comparaţii între serii
statistice diferite.
Utilizând datele referitoare la rata şomajului pe ţări, care au fost
sistematizate pe intervale de grupare (tabelul 4.4.2) pentru a facilita
calculele, se poate determina rata medie a şomajului:
231
x= = 9 ,6%
24
şi amplitudinea relativă a variaţiei:
15
A% = ⋅ 100 = 156 ,25% .
9 ,6
Acest rezultat arată că distanţa între capetele seriei reprezintă
156,25% din medie, o valoare relativ ridicată.
STATISTICA

Tabelul 4.4.2
Rata Nr. ţări xi xi ni xi − x di% xi − x ⋅ ni ( xi −x)2 ⋅ ni
şomajului (%) (ni)
0 1 2 3 4 5 6 7
2,5 - 5,5 6 4 24 -5,6 -58,33 33,6 188,2
5,5 - 8,5 4 7 28 -2,6 -27,08 10,4 27,0
8,5 - 11,5 6 10 60 0,4 4,17 2,4 0,96
11,5 - 14,5 3 13 39 3,4 35,42 10,2 34,68
14,5 - 17,5 5 16 80 6,4 66,67 32 204,8
Total 24 50 231 - - 88,6 455,64

Întrucât distanţa valorilor extreme, chiar dacă este comparată cu


media, reprezintă o informaţie insuficientă privind gradul de împrăştiere,
se calculează şi abaterile individuale absolute (di) ale termenilor seriei
(xi) de la medie ( x ), conform relaţiei:
_
d i = xi − x .
Abaterile individuale pot fi pozitive sau negative şi se măsoară cu
aceeaşi unitate de măsură ca şi caracteristica analizată. Semnificative
pentru gradul de împrăştiere a termenilor sunt îndeosebi abaterea maximă
pozitivă (dmax + ) şi negativă (dmax - ) :
dmax + = xmax - x
dmax - = xmin - x .
În exemplul considerat (tabelul 4.4.2) abaterile individuale
variază de la un minim de -5,6 la un maxim de 6,4, valori relativ mari
dacă le comparăm cu media.

Abaterile individuale relative (di%) se calculează raportând aba-


terile absolute la nivelul mediu al caracteristicii:
di
d i(%) = _
⋅ 100 .
x
Seriile de distribuţie a frecvenţelor

Şi în acest caz ne interesează abaterile extreme:


d max +
d max +(%) = ⋅ 100
x
d max −
d max −(%) = ⋅ 100
x
Se exprimă în procente (tabelul 4.4.2).
Acest indicator arată dimensiunile relative ale abaterilor
individuale comparativ cu ceea ce este caracteristic pentru colectivitatea
respectivă (media).
Toţi indicatorii prezentaţi anterior au dezavantajul că oferă
informaţii parţiale, limitate privind gradul de împrăştiere a valorilor
caracteristicii. Pentru a exprima variaţia totală sunt necesari indicatorii
sintetici.

4.4.2 Indicatorii sintetici ai variaţiei

Aceşti indicatori reunesc toate abaterile individuale ale termenilor


seriei într-o mărime unică, în măsură să exprime sintetic variaţia totală.
Modalitatea concretă în care se realizează această sinteză poate fi diferită,
de aceea există mai multe tipuri de indicatori.
Abaterea medie liniară reprezintă o medie aritmetică, simplă sau
ponderată, calculată din abaterile individuale, luate în valoare absolută,
ale tuturor termenilor seriei statistice de la media lor, conform relaţiei:
n
∑ xi − x
i =1
d = - pentru serii simple;
n
k
∑ xi − x ⋅ ni
i =1
d = k
- pentru serii cu frecvenţe absolute;
∑ ni
i =1

k
d = ∑ xi − x ⋅ n*i - pentru serii de frecvenţe relative
i =1 exprimate prin coeficienţi;
STATISTICA

∑x i
− x ⋅ n *i (%)
- pentru serii de frecvenţe relative
d= i =1

100 exprimate procentual.

În formula de calcul a abaterii medii liniare abaterile individuale


sunt considerate în valoare absolută, deoarece, în caz contrar, suma lor
ponderată ar fi nulă, conform proprietăţilor mediei aritmetice.
Pentru exemplul considerat (tabelul 4.4.2.), abaterea medie liniară
este:
_ 88,6
d= = 3,69% .
24
Aşadar, rata şomajului în ţările considerate se abate în medie cu
3,69 unităţi de la medie. Având în vedere valoarea mediei (9,6), abaterea
este semnificativă.
Deoarece, în analiza variaţiilor individuale, mai importante sunt
abaterile mari în valoare absolută, media pătratică este cea mai indicată.
Abaterea medie pătratică se calculează ca medie pătratică,
simplă sau ponderată, a abaterilor individuale absolute ale termenilor
seriei de la media lor aritmetică:
n _
∑ ( xi − x ) 2
i =1
σ= - pentru serii simple;
n
k _
∑ ( x i − x ) 2 ⋅ ni
i =1
σ= k
- pentru serii de frecvenţe absolute;
∑ ni
i =1

( )2
k
σ = ∑ xi − x ⋅ n*i - pentru serii de frecvenţe relative
i =1 exprimate sub formă de coeficienţi;

∑ (xi − x ) ⋅ n*i(%) - pentru serii de frecvenţe relative


k 2

i =1 exprimate procentual.
σ=
100
Seriile de distribuţie a frecvenţelor

Se exprimă în unitatea de măsură a caracteristicii, ceea ce o face


improprie comparaţiilor.
Abaterea medie pătratică este întotdeauna mai mare decât abaterea
medie liniară, deoarece media pătratică este întotdeauna mai mare decât
cea aritmetică.
Această relaţie de inegalitate se poate verifica pentru exemplul
considerat:
455,64
σ= = 4 ,36% deci σ > d
24
Raportul dintre abaterea medie liniară şi abaterea medie pătratică
se apropie de 0,8 în cazul seriilor care tind către repartiţia normală. Pentru
seria statistică analizată în acest exemplu, raportul este 0,846.
Cât de însemnată este abaterea medie, numai comparaţia cu media
o poate arăta. Această comparaţie se realizează prin intermediul
coeficientului de variaţie (v), care se calculează ca raport între abaterea
medie pătratică şi media aritmetică:
σ
v= _
⋅ 100.
x
O altă variantă de calcul:
d
v= _
⋅ 100.
x
Se exprimă în procente, ceea ce face posibilă comparaţia între serii
statistice de variabile statistice exprimate în unităţi de măsură diferite.
Întrucât anumite serii statistice pot fi mai bine reprezentate de
mediană sau modul, în numitorul formulei de calcul al coeficientului de
variaţie media poate fi înlocuită prin mediană sau modul.
Cu cât valoarea coeficientului de variaţie este mai apropiată de
zero cu atât seria statistică este mai omogenă şi, în consecinţă, media este
mai reprezentativă pentru colectivitatea respectivă. În literatura de
specialitate se avansează nivelul de 35 - 40 % ca limită maximă
admisibilă pentru coeficientul de variaţie. În situaţia unor valori mai mari
ale indicatorului, media nu mai este suficient de reprezentativă. Soluţia
care se impune este împărţirea colectivităţii în subgrupe omogene.
STATISTICA

În exemplul nostru:
4,36
v= ⋅ 100 = 45,4%
9 ,6
Aşadar, colectivitatea considerată în acest exemplu este eterogenă.
Ţările incluse în analiză (vezi tabelul 4.4.1) sunt foarte diferite din punct
de vedere al nivelului de dezvoltare şi al sistemului economic specific,
ceea ce determină diferenţe mari în mărimea indicatorului considerat. Se
poate încerca o grupare în: ţări dezvoltate, ţări mai puţin dezvoltate şi
fostele ţări socialiste.
Dispersia este un alt indicator sintetic al variaţiei care se
calculează ca medie aritmetică, simplă sau ponderată, a pătratelor
abaterilor termenilor faţă de media lor:
n _
∑ ( xi − x ) 2
i =1
σ2 = - pentru serii simple;
n
k _
∑ ( x i − x ) 2 ⋅ ni
i =1
σ2 = k
- pentru serii de frecvenţe absolute;
∑ ni
i =1

( )2
k
- pentru serii de frecvenţe relative
σ 2 = ∑ xi − x ⋅ n*i exprimate sub formă de coeficienţi;
i =1

∑ (xi − x )
k 2
⋅ n*i(%)
- pentru serii de frecvenţe relative
σ 2 = i =1
100 exprimate procentual.

Dispersia are acelaşi conţinut informaţional ca abaterea medie


pătratică, reprezentând practic pătratul acesteia.
Seriile de distribuţie a frecvenţelor

Efectuând câteva transformări simple, se poate stabili formula de


calcul a dispersiei prin metoda momentelor iniţiale:
n
2
∑ xi
σ 2 = i =1 − x 2 - pentru serii simple;
n
k
2
∑ xi ⋅ ni 2
i =1
σ2 = k
− x - pentru serii de frecvenţe absolute;
∑ ni
i =1

∑x - pentru serii de frecvenţe relative


2
σ2 = 2
i
⋅ n *i − x
i =1 exprimate sub formă de coeficienţi.
În exemplu considerat anterior dispersia este:
σ 2 = 18,985.
Nu are unitate de măsură.

Proprietăţile dispersiei

• Atunci când se măreşte (micşorează) fiecare termen al seriei cu


o constantă “a” valoarea dispersiei nu se modifică.
Demonstraţie∗:

∑ [(xi − a ) − (x − a )] ⋅ ni ∑ (xi − a − x + a ) ⋅ ni ∑ (xi − x ) ⋅ ni


2 2 2

i
= i
= i
=σ2
∑ ni ∑ ni ∑ ni
i i i

* Se folosesc proprietăţile mediei


STATISTICA

• Dacă se înmulţesc (împart) toţi termenii seriei cu o constantă “h”,


dispersia se multiplică (divide) de h2 ori.
Demonstraţie∗:
2
x x
∑  i −  ⋅ ni
h h
1
2 ∑ i
2
⋅ x − x ⋅ ni
σ2
( )
i   h i
= = 2 .
∑ ni ∑ ni h
i i
Analog se poate demonstra proprietatea în cazul multiplicării
termenilor cu o constantă.
• Dispersia faţă de o constantă “a” este mai mare decât dispersia
calculată faţă de medie cu pătratul diferenţei dintre medie şi
constanta respectivă:
_
σ a2 = σ x2 + ( x − a )2 .

unde: σ a2 - dispersia calculată faţă de o constantă a;


σ x2 - dispersia calculată faţă de medie.
Demonstraţie**:
∑ ( xi − a ) ∑ [(xi − x ) + (x − a )]
2 2
⋅ ni ⋅ ni
σ a2 = = =
∑ ni ∑ ni
∑ (xi − x ) ( )( ) (
+ 2 ⋅ xi − x ⋅ x − a + x − a  ⋅ ni )
2 2

= =
∑ fi
∑ (xi − x ) (x − a )2 ⋅ ∑ ni = σ 2 + (x − a )2
2
⋅ ni
= +0+ x
∑ ni ∑ ni

** Se va folosi următoarea proprietate a mediei: suma algebrică a tuturor abaterilor


termenilor seriei de la medie este nulă.
Seriile de distribuţie a frecvenţelor

Consecinţă:
_
σ x2 = σ a2 − ( x − a ) 2.
Ultimele două proprietăţi se regăsesc în formula de calcul
simplificat al dispersiei:

2
k  xi − a 
∑  ⋅ ni _
i =1  h 
σ x2 = k
⋅ h 2 − ( x− a )2 .
∑ ni
i =1

Această formulă se utilizează în cazul seriilor cu intervale de


variaţie egale. Este recomandată alegerea unei constante "a" egală cu
mărimea centrului de interval care corespunde frecvenţei maxime şi a
unei constante "h" de mărimea intervalului de grupare.
Formula uşurează calculele pentru seriile cu valori mari ale
caracteristicii.
Calcularea dispersiei pentru seria statistică prezentată anterior,
utilizând formula de calcul simplificat (tabelul 4.4.3.) conduce la
următorul rezultat:
51 2
σ2 = ⋅ 3 − ( 9,6 − 10 )2 = 18,97.
24
Tabelul 4.4.3
xi ni xi − a  xi − a 
2

h   ⋅ ni
 h 
0 1 2 3
4 6 -2 24
7 4 -1 4
10 6 0 0
13 3 1 3
16 5 2 20
Total 24 - 51
STATISTICA

Gruparea datelor statistice pe intervale de variaţie uşurează în


mare măsură calculul indicatorilor de variaţie dar determină diferenţe faţă
de mărimea indicatorilor corespunzători calculaţi pe baza datelor
negrupate.
Abaterea este cu atât mai însemnată cu cât mărimea intervalelor de
grupare este mai mare. În situaţii de acest fel se recomandă folosirea
formulei lui Sheppard pentru a corecta mărimea dispersiei. Sheppard
propune următoarea relaţie:
h2
σ 2 = σ calculat
2
− ,
12
unde: h - mărimea intervalelor de grupare egale.

Analiza indicatorilor tendinţei centrale şi a indicatorilor variaţiei


trebuie să se facă în mod combinat. Interpretarea lor izolată poate conduce
la erori. De exemplu, două serii statistice pot avea aceeaşi dispersie, dar
medii diferite, ca în figura* următoare:
f

x
x1 x2
Uneori, seriile statistice au aceeaşi medie, dar dispersii diferite ca
în această figură*:

* După: Bernard Py., Statistique descriptive, Economica, Paris, 1990, pag. 69.
Seriile de distribuţie a frecvenţelor

DISPERSIA CARACTERISTICII ALTERNATIVE

Caracteristica alternativă este o variabilă care admite numai două


variante (DA/NU) codificate cu 1, respectiv 0. Din această cauză,
indicatorii statistici calculaţi pentru caracteristica alternativă au o formă
particulară.
Media caracteristicii alternative (vezi paragraful 4.2.7.) se
calculează ca pondere a unităţilor care îndeplinesc o condiţie (variantă
afirmativă) în total colectivitate:
M
p= ,
N
unde: M - numărul de apariţii a variantei afirmative a caracteristicii;
N - numărul total al unităţilor statistice din colectivitate.

Media caracteristicii alternative este o mărime relativă de


structură: frecvenţă relativă.
Numărul unităţilor care nu îndeplinesc condiţia (varianta negativă)
este N-M, iar ponderea lor este:
N −M M
q= = 1− = 1− p
N N
Frecvenţele absolute şi relative ale variantelor sunt prezentate în
tabelul următor:

Tabelul 4.4.4
Variantele Valoarea Frecvenţe Frecvenţe relative
caracteristicii caracteristicii absolute (ni*)
alternative alternative (ni)
0 1 2 3
Afirmativ 1 M p
Negativ 0 N-M 1-p
Total - N 1
STATISTICA

Aplicând formula de calcul a dispersiei (în varianta care utilizează


frecvenţe relative exprimate prin coeficienţi) pentru datele din tabelul
4.4.4 obţinem:
2

σ 2p = ∑ (x − p ) ⋅ n *i = (1 − p ) ⋅ p + (0 − p ) (1 − p ) =
2 2 2
i
i =1

= p ⋅ (1 − p ) ⋅ (1 − p + p ) = p ⋅ (1 − p )
Abaterea medie pătratică a caracteristicii alternative este radical
din dispersie:
σp = p ⋅ (1 − p )

4.4.3 Variaţia intercuartilică şi interdecilică

Cunoaşterea relaţiilor care se stabilesc între indicatorii medii de


poziţie într-o repartiţie perfect simetrică permite interpretarea modului de
distribuţie a frecvenţelor în repartiţiile empirice.
Seriile perfect simetrice prezintă o aşezare simetrică a cuartilelor
faţă de mediană şi îndeplinesc anumite condiţii.
Astfel, distanţa dintre mediană şi cuartila inferioară (Q1) este egală
cu distanţa dintre cuartila superioară (Q3) şi mediană, conform relaţiei:
Me − Q1 = Q3 − Me .
Rezultă de aici că:
Q1 + Q3
2 ⋅ Me = Q1 + Q3 ⇒ Me = .
2
Această relaţie arată că, într-o serie perfect simetrică, mediana este
egală cu media aritmetică a cuartilelor extreme.
De regulă, seriile empirice se abat de la acest model al simetriei
perfecte şi relaţiile anterioare nu se verifică. Mărimea acestei abateri
poate fi măsurată cu ajutorul unor indicatori bazaţi pe cele trei cuartile,
numiţi indicatori ai variaţiei intercuartilice.
Abaterea intercuartilică reprezintă media abaterilor cuartilelor
extreme (Q1, Q3) de la mediană:
(Me − Q1 ) + (Q3 − Me) Q3 − Q1
AQ = =
2 2
Seriile de distribuţie a frecvenţelor

Abaterea intercuartilică se măsoară cu aceeaşi unitate de măsură


ca variabila analizată, ceea ce nu permite comparaţii între serii statistice
diferite din punctul de vedere al unităţilor de măsură.
Coeficientul de variaţie intercuartilică remediază acest dezavan-
taj, raportând abaterea intercuartilică la mediană:
Qd Q3 − Q1
Vq = = unde Vq ∈ [0 , 1]
Me 2 ⋅ Me
Cu cât distanţa dintre cuartilele extreme este mai mică în raport cu
mediana, cu atât coeficientul ia valori mai mici.
Indicatorii variaţiei intercuartilice pot oferi o măsură semnificativă
a seriilor cu un nivel redus de asimetrie. Pentru seriile cu asimetrie
pronunţată şi cu un număr mare de grupe, analiza poate fi adâncită prin
calcularea distanţei dintre decilele extreme (D1, D9). Acest interval
include 80 % din termenii seriei, comparativ cu 50 % în cazul intervalului
intercuartilic.
Abaterea interdecilică este media abaterilor decilelor extreme
faţă de mediană:
(Me − D1 ) + (D9 − Me) D9 − D1
AD = = .
2 2
Interpretarea acestui indicator se bazează pe faptul că într-o serie
perfect simetrică decilele extreme (ca şi cuartilele extreme) sunt egal
depărtate de mediană:
Me − D1 = D9 − Me .
Pentru asigurarea comparabilităţii între serii statistice diferite,
indicatorul se calculează şi în varianta relativă, prin împărţire la mediană.
Se obţine astfel coeficientul de variaţie interdecilică:
AD D9 − D1
VD = = unde VD ∈ [0 , 1]
Me 2 ⋅ Me
Cu cât seria are o tendinţă mai pronunţată de asimetrie, cu atât
coeficientul de variaţie interdecilică va avea o valoare mai apropiată de 1.
STATISTICA

4.4.4 Indicatorii variaţiei în colectivităţile


împărţite în grupe

În colectivităţile împărţite în grupe se pot calcula atât medii pe


grupe, cât şi o medie a colectivităţii totale. În mod corespunzător, se vor
calcula indicatori de variaţie pentru fiecare grupă şi pe întreaga
colectivitate. Indicatorii de variaţie pe întreaga colectivitate se pot calcula
fie făcând abstracţie de faptul că ea este compusă din mai multe grupe, fie
luând în calcul variaţia din interiorul grupelor şi variaţia dintre grupe.
În situaţii de acest fel, analiza se desfăşoară atât pe ansamblul
colectivităţii, cât şi la nivelul grupelor. Factorii care determină variaţia
caracteristicii sunt de două tipuri:
• un factor esenţial, în funcţie de care s-a realizat gruparea;
acesta explică abaterile mediilor de grupă de la media generală;
• factorii neesenţiali, reprezentaţi de ansamblul tuturor celorlalţi
factori care influenţează variaţia caracteristicii date; ei acţio-
nează în interiorul fiecărei grupe, fiind cauza abaterilor
termenilor individuali de la media grupei din care fac parte.
Atunci când factorul esenţial (înregistrat) este determinant, variaţia
dintre grupe este mult mai mare decât variaţia din interiorul grupelor. În caz
contrar, factorii neesenţiali (neînregistraţi) au o influenţă mai puternică.
Analiza variaţiei în colectivităţile împărţite în grupe porneşte de la
o repartiţie bidimensională de frecvenţe. Datele sunt înregistrate pentru
două caracteristici (x şi y) la nivelul fiecărei unităţi a colectivităţii.
Unităţile sunt împărţite pe grupe în funcţie de caracteristica x (factor
principal de grupare), iar în cadrul fiecărei grupe astfel formate, se face o
nouă împărţire în funcţie de variaţia caracteristicii y. Se obţin astfel
distribuţiile condiţionate ale variabilei y în funcţie de factorul de grupare
x. Rezultatele grupării sunt înregistrate într-un tabel cu dublă intrare (vezi
tabelul 4.4.5). Conţinutul tabelului îl formează frecvenţele nij care reflectă
numărul unităţilor statistice care aparţin grupei i după variaţia factorului
de grupare x şi subgrupei j după variaţia caracteristicii y.
Seriile de distribuţie a frecvenţelor

Tabelul 4.4.5
Grupe Subgrupe după y Total unităţi Medii de Dispersii de
după x yi ... yj ... ym pe grupe grupă grupă
(ni.) yi σi2
x1 n11 ... n1j ... n1m n1. y1 σ12
Μ Μ Μ
Μ Μ
xi ni1 ... nij ... nfim ni.
Μ Μ yi σi2
Μ
xr nr1 ... nrj ... nrm nr. Μ
Μ
yr
σ r2
Total unităţi r m
pe subgrupe n.1 ... n.j ... n.m ∑ ∑ nij y σ 2y
(n.j) i =1 j =1

Variaţia totală a caracteristicii poate fi analizată în următoarele


direcţii:
− abaterile valorilor individuale dintr-o grupă de la media grupei
respective (yj- yi );
− abaterile mediilor de grupă de la media colectivităţii totale
( yi - y );
− abaterile tuturor valorilor individuale de la media colectivităţii
totale (yj- y ).
Între cele trei componente există următoarea relaţie:
(y j − y ) = (y j − y i ) + (y i − y )
care se verifică la nivelul fiecărei unităţi statistice din colectivitate.
Fiecare din cele trei abateri va fi sintetizată pe ansamblul
colectivităţii printr-un indicator de variaţie.
Dispersia totală se calculează pe baza tuturor abaterilor indivi-
duale stabilite faţă de media colectivităţii totale.

∑ (y j − y )
m 2
⋅ n. j
2 j =1
σ =y m
,
∑ n. j
j =1
STATISTICA

unde: yj - valorile caracteristicii distribuită în funcţie de un factor de


grupare x;
y - media pe total;
n.j - frecvenţele subgrupelor formate după variaţia caracteristicii y;
m - numărul subgrupelor.
Media colectivităţii totale este:
r
∑ y i ⋅ ni .
i =1
y= r
,
∑ ni .
i =1

unde: y i - mediile pe grupe (medii condiţionate);


ni. – volumul grupelor formate după variaţia caracteristicii de
grupare x;
r – numărul grupelor.
Dispersia totală reuneşte influenţele tuturor factorilor (esenţiali şi
neesenţiali) care determină variaţia caracteristicii y.
Dispersia grupei se calculează pe baza abaterilor tuturor
variantelor dintr-o grupă faţă de media lor de grupă, conform relaţiei:

∑ (y j − y i ) ⋅ nij
m 2

j =1
σ i2 = m
,
∑ nij
j =1
iar mediile pe grupe sunt:
m
∑ y j ⋅ nij
j =1
yi = m
, i = 1,..., r,
∑ nij
j =1
unde: nij – frecvenţele condiţionate de variaţia combinată a
caracteristicilor x şi y.
Dispersiile pe grupe reflectă influenţa factorilor aleatori care
acţionează în interiorul grupelor, determinând variaţia valorilor
Seriile de distribuţie a frecvenţelor

individuale. Cu cât o grupă este mai omogenă, cu atât σ i2 va fi mai mic.


Dispersiile tuturor grupelor sunt sintetizate în media dispersiilor de grupă.
Media dispersiilor de grupă se calculează ca o medie aritmetică
a dispersiilor tuturor grupelor. Dacă grupele sunt egale ca volum se
foloseşte media aritmetică simplă, iar dacă volumul diferă de la o grupă la
alta se calculează ca medie aritmetică ponderată conform relaţiei
următoare:
r

2
∑ σ i2 ⋅ ni .
i =1
σ 2y / r = σ = r
∑ ni .
i =1

Dispersia dintre grupe se calculează pe baza abaterilor mediilor


de grupă de la media colectivităţii totale.

∑ (yi − y ) ⋅ ni .
r 2

i =1
σ 2y / x = δ 2 = r
∑ ni .
i =1

Dispersia dintre grupe măsoară influenţa factorului de grupare. Cu


cât este mai mare, cu atât factorul de grupare x are un rol mai important.
Regula adunării dispersiilor este următoarea: dispersia colec-
tivităţii totale este egală cu media dispersiilor de grupă plus dispersia
dintre grupe.
σ 2y = σ y2 / x + σ 2
Măsura influenţei factorului de grupare x asupra variaţiei caracte-
risticii y este dată de gradul de determinaţie (R2). Acesta se calculează
ca raport între dispersia dintre grupe şi dispersia totală:
σ 2y / x
R2 = ⋅ 100
σ 2y
Se consideră că factorul de grupare x influenţează hotărâtor
variaţia factorului determinat y dacă R2 > 50 %.
STATISTICA

Gradul de nedeterminaţie arată în ce proporţie influenţează


factorii aleatori (neînregistraţi) variaţia caracteristicii y. Se calculează ca
raport între media dispersiilor de grupă şi dispersia totală:
σ2
N2 = ⋅ 100
σ 2y
R 2 + N 2 = 100%
Pe baza mediilor şi a abaterilor medii pătratice, determinate pe
grupe şi pe total, se pot obţine informaţii referitoare la gradul de
omogenitate al acestora cu ajutorul coeficienţilor de variaţie
corespunzători, calculaţi după relaţiile:
- la nivelul grupei
σi
vi = ⋅ 100 unde σ i = σ i2
yi
- pe total
σ
v= ⋅ 100 unde σ = σ2
y
Comparând coeficienţii de variaţie la nivelul grupelor putem
aprecia că cea mai omogenă este grupa pentru care indicatorul menţionat
ia valoarea minimă.
Dacă structurarea colectivităţii pe grupe după variaţia
caracteristicii X s-a efectuat corect, coeficienţii de variaţie calculaţi la
nivelul grupelor sunt mai mici decât coeficientul de variaţie pe total:
vi < v i = 1, r
În cele ce urmează, vom aplica regula de adunare a dispersiilor pe
exemplul distribuţiei bidimensionale din tabelul următor:
Numărul agenţilor economici din administraţie după forma de proprietate,
pe clase de mărime, în anul 1996
Grupe de agenţi Subgrupe de clase de mărime, după
economici după forma numărul de salariaţi (persoane) Total
de proprietate 0-9 10 - 49 50 - 249 250 şi peste
0 1 2 3 4 5
- administraţie publică 20.407 9.452 3.232 345 33.436
- administraţie privată 23.152 47 26 8 23.233
Total 43.559 9.499 3258 353 56.669
Sursa: Anuarul statistic al României, anul 1997.
Seriile de distribuţie a frecvenţelor

Mediile de grupă reprezintă în acest caz numărul mediu de salariaţi


într-o unitate de administraţie publică, respectiv privată:
m
∑ y j ⋅ nij
j =1
yi = m
,
∑ nij
j =1
unde: yj - centrele de interval ale distribuţiei după y: 5, 30, 150, 350.
5 ⋅ 20407 + 30 ⋅ 9452 + 150 ⋅ 3232 + 350 ⋅ 345
y1 = ≅ 30 salariaţi
33436
5 ⋅ 23152 + 30 ⋅ 47 + 150 ⋅ 26 + 350 ⋅ 8
y2 = ≅ 5 salariaţi
23233
Media numărului de salariaţi într-o unitate, pe total administraţie:
r
∑ y i ⋅ ni .
i =1 30 ⋅ 33.436 + 5 ⋅ 23.233
y= r
= ≅ 20 salariaţi
56.669
∑ ni .
i =1

Dispersiile de grupă:

∑ (y j − y i )
m 2
⋅ nij
j =1
σ i2 = m
∑ nij
j =1

σ 12 =
(5 − 30)2 ⋅ 20407 + (30 − 30)2 ⋅ 9452 + (150 − 30)2 ⋅ 3232 +
33436

+
(350 − 30) 2
⋅ 345
= 2829,98
33436

σ 22 =
(5 − 5)2 ⋅ 23152 + (30 − 5)2 ⋅ 47 + (150 − 5)2 ⋅ 26 + (350 − 5)2 ⋅ 8 =
23233
= 65,78
STATISTICA

Media dispersiilor de grupă:

r
∑ σ i2 ⋅ ni .
2 i =1 2829,98 ⋅ 33436 + 65,79 ⋅ 23233
σ = r
= = 1696,73
56669
∑ ni .
i =1

Dispersia dintre grupe:

∑ (y i − y )
r 2
⋅ ni .
σ 2
= i =1
=
(30 − 20 )2 ⋅ 33436 + (5 − 20 )2 23233
=
y/ x r 56669
∑ ni .
i =1
= 151,25
Dispersia totală:

∑ (y j − y )
m 2
⋅ n. j
σ = 2 j =1
=
(5 − 20)2 ⋅ 43559 + (30 − 20)2 ⋅ 9499 +
y m 56669
∑ n. j
j =1

+
(150 − 20)2 ⋅ 3258 + (350 − 20)2 ⋅ 353 = 1848,03
56669
Regula adunării dispersiilor:
2
σ y2 = σ y2 / x + σ ⇔ 1848,03 ≅ 151,25 + 1696 ,73
Întrucât media dispersiilor de grupă este mult mai mare decât
dispersia dintre grupe, rezultă că împărţirea unităţilor din administraţie
după forma de proprietate nu este un factor hotărâtor pentru numărul
(
mediu de angajaţi R 2y / x = 8,18% . )
Seriile de distribuţie a frecvenţelor

Regula de adunare a dispersiilor se poate aplica şi în cazul seriilor


cu frecvenţe relative prezentate în tabele de forma:Tabelul 4.4.6
Valorile Cracteristica Y Total Ponderea
caracteristicii Frecvenţe relative (%) (%) grupei
de grupare X (ni(%))
y1 y2 … yj … ym
x1 n*11 n*12 ... n*1j … n*1m 100. n1(%)
x2 n*21 n*22 ... n*2j … n*2m 100 n2(%)
... ... ... … ... … ... ... ...
xi n*i1 n*i2 ... n*ij … n*im 100 ni(%)
... ... ... … ... … ... ... ...
xr n*r1 n*r2 ... n*rj … n*rm 100 nr(%)
Total 100

În acest caz se calculează indicatorii medii de variaţie cu ajutorul


formulelor în care frecvenţele se exprimă sub forma de greutăţi specifice,
iar suma lor este egală cu 1 sau 100%.
Dispersia de grupă se calculează astfel:
m

m
∑ ( y j − yi ) 2 n*ij(%)
j =1
σ i2 = ∑ ( y j − y i ) 2 n*ij sau σ i2 =
j =1 100
Pentru a calcula nivelul mediu pe total, media dispersiilor de
grupă şi dispersia dintre grupe, trebuie să se cunoască structura pe grupe a
colectivităţii. Dacă grupele sunt egale între ele ca volum, indicatorii
respectivi se calculează folosind formule de calcul pentru o serie simplă.
Dacă volumul, diferă de la o grupă la alta atunci trebuie să se folosească
frecvenţele pe grupe.
Pentru a sintetiza variaţia la nivelul grupelor într-un singur
indicator se calculează media dispersiilor de grupă:
r
∑ σ i2 ⋅ ni .(%) *
σ 2 = i =1
100
*
în care n i .(%) reprezintă greutatea specifică a fiecărei grupe faţă de total.
STATISTICA

Pentru calculul dispersiei dintre grupe şi a dispersiei faţă de total


este necesară calcularea mediei pe întreaga colectivitate:
r
r ∑ yi n*i
i =1
y = ∑ yi n*i sau, y =
i =1 100
Dispersia dintre grupe se calculează după formula:
r
r ∑ ( yi − y )2 n*i(%)
i =1
δ 2 = ∑ ( yi − y )2 n*i sau δ 2 =
i =1 100
Dispersia pe total se calculează folosind regula de adunare a
dispersiilor.
În cazul folosirii frecvenţelor relative trebuie să se cunoască atât
structura seriilor componente cât şi structura pe grupe a colectivităţii
totale.
În cazul în care colectivitatea este împărţită în grupe şi se studiază
variaţia unei caracteristici alternative tabelul cu dublă intrare are
următoarea formă:
Tabelul 4.4.7
Valorile Total
caracteristicii Variantele caracteristicii
de grupare X analizate Y
y1=0 y2=1
x1 N1 - M1 M1 N1
x2 N2 - M2 M2 N2
... ... ... ...
xi Ni - Mi Mi Ni
... ... ... ...
xr Nr - Mr Mr Nr
Total N-M M N

Indicatorii medii şi ai variaţiei calculaţi pe baza acestui tabel sunt


prezentaţi în cele ce urmează.
Seriile de distribuţie a frecvenţelor

Dispersia de grupă pentru o caracteristică alternativă ( σ 2p ) se


i

calculează după relaţia:

σ 2p = pi qi sau σ 2p = pi ( 1 − pi )
i i

în care :
pi - reprezintă media caracteristicii alternative pentru grupa i
 M 
 pi = i  ;
 Ni 
qi - frecvenţele relative ale unităţilor care nu posedă caracteristica
în fiecare grupă.
Media dispersiilor de grupă ( σ p2 ) se calculează ca o medie
ponderată a dispersiilor grupelor în care a fost împărţită colectivitatea:
r
∑ σ 2pi N i
i =1
σ p2 = r
∑ Ni
i =1
în care Ni - reprezintă numărul total al unităţilor observate în fiecare
grupă.
Dispersia dintre grupe pentru o caracteristică alternativă
2
( δ p ) se calculează pe baza abaterilor mediilor caracteristicii alternative
din fiecare grupă şi media pe întreaga colectivitate:
r
∑ ( pi − p ) 2 N i
i =1
δ p2 = r
∑ Ni
i =1
în care p este media caracteristicii alternative pe întreaga colectivitate
M
(p= ).
N
STATISTICA

Dispersia totală a caracteristicii alternative ( σ 2p ) se calculează


pe baza celor două greutăţi specifice (p, q) din colectivitatea totală:
σ 2p = p ⋅ q
Regula adunării dispersiilor se păstrează şi în cazul unei
caracteristici alternative:
σ 2p = σ p2 + δ p2

4.5 INDICATORII ASIMETRIEI


Seriile empirice cu care lucrează statistica tind deseori către
modelul repartiţiei normale, care este o distribuţie perfect simetrică.
Distribuţia perfect simetrică se caracterizează prin egalitatea
dintre medie, mediană şi modul. Frecvenţele se distribuie simetric la
dreapta şi la stânga valorii centrale, care are frecvenţa maximă. Graficul
are formă “ de clopot ” (fig. 4.5.1.).
În acest caz, acţiunea factorilor întâmplători are caracter regulat,
astfel încât acţiunea lor se repartizează uniform, în ambele sensuri, faţă de
medie.
Comparaţia între medie şi indicatorii tendinţei centrale permite
interpretarea gradului de asimetrie a unei distribuţii de frecvenţe. Graficul
(histograma, poligonul frecvenţelor) oferă o primă imagine asupra
gradului de asimetrie.

x = Me = M0 x
Fig. 4.5.1 Distribuţia perfect simetrică
Seriile de distribuţie a frecvenţelor

Asimetria pozitivă (fig. 4.5.2) este caracteristică acelor


colectivităţi în care predomină valorile mici ale caracteristicii, de unde
rezultă următoarea relaţie de inegalitate:
Mo < Me < x .
Pentru acest tip de distribuţie de frecvenţe, media reprezintă mai
bine valorile mici ale seriei, care sunt predominante; dimpotrivă, valorile
mari sunt mult distanţate faţă de medie.
f

Mo M e x x
Fig. 4.5.2 Asimetrie pozitivă

Asimetria negativă (fig. 4.5.3) este specifică seriilor de distribuţie


de frecvenţe în care predomină valorile mari ale caracteristicii, astfel
încât:
x < Me < Mo
În acest caz, media este semnificativă pentru valorile mari ale
caracteristicii; termenii cu valori mici ai seriei statistice nu sunt bine
reprezentaţi.
f

x M eM o x

Fig. 4.3 Asimetrie negativă


STATISTICA

Distribuţiile de frecvenţe care sunt numai uşor asimetrice verifică


următoarea legătură între medie, mediană şi modul:
Mo = x − 3 ⋅ ( x − Me ) .
Măsurarea asimetriei se bazează pe indicatori care compară
media cu mediana (sau modulul), în condiţiile unui anumit grad de
împrăştiere a unităţilor colectivităţii (măsurat prin abaterea medie
pătratică).
1) Pentru seriile cu intervale de grupare mari sau inegale se mai
calculează şi densitatea de repartiţie a frecvenţelor absolute/relative
pentru fiecare interval în parte, ca raport între frecvenţa absolută/relativă
şi mărimea intervalului:
ni
Dabs = ,
k

n*i
Drel = .
k
2) Coeficienţii de asimetrie Pearson
Cel mai frecvent, în practică se utilizează coeficienţii de asimetrie
Pearson, în două variante:
a) ca raport între asimetria absolută şi abaterea medie pătratică:
_
x − Mo
C as = unde C as ∈ (-1, 1)
σ
_ 
3 ⋅  x − Me 
b) C as ′ =   unde C ′ ∈ (-3, 3)
as
σ
şi se utilizează pentru distribuţii uşor asimetrice.
Ambii coeficienţi au valori > 0 când distribuţia de frecvenţe are
asimetrie pozitivă şi valori < 0 în cazul asimetriei negative. Pentru serii
perfect simetrice valoarea lor este zero.
Seriile de distribuţie moderat asimetrice au valoarea coeficientului
de asimetrie |Cas| < 0,3 şi |Cas' |< 1.
Seriile de distribuţie a frecvenţelor

Pearson propune şi alţi indicatori de asimetrie, indicaţi pentru


seriile foarte mari:
µ 32
β1 =
µ 23
µ4
β2 =
µ 22
unde:

µ2 = ∑ i
(
x − x ⋅ ni )2 (dispersia)
∑ ni
(x − x )
µ3 = ∑ i
3
⋅ ni
∑ ni

µ4 = ∑ i
(
x − x ⋅ ni )4
∑ ni
Mărimile µ 2 , µ 3 , µ 4 sunt momente centrate de ordinul 2,
respectiv 3 şi 4.
Coeficienţii β1 şi β 2 reflectă intensitatea concentrării
frecvenţelor în centrul distribuţiei.
Gradul de boltire a distribuţiei este măsurat de coeficientul β 2 ,
astfel:
• curbă leptocurtică
f

x
STATISTICA

În cazul curbei leptocurtice β 2 > 3.


• curbă platicurtică β 2 < 3
f

x
Atunci când β 2 = 3, curba este normală.

3) Coeficienţii de asimetrie intercuartilică şi interdecilică


Coeficientul Yule foloseşte distanţele dintre cuartile ca măsură a
asimetriei, conform relaţiei:
(Q3 − Me) − (Me − Q1 )
CY = unde CY ∈ [− 1, 1]
(Q3 − Me) + (Me − Q1 )
Coeficientul Bowley utilizează distanţele dintre decile:
(D9 − Me) − (Me − D1 )
CB = unde C B ∈ [− 1, 1]
(D9 − Me) + (Me − D1 )
Când aceşti coeficienţi au valori apropriate de zero, seria tinde
către distribuţia perfect simetrică. Valori mai mari de 0,3 în valoare
absolută indică o asimetrie pronunţată. Semnul + sau - al indicatorului se
referă la tipul asimetriei: pozitivă sau negativă.

4.6 INDICATORII CONCENTRĂRII


Prin concentrare, în statistică, se înţelege faptul că o pondere mică
din colectivitate deţine o pondere mare din valoarea variabilei studiate.
La caracterizarea statistică a concentrării se pot folosi: metoda
grafică şi măsurarea concentrării prin indicatori statistici adecvaţi.
Analiza concentrării se bazează pe curba de concentrare denumită
şi curba lui Lorenz care se construieşte, de regulă, pentru repartiţiile
Seriile de distribuţie a frecvenţelor

construite pe intervale de grupare şi presupune parcurgerea următoarelor


etape:
1. Calcularea frecvenţelor relative
n
ni * = i ⋅ 100
∑ ni
2. Calculul frecvenţelor relative cumulate crescător (Fi(%));
3. Determinarea nivelului totalizat al caracteristicii pe fiecare
grupă (xini) şi pe total colectivitate (Σxini);
4. Determinarea greutăţii specifice care exprimă ponderea
nivelului totalizator al fiecărei grupe în total
xi ni
( g i* = ⋅ 100 );
∑ xi ni
5. Calcularea greutăţilor specifice cumulate crescător (gic*);
6. Construirea curbei de concentrare.
Acest tip de grafic se construieşte în sistem de axe, în cadranul I.
Pe axa OX se reprezintă frecvenţele relative cumulate iar pe OY greutăţile
specifice cumulate.. Fiecare pereche de valori (Fi(%),gic(%)) se reprezintă
grafic printr-un punct. Unind succesiv două câte două puncte alăturate
prin segmente de dreaptă se obţine curba de concentrare.
Suprafaţa mărginită de curba de concentrare şi dreapta egalităţii
perfecte a frecvenţelor (diagonala care uneşte punctele de coordonate
(0,0) şi (100,100)) se numeşte arie de concentrare. Cu cât această arie este
mai mare cu atât concentrarea este mai puternică.
Pentru a reda în expresie numerică mărimea gradului de
concentrare se calculează indicatori statistici adecvaţi.
Cel mai frecvent utilizat este coeficientul de concentrare propus de
statisticianul italian Corado Gini potrivit relaţiei:

C= ∑ g i2 unde i = 1, n

 1 
Coeficientul Gini ia valori în intervalul  ,1 . Atunci când cele
 n 
n unităţi au ponderi egale în colectivitate, adică repartiţia studiată este
STATISTICA

1
absolut uniformă, rezultă C = , iar dacă variabila cercetată se
n
concentrează într-o singură unitate, C=1.
Pentru a înlătura dezavantajul legat de faptul că limita inferioară
este variabilă depinzând de numărul termenilor seriei se foloseşte un alt
indicator de concentrare propus de R. Struck:
n ∑ g i2 − 1
C=
n −1
Interpretarea valorii acestui coeficient se face în intervalul [0,1].
Cu cât coeficientul de concentrare este mai aproape de limita inferioară, el
exprimă o mai uniformă repartizare a elementelori colectivităţii pe tipurile
calitative observate. O apropiere de limita superioară sugerează o
concentrare pe un anumit tip sau pe câteva tipuri calitative.

4.7 ÎNTREBĂRI ŞI TESTE-GRILĂ

4.7.1 Întrebări recapitulative

1.Ce înţelegeţi prin frecvenţe absolute?


2.Ce înţelegeţi prin frecvenţe relative?
3.Ce înţelegeţi prin frecvenţe cumulate?
4.Cum se obţine valoarea centralizată la nivelul grupei?
5.Cum se obţine valoarea centralizată la nivelul ansamblului?
6.Cum se determină indicatorul de nivel al caracteristicii de
grupare în cazul distribuţiilor de frecvenţe obţinute prin gruparea
pe intervale?
7. Cum se calculează densitatea de repartiţie?
8. Când se recomandă utilizarea densităţii de repartiţie?
9. Ce reprezintă xi ni ?
10. Ce reprezintă ∑x ni i
?
11. Care sunt indicatorii tendinţei centrale?
12. Ce înţelegeţi prin mod (modul, dominantă)?
13. Cum se stabileşte locul modului în cazul grupării pe variante?
14. Cum se stabileşte locul modului în cazul grupării pe intervale?
Seriile de distribuţie a frecvenţelor

15. Cum se determină modul în cazul grupării pe variante?


16. Cum se determină modul în cazul grupării pe intervale?
17. Când se recomandă utilizarea modului?
18. În ce caz nu poate fi calculat modul ca indicator al tendinţei
centrale?
19. O serie de distribuţie de frecvenţe poate avea mai multe
moduri? Dacă da, cum se continuă analiza?
20. Când se recomandă utilizarea modului ca o alternativă la media
aritmetică?
21. Ce grafic se poate utiliza pentru estimarea modului?
22. Ce înţelegeţi prin mediană?
23. Cum se determină locul medianei pentru o distribuţie de
frecvenţe rezultată prin gruparea pe variante?
24. Cum se determină locul medianei pentru o distribuţie de
frecvenţe rezultată prin gruparea pe intervale?
25. Cum se determină valoarea medianei pentru o distribuţie de
frecvenţe rezultată prin gruparea pe variante?
26. Cum se determină valoarea medianei pentru o distribuţie de
frecvenţe rezultată prin gruparea pe intervale?
27. Ce grafic se poate utiliza pentru estimarea medianei?
28. Când se recomandă utilizarea medianei ca o alternativă la
media aritmetică?
29. În ce situaţie mediana reprezintă singura alternativă pentru
calcularea mediei unei caracteristici statistice?
30. Cum se defineşte media aritmetică?
31. Ce condiţii trebuie să îndeplinească datele statistice din care se
calculează media aritmetică?
32. Care este principalul dezavantaj al mediei aritmetice?
33. Care este principalul avantaj al mediei aritmetice?
34. Ce criterii se folosesc pentru verificarea corectitudinii
calculului mediei aritmetice?
35. Care sunt principalele proprietăţi ale mediei aritmetice?
36. Când se recomandă folosirea formulei de calcul simplificat în
calculul mediei?
37. Pe ce proprietăţi ale mediei se bazează formula de calcul
simplificat?
38. Pe ce proprietate a mediei se bazează calculul mediei aritmetice
cu frecvenţe relative?
STATISTICA

39. Ce tipuri de frecvenţe se pot folosi la calculul mediei


aritmetice?
40. Cum se calculează media de medii parţiale?
41. Ce relaţii pot exista între indicatorii tendinţei centrale?
42. Ce reprezintă media armonică?
43. Când se recomandă utilizarea mediei armonice?
44. Când se utilizează media armonică ca formă transformată a
mediei aritmetice? Exemplificaţi.
45. Ce reprezintă media pătratică?
46. Când se recomandă utilizarea mediei pătratice? Exemplificaţi.
47. Ce reprezintă media geometrică?
48. Când se recomandă utilizarea mediei geometrice?
Exemplificaţi.
49. Cum se calculează media geometrică de medii geometrice
parţiale? Exemplificaţi.
50. Ce condiţie trebuie respectată la calcularea mediei geometrice
din medii geometrice parţiale? Exemplificaţi.
51. Ce tip de medie se poate utiliza pentru denaturarea realităţii în
sens pozitiv?
52. Ce tip de medie se poate utiliza pentru denaturarea realităţii în
sens negativ?
53. Cum se calculează mărimea relativă la nivelul ansamblului din
mărimi relative parţiale de acelaşi tip în cazul în care se cunosc
numărătorii din care s-au calculat mărimile parţiale?
54. Cum se calculează mărimea relativă la nivelul ansamblului din
mărimi relative parţiale de acelaşi tip în cazul în care se cunosc
numitorii din care s-au calculat mărimile parţiale?
55. Din ce categorie de indicatori face parte mediana?
56. Ce sunt cuantilele?
57. Ce sunt cuartilele?
58. Ce sunt decilele?
59. Ce sunt centilele?
60. Ce înţelegeţi prin asimetrie?
61. Care este relaţia între indicatorii tendinţei centrale când
predomină valorile mici ale seriei?
62. Care este relaţia între indicatorii tendinţei centrale când
predomină valorile mici ale seriei?
Seriile de distribuţie a frecvenţelor

63. Care este relaţia între indicatorii tendinţei centrale când seria
este perfect simetrică?
64. Când o serie este perfect simetrică?
65. Când o serie este simetrică?
66. Ce relaţie există între indicatorii tendinţei centrale când seria
este uşor asimetrică?
67. Cum se calculează şi cum se interpretează coeficienţii de
asimetrie propuşi de Pearson?
68. Cum se calculează şi ce semnificaţie are media caracteristicii
alternative?
69. Cum se calculează şi ce semnificaţie are dispersia caracteristicii
alternative?
70. Care este cel mai potrivit indicator pentru caracterizarea
variaţiei unei caracteristici statistice?
71. Când se utilizează amplitudinea absolută a variaţiei?
72. Când se recomandă utilizarea abaterii medii liniare?
73. Ce relaţie este între abaterea medie liniară şi abaterea medie
pătratică în cazul unei distribuţii normale?
74. Care este corecţia lui Sheppard şi ce condiţii trebuie îndeplinite
pentru a putea fi utilizată?
75. Când se recomandă utilizarea abaterii medii pătratice?
76. Care este regula de adunare a dispersiilor?
77. Ce semnificaţie are dispersia dintre grupe?
78. Ce semnificaţie are media dispersiilor de grupă?
79. Ce semnificaţie are dispersia pe total?
80. Cum trebuie să fie variaţia la nivelul fiecărei grupe faţă de
variaţia pe total în seriile de distribuţie bidimensionale?
81. Ce indicatori se pot calcula pe baza regulii de adunare a
dispersiilor?
82. Ce semnificaţie are gradul de determinaţie?
83. Ce semnificaţie are gradul de nedeterminaţie?
STATISTICA

4.7.2 Teste-grilă

1. Media aritmetică reprezintă:


a) indicator al tendinţei centrale;
b) indicator de corelaţie;
c) o măsură a asimetriei;
d) un indicator economic;
e) o măsură a omogenităţii.

2. Indicatorul care redă ceea ce este esenţial şi tipic într-o


colectivitate este:
a) modul;
b) coeficientul de variaţie;
c) dispersia;
d) mediana;
e) media.

3. Valorile aberante (anormal de mari sau mici) nu influenţează:


a) media;
b) mediana;
c) dispersia;
d) coeficientul de variaţie.

4. În cazul în care termenii seriei statistice au valori pozitive şi


negative se utilizează media:
a) aritmetică;
b) armonică;
c) pătratică;
d) geometrică.

5. În cazul în care predomină valorile mici ale caracteristicii se


utilizează media:
a) aritmetică;
b) armonică;
c) pătratică;
d) geometrică.
Seriile de distribuţie a frecvenţelor

6. În cazul în care nu este posibilă însumarea termenilor seriei


statistice se utilizează media:
a) aritmetică;
b) armonică;
c) pătratică;
d) geometrică.

7. În cazul în care termenii seriei statistice au valori negative sau


nule nu se utilizează media:
a) aritmetică;
b) armonică;
c) pătratică;
d) geometrică.

8. Între media armonică ( xh ) şi media pătratică ( x p ), calculate


pentru aceeaşi serie statistică, există relaţia:
a) xh > x p ;
b) xh = x p ;
c) xh < x p ;
d) nu se pot compara.

9. Între media aritmetică ( x ) şi media geometrică (c), calculate


pentru aceeaşi serie statistică, există relaţia:
a) x > x p ;
b) x = x p ;
c) x < x p ;
d) nu se pot compara.
STATISTICA

10. Valoarea caracteristicii statistice care se întâlneşte cel mai


frecvent în cadrul seriei statistice nu este:
a) modulul;
b) moda;
c) mediana;
d) dominanta seriei;
e) modul.

11. La o firmă, salariul mediu al personalului de administraţie este


de 4,5 mil. lei, iar cel al muncitorilor de 2,5 mil.lei. Care este
ponderea personalului de administraţie, dacă salariul mediu
lunar al firmei este de 3 mil. lei?
a) 50%;
b) 30%;
c) 25%;
d) 20%.

12. Studentele dintr-o grupă au înălţimea medie de 165 cm, iar


studenţii 175 cm. Care este înălţimea medie în grupa respectivă
dacă ponderea studentelor este 60%?
a) 170cm;
b) 169cm;
c) 165cm;
d) 175cm.

13. Preţul unui produs a crescut în medie cu 1% lunar în primul


semestru al anului şi cu 2% lunar în semestrul al doilea.
Creşterea medie lunară pe întregul an a fost:
a) 1,5%;
b) 1%;
c) 2%;
d) 3%;
e) nu se poate calcula.
Seriile de distribuţie a frecvenţelor

14. Dinamica producţiei realizate de o firmă în primele şase luni


ale anului a fost: 110%, 112%, 108%, 106%,111%,120%. Tipul
de medie cel mai indicat a se calcula în acest caz este:
a) aritmetică;
b) armonică;
c) pătratică;
d) geometrică.

15. Într-un magazin de încălţăminte au fost vândute într-o zi 10


perechi de pantofi având următoarele mărimi:
38,39,35,36,37,38,38,39,37,38. Denumiţi mărimea medie cea
mai indicată a se calcula în acest caz.
a) media aritmetică;
b) media armonică;
c) modul;
d) media geometrică;
e) mediana.

16. Notele obţinute de un student într-o sesiune de examene au


fost: 7,8,8,9,9,10. Denumiţi tipul de medie pe care va prefera
studentul să o calculeze în acest caz.
a) aritmetică;
b) armonică;
c) pătratică;
d) geometrică.

17. Temperaturile înregistrate la ora prânzului la o staţie meteo în


prima săptămână din luna decembrie au fost(grade celsius): -2,-
1,+1,+3,+1,-4,-2. Denumiţi tipul de medie cel mai indicat a se
calcula în acest caz.
a) aritmetică;
b) armonică;
c) pătratică;
d) geometrică.
STATISTICA

18. Ştiind că media aritmetică simplă a zece termeni este 300, dacă
se adaugă la fiecare termen 30 de unităţi şi totodată se împarte
la 11 care va fi noua medie obţinută?
a) 30;
b) 330;
c) 270;
d) 300.

19. Cele 10 hoteluri dintr-un oraş au fost evaluate astfel: 2 hoteluri-


3stele, 5 hoteluri-2stele, 3 hoteluri-1stea. Care este valoarea
medie pe total?
a) 2 stele;
b) 3 stele;
c) 1,9 stele;
d) nu se poate calcula.

20. Încasările lunare obţinute de magazinele dintr-o reţea de


distribuţie au fost (mil. lei): 450, 390, 420, 1684, 398, 375, 405.
Precizaţi care este valoarea medie cea mai indicată a se calcula.
a) medie aritmetică;
b) medie armonică;
c) mediană;
d) nici una.

21. La două anchete în rândul studenţilor, 15% dintre cei 100 de


participanţi la un curs, respectiv 20% dintre cei 150 de
participanţi la un alt curs s-au pronunţat pentru desfiinţarea
cursului de statistică. Ce procent mediu de studenţi este
favorabil desfiinţării cursului de statistică?
a) 17,5%;
b) 18%;
c) 18,5%;
d) 17%.
Seriile de distribuţie a frecvenţelor

22. O maşină parcurge 4 porţiuni egale ale unui traseu cu vitezele


de 40 km/oră, 50 km/oră, 80 km/oră şi 100 km/oră. Care a fost
viteza medie pe întregul drum?
a) 59,26 km/oră;
b) 67,5 km/oră;
c) 65,7 km/oră;
d) 60 km/oră.

23. La un concurs de gimnastică cele 7 participante din România au


ocupat următoarele locuri: 11,4,5,9,8,2,12. Ce loc au ocupat
gimnastele în medie?
a) 9;
b) 8;
c) 7;
d)7,3.

24. În două zone ale unei regiuni s-au stabilit următoarele ponderi
ale şomerilor şi numărul total de şomeri, astfel:
- zona A: 15%, respectiv 100 mii persoane
- zona B: 20%, respectiv 150 mii persoane.
Stabiliţi ponderea medie a şomerilor pe total regiune.
a) 18;
b) 17;
c) 17,65;
d) 18,5.

25. Distribuţia studenţilor dintr-o grupă după nota la examenul de


statistică este:
Nota 4 5 6 7 8 9 10 Total
Nr. studenţi 2 4 6 8 5 4 1 30
Valoarea mediană este:
a) 5;
b) 6;
c) 7;
d) 8;
e) 9.
STATISTICA

26. Trei pătrimi din valorile individuale ale unei serii statistice sunt
mai mari decât:
a) cuartila inferioară;
b) cuartila a treia;
c) mediana;
d) cuartila superioară.

27. 25% din valorile individuale ale unei serii statistice sunt mai
mari decât:
a) cuartila inferioară;
b) modul;
c) mediana;
d) cuartila superioară.

28. Jumătate din valorile individuale ale unei caracteristici, situate


în centrul seriei statistice, sunt:
a) mai mari decât cuartila inferioară;
b) mai mici decât cuartila a treia;
c) egale cu mediana;
d) cuprinse între cuartila inferioară şi cuartila superioară;
e) mai mari decât mediana.

29. Indicatorii tendinţei centrale sunt:


a) media mediana,modul;
b) mediana, modul;
c) cuartilele;
d) cuantilele.

30. Nu sunt indicatori medii de poziţie:


a) mediana;
b) modul;
c) cuartilele;
d) decilele;
e) media aritmetică.
Seriile de distribuţie a frecvenţelor

31. Pentru calculul grafic al medianei se folosesc:


a) diagramele frecvenţelor cumulate crescător sau descrescător;
b) histograma;
c) diagramele prin coloane;
d) diagramele de volum.
32. Pentru calculul grafic al modului se folosesc:
a) diagramele frecvenţelor cumulate crescător sau descrescător;
b) histograma;
c) diagramele prin benzi;
d) diagramele de volum.
33. Caracterizarea gradului de împrăştiere a unităţilor purtătoare ale
caracteristicii se realizează cu:
a) indicatorii simpli şi sintetici ai variaţiei;
b) regula de adunare a dispersiilor;
c) indicii teritoriali;
d) indicii de dinamică;
e) indicatorii medii de poziţie.

34. Pentru a măsura gradul de omogenitate a unei serii statistice


utilizăm:
a) abaterea medie pătratică;
b) media;
c) coeficientul de variaţie;
d) coeficientul de corelaţie;
e) mediana.

35. În cazul unei distribuţii condiţionate a variabilei Y în funcţie de


un factor de grupare X este adevărată în orice situaţie relaţia:
a) dispersia generală este egală cu suma dintre media
dispersiilor de grupă şi dispersia dintre grupe;
b) dispersia dintre grupe este mai mare decât media dispersiilor
de grupă;
c) dispersia dintre grupe este mai mică decât media dispersiilor
de grupă;
d) dispersia dintre grupe este mai mare decât dispersia totală;
e) dispersia dintre grupe este egală cu media dispersiilor de
grupă.
STATISTICA

36. În cazul unei distribuţii condiţionate a variabilei Y în funcţie de


un factor de grupare X variaţia caracteristicii Y sub influenţa
factorilor întâmplători se măsoară prin:
a) dispersiile de grupă;
b) dispersia dintre grupe;
c) diferenţa dintre dispersia totală şi dispersia dintre grupe;
d) dispersia totală;
e) nu se poate calcula.

37. În cazul unei distribuţii condiţionate a variabilei Y în funcţie de


un factor de grupare X variaţia caracteristicii Y sub influenţa
factorilor esenţiali se măsoară prin:
a) dispersiile de grupă;
b) dispersia dintre grupe;
c) diferenţa dintre dispersia totală şi dispersia dintre grupe;
d) dispersia totală;
e) media dispersiilor de grupă.

38. Seriile statistice în care predomină valorile mari ale


caracteristicii verifică relaţiile:
a) media este inferioară modulului;
b) mediana este superioară mediei;
c) moda este mai mică decât media;
d) media este mai mică decât cuartila a doua;
e) mediana şi modul sunt egale.
Alegeţi combinaţia corectă: A(a,b,e); B(a,b,d); C(b,d,e); D(a,b,c).

39. Distribuţiile unidimensionale perfect simetrice verifică relaţiile:


a) media este inferioară modulului;
b) mediana este superioară mediei;
c) oda este mai mică decât media;
d) media este egală cu cuartila a doua;
e) mediana şi modul sunt egale.
Alegeţi combinaţia corectă: A(a,b,e); B(e,d); C(b,d,e); D(a,b,c).
Seriile de distribuţie a frecvenţelor

40. Într-o grupă de studenţi vârsta medie este de 23 ani, dar cei mai
mulţi studenţi au 21 de ani. Distribuţia este:
a) simetrică;
b) pozitiv asimetrică;
c) negativ asimetrică.

41. Valoarea coeficientului de variaţie este invers proporţională cu


mărimea:
a) mediei;
b) dispersiei;
c) abaterii medii pătratice;
d) abaterii medii liniare.

42. Într-o secţie a unei unităţi economice productivitatea medie este


de 40 bucăţi pe muncitor, cu o abatere medie liniară de 4
bucăţi, iar într-o altă secţie productivitatea medie este 50 cu
abatere medie liniară de 5.Care colectivitate este mai omogenă?
a) secţia I;
b) secţia II;
c) nici una nu este omogenă;
d) au acelaşi nivel de omogenitate.

43. Valoarea raportului de nedeterminaţie este direct proporţională


cu:
a) variaţia caracteristicii Y sub influenţa factorilor întâmplători;
b) dispersia dintre grupe;
c) diferenţa dintre dispersia totală şi dispersia dintre grupe;
d) dispersia totală;
e) media dispersiilor de grupă.
Alegeţi combinaţia corectă: A(a,c,e); B(a,b,c); C(d,e).

44. Dacă valoarea raportului de determinaţie este 60% şi media


dispersiilor de grupă 100, care este mărimea dispersiei dintre
grupe?
a) 250;
b) 150;
c) 200.
STATISTICA

45. Mărimea negativă a coeficientului de asimetrie indică:


a) o legătură inversă;
b) o legătură directă;
c) preponderenţa valorilor mari ale caracteristicii;
d) preponderenţa valorilor mici ale caracteristicii;
e) o asimetrie foarte mare.

Soluţii:
1.a; 2.e; 3.b; 4.c; 5.b; 6.d; 7.d; 8.c; 9.a; 10.c; 11.c; 12.b; 13.a; 14.d; 15.c;
16.c; 17.c; 18.a; 19.a; 20.c; 21.b; 22.a; 23.b; 24.c; 25.c; 26.a; 27.d; 28.d;
29.a; 30.e; 31.a; 32.b.33.a; 34.c; 35.a; 36.c; 37.b; 38.B; 39.b; 40.b; 41.a;
42.d; 43.a; 44.b; 45.c.

You might also like