Capitolul 4

SERIILE DE DISTRIBUŢIE
A FRECVENŢELOR
Observaţiile înregistrate în prima fază a cercetării statistice sunt
supuse unui proces de sistematizare, de ordonare.
În urma grupării după caracteristici atributive se obţin serii de
distribuţie (repartiţie) a frecvenţelor pe intervale de valori (vezi tabelul
2.6.2) sau pe variante. Acestea oferă imaginea structurii colectivităţii, a
repartizării unităţilor ei după intervalele de valori sau variantele
caracteristicii de grupare.
Seria de distribuţie de frecvenţe este compusă din două şiruri de
date:
• primul şir cuprinde variantele caracteristicii sau intervalele de
valori;
• al doilea şir arată numărul unităţilor incluse în fiecare grupă
astfel formată (frecvenţa, efectivul).
În funcţie de natura caracteristicii de grupare, o serie de distribuţie
poate fi cantitativă sau calitativă, continuă sau discretă. Totodată, repartiţiile
pot fi teoretice, dacă reflectă o legitate matematică de repartiţie a
frecvenţelor, sau empirice, dacă rezultă în urma prelucrării datelor reale.
Repartiţiile empirice prezintă următoarele proprietăţi:
• omogenitatea termenilor: variantele individuale sunt de aceeaşi
natură şi cu valori apropriate, fiind determinate în cea mai mare
măsură de acţiunea aceloraşi factori esenţiali;
• variabilitatea valorilor individuale este dată de acţiunea mai
puternică a unor factori întâmplători, care determină abaterea
mărimilor individuale de la tendinţa centrală impusă de factorii
esenţiali;
• independenţa termenilor este efectul existenţei distincte a
unităţilor statistice în cadrul colectivităţii totale; fiecare unitate
este rezultatul unei manifestări individualizate, diferite a
fenomenului de masă;
• forma repartiţiei derivă din modalitatea specifică de combinare
a influenţelor factorilor esenţiali şi neesenţiali; există serii cu o
repartiţie relativ uniformă a frecvenţelor şi altele cu unul sau
STATISTICA

mai multe puncte de concentrare. Aceste concentrări ale
frecvenţelor apar fie în jurul tendinţei centrale, fie la unul sau
ambele capete ale seriei.
O analiză completă a seriilor de distribuţie a frecvenţelor se
bazează pe următorii indicatori:
• indicatori de nivel (nivel individual şi nivel totalizat sau valoare
centralizată) şi de frecvenţe (frecvenţe absolute, frecvenţe
relative şi frecvenţe cumulate);
• indicatori medii: media aritmetică, armonică, pătratică,
geometrică;
• indicatori medii de poziţie: mediană, cuartile, decile, modul;
• indicatori simpli şi sintetici ai variaţiei: amplitudinea variaţiei,
abateri individuale, abatere medie liniară, abaterea medie
pătratică (abaterea standard, abaterea tip), dispersia (varianţa),
coeficientul de variaţie;
• indicatori ai asimetriei;
• indicatori ai concentrării.
Acest sistem complex de indicatori este completat cu reprezentări
grafice (histogramă, poligonul frecvenţelor, poligonul frecvenţelor cumu-
late) care pun în evidenţă forma repartiţiei şi orientează analiza.
Scopul analizei şi particularităţile seriei de repartiţie studiate
determină indicatorii cei mai potriviţi pentru fiecare caz în parte.
4.1 INDICATORI DE NIVEL ŞI DE FRECVENŢE
În cazul datelor negrupate, indicatorii de nivel sunt chiar valorile
individuale ale unei caracteristici (x
i
unde i ia valori de la 1 la n). În cazul
seriilor de distribuţie unidimensionale, ca indicatori de nivel (x
i
unde i ia
valori de la 1 la k, în cazul unei distribuţii de frecvenţe cu k grupe) se
utilizează variantele în cazul grupării pe variante şi centrele de intervale
(calculate ca medie aritmetică simplă a limitelor fiecărui interval) în cazul
grupării pe intervale.
Nivelul totalizat al caracteristicii se calculează în mod diferit în
funcţie de tipul seriei.
Seriile de distribuţie a frecvenţelor


Pentru o serie de date negrupate, nivelul totalizat se obţine prin
însumarea tuturor valorilor individuale:

=
n
i
i
x
1
.
Pentru date grupate se poate calcula nivelul totalizat al fiecărei
grupe şi pe total în funcţie de datele disponibile.
Dacă se cunosc valorile individuale din care s-a efectuat gruparea:
- nivelul totalizat al grupei:

=
i
n
j
ij
x
1

- nivelul centralizat pe total:
∑ ∑
= =
k
i
n
j
ij
i
x
1 1
unde k este numărul de grupe.
În cazul în care nu se cunosc valorile individuale din cadrul
fiecărei grupe:
- nivelul totalizat al grupei:
i i
n x unde n
i
este volumul grupei iar x
i
indicatorul de nivel al
grupei;
- nivelul centralizat pe total:

=
k
i
i i
n x
1
unde k este numărul de grupe.

Indicatorii de nivel totalizat se pot reprezenta grafic prin diagrame
de volum al caracteristicii (pătrat, cerc, dreptunghi) a căror suprafaţă este
proporţională cu valoarea de reprezentat grafic sau prin diagrama prin
coloane nelipite.
Pentru seriile de distribuţie (repartiţie) se pot calcula următorii
indicatori de frecvenţe:
• frecvenţe absolute;
• frecvenţe relative;
• frecvenţe cumulate.
Frecvenţele absolute (n
i
) rezultă din operaţia de grupare a
unităţilor colectivităţii. Numărul unităţilor statistice care aparţin unei
grupe (clase) reprezintă frecvenţa grupei respective.
unde n
i
este volumul grupei iar x
ij
valorile
individuale din cadrul grupei respective;
STATISTICA

Întrucât frecvenţele absolute se exprimă în unităţi concrete de
măsură (număr de muncitori, de firme, de persoane, de magazine etc.) nu
se pot compara între ele serii statistice.
Reprezentarea grafică a frecvenţelor absolute se face cu ajutorul
histogramei şi a poligonului frecvenţelor.
Vom exemplifica în continuare modul de construire a histogramei
şi a poligonului frecvenţelor pentru intervale de grupare egale, pe baza
datelor din tabelul următor:

Gruparea muncitorilor unei firme după nivelul dotării tehnice
Tabelul 4.1.1
Frecvenţe absolute cumulate Grupe de muncitori
după dotarea tehnică
(mil. lei capital fix pe
muncitor)
Număr de
muncitori
(n
i
)
crescător
(F
i
a
)
descrescător
(F
i
d
)
0 1 2 3
1,5 - 2,0 14 14 150
2,0 - 2,5 18 32 136
2,5 - 3,0 30 62 118
3,0 - 3,5 48 110 88
3,5 - 4,0 25 135 40
4,0 - 4,5 15 150 15
Total 150 - -
Date convenţionale
Histograma pentru intervale egale se obţine construind un număr
de coloane egal cu numărul grupelor, având baze egale pe Ox (variaţia
este continuă) şi înălţimea dată de frecvenţele grupelor pe care le
reprezintă (figura 4.1.1).
14
18
30
48
25
15
0
10
20
30
40
50
60
dotare tehnica (mil.lei/m)
N
r
.

m
u
n
c
i
t
o
r
i

Fig.4.1.1 Distribuţia muncitorilor după dotarea tehnică (histogramă)
1,5 2 2,5 3 3,5 4 4,5
Seriile de distribuţie a frecvenţelor



Acest tip de grafic pune în evidenţă forma de variaţie a
caracteristicii şi gradul de asimetrie a seriei.
Poligonul frecvenţelor corespunzător grupării pe intervale egale
este prezentat în figura nr. 4.1.2.
Frecvenţele relative arată importanţa relativă a fiecărei grupe,
punând în evidenţă structura colectivităţii. Folosirea acestui indicator
permite să se compare seriile empirice între ele sau cu distribuţiile
teoretice.


0
14
18
30
48
25
15
0 0
10
20
30
40
50
60
dotare tehnica (mil.lei/m)
N
r
.

m
u
n
c
i
t
o
r
i

Figura 4.1.2 - Poligonul frecvenţelor


Se calculează cu relaţia:

=
=
k
i
i
i *
i
n
n
n
1
sau 100
1
⋅ =

=
k
i
i
i *
(%) i
n
n
n
unde: n
i
- frecvenţa absolută a grupei i;
*
i
n - frecvenţa relativă a grupei i, exprimată sub formă de
coeficient;
*
(%() i
n - frecvenţa relativă a grupei i, exprimată procentual;

1,5 2 2,5 3 3,5 4 4,5
STATISTICA


=
k
i
i
n
1
- totalul frecvenţelor celor k grupe ale colectivităţii.
Rezultatele calculului frecvenţelor relative pentru seria statistică
din tabelul 4.1.1 sunt prezentate în tabelul 4.1.2.

Tabelul 4.1.2
Grupe de muncitori
după dotarea tehnică
Frecvenţe
relative (%)
Frecvenţe relative cumulate (%)
(mil. lei capital fix
pe muncitor)
(n
i
*
) crescător

descrescător

0 1 2 3
1,5 - 2,0 9,33 9,33 100,00
2,0 - 2,5 12,00 21,33 90,67
2,5 - 3,0 20,00 41,33 78,67
3,0 - 3,5 32,00 73,33 58,67
3,5 - 4,0 16,67 90,00 26,67
4,0 - 4,5 10,00 100,00 10,00
Total 100,00 - -

Reprezentarea grafică se poate mai face prin intermediul
diagramelor de structură: pătratul, cercul, semicercul, dreptunghiul.
Frecvenţele cumulate pot fi calculate în două modalităţi, în
funcţie de sensul în care se face însumarea frecvenţelor:
a) ascendent sau crescător (tabelul 4.1.1, coloana treia) - frecvenţa
cumulată a unei grupe i (F
i
a
) este suma frecvenţelor primelor i intervale
ale seriei:

=
=
i
j
j
a
i
n F
1
, j = 1, 2, ..., i.
Arată numărul total al unităţilor care au valoarea caracteristicii
mai mică sau egală cu limita superioară a intervalului i.
b) descendent sau descrescător (tabelul 4.1.1., coloana a patra)-
frecvenţa cumulată a unei grupe i este suma frecvenţelor intervalelor de la
i la k:

=
=
k
i j
j
d
i
n F
Indică numărul total al unităţilor statistice pentru care valoarea
caracteristicii este mai mare sau egală cu limita inferioară a intervalului i.
Seriile de distribuţie a frecvenţelor


Frecvenţele cumulate se pot calcula şi pe baza frecvenţelor
relative, conform formulelor precedente, în care se înlocuieşte n
j
cu n
j
*
(vezi tabelul 4.1.2, coloanele trei şi patru).
Reprezentarea grafică: poligonul frecvenţelor absolute cumulate
crescător (ascendent) şi descrescător (descendent) sunt date în figura 4.1.3
iar poligonul frecvenţelor relative cumulate în figura 4.1.4.

Figura 4.1.3 - Poligonul frecvenţelor absolute cumulate

0
15
30
45
60
75
90
105
1.5 2 2.5 3 3.5 4 4.5
dotare tehnică (mil. lei/m.)
frecvenţe
relative
cumulate
(%)
Crescator
Descrescator

Figura 4.1.4 - Poligonul frecvenţelor relative cumulate
4.2 INDICATORI MEDII
Statistica încearcă să redea ceea ce este tipic, comun şi general în
evoluţia fenomenelor şi proceselor economice. Variabilitatea deosebită a
acestora în formele lor individuale de manifestare impune găsirea unor
indicatori sintetici care să reunească valorile individuale, exprimând
printr-o măsură unică esenţa fenomenului.
Indicatorii medii răspund acestui deziderat, sintetizând ceea ce
este comun, tipic în manifestarea fenomenului considerat. Ei măsoară
influenţa cauzelor esenţiale, înlăturând variaţiile întâmplătoare în evoluţia
fenomenelor şi proceselor.
STATISTICA

Pentru ca indicatorii medii să aibă conţinut real şi să fie
reprezentativi pentru colectivitatea analizată este necesar să fie îndeplinite
câteva condiţii:
• omogenitatea colectivităţii;
• volum suficient de mare de date individuale;
• forma adecvată a indicatorului.
Media este un indicator al tendinţei centrale care arată nivelul la
care ar fi ajuns caracteristica dacă în toate cazurile individuale factorii
esenţiali şi neesenţiali ar fi acţionat constant. Este valoarea tipică pentru
reprezentarea unei colectivităţi, dar este posibil să nu coincidă cu nici una
din valorile individuale înregistrate de caracteristică în colectivitatea
respectivă.
Mediile se calculează utilizând toate valorile individuale şi se
exprimă în unitatea de măsură a caracteristicii considerate.
Se consideră că un indicator mediu este adecvat dacă răspunde
condiţiilor formulate de statisticianul G.U. Yule, sintetizate astfel:
• definire obiectivă;
• utilizarea tuturor valorilor individuale înregistrate;
• semnificaţie clară;
• simplitatea şi rapiditatea calculului;
• stabilitatea (în cazul utilizării mai multor eşantioane de acelaşi
volum extrase din aceeaşi colectivitate);
• posibilitatea utilizării la calcule algebrice.
Necesităţile diverse ale analizei statistice şi natura diferită a
caracteristicilor înregistrate au impus utilizarea practică a unor forme
variate de medii, dintre care mai frecvent întâlnite sunt:
• media aritmetică;
• media armonică;
• media pătratică;
• media geometrică.
Indicatorii medii se pot prezenta sub formă simplă, atunci când
datele sunt negrupate sau când frecvenţele tuturor grupelor sunt egale (se
simplifică) sau sub formă ponderată, atunci când frecvenţele diferă între
ele.
Seriile de distribuţie a frecvenţelor


4.2.1 Media aritmetică
Media aritmetică este rezultatul sintetizării într-o singură expresie
numerică a tuturor nivelurilor individuale observate, fiind obţinută prin
raportarea valorii totalizate a caracteristicii la numărul total al unităţilor.
Acest tip de medie este indicat îndeosebi atunci când fenomenul
supus cercetării înregistrează modificări aproximativ constante în
progresie aritmetică.
Fiind dată o caracteristică oarecare cu valorile x
1
, x
2
,...,x
n
, media
aritmetică este acea valoare tipică ce poate substitui fiecare valoare
individuală x
i,
i = 1,...,n, astfel încât:
x n x
n
i
i
⋅ =

=1
.
Rezultă de aici formula de calcul a mediei aritmetice simple:
n
x
x
n
i
i

=
=
1
.
În cazul în care fiecare valoare individuală x
i
are nu una, ci mai
multe apariţii în cadrul colectivităţii analizate, se aplică formula de calcul
a mediei aritmetice ponderate:


=
=

=
k
i
i
k
i
i i
n
n x
x
1
1
,
unde:
n
i
- frecvenţa (numărul de apariţii) al variantei x
i
;
k - numărul de valori distincte.

În cazul în care unităţile nu sunt grupate pe variante, ci pe
intervale de variaţie, x
i
reprezintă centrul de interval. Centrul fiecărui
interval se determină ca medie aritmetică simplă între limita superioară şi
limita inferioară a intervalului respectiv.
STATISTICA

Se observă că indiferent de situaţie, nivelul totalizat al
caracteristicii se poate determina ca produs între nivelul mediu şi numărul
unităţilor:
n x x
n
i
i
⋅ =

=1
în cazul datelor negrupate;

n x n x
k
i
i i
⋅ =

=1
în cazul datelor grupate.
Astfel exprimat, nivelul totalizat se reprezintă grafic prin
dreptunghi.
Atunci când în locul frecvenţelor absolute folosim frecvenţe
relative
)
n
n
n (
k
i
i
i *
(%) i
100
1
⋅ =

=
, formula anterioară devine:
100
1

=

=
k
i
*
(%) i i
n x
x
Un exemplu de calcul al mediei aritmetice ponderate utilizând atât
frecvenţele absolute, cât şi frecvenţele relative, este prezentat în tabelul
4.2.1. Vârsta medie este 20 96 19 24 479 ≈ = = , / x ani. Valoarea obţinută
este foarte reprezentativă datorită omogenităţii colectivităţii.

Calculul vârstei medii într-o grupă de studenţi
Tabelul 4.2.1
Vârsta
(x
i
)
Nr. studenţi
(n
i
)
i i
n x ⋅
*
(%) i
n
*
i i
n x
0 1 2 3 4
19
20
21
22
5
16
2
1
95
320
42
22
20,83
66,67
8,33
4,17
395,77
1333,40
174,93
91,74
Total 24 479 100,00 1995,84
4.2.2 Proprietăţile mediei aritmetice
Media aritmetică prezintă mai multe proprietăţi.
Seriile de distribuţie a frecvenţelor


1. Într-un şir de valori egale, media aritmetică este egală cu
acestea.
c x , c x x x
n i
= = = = = = Κ Κ
1

Demonstraţie:
c
n
c n
n
c
n
x
x
n
i
n
i
i
=

= = =
∑ ∑
= = 1 1

2. Media aritmetică este cuprinsă în intervalul de variaţie al
caracteristicii pentru care se calculează. Aşadar:
x
min
< x < x
max
,
unde: x
min
- valoarea minimă a caracteristicii înregistrate;
x
max
- valoarea maximă.
Demonstraţie:




=
i
i i
n
n x
x
Dar



i
i i
n
n x
>



i
i min
n
n x
unde
min
i
i min
i
i min
x
n
n x
n
n x
=

=






Rezultă că
min
x x > .
În mod analog se demonstrează că
max
x x < .
3. Media oscilează în jurul grupei cu frecvenţa cea mai mare, în
cazul distribuţiei de frecvenţe.
4. Suma algebrică a tuturor abaterilor individuale ale termenilor
seriei de la media lor aritmetică este nulă:

=
= ⋅ −
m
i
i i
n ) x x (
1
0 .

Demonstraţie:
STATISTICA

( )
∑ ∑ ∑ ∑


∑ ∑ ∑ ∑ ∑
= ⋅ − ⋅ = ⋅

− ⋅ =
= ⋅ − ⋅ = ⋅ − ⋅ = ⋅ −
0
i i i i i
i
i i
i i
i i i i i i i i
n x n x n
n
n x
n x
n x n x n x n x n x x

5. Dacă se măresc (micşorează) toate valorile individuale din care
se calculează media cu o constantă a, noua lor medie aritmetică se
măreşte (micşorează) cu aceeaşi valoare a.
Demonstraţie:
( )
a x
n
n
a x
n
n a
n
n x
n
n a x
i
i
i
i
i
i i
i
i i
± = ⋅ ± =

±

=
⋅ ±








.
6. Dacă se împart (înmulţesc) toate valorile individuale cu o
constantă h, media aritmetică se divide (multiplică) cu aceeaşi constantă h.
Demonstraţie:

h
x
n
n x
h n
n
h
x
i
i i
i
i
i
=

⋅ =
⋅ |
.
|

\
|




1

( )
x h
n
n x h
n
n x h
i
i i
i
i i
⋅ =
⋅ ⋅
=
⋅ ⋅





7. Dacă se divid toate frecvenţele cu o constantă g, media
aritmetică nu se modifică.
Demonstraţie:
x
n
g
n x
g
g
n
g
n
x
i
i i
i
i
i
=

⋅ ⋅
=
|
|
.
|

\
|
|
|
.
|

\
|





1
1

Dacă înlocuim constanta g cu suma frecvenţelor seriei
|
|
.
|

\
|

=
k
i
i
n
1

obţinem formula de calcul a mediei aritmetice pe baza frecvenţelor
relative:
Seriile de distribuţie a frecvenţelor









⋅ =

=
|
|
.
|

\
|
|
|
.
|

\
|

*
i i
*
i
*
i i
i
i
i
i
i
n x
n
n x
n
n
n
n
x


8. Media aritmetică determinată pentru suma a două variabile
independente este egală cu suma mediilor celor două variabile:
y x y x + = + ,
unde:
x - media variabilei X;
y - media variabilei Z;
y x + - media sumei celor două variabile.
9. Media produsului între două variabile independente este egală
cu produsul mediilor celor două variabile:
y x y x ⋅ = ⋅
Aceste proprietăţi sunt utilizate la calculul simplificat al mediei (5,
6, 7) şi pentru verificarea corectitudinii calculului (1, 2, 3).

4.2.3 Calculul simplificat al mediei aritmetice
Întrucât în viaţa economică reală datele individuale din care se
calculează media reprezintă deseori valori mari, cu zecimale, este utilă
aducerea şirului iniţial de valori într-o formă mai simplă, care să faciliteze
calculele.
Pentru aceasta, în calculul mediei aritmetice pentru serii de
distribuţie de frecvenţe pe intervale egale de grupare se poate utiliza
următoarea formulă de calcul simplificat:
STATISTICA

a k
n
n
h
a x
x
k
i
i
k
i
i
i
+ ⋅
⋅ |
.
|

\
|

=


=
=
1
1
,
unde: x
i
- centrele intervalelor de grupare (se calculează ca medie
aritmetică simplă a capetelor fiecărui interval);
n
i
- frecvenţa fiecărui interval i;
a - constantă egală cu valoarea centrului de interval care are
frecvenţa maximă;
h - mărimea intervalului de grupare;
k - numărul intervalelor de grupare.
Un exemplu de aplicare a acestei formule se regăseşte în tabelul
4.2.2.
Calcularea mediei vânzărilor lunare
în unităţile comerciale dintr-o localitate
Tabelul 4.2.2
Vânzări
(mil. lei)
Nr. unităţi
(n
i
)
Centrul de
interval (x
i
)
h
a x
i


i
i
n
h
a x



0 1 2 3 4
10 -14 10 12 -2 -20
14 - 18 30 16 -1 -30
18 - 22 40 20 0 0
22 - 26 20 24 1 20
Total 100 - - -30
Date convenţionale

Media vânzărilor este:
8 18 20 4
100
30
, x = + ⋅

= mil lei/unitate comercială.
Aplicarea formulei obişnuite de calcul (media aritmetică
ponderată) conduce la acelaşi rezultat.
Seriile de distribuţie a frecvenţelor


4.2.4 Media armonică
Media armonică a unui şir de valori x
i
, i = 1,...,n, se calculează din
valorile inverse
|
|
.
|

\
|
i
x
1
ale termenilor. Substituind valorile individuale cu
media lor armonică (
h
x ), ca valoare tipică a şirului, şi însumând termenii,
obţinem:

=
⋅ =
n
i h i
x
n
x
1
1 1
.
De aici rezultă formula de calcul a mediei armonice simple:

=
=
n
i i
h
x
n
x
1
1
.
În cazul seriilor de distribuţie de frecvenţe se utilizează media
armonică ponderată:


=
=

=
k
i
i
i
k
i
i
h
n
x
n
x
1
1
1
.
Dacă folosim frecvenţe relative, media armonică devine:

=

=
k
i
*
i
i
h
n
x
x
1
1
1
sau

=

=
k
i
*
(%) i
i
h
n
x
x
1
1
100
.
Fiind calculată din valorile inverse ale termenilor seriei, media
armonică este mai mică decât cea aritmetică, dacă valorile seriei sunt
pozitive.
Atunci când două variabile se află într-un raport de inversă
proporţionalitate, pentru una din variabile se va utiliza media aritmetică,
iar pentru cealaltă media armonică.
STATISTICA

Utilizarea mediei armonice este indicată în toate cazurile în care în
cadrul colectivităţii analizate predomină valorile mici. Fiind mai mică decât
media aritmetică, media armonică reprezintă mai bine aceste valori.
În practică, media armonică este frecvent folosită la calculul
preţului mediu şi al indicelui mediu al preţurilor.
Atunci când nu se cunosc frecvenţele absolute n
i
, ci produsele x
i
n
i
,
media armonică poate fi calculată cu relaţia:


=
=
⋅ ⋅

=
k
i
i i
i
k
i
i i
h
n x
x
n x
x
1
1
1
.
În acest caz, media armonică este egală cu media aritmetică, după
cum se poate demonstra cu uşurinţă:
x
n
n x
n x
x
n x
x
i
i i
i i
i
i i
h
=

=
⋅ ⋅

=




1
.
Pentru a ilustra aplicarea acestei forme a mediei armonice,
considerăm cazul unui agent economic care îşi procură materia primă de
la patru furnizori diferiţi. Din evidenţa curentă cunoaştem preţul mediu şi
valorea achiziţiilor pentru fiecare furnizor (tabelul 4.2.3).

Tabelul 4.2.3
Furnizor Preţ mediu
(mii lei/kg)
Valoarea achiziţiei
(mil. lei)
0 1 2
A 15,75 58,4
B 21,50 46,2
C 24,25 62,5
D 26,00 38,0
Total - 205,1
Date convenţionale

Seriile de distribuţie a frecvenţelor


Vom determina preţul mediu al materiei prime achiziţionate de
agentul economic utilizând formula anterioară de calcul a mediei
armonice:
726 20
38
26
1
5 62
25 24
1
2 46
5 21
1
4 58
75 15
1
1 205
,
,
,
,
,
,
,
,
x
h
=
⋅ + ⋅ + ⋅ + ⋅
= mii lei/kg.

4.2.5 Media pătratică
Se calculează din termenii seriei ridicaţi la pătrat. Dacă se
înlocuieşte fiecare valoare individuală ridicată la pătrat (
2
i
x
)

cu media
pătratică
2
p
x , într-un şir de n termeni şi se însumează termenii, rezultă:

=
⋅ =
n
i
p i
x n x
1
2 2
,
de unde obţinem formula de calcul a mediei pătratice simple:
n
x
x
n
i
i
p

=
=
1
2
.
Media pătratică ponderată este:


=
=

=
k
i
i
k
i
i i
p
n
n x
x
1
1
2
.
Folosind frecvenţe relative (n
i
*
) exprimate prin coeficienţi,
formula mediei pătratice ponderate devine:

=
⋅ =
k
i
*
i i
p
n x x
1
2

STATISTICA

Fiind calculată din valorile individuale ridicate la pătrat, media
pătratică este întotdeauna mai mare decât cea aritmetică; de aceea,
folosirea acestui tip de medie este justificată îndeosebi în situaţiile în care
predomină valorile mari în cadrul colectivităţii pentru care se calculează
media. De asemenea, este indicată atunci când se acordă o atenţie
deosebită valorilor mari, cum este cazul calculului abaterii medii pătratice
(vezi paragraful 4.4.2) şi atunci când valorile caracteristicii sunt atât
pozitive, cât şi negative.
De exemplu, mărimea profitului anual obţinut de agenţii
economici dintr-un anumit domeniu de activitate se încadrează între 48 şi
576 milioane lei, cu o medie de 284 milioane lei. Dacă dorim să aflăm
care este abaterea medie a agenţilor economici de la acest profit mediu nu
vom calcula media aritmetică (ar fi nulă, conform proprietăţilor mediei),
ci media geometrică, neinfluenţată de semnul diferit al abaterilor.

4.2.6 Media geometrică
Dacă se înmulţesc toţi termenii unei serii statistice x
i
, i = 1,.., n şi se
înlocuieşte fiecare valoare individuală cu media lor geometrică
g
x , se
obţine:
g g g n
x ... x x x .... x x ⋅ ⋅ ⋅ = ⋅ ⋅ ⋅
2 1
,
de unde:

=
=
n
i
n
g i
x x
1
.
Rezultă formula de calcul a mediei geometrice simple:
n
n
i
i g
x x

=
=
1
.
Pentru seriile de distribuţie de frecvenţe se aplică formula de
calcul a mediei geometrice ponderate:

=

=
i
i n
k
i
n
i g
x x
1
.
Seriile de distribuţie a frecvenţelor


Calculul acestui tip de medie se poate realiza cu ajutorul
logaritmilor. Calculul nu este posibil dacă există valori negative sau nule.
Logaritmând, formula de calcul a mediei geometrice simple devine:
n
x lg
x lg
n
i
i
g

=
=
1

În cazul mediei geometrice ponderate, prin logaritmare obţinem:


=
=

=
k
i
i
k
i
i i
g
n
x lg n
x lg
1
1
.
Media geometrică este mai mică decât media aritmetică, dar este
superioară celei armonice. Reprezintă mai bine valorile mici ale
caracteristicii.
Folosirea mediei geometrice este obligatorie în situaţiile în care
între termenii seriei nu este posibilă însumarea, ci produsul, cum este
cazul indicilor de dinamică.
De exemplu, cifra de afaceri a unui agent economic creşte cu 8 % în
primul semestru al anului 2000 şi cu 15 % în cel de-al doilea semestru.
Media aritmetică nu este indicată în acest caz (mărimi neînsumabile direct).
Vom calcula media geometrică a celor doi indici de dinamică semestriali,
deoarece între indici este posibilă relaţia de produs:
114 , 1 15 , 1 08 , 1 x x
n
n
1 i
i
g = ⋅ = =

=

Ritmul mediu de creştere pe cele două semestre a fost 11,4 %.
Media geometrică este indicată şi în cazul valorilor care au
tendinţă de creştere în progresie geometrică.
Tipul de medie cel mai utilizat în practică este media aritmetică. În
funcţie de particularităţile seriei statistice analizate, se mai pot calcula
alte medii.
STATISTICA

4.2.7 Media caracteristicii alternative
Caracteristica alternativă înregistrează numai două variante posibile
de manifestare. De exemplu, candidat admis/respins, produs bun/rebut, plan
de producţie realizat/nerealizat, persoană căsătorită/necăsătorită etc.
În practică, orice variabilă poate fi exprimată sub formă alternativă
dacă se împarte colectivitatea în două grupe după un anumit criteriu. În
cazul unei variabile calitative se consideră o modalitate ca fiind forma
directă de manifestare a caracteristicii iar toate celelalte modalităţi ca
opusul formei directe de manifestare a caracteristicii. Pentru variabilele
numerice cel mai frecvent se utilizează criteriul mediei, structurându-se
colectivitatea în unităţi cu valoarea caracteristicii sub/peste medie.
Alteori, în locul mediei se alege o valoare semnificativă a caracteristicii.
De exemplu, pornind de la distribuţia salariaţilor unei firme după numărul
anilor de şcolarizare, se poate trece la distribuţia alternativă de tipul
persoane cu/fără studii superioare.
În vederea satisfacerii necesităţilor de calcul, cele două variante
ale caracteristicii alternative pot fi codificate cu:
• "1" - variantă pozitivă, răspunsul afirmativ;
• "0" - variantă opusă, răspuns negativ.

Pentru calculul mediei aritmetice a caracteristicii alternative
utilizează formula mediei ponderate:


=
=

=
k
i
i
k
i
i i
n
n x
x
1
1
,
unde k = 2.
Conform notaţiilor din tabelul 4.2.4, formula anterioară devine:
( )
N
M
N
M N M
p =
− ⋅ + ⋅
=
0 1
,
unde: M - frecvenţa (numărul) unităţilor care au varianta afirmativă;
N - volumul colectivităţii statistice.
Seriile de distribuţie a frecvenţelor


După cum rezultă din această relaţie, media caracteristicii
alternative este o mărime relativă de structură, care arată ponderea
unităţilor care îndeplinesc o anumită condiţie în total colectivitate.

Tabelul 4.2.4
Variante x
i
n
i

0 1 2
• afirmativ 1 M
• negativ 0 N-M
Total - N

4.3 INDICATORI DE POZIŢIE
Din punctul de vedere al analizei statistice, pe lângă informaţiile
cu caracter sintetic privind valorile individuale, este important şi modul în
care sunt repartizate aceste valori.
Mediile se calculează pe baza tuturor valorilor individuale ale seriei,
ceea ce le face sensibile la valorile extreme, mai puţin semnificative.
Uneori, valorile extreme ale seriei sunt excesiv de îndepărtate de centrul
seriei, ceea ce afectează în mare măsură reprezentativitatea mediei. Alteori,
unităţile seriei au tendinţa de a se concentra la una din extremităţile seriei,
rezultând distribuţii asimetrice la dreapta sau la stânga.

Pentru aceasta se calculează indicatorii medii de poziţie (de
structură):
• mediana;
• cuartilele;
• decilele;
• modul.
STATISTICA

4.3.1 Mediana
Mediana este acea valoare a unei serii statistice ordonate crescător
sau descrescător, care împarte seria în două părţi egale. Aşadar, mediana
este valoarea din centrul seriei: jumătate din termeni sunt mai mici sau
egali cu mediana, jumătate sunt mai mari sau egali. Mediana este o
mărime care depinde în primul rând de numărul termenilor.
Pentru seriile simple, mediana este termenul din mijloc (dacă seria
are număr impar de termeni) sau se determină, în mod convenţional, ca
medie aritmetică simplă a celor două valori din centrul seriei, dacă
numărul termenilor este par.
Pentru seriile de distribuţie de frecvenţe, calculul medianei
parcurge următoarele etape:
a) Se identifică grupa în care este inclusă mediana care este acea
grupă a cărei frecvenţă cumulată este prima mai mare decât
2
1
1

=
+
k
i
i
n
;
b) Se determină valoarea efectivă a medianei ţinând cont de
modalitatea de grupare a datelor.
În cazul în care distribuţia de frecvenţe s-a obţinut prin gruparea
pe intervale, mediana se determină cu ajutorul următoarei formule:
me
me
i
i
k
i
i
me
n
n n
h x Me
∑ ∑

= =

|
|
.
|

\
|
+ ⋅
⋅ + =
1
1 1
0
1
2
1
,
unde: Me - valoarea medianei;
me – indexul intervalului median;
x
0
- limita inferioară a intervalului median;
h
me
- mărimea intervalului median;
n
me
- frecvenţa intervalului median;


=
1
1
me
i
i
n - suma frecvenţelor intervalelor anterioare celui median.
Mediana se exprimă în unitatea de măsură a caracteristicii
respective.

Seriile de distribuţie a frecvenţelor


Gruparea comunelor după numărul locuitorilor în anul 1994
Tabelul 4.3.1
Număr locuitori Număr
comune
(n
i
)
Mărimea
intervalulu
i (h
i
)
1000
i
i
h
k =
Frecvenţe
reduse
i
i
ri
k
n
n =
0 1 2 3 4
sub 999 40 1000 1 40
1000 - 1999 364 1000 1 364
2000 - 4999 1678 3000 3 560
5000 - 9999 575 5000 5 115
10000 şi peste 31 5000 5 6
Total 2688 - - -

Sursa: Anuarul statistic al României, anul 1995, pag.92.

De exemplu, utilizând datele din tabelul 4.3.1., se poate determina
valoarea mediană a numărului de locuitori pe o comună.
Se determină întâi locul medianei:
5 1344
2
1 2688
, locul
me
=
+
= .
Cumulând succesiv frecvenţele din coloana 2 a tabelului 4.3.1.
până la obţinerea unui număr superior lui 1345, constatăm că mediana
(termenul cu numărul 1344,5) trebuie să se afle în intervalul 2000 - 4999.
Pentru calcularea medianei este necesară redefinirea intervalului
median (1999,5-4999,5).
Aplicăm în continuare formula de calcul a medianei:
3681
1678
364 40 5 1344
3000 5 1999 ≅
+ −
⋅ + =
) ( ,
, Me locuitori.
Rezultă că jumătate din comunele ţării au o populaţie sub 3681
locuitori, jumătate au o populaţie mai numeroasă.
În cazul datelor grupate pe variante, valoarea medianei este chiar
varianta a cărei frecvenţă cumulată este prima mai mare decât
( )

+1
2
1
i
n .
STATISTICA

Spre deosebire de medie, mediana nu este influenţată de valorile
extreme ale seriei; de aceea ea poate înlocui cu succes media atunci când
apar valori aberante.
Mediana poate fi determinată şi prin metoda grafică. Proiecţia pe
axa Ox a punctului de intersecţie a curbelor frecvenţelor cumulate
crescător şi descrescător reprezintă mediana.
4.3.2 Cuartile, decile, centile
Mediana face parte din familia cuantilelor. Acestea descriu poziţia
anumitor termeni în cadrul seriei statistice. Din acelaşi grup mai fac parte:
cuartilele, decilele şi centilele.
Cuartilele sunt 3 valori care împart seria statistică în 4 părţi egale
) Q Q (
3 1
÷ .
Decilele sunt mărimile care împart seria statistică în 10 părţi egale
) D D (
9 1
÷ .
Centilele sunt mărimile care împart seria statistică în 100 de părţi
egale ) C C (
99 1
÷ .
Decilele şi, mai ales, centilele se calculează doar pentru seriile
statistice cu număr mare de grupe şi cu amplitudine mare a variaţiei.
Aceşti indicatori sunt utilizaţi îndeosebi pentru seriile pronunţat
asimetrice.
Cuartilele, ca şi mediana, se determină pe baza valorilor ordonate
ale seriei statistice. Prima operaţie constă în localizarea celor trei cuartile.
Locul primei cuartile Q
1
(cuartila inferioară):
( )

+ = 1
4
1
1
i Q
n l .
Locul celei de a doua cuartile Q
2
, care este de fapt mediana:
( ) ( )
∑ ∑
+ = + = 1
2
1
1
4
2
2
i i Q
n n l .
Locul celei de a treia cuartile Q
3
(cuartila superioară):
( )

+ = 1
4
3
3
i Q
n l .
Seriile de distribuţie a frecvenţelor


Calculul efectiv al cuartilelor se face prin interpolare în cadrul
intervalului în care a fost localizată fiecare cuartilă, conform relaţiilor:
1
1
1 1
0 1
1
1
1
4
1
Q
q
i
i
k
i
i
Q
n
n n
d x Q
∑ ∑

= =

|
|
.
|

\
|
+ ⋅
⋅ + = ,
Me Q =
2
,
3
1
1 1
0 3
3
3
1
4
3
Q
q
i
i
k
i
i
Q
n
n n
d x Q
∑ ∑

= =

|
|
.
|

\
|
+ ⋅
⋅ + = ,
unde: x
0
- limita inferioară a intervalului în care se află Q
1
, respectiv Q
3
;
1
Q
d ,
3
Q
d - mărimea intervalului în care se situează cuartila
inferioară, respectiv superioară;
1
Q
n ,
3
Q
n - frecvenţa intervalului în care se află Q
1,
respectiv Q
3
;


=
1
1
1
q
i
i
n ,


=
1
1
3
q
i
i
n - suma frecvenţelor intervalelor care preced intervalul
cuartilei inferioare, respectiv superioare.
Utilizând datele din tabelul 4.3.1, vom calcula în continuare
valoarea cuartilei inferioare şi a celei superioare.
Locul cuartilei inferioare:
25 672
4
1 2688
1
, l
Q
=
+
=
Rezultă că Q
1
este localizată în intervalul (1999,5-4999,5).
Valoarea cuartilei inferioare:
( )
2479
1678
364 40 25 672
3000 5 1999
1

+ −
⋅ + =
,
, Q locuitori.
Acest rezultat ne arată că 25 % din comune au o populaţie sub
2479 locuitori, iar 75 % au o populaţie superioară acestui nivel.
STATISTICA

Locul cuartilei superioare:
( ) 75 2016 1 2688
4
3
3
, Q = + ⋅ = .
Q
3
aparţine intervalului (1999,5-4999,5).
Valoarea cuartilei superioare:
4883
1678
404 75 2016
3000 5 1999
3


⋅ + =
,
, Q locuitori.
Un sfert din comune depăşesc 4883 de locuitori, în timp ce trei
sferturi din comune au sub 4883 locuitori.
Totodată, aceste rezultate arată că jumătate din comunele ţării au
între 2479 şi 4883 locuitori.
Decilele sunt în număr de nouă şi împart seria statistică ordonată
în 10 părţi egale, fiecare parte deţinând 10% din numărul unităţilor
colectivităţii. Decila a cincea este mediana.
Decilele se determină prin intermediul unor operaţii asemănătoare
celor folosite pentru mediană şi cuartile.
Locul unei decile oarecare D
j
este dat de relaţia:
|
|
.
|

\
|
+ ⋅ =

=
k
i
i D
n
j
l
j
1
1
10
, j = 1,..., 9.
Valoarea decilei D
j
:
j
j
D
d
i
i
k
i
i
j
n
n n
j
d x D
∑ ∑

= =

|
|
.
|

\
|
+ ⋅
⋅ + =
1
1 1
0
1
10
,
unde: x
0
- limita inferioară a intervalului în care se află decila j;
d - mărimea intervalului în care se află decila j;
j
D
n - frecvenţa intervalului în care se află decila j;


=
1
1
j
d
i
i
n
- frecvenţele intervalelor ce preced intervalul în care se
află decila j
Seriile de distribuţie a frecvenţelor


4.3.3 Modulul
Modulul (modul sau dominanta) reprezintă valoarea cel mai frecvent
întâlnită în cadrul colectivităţii statistice analizate. El corespunde aşadar
frecvenţei maxime, ceea ce îl face uşor de identificat în cazul seriilor simple.
În seriile de intervale se stabileşte întâi intervalul modal (cel care are
frecvenţa maximă), apoi se determină valoarea efectivă a modulului, cu relaţia:
2 1
1
0
0
∆ ∆

+
⋅ + =
m
h x Mo ,
1 1
0 0

− =
m m
n n ∆ ,
1 2
0 0
+
− =
m m
n n ∆ ,
unde: Mo - modulul;
x
0
- limita inferioară a intervalului modal;
0
m
n - frecvenţa intervalului modal;
1
0
− m
n - frecvenţa intervalului anterior;
1
0
+ m
n - frecvenţa intervalului următor;
0
m
h - mărimea intervalului modal.

Se exprimă în unitatea de măsură a caracteristicii analizate.
Determinarea modulului se poate face şi pe cale grafică.
Pentru seriile de repartiţie pe variante, modulul este proiecţia pe axa Ox
a vârfului poligonului frecvenţelor.
Pentru seriile de repartiţie de frecvenţe, modulul se localizează în
intervalul corespunzător coloanei cu frecvenţă maximă. Din cele două vârfuri
superioare ale coloanei respective se trasează diagonale spre punctele de
intersecţie cu coloanele alăturate. Proiecţia pe Ox a punctului de intersecţie a
celor două diagonale este valoarea modulului.
Folosind datele din tabelul 4.3.1., putem calcula numărul cel mai
frecvent de locuitori într-o comună cu ajutorul modulului. Intervalul modal este
determinat pe baza frecvenţelor reduse (vezi coloana 4) deoarece seria are
intervale neegale şi este intervalul 1999,5 – 4999,5. Valoarea modulului este:
3630
2417
1314
3000 5 1999
0
= ⋅ + = , M locuitori.
STATISTICA

1314 364 1678
1
= − = ∆
1103 575 1678
2
= − = ∆ .
În cazul unei serii de distribuţie a frecvenţelor obţinută prin gruparea pe
variante, valoarea modului este chiar varianta cu frecvenţa cea mai mare.
Dacă seria prezintă două frecvenţe maxime identice alăturate, se
defineşte un interval modal prin reunirea celor două intervale alăturate fără a
putea calcula valoarea exactă a modului.
Dacă seria prezintă două sau mai multe frecvenţe maxime nealăturate şi,
posibil, neegale, spunem că seria este bimodală, trimodală etc. şi se calculează
toate valorile modale.
Distribuţiile bimodale (cu două frecvenţe maxime) reprezintă o situaţie
rar întâlnită, care impune separarea unităţilor colectivităţii în două distribuţii de
frecvenţe.
De exemplu, o fabrică de încălţăminte care doreşte să-şi fixeze structura
producţiei în funcţie de mărimile cele mai solicitate, face un studiu al pieţei prin
sondaj. Dacă datele observării sunt înregistrate nediferenţiat în cadrul populaţiei,
distribuţia de frecvenţe va avea două valori modale: cea mai mică reprezintă
numărul la pantof preponderent la femei, iar cea mai mare indică mărimea cu
frecvenţă maximă la bărbaţi.
Media, mediana şi modulul caracterizează tendinţa centrală şi forma de
variaţie a caracteristicii. Ele coincid în cazul unei distribuţii perfect simetrice.
Pentru distribuţiile moderat asimetrice, între medie, mediană şi modul
există următoarea legătură:
( ) Me x Mo x − ⋅ = − 3
Gradul de precizie al medianei şi modulului este mai redus decât al
mediei, întrucât nu includ în calcul toate valorile individuale. Cu toate acestea, în
anumite situaţii, ele pot înlocui media. De exemplu, modulul va fi preferat
mediei ca măsură a taliei la confecţii, iar mediana va reprezenta mai bine o serie
cu valori extreme excesiv de distanţate de restul valorilor.
Alegerea indicatorilor trebuie să corespundă esenţei fenomenului şi
particularităţilor distribuţiei analizate.
Seriile de distribuţie a frecvenţelor


4.4 INDICATORII VARIAŢIEI
Fenomenele şi procesele economice au un grad ridicat de
complexitate şi variabilitate datorită multitudinii de factori, direcţi şi
indirecţi, esenţiali sau întâmplători, care le influenţează. Din această
perspectivă, media, ca indicator al tendinţei centrale, poate să nu fie
întotdeauna expresia esenţei fenomenului. Acest lucru se întâmplă atunci
când colectivitatea pentru care este calculată media prezintă o mare
variaţie a valorilor individuale înregistrate; utilizarea exclusivă a mediei
în acest caz creează o imagine eronată a fenomenului analizat.
Media este reprezentativă pentru o colectivitate statistică doar
dacă este calculată din mărimi omogene, cu grad redus de variaţie. În
acest caz, variantele individuale ale caracteristicii au valori apropiate de
medie.
Pentru a verifica măsura în care se abat variantele de la medie se
calculează indicatorii variaţiei.
Indicatorii variaţiei asigură:
• verificarea gradului de omogenitate a colectivităţii şi implicit a
reprezentativităţii mediei;
• caracterizarea formei de repartiţie şi a variaţiei unei
caracteristici;
• testarea grupării corecte a datelor;
• separarea modului de acţiune a factorilor esenţiali de cei
întâmplători;
• compararea seriilor de repartiţie;
• aplicarea testelor statistice.
După complexitate şi numărul termenilor individuali implicaţi,
indicatorii variaţiei sunt incluşi în două categorii: simpli şi sintetici.
4.4.1 Indicatorii simpli ai variaţiei
Aceşti indicatori încearcă să caracterizeze gradul de împrăştiere a
termenilor unei serii statistice, utilizând numai două valori simultan.
Se determină sub forma unor mărimi absolute sau relative (prin
raportare la media seriei).
STATISTICA

Amplitudinea absolută a variaţiei reprezintă diferenţa dintre
valorile extreme ale caracteristicii înregistrate. Se determină cu formula:
min max
x x A − = ,
unde: x
max
, x
min
- valoarea cea mai mare, respectiv cea mai mică
înregistrată de caracteristica statistică în cadrul seriei
respective.

Rata şomajului pe ţări
*

Tabelul 4.4.1

Ţara Rata şomajului (%)
0 1
Austria
Belgia
Bulgaria
Canada
Rep. Cehă
Rep. Coreea
6,8
13,0
16,4
11,2
3,5
2,8
Danemarca
Elveţia
Finlanda
Franţa
Fosta RDG
Fosta RFG
Italia
Japonia
Norvegia
12,4
4,5
17,5
11,61
5,8
8,2
11,5
2,5
5,5
Olanda
Polonia
Regatul Unit
România
*)

15,7
5,5
10,2
10,9
Spania
S.U.A.
Suedia
Turcia
Ungaria
16,6
6,7
8,7
7,9
12,1
* Notă: 1994
Sursa: Anuarul statistic al României, anul 1995.

Seriile de distribuţie a frecvenţelor


Considerând seria statistică prezentată în tabelul 4.4.1,
amplitudinea variaţiei este:
A = 17,5 - 2,5 = 15%.
Unitatea de măsură este cea a caracteristicii pentru care se
calculează.
În cazul în care variaţia caracteristicii este sistematizată pe
intervale de grupare, amplitudinea absolută a variaţiei se calculează ca
diferenţă între limita superioară a ultimului interval şi limita inferioară a
primului interval:
l L
x x A − =
Amplitudinea variaţiei prezintă dezavantajul utilizării exclusive a
valorilor extreme care pot fi depărtate de masa variantelor caracteristicii.
De aceea, pentru a aprecia mai bine ce reprezintă distanţa valorilor
extreme, comparativ cu ceea ce este tipic, caracteristic pentru variabila
înregistrată, se calculează amplitudinea relativă a variaţiei, cu formula:
100 ⋅ =
x
A
A
%
,
unde: x - media aritmetică a caracteristicii.
Se exprimă în procente.
Amplitudinea relativă a variaţiei permite comparaţii între serii
statistice diferite.
Utilizând datele referitoare la rata şomajului pe ţări, care au fost
sistematizate pe intervale de grupare (tabelul 4.4.2) pentru a facilita
calculele, se poate determina rata medie a şomajului:
% , x 6 9
24
231
= =
şi amplitudinea relativă a variaţiei:
% ,
,
A
%
25 156 100
6 9
15
= ⋅ = .
Acest rezultat arată că distanţa între capetele seriei reprezintă
156,25% din medie, o valoare relativ ridicată.
STATISTICA

Tabelul 4.4.2
Rata
şomajului (%)
Nr. ţări
(n
i
)
x
i
x
i
n
i

x x
i


d
i%

i i
n x x ⋅ −
i i
n ) x x ( ⋅ −
2

0 1 2 3 4 5 6 7
2,5 - 5,5 6 4 24 -5,6 -58,33 33,6 188,2
5,5 - 8,5 4 7 28 -2,6 -27,08 10,4 27,0
8,5 - 11,5 6 10 60 0,4 4,17 2,4 0,96
11,5 - 14,5 3 13 39 3,4 35,42 10,2 34,68
14,5 - 17,5 5 16 80 6,4 66,67 32 204,8
Total 24 50 231 - - 88,6 455,64

Întrucât distanţa valorilor extreme, chiar dacă este comparată cu
media, reprezintă o informaţie insuficientă privind gradul de împrăştiere,
se calculează şi abaterile individuale absolute (d
i
) ale termenilor seriei
(x
i
) de la medie ( x ), conform relaţiei:
_
i i
x x d − = .
Abaterile individuale pot fi pozitive sau negative şi se măsoară cu
aceeaşi unitate de măsură ca şi caracteristica analizată. Semnificative
pentru gradul de împrăştiere a termenilor sunt îndeosebi abaterea maximă
pozitivă (d
max +
) şi negativă (d
max -
)

:
d
max +
= x
max
- x
d
max -
= x
min
- x .
În exemplul considerat (tabelul 4.4.2) abaterile individuale
variază de la un minim de -5,6 la un maxim de 6,4, valori relativ mari
dacă le comparăm cu media.

Abaterile individuale relative (d
i%
) se calculează raportând aba-
terile absolute la nivelul mediu al caracteristicii:
100 ⋅ =
_
i
(%) i
x
d
d .
Seriile de distribuţie a frecvenţelor


Şi în acest caz ne interesează abaterile extreme:
100 ⋅ =
+
+
x
d
d
max
(%) max

100 ⋅ =


x
d
d
max
(%) max

Se exprimă în procente (tabelul 4.4.2).
Acest indicator arată dimensiunile relative ale abaterilor
individuale comparativ cu ceea ce este caracteristic pentru colectivitatea
respectivă (media).
Toţi indicatorii prezentaţi anterior au dezavantajul că oferă
informaţii parţiale, limitate privind gradul de împrăştiere a valorilor
caracteristicii. Pentru a exprima variaţia totală sunt necesari indicatorii
sintetici.
4.4.2 Indicatorii sintetici ai variaţiei
Aceşti indicatori reunesc toate abaterile individuale ale termenilor
seriei într-o mărime unică, în măsură să exprime sintetic variaţia totală.
Modalitatea concretă în care se realizează această sinteză poate fi diferită,
de aceea există mai multe tipuri de indicatori.
Abaterea medie liniară reprezintă o medie aritmetică, simplă sau
ponderată, calculată din abaterile individuale, luate în valoare absolută,
ale tuturor termenilor seriei statistice de la media lor, conform relaţiei:
n
x x
d
n
i
i

=

=
1
- pentru serii simple;


=
=
⋅ −
=
k
i
i
k
i
i i
n
n x x
d
1
1
- pentru serii cu frecvenţe absolute;
*
i
k
i
i
n x x d ⋅ − =

=1
- pentru serii de frecvenţe relative
exprimate prin coeficienţi;
STATISTICA

100
n x x
d
*
(%) i
k
1 i
i
⋅ −
=

=


În formula de calcul a abaterii medii liniare abaterile individuale
sunt considerate în valoare absolută, deoarece, în caz contrar, suma lor
ponderată ar fi nulă, conform proprietăţilor mediei aritmetice.
Pentru exemplul considerat (tabelul 4.4.2.), abaterea medie liniară
este:
% ,
,
d
_
69 3
24
6 88
= = .
Aşadar, rata şomajului în ţările considerate se abate în medie cu
3,69 unităţi de la medie. Având în vedere valoarea mediei (9,6), abaterea
este semnificativă.
Deoarece, în analiza variaţiilor individuale, mai importante sunt
abaterile mari în valoare absolută, media pătratică este cea mai indicată.
Abaterea medie pătratică se calculează ca medie pătratică,
simplă sau ponderată, a abaterilor individuale absolute ale termenilor
seriei de la media lor aritmetică:
n
) x x (
n
i
_
i

=

=
1
2
σ - pentru serii simple;


=
=
⋅ −
=
k
i
i
k
i
i
_
i
n
n ) x x (
1
1
2
σ - pentru serii de frecvenţe absolute;
( )

=
⋅ − =
k
i
*
i i
n x x
1
2
σ
( )
100
1
2

=
⋅ −
=
k
i
*
(%) i i
n x x
σ
- pentru serii de frecvenţe relative
exprimate sub formă de coeficienţi;
- pentru serii de frecvenţe relative
exprimate procentual.
- pentru serii de frecvenţe relative
exprimate procentual.
Seriile de distribuţie a frecvenţelor


Se exprimă în unitatea de măsură a caracteristicii, ceea ce o face
improprie comparaţiilor.
Abaterea medie pătratică este întotdeauna mai mare decât abaterea
medie liniară, deoarece media pătratică este întotdeauna mai mare decât
cea aritmetică.
Această relaţie de inegalitate se poate verifica pentru exemplul
considerat:
% ,
,
36 4
24
64 455
= = σ deci d > σ
Raportul dintre abaterea medie liniară şi abaterea medie pătratică
se apropie de 0,8 în cazul seriilor care tind către repartiţia normală. Pentru
seria statistică analizată în acest exemplu, raportul este 0,846.
Cât de însemnată este abaterea medie, numai comparaţia cu media
o poate arăta. Această comparaţie se realizează prin intermediul
coeficientului de variaţie (v), care se calculează ca raport între abaterea
medie pătratică şi media aritmetică:
.
x
v
_
100 ⋅ =
σ

O altă variantă de calcul:
.
x
d
v
_
100 ⋅ =
Se exprimă în procente, ceea ce face posibilă comparaţia între serii
statistice de variabile statistice exprimate în unităţi de măsură diferite.
Întrucât anumite serii statistice pot fi mai bine reprezentate de
mediană sau modul, în numitorul formulei de calcul al coeficientului de
variaţie media poate fi înlocuită prin mediană sau modul.
Cu cât valoarea coeficientului de variaţie este mai apropiată de
zero cu atât seria statistică este mai omogenă şi, în consecinţă, media este
mai reprezentativă pentru colectivitatea respectivă. În literatura de
specialitate se avansează nivelul de 35 - 40 % ca limită maximă
admisibilă pentru coeficientul de variaţie. În situaţia unor valori mai mari
ale indicatorului, media nu mai este suficient de reprezentativă. Soluţia
care se impune este împărţirea colectivităţii în subgrupe omogene.
STATISTICA

În exemplul nostru:
% ,
,
,
v 4 45 100
6 9
36 4
= ⋅ =
Aşadar, colectivitatea considerată în acest exemplu este eterogenă.
Ţările incluse în analiză (vezi tabelul 4.4.1) sunt foarte diferite din punct
de vedere al nivelului de dezvoltare şi al sistemului economic specific,
ceea ce determină diferenţe mari în mărimea indicatorului considerat. Se
poate încerca o grupare în: ţări dezvoltate, ţări mai puţin dezvoltate şi
fostele ţări socialiste.
Dispersia este un alt indicator sintetic al variaţiei care se
calculează ca medie aritmetică, simplă sau ponderată, a pătratelor
abaterilor termenilor faţă de media lor:
n
) x x (
n
i
_
i

=

=
1
2
2
σ - pentru serii simple;


=
=
⋅ −
=
k
i
i
k
i
i
_
i
n
n ) x x (
1
1
2
2
σ - pentru serii de frecvenţe absolute;
( )

=
⋅ − =
k
i
*
i i
n x x
1
2
2
σ
( )
100
1
2
2

=
⋅ −
=
k
i
*
(%) i i
n x x
σ

Dispersia are acelaşi conţinut informaţional ca abaterea medie
pătratică, reprezentând practic pătratul acesteia.
- pentru serii de frecvenţe relative
exprimate sub formă de coeficienţi;
- pentru serii de frecvenţe relative
exprimate procentual.
Seriile de distribuţie a frecvenţelor


Efectuând câteva transformări simple, se poate stabili formula de
calcul a dispersiei prin metoda momentelor iniţiale:
2 1
2
2
x
n
x
n
i
i
− =

=
σ - pentru serii simple;
2
1
1
2
2
x
n
n x
k
i
i
k
i
i i


=


=
=
σ - pentru serii de frecvenţe absolute;
2
k
1 i
*
i
2
i
2
x n x − ⋅ = σ

=

În exemplu considerat anterior dispersia este:
. ,985 18
2
= σ
Nu are unitate de măsură.


Proprietăţile dispersiei

• Atunci când se măreşte (micşorează) fiecare termen al seriei cu
o constantă “a” valoarea dispersiei nu se modifică.
Demonstraţie

:
( ) ( ) | | ( ) ( )
2
2 2 2
σ =
⋅ −
=
⋅ + − −
=
⋅ − − −






i
i
i
i i
i
i
i
i i
i
i
i
i i
n
n x x
n
n a x a x
n
n a x a x


* Se folosesc proprietăţile mediei
- pentru serii de frecvenţe relative
exprimate sub formă de coeficienţi.
STATISTICA

• Dacă se înmulţesc (împart) toţi termenii seriei cu o constantă “h”,
dispersia se multiplică (divide) de h
2
ori.
Demonstraţie

:
( )
2
2
2
2
2
1
h
n
n x x
h
n
n
h
x
h
x
i
i
i
i i
i
i
i
i
i
σ
=
⋅ − ⋅
=

|
|
.
|

\
|





.
Analog se poate demonstra proprietatea în cazul multiplicării
termenilor cu o constantă.
• Dispersia faţă de o constantă “a” este mai mare decât dispersia
calculată faţă de medie cu pătratul diferenţei dintre medie şi
constanta respectivă:
. ) a x (
_
x a
2 2 2
− + = σ σ
unde:
2
a
σ - dispersia calculată faţă de o constantă a;
2
x
σ - dispersia calculată faţă de medie.
Demonstraţie
**
:
( ) ( ) ( ) | |
( ) ( ) ( ) ( )
( ) ( )
( )
2
2
2 2
2 2
2
2
2
0
2
a x
n
n a x
n
n x x
f
n a x a x x x x x
n
n a x x x
n
n a x
x
i
i
i
i i
i
i i i
i
i i
i
i i
a
− + =
⋅ −
+ +
⋅ −
=
=

(
¸
(

¸

− + − ⋅ − ⋅ + −
=
=
⋅ − + −
=
⋅ −
=










σ
σ



** Se va folosi următoarea proprietate a mediei: suma algebrică a tuturor abaterilor
termenilor seriei de la medie este nulă.
Seriile de distribuţie a frecvenţelor


Consecinţă:
.
_
a x
) a x (
2 2 2
− − = σ σ
Ultimele două proprietăţi se regăsesc în formula de calcul
simplificat al dispersiei:

. ) a x ( h
n
n
h
a x
_
k
i
i
k
i
i
i
x
2 2
1
1
2
2
− − ⋅
⋅ |
.
|

\
|

=


=
=
σ
Această formulă se utilizează în cazul seriilor cu intervale de
variaţie egale. Este recomandată alegerea unei constante "a" egală cu
mărimea centrului de interval care corespunde frecvenţei maxime şi a
unei constante "h" de mărimea intervalului de grupare.
Formula uşurează calculele pentru seriile cu valori mari ale
caracteristicii.
Calcularea dispersiei pentru seria statistică prezentată anterior,
utilizând formula de calcul simplificat (tabelul 4.4.3.) conduce la
următorul rezultat:
2 2 2
10 6 9 3
24
51
) , ( − − ⋅ = σ = 18,97.
Tabelul 4.4.3
x
i
n
i

h
a x
i


i
i
n
h
a x
⋅ |
.
|

\
|

2

0 1 2 3
4
7
10
13
16
6
4
6
3
5
-2
-1
0
1
2
24
4
0
3
20
Total 24 - 51

STATISTICA

Gruparea datelor statistice pe intervale de variaţie uşurează în
mare măsură calculul indicatorilor de variaţie dar determină diferenţe faţă
de mărimea indicatorilor corespunzători calculaţi pe baza datelor
negrupate.
Abaterea este cu atât mai însemnată cu cât mărimea intervalelor de
grupare este mai mare. În situaţii de acest fel se recomandă folosirea
formulei lui Sheppard pentru a corecta mărimea dispersiei. Sheppard
propune următoarea relaţie:
12
2
2 2
h
calculat
− = σ σ ,
unde: h - mărimea intervalelor de grupare egale.

Analiza indicatorilor tendinţei centrale şi a indicatorilor variaţiei
trebuie să se facă în mod combinat. Interpretarea lor izolată poate conduce
la erori. De exemplu, două serii statistice pot avea aceeaşi dispersie, dar
medii diferite, ca în figura
*
următoare:
x
f

Uneori, seriile statistice au aceeaşi medie, dar dispersii diferite ca
în această figură
*
:
x
f


*
După: Bernard Py., Statistique descriptive, Economica, Paris, 1990, pag. 69.
1
x
2
x
Seriile de distribuţie a frecvenţelor


DISPERSIA CARACTERISTICII ALTERNATIVE

Caracteristica alternativă este o variabilă care admite numai două
variante (DA/NU) codificate cu 1, respectiv 0. Din această cauză,
indicatorii statistici calculaţi pentru caracteristica alternativă au o formă
particulară.
Media caracteristicii alternative (vezi paragraful 4.2.7.) se
calculează ca pondere a unităţilor care îndeplinesc o condiţie (variantă
afirmativă) în total colectivitate:
N
M
p = ,
unde: M - numărul de apariţii a variantei afirmative a caracteristicii;
N - numărul total al unităţilor statistice din colectivitate.

Media caracteristicii alternative este o mărime relativă de
structură: frecvenţă relativă.
Numărul unităţilor care nu îndeplinesc condiţia (varianta negativă)
este N-M, iar ponderea lor este:
p
N
M
N
M N
q − = − =

= 1 1
Frecvenţele absolute şi relative ale variantelor sunt prezentate în
tabelul următor:

Tabelul 4.4.4
Variantele
caracteristicii
alternative
Valoarea
caracteristicii
alternative
Frecvenţe
absolute
(n
i
)
Frecvenţe relative
(n
i
*
)
0 1 2 3
Afirmativ
Negativ
1
0
M
N - M
p
1 - p
Total - N 1

STATISTICA

Aplicând formula de calcul a dispersiei (în varianta care utilizează
frecvenţe relative exprimate prin coeficienţi) pentru datele din tabelul
4.4.4 obţinem:
( ) ( ) ( ) ( )
( ) ( ) ( ) p 1 p p p 1 p 1 p
p 1 p 0 p p 1 n p x
2 2
2
1 i
*
i
2
i
2
p
− ⋅ = + − ⋅ − ⋅ =
= − − + ⋅ − = ⋅ − = σ

=

Abaterea medie pătratică a caracteristicii alternative este radical
din dispersie:
( ) p p
p
− ⋅ = 1 σ
4.4.3 Variaţia intercuartilică şi interdecilică
Cunoaşterea relaţiilor care se stabilesc între indicatorii medii de
poziţie într-o repartiţie perfect simetrică permite interpretarea modului de
distribuţie a frecvenţelor în repartiţiile empirice.
Seriile perfect simetrice prezintă o aşezare simetrică a cuartilelor
faţă de mediană şi îndeplinesc anumite condiţii.
Astfel, distanţa dintre mediană şi cuartila inferioară (Q
1
) este egală
cu distanţa dintre cuartila superioară (Q
3
) şi mediană, conform relaţiei:
Me Q Q Me − = −
3 1
.
Rezultă de aici că:
2
2
3 1
3 1
Q Q
Me Q Q Me
+
= ⇒ + = ⋅ .
Această relaţie arată că, într-o serie perfect simetrică, mediana este
egală cu media aritmetică a cuartilelor extreme.
De regulă, seriile empirice se abat de la acest model al simetriei
perfecte şi relaţiile anterioare nu se verifică. Mărimea acestei abateri
poate fi măsurată cu ajutorul unor indicatori bazaţi pe cele trei cuartile,
numiţi indicatori ai variaţiei intercuartilice.
Abaterea intercuartilică reprezintă media abaterilor cuartilelor
extreme (Q
1
, Q
3
) de la mediană:
( ) ( )
2 2
1 3 3 1
Q Q Me Q Q Me
A
Q

=
− + −
=
Seriile de distribuţie a frecvenţelor


Abaterea intercuartilică se măsoară cu aceeaşi unitate de măsură
ca variabila analizată, ceea ce nu permite comparaţii între serii statistice
diferite din punctul de vedere al unităţilor de măsură.
Coeficientul de variaţie intercuartilică remediază acest dezavan-
taj, raportând abaterea intercuartilică la mediană:
Me
Q Q
Me
Q
V
d
q


= =
2
1 3
unde | | 1 0, V
q

Cu cât distanţa dintre cuartilele extreme este mai mică în raport cu
mediana, cu atât coeficientul ia valori mai mici.
Indicatorii variaţiei intercuartilice pot oferi o măsură semnificativă
a seriilor cu un nivel redus de asimetrie. Pentru seriile cu asimetrie
pronunţată şi cu un număr mare de grupe, analiza poate fi adâncită prin
calcularea distanţei dintre decilele extreme (D
1
, D
9
). Acest interval
include 80 % din termenii seriei, comparativ cu 50 % în cazul intervalului
intercuartilic.
Abaterea interdecilică este media abaterilor decilelor extreme
faţă de mediană:
( ) ( )
2 2
1 9 9 1
D D Me D D Me
A
D

=
− + −
= .
Interpretarea acestui indicator se bazează pe faptul că într-o serie
perfect simetrică decilele extreme (ca şi cuartilele extreme) sunt egal
depărtate de mediană:
Me D D Me − = −
9 1
.
Pentru asigurarea comparabilităţii între serii statistice diferite,
indicatorul se calculează şi în varianta relativă, prin împărţire la mediană.
Se obţine astfel coeficientul de variaţie interdecilică:
Me
D D
Me
A
V
D
D


= =
2
1 9
unde | | 1 0, V
D

Cu cât seria are o tendinţă mai pronunţată de asimetrie, cu atât
coeficientul de variaţie interdecilică va avea o valoare mai apropiată de 1.
STATISTICA

4.4.4 Indicatorii variaţiei în colectivităţile
împărţite în grupe
În colectivităţile împărţite în grupe se pot calcula atât medii pe
grupe, cât şi o medie a colectivităţii totale. În mod corespunzător, se vor
calcula indicatori de variaţie pentru fiecare grupă şi pe întreaga
colectivitate. Indicatorii de variaţie pe întreaga colectivitate se pot calcula
fie făcând abstracţie de faptul că ea este compusă din mai multe grupe, fie
luând în calcul variaţia din interiorul grupelor şi variaţia dintre grupe.
În situaţii de acest fel, analiza se desfăşoară atât pe ansamblul
colectivităţii, cât şi la nivelul grupelor. Factorii care determină variaţia
caracteristicii sunt de două tipuri:
• un factor esenţial, în funcţie de care s-a realizat gruparea;
acesta explică abaterile mediilor de grupă de la media generală;
• factorii neesenţiali, reprezentaţi de ansamblul tuturor celorlalţi
factori care influenţează variaţia caracteristicii date; ei acţio-
nează în interiorul fiecărei grupe, fiind cauza abaterilor
termenilor individuali de la media grupei din care fac parte.
Atunci când factorul esenţial (înregistrat) este determinant, variaţia
dintre grupe este mult mai mare decât variaţia din interiorul grupelor. În caz
contrar, factorii neesenţiali (neînregistraţi) au o influenţă mai puternică.
Analiza variaţiei în colectivităţile împărţite în grupe porneşte de la
o repartiţie bidimensională de frecvenţe. Datele sunt înregistrate pentru
două caracteristici (x şi y) la nivelul fiecărei unităţi a colectivităţii.
Unităţile sunt împărţite pe grupe în funcţie de caracteristica x (factor
principal de grupare), iar în cadrul fiecărei grupe astfel formate, se face o
nouă împărţire în funcţie de variaţia caracteristicii y. Se obţin astfel
distribuţiile condiţionate ale variabilei y în funcţie de factorul de grupare
x. Rezultatele grupării sunt înregistrate într-un tabel cu dublă intrare (vezi
tabelul 4.4.5). Conţinutul tabelului îl formează frecvenţele n
ij
care reflectă
numărul unităţilor statistice care aparţin grupei i după variaţia factorului
de grupare x şi subgrupei j după variaţia caracteristicii y.
Seriile de distribuţie a frecvenţelor


Tabelul 4.4.5
Grupe Subgrupe după y Total unităţi Medii de Dispersii de
după x y
i
... y
j
... y
m
pe grupe
(n
i.
)
grupă

i
y
grupă
2
i
σ
x
1
Μ
x
i

Μ

x
r

n
11
... n
1j
... n
1m
Μ
n
i1
... n
ij
... nf
im

Μ
n
r1
... n
rj
... n
rm

n
1.

Μ
n
i.

Μ
n
r.

1
y
Μ
i
y
Μ
r
y
2
1
σ
Μ
2
i
σ
Μ
2
r
σ
Total unităţi
pe subgrupe
(n.
j
)

n.
1
... n.
j
... n.
m
∑∑
= =
r
i
m
j
ij
n
1 1


y

2
y
σ


Variaţia totală a caracteristicii poate fi analizată în următoarele
direcţii:
− abaterile valorilor individuale dintr-o grupă de la media grupei
respective (y
j
-
i
y );
− abaterile mediilor de grupă de la media colectivităţii totale
(
i
y - y);
− abaterile tuturor valorilor individuale de la media colectivităţii
totale (y
j
- y).
Între cele trei componente există următoarea relaţie:
( ) ( ) ( ) y y y y y y
i i j j
− + − = −
care se verifică la nivelul fiecărei unităţi statistice din colectivitate.
Fiecare din cele trei abateri va fi sintetizată pe ansamblul
colectivităţii printr-un indicator de variaţie.
Dispersia totală se calculează pe baza tuturor abaterilor indivi-
duale stabilite faţă de media colectivităţii totale.
( )


=
=
⋅ −
=
m
j
j
m
j
j j
y
. n
. n y y
1
1
2
2
σ ,
STATISTICA

unde: y
j
- valorile caracteristicii distribuită în funcţie de un factor de
grupare x;
y - media pe total;
n.
j
- frecvenţele subgrupelor formate după variaţia caracteristicii y;
m - numărul subgrupelor.
Media colectivităţii totale este:


=
=

=
r
i
i
r
i
i i
. n
. n y
y
1
1
,
unde:
i
y - mediile pe grupe (medii condiţionate);
n
i
. – volumul grupelor formate după variaţia caracteristicii de
grupare x;
r – numărul grupelor.
Dispersia totală reuneşte influenţele tuturor factorilor (esenţiali şi
neesenţiali) care determină variaţia caracteristicii y.
Dispersia grupei se calculează pe baza abaterilor tuturor
variantelor dintr-o grupă faţă de media lor de grupă, conform relaţiei:
( )


=
=
⋅ −
=
m
j
ij
m
j
ij i j
i
n
n y y
1
1
2
2
σ ,
iar mediile pe grupe sunt:


=
=

=
m
j
ij
m
j
ij j
i
n
n y
y
1
1
, i = 1,..., r,
unde: n
ij
– frecvenţele condiţionate de variaţia combinată a
caracteristicilor x şi y.
Dispersiile pe grupe reflectă influenţa factorilor aleatori care
acţionează în interiorul grupelor, determinând variaţia valorilor
Seriile de distribuţie a frecvenţelor


individuale. Cu cât o grupă este mai omogenă, cu atât
2
i
σ va fi mai mic.
Dispersiile tuturor grupelor sunt sintetizate în media dispersiilor de grupă.
Media dispersiilor de grupă se calculează ca o medie aritmetică
a dispersiilor tuturor grupelor. Dacă grupele sunt egale ca volum se
foloseşte media aritmetică simplă, iar dacă volumul diferă de la o grupă la
alta se calculează ca medie aritmetică ponderată conform relaţiei
următoare:


=
=

= =
r
i
i
r
i
i i
r / y
. n
. n
1
1
2
2
2
σ
σ σ
Dispersia dintre grupe se calculează pe baza abaterilor mediilor
de grupă de la media colectivităţii totale.
( )


=
=
⋅ −
= =
r
i
i
r
i
i i
x / y
. n
. n y y
1
1
2
2 2
δ σ
Dispersia dintre grupe măsoară influenţa factorului de grupare. Cu
cât este mai mare, cu atât factorul de grupare x are un rol mai important.
Regula adunării dispersiilor este următoarea: dispersia colec-
tivităţii totale este egală cu media dispersiilor de grupă plus dispersia
dintre grupe.
2 2 2
σ σ σ + =
x / y y

Măsura influenţei factorului de grupare x asupra variaţiei caracte-
risticii y este dată de gradul de determinaţie (R
2
). Acesta se calculează
ca raport între dispersia dintre grupe şi dispersia totală:
100
2
2
2
⋅ =
y
x / y
R
σ
σ

Se consideră că factorul de grupare x influenţează hotărâtor
variaţia factorului determinat y dacă R
2
> 50 %.
STATISTICA

Gradul de nedeterminaţie arată în ce proporţie influenţează
factorii aleatori (neînregistraţi) variaţia caracteristicii y. Se calculează ca
raport între media dispersiilor de grupă şi dispersia totală:
% N R
N
y
100
100
2 2
2
2
2
= +
⋅ =
σ
σ

Pe baza mediilor şi a abaterilor medii pătratice, determinate pe
grupe şi pe total, se pot obţine informaţii referitoare la gradul de
omogenitate al acestora cu ajutorul coeficienţilor de variaţie
corespunzători, calculaţi după relaţiile:
- la nivelul grupei
100 ⋅ =
i
i
i
y
v
σ
unde
2
i i
σ σ =
- pe total
100 ⋅ =
y
v
σ
unde
2
σ σ =
Comparând coeficienţii de variaţie la nivelul grupelor putem
aprecia că cea mai omogenă este grupa pentru care indicatorul menţionat
ia valoarea minimă.
Dacă structurarea colectivităţii pe grupe după variaţia
caracteristicii X s-a efectuat corect, coeficienţii de variaţie calculaţi la
nivelul grupelor sunt mai mici decât coeficientul de variaţie pe total:
v v
i
< r , i 1 =
În cele ce urmează, vom aplica regula de adunare a dispersiilor pe
exemplul distribuţiei bidimensionale din tabelul următor:
Numărul agenţilor economici din administraţie după forma de proprietate,
pe clase de mărime, în anul 1996
Grupe de agenţi
economici după forma
Subgrupe de clase de mărime, după
numărul de salariaţi (persoane)

Total
de proprietate 0 - 9 10 - 49 50 - 249 250 şi peste
0 1 2 3 4 5
- administraţie publică 20.407 9.452 3.232 345 33.436
- administraţie privată 23.152 47 26 8 23.233
Total 43.559 9.499 3258 353 56.669
Sursa: Anuarul statistic al României, anul 1997.
Seriile de distribuţie a frecvenţelor


Mediile de grupă reprezintă în acest caz numărul mediu de salariaţi
într-o unitate de administraţie publică, respectiv privată:


=
=

=
m
j
ij
m
j
ij j
i
n
n y
y
1
1
,
unde: y
j
- centrele de interval ale distribuţiei după y: 5, 30, 150, 350.
30
33436
345 350 3232 150 9452 30 20407 5
1

⋅ + ⋅ + ⋅ + ⋅
= y salariaţi
5
23233
8 350 26 150 47 30 23152 5
2

⋅ + ⋅ + ⋅ + ⋅
= y salariaţi
Media numărului de salariaţi într-o unitate, pe total administraţie:
20
669 56
233 23 5 436 33 30
1
1

⋅ + ⋅
=

=


=
=
.
. .
. n
. n y
y
r
i
i
r
i
i i
salariaţi
Dispersiile de grupă:
( )


=
=
⋅ −
=
m
j
ij
m
j
ij i j
i
n
n y y
1
1
2
2
σ
( ) ( ) ( )
( )
98 2829
33436
345 30 350
33436
3232 30 150 9452 30 30 20407 30 5
2
2 2 2
2
1
, =
⋅ −
+
+
⋅ − + ⋅ − + ⋅ −
= σ
( ) ( ) ( ) ( )
78 65
23233
8 5 350 26 5 150 47 5 30 23152 5 5
2 2 2 2
2
2
, =
=
⋅ − + ⋅ − + ⋅ − + ⋅ −
= σ

STATISTICA

Media dispersiilor de grupă:
73 1696
56669
23233 79 65 33436 98 2829
1
1
2
2
,
, ,
. n
. n
r
i
i
r
i
i i
=
⋅ + ⋅
=

=


=
=
σ
σ
Dispersia dintre grupe:
( )
( ) ( )
25 151
56669
23233 20 5 33436 20 30
2 2
1
1
2
2
,
. n
. n y y
r
i
i
r
i
i i
x / y
=
=
− + ⋅ −
=
⋅ −
=


=
=
σ

Dispersia totală:
( )
( ) ( )
( ) ( )
03 1848
56669
353 20 350 3258 20 150
56669
9499 20 30 43559 20 5
2 2
2 2
1
1
2
2
,
. n
. n y y
m
j
j
m
j
j j
y
=
⋅ − + ⋅ −
+
+
⋅ − + ⋅ −
=
⋅ −
=


=
=
σ

Regula adunării dispersiilor:
73 1696 25 151 03 1848
2
2 2
, , ,
x / y y
+ ≅ ⇔ + = σ σ σ
Întrucât media dispersiilor de grupă este mult mai mare decât
dispersia dintre grupe, rezultă că împărţirea unităţilor din administraţie
după forma de proprietate nu este un factor hotărâtor pentru numărul
mediu de angajaţi ( ) % 18 , 8 R
2
x / y
= .
Seriile de distribuţie a frecvenţelor


Regula de adunare a dispersiilor se poate aplica şi în cazul seriilor
cu frecvenţe relative prezentate în tabele de forma:Tabelul 4.4.6
Valorile
caracteristicii
de grupare X
Cracteristica Y
Frecvenţe relative (%)
Total
(%)
Ponderea
grupei
(n
i(%)
)
y
1
y
2
… y
j
… y
m

x
1
n*
11
n*
12
... n*
1j
… n*
1m
100
.
n
1(%)

x
2
n*
21
n*
22
... n*
2j
… n*
2m
100 n
2(%)

... ... ... … ... … ... ... ...
x
i
n*
i1
n*
i2
... n*
ij
… n*
im
100 n
i(%)

... ... ... … ... … ... ... ...
x
r
n*
r1
n*
r2
... n*
rj
… n*
rm
100 n
r(%)

Total 100

În acest caz se calculează indicatorii medii de variaţie cu ajutorul
formulelor în care frecvenţele se exprimă sub forma de greutăţi specifice,
iar suma lor este egală cu 1 sau 100%.
Dispersia de grupă se calculează astfel:

=
− =
m
j
*
ij i j i
n ) y y (
1
2 2
σ sau
100
1
2
2

=

=
m
j
*
(%) ij i j
i
n ) y y (
σ
Pentru a calcula nivelul mediu pe total, media dispersiilor de
grupă şi dispersia dintre grupe, trebuie să se cunoască structura pe grupe a
colectivităţii. Dacă grupele sunt egale între ele ca volum, indicatorii
respectivi se calculează folosind formule de calcul pentru o serie simplă.
Dacă volumul, diferă de la o grupă la alta atunci trebuie să se folosească
frecvenţele pe grupe.
Pentru a sintetiza variaţia la nivelul grupelor într-un singur
indicator se calculează media dispersiilor de grupă:

100
1
2
2

=

=
r
i
.(%) i i
* n σ
σ
în care
*
.(%) i
n reprezintă greutatea specifică a fiecărei grupe faţă de total.
STATISTICA

Pentru calculul dispersiei dintre grupe şi a dispersiei faţă de total
este necesară calcularea mediei pe întreaga colectivitate:
*
i
r
i
i
n y y

=
=
1
sau,
100
1
*
i
r
i
i
n y
y

=
=
Dispersia dintre grupe se calculează după formula:

=
− =
r
i
*
i i
n ) y y (
1
2 2
δ sau
100
1
2
2

=

=
r
i
*
(%) i i
n ) y y (
δ
Dispersia pe total se calculează folosind regula de adunare a
dispersiilor.
În cazul folosirii frecvenţelor relative trebuie să se cunoască atât
structura seriilor componente cât şi structura pe grupe a colectivităţii
totale.
În cazul în care colectivitatea este împărţită în grupe şi se studiază
variaţia unei caracteristici alternative tabelul cu dublă intrare are
următoarea formă:
Tabelul 4.4.7
Valorile
caracteristicii
de grupare X

Variantele caracteristicii
analizate Y
Total
y
1=
0 y
2
=1
x
1
N
1
- M
1
M
1
N
1

x
2
N
2
- M
2
M
2
N
2

... ... ... ...
x
i
N
i
- M
i
M
i
N
i

... ... ... ...
x
r
N
r
- M
r
M
r
N
r

Total N - M M N

Indicatorii medii şi ai variaţiei calculaţi pe baza acestui tabel sunt
prezentaţi în cele ce urmează.
Seriile de distribuţie a frecvenţelor


Dispersia de grupă pentru o caracteristică alternativă (
2
i
p
σ ) se
calculează după relaţia:
) p ( p q p
i i
p
i i
p
i i
− = = 1 sau
2 2
σ σ
în care :
p
i
- reprezintă media caracteristicii alternative pentru grupa i
|
|
.
|

\
|
=
i
i
i
N
M
p ;
q
i
- frecvenţele relative ale unităţilor care nu posedă caracteristica
în fiecare grupă.
Media dispersiilor de grupă ) (
p
2
σ se calculează ca o medie
ponderată a dispersiilor grupelor în care a fost împărţită colectivitatea:


=
=
=
r
i
i
r
i
i p
p
N
N
i
1
1
2
2
σ
σ
în care N
i
- reprezintă numărul total al unităţilor observate în fiecare
grupă.
Dispersia dintre grupe pentru o caracteristică alternativă
) (
p
2
δ se calculează pe baza abaterilor mediilor caracteristicii alternative
din fiecare grupă şi media pe întreaga colectivitate:


=
=

=
r
i
i
r
i
i i
p
N
N ) p p (
1
1
2
2
δ
în care p este media caracteristicii alternative pe întreaga colectivitate
(
N
M
p = ).
STATISTICA

Dispersia totală a caracteristicii alternative ) (
p
2
σ se calculează
pe baza celor două greutăţi specifice (p, q) din colectivitatea totală:
q p
p
⋅ =
2
σ
Regula adunării dispersiilor se păstrează şi în cazul unei
caracteristici alternative:
2 2 2
p p p
δ σ σ + =

4.5 INDICATORII ASIMETRIEI
Seriile empirice cu care lucrează statistica tind deseori către
modelul repartiţiei normale, care este o distribuţie perfect simetrică.
Distribuţia perfect simetrică se caracterizează prin egalitatea
dintre medie, mediană şi modul. Frecvenţele se distribuie simetric la
dreapta şi la stânga valorii centrale, care are frecvenţa maximă. Graficul
are formă “ de clopot ” (fig. 4.5.1.).
În acest caz, acţiunea factorilor întâmplători are caracter regulat,
astfel încât acţiunea lor se repartizează uniform, în ambele sensuri, faţă de
medie.
Comparaţia între medie şi indicatorii tendinţei centrale permite
interpretarea gradului de asimetrie a unei distribuţii de frecvenţe. Graficul
(histograma, poligonul frecvenţelor) oferă o primă imagine asupra
gradului de asimetrie.



Fig. 4.5.1 Distribuţia perfect simetrică

x M M
e
= =
0
f
x
Seriile de distribuţie a frecvenţelor


Asimetria pozitivă (fig. 4.5.2) este caracteristică acelor
colectivităţi în care predomină valorile mici ale caracteristicii, de unde
rezultă următoarea relaţie de inegalitate:
Mo < Me < x .
Pentru acest tip de distribuţie de frecvenţe, media reprezintă mai
bine valorile mici ale seriei, care sunt predominante; dimpotrivă, valorile
mari sunt mult distanţate faţă de medie.



Fig. 4.5.2 Asimetrie pozitivă

Asimetria negativă (fig. 4.5.3) este specifică seriilor de distribuţie
de frecvenţe în care predomină valorile mari ale caracteristicii, astfel
încât:
Mo Me x < <
În acest caz, media este semnificativă pentru valorile mari ale
caracteristicii; termenii cu valori mici ai seriei statistice nu sunt bine
reprezentaţi.



Fig. 4.3 Asimetrie negativă
f
x M
o
M
e
x
x
x M M
e o
f
STATISTICA

Distribuţiile de frecvenţe care sunt numai uşor asimetrice verifică
următoarea legătură între medie, mediană şi modul:
) Me x ( x Mo − ⋅ − = 3 .
Măsurarea asimetriei se bazează pe indicatori care compară
media cu mediana (sau modulul), în condiţiile unui anumit grad de
împrăştiere a unităţilor colectivităţii (măsurat prin abaterea medie
pătratică).
1) Pentru seriile cu intervale de grupare mari sau inegale se mai
calculează şi densitatea de repartiţie a frecvenţelor absolute/relative
pentru fiecare interval în parte, ca raport între frecvenţa absolută/relativă
şi mărimea intervalului:
k
n
D
i
abs
= ,
k
n
D
*
i
rel
= .
2) Coeficienţii de asimetrie Pearson
Cel mai frecvent, în practică se utilizează coeficienţii de asimetrie
Pearson, în două variante:
a) ca raport între asimetria absolută şi abaterea medie pătratică:
σ
Mo x
C
_
as

= unde ∈
as
C (-1, 1)
b)
σ
|
|
.
|

\
|
− ⋅
=

Me x
C
_
as
3
unde ∈

as
C (-3, 3)
şi se utilizează pentru distribuţii uşor asimetrice.
Ambii coeficienţi au valori > 0 când distribuţia de frecvenţe are
asimetrie pozitivă şi valori < 0 în cazul asimetriei negative. Pentru serii
perfect simetrice valoarea lor este zero.
Seriile de distribuţie moderat asimetrice au valoarea coeficientului
de asimetrie |C
as
| < 0,3 şi |C
as
'
|< 1.
Seriile de distribuţie a frecvenţelor


Pearson propune şi alţi indicatori de asimetrie, indicaţi pentru
seriile foarte mari:
2
2
4
2
3
2
2
3
1
µ
µ
β
µ
µ
β
=
=

unde:
( )


⋅ −
=
i
i i
n
n x x
2
2
µ (dispersia)
( )


⋅ −
=
i
i i
n
n x x
3
3
µ
( )


⋅ −
=
i
i i
n
n x x
4
4
µ
Mărimile
4 3 2
µ µ µ , , sunt momente centrate de ordinul 2,
respectiv 3 şi 4.
Coeficienţii
1
β şi
2
β reflectă intensitatea concentrării
frecvenţelor în centrul distribuţiei.
Gradul de boltire a distribuţiei este măsurat de coeficientul
2
β ,
astfel:
• curbă leptocurtică



f
x
STATISTICA

În cazul curbei leptocurtice
2
β > 3.
• curbă platicurtică
2
β < 3



Atunci când
2
β = 3, curba este normală.

3) Coeficienţii de asimetrie intercuartilică şi interdecilică
Coeficientul Yule foloseşte distanţele dintre cuartile ca măsură a
asimetriei, conform relaţiei:
( ) ( )
( ) ( )
| | 1 1 unde
1 3
1 3
, C
Q Me Me Q
Q Me Me Q
C
Y Y
− ∈
− + −
− − −
=
Coeficientul Bowley utilizează distanţele dintre decile:
( ) ( )
( ) ( )
| | 1 1 unde
1 9
1 9
, C
D Me Me D
D Me Me D
C
B B
− ∈
− + −
− − −
=
Când aceşti coeficienţi au valori apropriate de zero, seria tinde
către distribuţia perfect simetrică. Valori mai mari de 0,3 în valoare
absolută indică o asimetrie pronunţată. Semnul + sau - al indicatorului se
referă la tipul asimetriei: pozitivă sau negativă.

4.6 INDICATORII CONCENTRĂRII
Prin concentrare, în statistică, se înţelege faptul că o pondere mică
din colectivitate deţine o pondere mare din valoarea variabilei studiate.
La caracterizarea statistică a concentrării se pot folosi: metoda
grafică şi măsurarea concentrării prin indicatori statistici adecvaţi.
Analiza concentrării se bazează pe curba de concentrare denumită
şi curba lui Lorenz care se construieşte, de regulă, pentru repartiţiile
f
x
Seriile de distribuţie a frecvenţelor


construite pe intervale de grupare şi presupune parcurgerea următoarelor
etape:
1. Calcularea frecvenţelor relative
100 ⋅ =

i
i
i
n
n
* n
2. Calculul frecvenţelor relative cumulate crescător (F
i(%)
);
3. Determinarea nivelului totalizat al caracteristicii pe fiecare
grupă (x
i
n
i
) şi pe total colectivitate (Σx
i
n
i
);
4. Determinarea greutăţii specifice care exprimă ponderea
nivelului totalizator al fiecărei grupe în total
( 100 ⋅ =

i i
i i
i
n x
n x
* g );
5. Calcularea greutăţilor specifice cumulate crescător (g
ic
*);
6. Construirea curbei de concentrare.
Acest tip de grafic se construieşte în sistem de axe, în cadranul I.
Pe axa OX se reprezintă frecvenţele relative cumulate iar pe OY greutăţile
specifice cumulate.. Fiecare pereche de valori (F
i(%)
,g
ic(%)
) se reprezintă
grafic printr-un punct. Unind succesiv două câte două puncte alăturate
prin segmente de dreaptă se obţine curba de concentrare.
Suprafaţa mărginită de curba de concentrare şi dreapta egalităţii
perfecte a frecvenţelor (diagonala care uneşte punctele de coordonate
(0,0) şi (100,100)) se numeşte arie de concentrare. Cu cât această arie este
mai mare cu atât concentrarea este mai puternică.
Pentru a reda în expresie numerică mărimea gradului de
concentrare se calculează indicatori statistici adecvaţi.
Cel mai frecvent utilizat este coeficientul de concentrare propus de
statisticianul italian Corado Gini potrivit relaţiei:
n , i g C
i
1 unde
2
= =


Coeficientul Gini ia valori în intervalul
(
¸
(

¸

1
1
,
n
. Atunci când cele
n unităţi au ponderi egale în colectivitate, adică repartiţia studiată este
STATISTICA

absolut uniformă, rezultă
n
C
1
= , iar dacă variabila cercetată se
concentrează într-o singură unitate, C=1.
Pentru a înlătura dezavantajul legat de faptul că limita inferioară
este variabilă depinzând de numărul termenilor seriei se foloseşte un alt
indicator de concentrare propus de R. Struck:
1
1
2


=

n
g n
C
i

Interpretarea valorii acestui coeficient se face în intervalul [0,1].
Cu cât coeficientul de concentrare este mai aproape de limita inferioară, el
exprimă o mai uniformă repartizare a elementelori colectivităţii pe tipurile
calitative observate. O apropiere de limita superioară sugerează o
concentrare pe un anumit tip sau pe câteva tipuri calitative.


4.7 ÎNTREBĂRI ŞI TESTE-GRILĂ

4.7.1 Întrebări recapitulative

1. Ce înţelegeţi prin frecvenţe absolute?
2. Ce înţelegeţi prin frecvenţe relative?
3. Ce înţelegeţi prin frecvenţe cumulate?
4. Cum se obţine valoarea centralizată la nivelul grupei?
5. Cum se obţine valoarea centralizată la nivelul ansamblului?
6. Cum se determină indicatorul de nivel al caracteristicii de
grupare în cazul distribuţiilor de frecvenţe obţinute prin gruparea
pe intervale?
7. Cum se calculează densitatea de repartiţie?
8. Când se recomandă utilizarea densităţii de repartiţie?
9. Ce reprezintă
i i
n x ?
10. Ce reprezintă
i
i
n x

?
11. Care sunt indicatorii tendinţei centrale?
12. Ce înţelegeţi prin mod (modul, dominantă)?
13. Cum se stabileşte locul modului în cazul grupării pe variante?
14. Cum se stabileşte locul modului în cazul grupării pe intervale?
Seriile de distribuţie a frecvenţelor


15. Cum se determină modul în cazul grupării pe variante?
16. Cum se determină modul în cazul grupării pe intervale?
17. Când se recomandă utilizarea modului?
18. În ce caz nu poate fi calculat modul ca indicator al tendinţei
centrale?
19. O serie de distribuţie de frecvenţe poate avea mai multe
moduri? Dacă da, cum se continuă analiza?
20. Când se recomandă utilizarea modului ca o alternativă la media
aritmetică?
21. Ce grafic se poate utiliza pentru estimarea modului?
22. Ce înţelegeţi prin mediană?
23. Cum se determină locul medianei pentru o distribuţie de
frecvenţe rezultată prin gruparea pe variante?
24. Cum se determină locul medianei pentru o distribuţie de
frecvenţe rezultată prin gruparea pe intervale?
25. Cum se determină valoarea medianei pentru o distribuţie de
frecvenţe rezultată prin gruparea pe variante?
26. Cum se determină valoarea medianei pentru o distribuţie de
frecvenţe rezultată prin gruparea pe intervale?
27. Ce grafic se poate utiliza pentru estimarea medianei?
28. Când se recomandă utilizarea medianei ca o alternativă la
media aritmetică?
29. În ce situaţie mediana reprezintă singura alternativă pentru
calcularea mediei unei caracteristici statistice?
30. Cum se defineşte media aritmetică?
31. Ce condiţii trebuie să îndeplinească datele statistice din care se
calculează media aritmetică?
32. Care este principalul dezavantaj al mediei aritmetice?
33. Care este principalul avantaj al mediei aritmetice?
34. Ce criterii se folosesc pentru verificarea corectitudinii
calculului mediei aritmetice?
35. Care sunt principalele proprietăţi ale mediei aritmetice?
36. Când se recomandă folosirea formulei de calcul simplificat în
calculul mediei?
37. Pe ce proprietăţi ale mediei se bazează formula de calcul
simplificat?
38. Pe ce proprietate a mediei se bazează calculul mediei aritmetice
cu frecvenţe relative?
STATISTICA

39. Ce tipuri de frecvenţe se pot folosi la calculul mediei
aritmetice?
40. Cum se calculează media de medii parţiale?
41. Ce relaţii pot exista între indicatorii tendinţei centrale?
42. Ce reprezintă media armonică?
43. Când se recomandă utilizarea mediei armonice?
44. Când se utilizează media armonică ca formă transformată a
mediei aritmetice? Exemplificaţi.
45. Ce reprezintă media pătratică?
46. Când se recomandă utilizarea mediei pătratice? Exemplificaţi.
47. Ce reprezintă media geometrică?
48. Când se recomandă utilizarea mediei geometrice?
Exemplificaţi.
49. Cum se calculează media geometrică de medii geometrice
parţiale? Exemplificaţi.
50. Ce condiţie trebuie respectată la calcularea mediei geometrice
din medii geometrice parţiale? Exemplificaţi.
51. Ce tip de medie se poate utiliza pentru denaturarea realităţii în
sens pozitiv?
52. Ce tip de medie se poate utiliza pentru denaturarea realităţii în
sens negativ?
53. Cum se calculează mărimea relativă la nivelul ansamblului din
mărimi relative parţiale de acelaşi tip în cazul în care se cunosc
numărătorii din care s-au calculat mărimile parţiale?
54. Cum se calculează mărimea relativă la nivelul ansamblului din
mărimi relative parţiale de acelaşi tip în cazul în care se cunosc
numitorii din care s-au calculat mărimile parţiale?
55. Din ce categorie de indicatori face parte mediana?
56. Ce sunt cuantilele?
57. Ce sunt cuartilele?
58. Ce sunt decilele?
59. Ce sunt centilele?
60. Ce înţelegeţi prin asimetrie?
61. Care este relaţia între indicatorii tendinţei centrale când
predomină valorile mici ale seriei?
62. Care este relaţia între indicatorii tendinţei centrale când
predomină valorile mici ale seriei?
Seriile de distribuţie a frecvenţelor


63. Care este relaţia între indicatorii tendinţei centrale când seria
este perfect simetrică?
64. Când o serie este perfect simetrică?
65. Când o serie este simetrică?
66. Ce relaţie există între indicatorii tendinţei centrale când seria
este uşor asimetrică?
67. Cum se calculează şi cum se interpretează coeficienţii de
asimetrie propuşi de Pearson?
68. Cum se calculează şi ce semnificaţie are media caracteristicii
alternative?
69. Cum se calculează şi ce semnificaţie are dispersia caracteristicii
alternative?
70. Care este cel mai potrivit indicator pentru caracterizarea
variaţiei unei caracteristici statistice?
71. Când se utilizează amplitudinea absolută a variaţiei?
72. Când se recomandă utilizarea abaterii medii liniare?
73. Ce relaţie este între abaterea medie liniară şi abaterea medie
pătratică în cazul unei distribuţii normale?
74. Care este corecţia lui Sheppard şi ce condiţii trebuie îndeplinite
pentru a putea fi utilizată?
75. Când se recomandă utilizarea abaterii medii pătratice?
76. Care este regula de adunare a dispersiilor?
77. Ce semnificaţie are dispersia dintre grupe?
78. Ce semnificaţie are media dispersiilor de grupă?
79. Ce semnificaţie are dispersia pe total?
80. Cum trebuie să fie variaţia la nivelul fiecărei grupe faţă de
variaţia pe total în seriile de distribuţie bidimensionale?
81. Ce indicatori se pot calcula pe baza regulii de adunare a
dispersiilor?
82. Ce semnificaţie are gradul de determinaţie?
83. Ce semnificaţie are gradul de nedeterminaţie?

STATISTICA


4.7.2 Teste-grilă


1. Media aritmetică reprezintă:
a) indicator al tendinţei centrale;
b) indicator de corelaţie;
c) o măsură a asimetriei;
d) un indicator economic;
e) o măsură a omogenităţii.

2. Indicatorul care redă ceea ce este esenţial şi tipic într-o
colectivitate este:
a) modul;
b) coeficientul de variaţie;
c) dispersia;
d) mediana;
e) media.

3. Valorile aberante (anormal de mari sau mici) nu influenţează:
a) media;
b) mediana;
c) dispersia;
d) coeficientul de variaţie.

4. În cazul în care termenii seriei statistice au valori pozitive şi
negative se utilizează media:
a) aritmetică;
b) armonică;
c) pătratică;
d) geometrică.

5. În cazul în care predomină valorile mici ale caracteristicii se
utilizează media:
a) aritmetică;
b) armonică;
c) pătratică;
d) geometrică.
Seriile de distribuţie a frecvenţelor



6. În cazul în care nu este posibilă însumarea termenilor seriei
statistice se utilizează media:
a) aritmetică;
b) armonică;
c) pătratică;
d) geometrică.


7. În cazul în care termenii seriei statistice au valori negative sau
nule nu se utilizează media:
a) aritmetică;
b) armonică;
c) pătratică;
d) geometrică.


8. Între media armonică (
h
x ) şi media pătratică (
p
x ), calculate
pentru aceeaşi serie statistică, există relaţia:
a)
h
x >
p
x ;
b)
h
x =
p
x ;
c)
h
x <
p
x ;
d) nu se pot compara.


9. Între media aritmetică ( x ) şi media geometrică (c), calculate
pentru aceeaşi serie statistică, există relaţia:
a) x >
p
x ;
b) x =
p
x ;
c) x <
p
x ;
d) nu se pot compara.

STATISTICA


10. Valoarea caracteristicii statistice care se întâlneşte cel mai
frecvent în cadrul seriei statistice nu este:
a) modulul;
b) moda;
c) mediana;
d) dominanta seriei;
e) modul.

11. La o firmă, salariul mediu al personalului de administraţie este
de 4,5 mil. lei, iar cel al muncitorilor de 2,5 mil.lei. Care este
ponderea personalului de administraţie, dacă salariul mediu
lunar al firmei este de 3 mil. lei?
a) 50%;
b) 30%;
c) 25%;
d) 20%.

12. Studentele dintr-o grupă au înălţimea medie de 165 cm, iar
studenţii 175 cm. Care este înălţimea medie în grupa respectivă
dacă ponderea studentelor este 60%?
a) 170cm;
b) 169cm;
c) 165cm;
d) 175cm.

13. Preţul unui produs a crescut în medie cu 1% lunar în primul
semestru al anului şi cu 2% lunar în semestrul al doilea.
Creşterea medie lunară pe întregul an a fost:
a) 1,5%;
b) 1%;
c) 2%;
d) 3%;
e) nu se poate calcula.

Seriile de distribuţie a frecvenţelor


14. Dinamica producţiei realizate de o firmă în primele şase luni
ale anului a fost: 110%, 112%, 108%, 106%,111%,120%. Tipul
de medie cel mai indicat a se calcula în acest caz este:
a) aritmetică;
b) armonică;
c) pătratică;
d) geometrică.

15. Într-un magazin de încălţăminte au fost vândute într-o zi 10
perechi de pantofi având următoarele mărimi:
38,39,35,36,37,38,38,39,37,38. Denumiţi mărimea medie cea
mai indicată a se calcula în acest caz.
a) media aritmetică;
b) media armonică;
c) modul;
d) media geometrică;
e) mediana.

16. Notele obţinute de un student într-o sesiune de examene au
fost: 7,8,8,9,9,10. Denumiţi tipul de medie pe care va prefera
studentul să o calculeze în acest caz.
a) aritmetică;
b) armonică;
c) pătratică;
d) geometrică.

17. Temperaturile înregistrate la ora prânzului la o staţie meteo în
prima săptămână din luna decembrie au fost(grade celsius): -2,-
1,+1,+3,+1,-4,-2. Denumiţi tipul de medie cel mai indicat a se
calcula în acest caz.
a) aritmetică;
b) armonică;
c) pătratică;
d) geometrică.

STATISTICA

18. Ştiind că media aritmetică simplă a zece termeni este 300, dacă
se adaugă la fiecare termen 30 de unităţi şi totodată se împarte
la 11 care va fi noua medie obţinută?
a) 30;
b) 330;
c) 270;
d) 300.

19. Cele 10 hoteluri dintr-un oraş au fost evaluate astfel: 2 hoteluri-
3stele, 5 hoteluri-2stele, 3 hoteluri-1stea. Care este valoarea
medie pe total?
a) 2 stele;
b) 3 stele;
c) 1,9 stele;
d) nu se poate calcula.

20. Încasările lunare obţinute de magazinele dintr-o reţea de
distribuţie au fost (mil. lei): 450, 390, 420, 1684, 398, 375, 405.
Precizaţi care este valoarea medie cea mai indicată a se calcula.
a) medie aritmetică;
b) medie armonică;
c) mediană;
d) nici una.

21. La două anchete în rândul studenţilor, 15% dintre cei 100 de
participanţi la un curs, respectiv 20% dintre cei 150 de
participanţi la un alt curs s-au pronunţat pentru desfiinţarea
cursului de statistică. Ce procent mediu de studenţi este
favorabil desfiinţării cursului de statistică?
a) 17,5%;
b) 18%;
c) 18,5%;
d) 17%.

Seriile de distribuţie a frecvenţelor


22. O maşină parcurge 4 porţiuni egale ale unui traseu cu vitezele
de 40 km/oră, 50 km/oră, 80 km/oră şi 100 km/oră. Care a fost
viteza medie pe întregul drum?
a) 59,26 km/oră;
b) 67,5 km/oră;
c) 65,7 km/oră;
d) 60 km/oră.

23. La un concurs de gimnastică cele 7 participante din România au
ocupat următoarele locuri: 11,4,5,9,8,2,12. Ce loc au ocupat
gimnastele în medie?
a) 9;
b) 8;
c) 7;
d)7,3.

24. În două zone ale unei regiuni s-au stabilit următoarele ponderi
ale şomerilor şi numărul total de şomeri, astfel:
- zona A: 15%, respectiv 100 mii persoane
- zona B: 20%, respectiv 150 mii persoane.
Stabiliţi ponderea medie a şomerilor pe total regiune.
a) 18;
b) 17;
c) 17,65;
d) 18,5.

25. Distribuţia studenţilor dintr-o grupă după nota la examenul de
statistică este:
Nota 4 5 6 7 8 9 10 Total
Nr. studenţi 2 4 6 8 5 4 1 30

Valoarea mediană este:
a) 5;
b) 6;
c) 7;
d) 8;
e) 9.
STATISTICA


26. Trei pătrimi din valorile individuale ale unei serii statistice sunt
mai mari decât:
a) cuartila inferioară;
b) cuartila a treia;
c) mediana;
d) cuartila superioară.

27. 25% din valorile individuale ale unei serii statistice sunt mai
mari decât:
a) cuartila inferioară;
b) modul;
c) mediana;
d) cuartila superioară.

28. Jumătate din valorile individuale ale unei caracteristici, situate
în centrul seriei statistice, sunt:
a) mai mari decât cuartila inferioară;
b) mai mici decât cuartila a treia;
c) egale cu mediana;
d) cuprinse între cuartila inferioară şi cuartila superioară;
e) mai mari decât mediana.

29. Indicatorii tendinţei centrale sunt:
a) media mediana,modul;
b) mediana, modul;
c) cuartilele;
d) cuantilele.

30. Nu sunt indicatori medii de poziţie:
a) mediana;
b) modul;
c) cuartilele;
d) decilele;
e) media aritmetică.

Seriile de distribuţie a frecvenţelor


31. Pentru calculul grafic al medianei se folosesc:
a) diagramele frecvenţelor cumulate crescător sau descrescător;
b) histograma;
c) diagramele prin coloane;
d) diagramele de volum.

32. Pentru calculul grafic al modului se folosesc:
a) diagramele frecvenţelor cumulate crescător sau descrescător;
b) histograma;
c) diagramele prin benzi;
d) diagramele de volum.
33. Caracterizarea gradului de împrăştiere a unităţilor purtătoare ale
caracteristicii se realizează cu:
a) indicatorii simpli şi sintetici ai variaţiei;
b) regula de adunare a dispersiilor;
c) indicii teritoriali;
d) indicii de dinamică;
e) indicatorii medii de poziţie.

34. Pentru a măsura gradul de omogenitate a unei serii statistice
utilizăm:
a) abaterea medie pătratică;
b) media;
c) coeficientul de variaţie;
d) coeficientul de corelaţie;
e) mediana.

35. În cazul unei distribuţii condiţionate a variabilei Y în funcţie de
un factor de grupare X este adevărată în orice situaţie relaţia:
a) dispersia generală este egală cu suma dintre media
dispersiilor de grupă şi dispersia dintre grupe;
b) dispersia dintre grupe este mai mare decât media dispersiilor
de grupă;
c) dispersia dintre grupe este mai mică decât media dispersiilor
de grupă;
d) dispersia dintre grupe este mai mare decât dispersia totală;
e) dispersia dintre grupe este egală cu media dispersiilor de
grupă.
STATISTICA


36. În cazul unei distribuţii condiţionate a variabilei Y în funcţie de
un factor de grupare X variaţia caracteristicii Y sub influenţa
factorilor întâmplători se măsoară prin:
a) dispersiile de grupă;
b) dispersia dintre grupe;
c) diferenţa dintre dispersia totală şi dispersia dintre grupe;
d) dispersia totală;
e) nu se poate calcula.

37. În cazul unei distribuţii condiţionate a variabilei Y în funcţie de
un factor de grupare X variaţia caracteristicii Y sub influenţa
factorilor esenţiali se măsoară prin:
a) dispersiile de grupă;
b) dispersia dintre grupe;
c) diferenţa dintre dispersia totală şi dispersia dintre grupe;
d) dispersia totală;
e) media dispersiilor de grupă.

38. Seriile statistice în care predomină valorile mari ale
caracteristicii verifică relaţiile:
a) media este inferioară modulului;
b) mediana este superioară mediei;
c) moda este mai mică decât media;
d) media este mai mică decât cuartila a doua;
e) mediana şi modul sunt egale.
Alegeţi combinaţia corectă: A(a,b,e); B(a,b,d); C(b,d,e); D(a,b,c).

39. Distribuţiile unidimensionale perfect simetrice verifică relaţiile:
a) media este inferioară modulului;
b) mediana este superioară mediei;
c) oda este mai mică decât media;
d) media este egală cu cuartila a doua;
e) mediana şi modul sunt egale.
Alegeţi combinaţia corectă: A(a,b,e); B(e,d); C(b,d,e); D(a,b,c).

Seriile de distribuţie a frecvenţelor


40. Într-o grupă de studenţi vârsta medie este de 23 ani, dar cei mai
mulţi studenţi au 21 de ani. Distribuţia este:
a) simetrică;
b) pozitiv asimetrică;
c) negativ asimetrică.

41. Valoarea coeficientului de variaţie este invers proporţională cu
mărimea:
a) mediei;
b) dispersiei;
c) abaterii medii pătratice;
d) abaterii medii liniare.

42. Într-o secţie a unei unităţi economice productivitatea medie este
de 40 bucăţi pe muncitor, cu o abatere medie liniară de 4
bucăţi, iar într-o altă secţie productivitatea medie este 50 cu
abatere medie liniară de 5.Care colectivitate este mai omogenă?
a) secţia I;
b) secţia II;
c) nici una nu este omogenă;
d) au acelaşi nivel de omogenitate.

43. Valoarea raportului de nedeterminaţie este direct proporţională
cu:
a) variaţia caracteristicii Y sub influenţa factorilor întâmplători;
b) dispersia dintre grupe;
c) diferenţa dintre dispersia totală şi dispersia dintre grupe;
d) dispersia totală;
e) media dispersiilor de grupă.
Alegeţi combinaţia corectă: A(a,c,e); B(a,b,c); C(d,e).

44. Dacă valoarea raportului de determinaţie este 60% şi media
dispersiilor de grupă 100, care este mărimea dispersiei dintre
grupe?
a) 250;
b) 150;
c) 200.

STATISTICA


45. Mărimea negativă a coeficientului de asimetrie indică:
a) o legătură inversă;
b) o legătură directă;
c) preponderenţa valorilor mari ale caracteristicii;
d) preponderenţa valorilor mici ale caracteristicii;
e) o asimetrie foarte mare.


Soluţii:
1.a; 2.e; 3.b; 4.c; 5.b; 6.d; 7.d; 8.c; 9.a; 10.c; 11.c; 12.b; 13.a; 14.d; 15.c;
16.c; 17.c; 18.a; 19.a; 20.c; 21.b; 22.a; 23.b; 24.c; 25.c; 26.a; 27.d; 28.d;
29.a; 30.e; 31.a; 32.b.33.a; 34.c; 35.a; 36.c; 37.b; 38.B; 39.b; 40.b; 41.a;
42.d; 43.a; 44.b; 45.c.

STATISTICA

mai multe puncte de concentrare. Aceste concentrări ale frecvenţelor apar fie în jurul tendinţei centrale, fie la unul sau ambele capete ale seriei. O analiză completă a seriilor de distribuţie a frecvenţelor se bazează pe următorii indicatori: • indicatori de nivel (nivel individual şi nivel totalizat sau valoare centralizată) şi de frecvenţe (frecvenţe absolute, frecvenţe relative şi frecvenţe cumulate); • indicatori medii: media aritmetică, armonică, pătratică, geometrică; • indicatori medii de poziţie: mediană, cuartile, decile, modul; • indicatori simpli şi sintetici ai variaţiei: amplitudinea variaţiei, abateri individuale, abatere medie liniară, abaterea medie pătratică (abaterea standard, abaterea tip), dispersia (varianţa), coeficientul de variaţie; • indicatori ai asimetriei; • indicatori ai concentrării. Acest sistem complex de indicatori este completat cu reprezentări grafice (histogramă, poligonul frecvenţelor, poligonul frecvenţelor cumulate) care pun în evidenţă forma repartiţiei şi orientează analiza. Scopul analizei şi particularităţile seriei de repartiţie studiate determină indicatorii cei mai potriviţi pentru fiecare caz în parte. 4.1 INDICATORI DE NIVEL ŞI DE FRECVENŢE În cazul datelor negrupate, indicatorii de nivel sunt chiar valorile individuale ale unei caracteristici (xi unde i ia valori de la 1 la n). În cazul seriilor de distribuţie unidimensionale, ca indicatori de nivel (xi unde i ia valori de la 1 la k, în cazul unei distribuţii de frecvenţe cu k grupe) se utilizează variantele în cazul grupării pe variante şi centrele de intervale (calculate ca medie aritmetică simplă a limitelor fiecărui interval) în cazul grupării pe intervale. Nivelul totalizat al caracteristicii se calculează în mod diferit în funcţie de tipul seriei.

Seriile de distribuţie a frecvenţelor

Pentru o serie de date negrupate, nivelul totalizat se obţine prin însumarea tuturor valorilor individuale:
i =1

∑ xi .

n

Pentru date grupate se poate calcula nivelul totalizat al fiecărei grupe şi pe total în funcţie de datele disponibile. Dacă se cunosc valorile individuale din care s-a efectuat gruparea: - nivelul totalizat al grupei: unde ni este volumul grupei iar xij valorile j =1 individuale din cadrul grupei respective; - nivelul centralizat pe total:
i =1 j =1

∑ xij
k ni

ni

∑ ∑ xij unde k este numărul de grupe.

În cazul în care nu se cunosc valorile individuale din cadrul fiecărei grupe: - nivelul totalizat al grupei: xi ni unde ni este volumul grupei iar xi indicatorul de nivel al grupei; - nivelul centralizat pe total:
i =1

∑ x i ni

k

unde k este numărul de grupe.

Indicatorii de nivel totalizat se pot reprezenta grafic prin diagrame de volum al caracteristicii (pătrat, cerc, dreptunghi) a căror suprafaţă este proporţională cu valoarea de reprezentat grafic sau prin diagrama prin coloane nelipite. Pentru seriile de distribuţie (repartiţie) se pot calcula următorii indicatori de frecvenţe: • frecvenţe absolute; • frecvenţe relative; • frecvenţe cumulate. Frecvenţele absolute (ni) rezultă din operaţia de grupare a unităţilor colectivităţii. Numărul unităţilor statistice care aparţin unei grupe (clase) reprezintă frecvenţa grupei respective.

1 Număr de Frecvenţe absolute cumulate Grupe de muncitori după dotarea tehnică muncitori descrescător crescător (ni) (mil. Nr.4.1.0 .0 .1).5 . de magazine etc.0 .0 4. având baze egale pe Ox (variaţia este continuă) şi înălţimea dată de frecvenţele grupelor pe care le reprezintă (figura 4.5 Total Date convenţionale 14 18 30 48 25 15 150 14 32 62 110 135 150 - 150 136 118 88 40 15 - Histograma pentru intervale egale se obţine construind un număr de coloane egal cu numărul grupelor. pe baza datelor din tabelul următor: Gruparea muncitorilor unei firme după nivelul dotării tehnice Tabelul 4.5 3.5 2.5 2 2.4. lei capital fix pe (Fid) (Fia) muncitor) 0 1 2 3 1.5 3 3.5 4 4. Vom exemplifica în continuare modul de construire a histogramei şi a poligonului frecvenţelor pentru intervale de grupare egale. de firme.1.lei/m) 48 30 14 18 25 15 Fig.2.3.2.STATISTICA Întrucât frecvenţele absolute se exprimă în unităţi concrete de măsură (număr de muncitori.5 .0 2.3. de persoane.) nu se pot compara între ele serii statistice.0 3.1.5 dotare tehnica (mil.5 . muncitori 60 50 40 30 20 10 0 1.1 Distribuţia muncitorilor după dotarea tehnică (histogramă) . Reprezentarea grafică a frecvenţelor absolute se face cu ajutorul histogramei şi a poligonului frecvenţelor.4.

n* . 4.lei/m) Figura 4. Poligonul frecvenţelor corespunzător grupării pe intervale egale este prezentat în figura nr.1.2. Frecvenţele relative arată importanţa relativă a fiecărei grupe.frecvenţa absolută a grupei i.5 dotare tehnica (mil.5 2 48 30 14 18 25 15 0 2.Seriile de distribuţie a frecvenţelor Acest tip de grafic pune în evidenţă forma de variaţie a caracteristicii şi gradul de asimetrie a seriei. punând în evidenţă structura colectivităţii.frecvenţa relativă a grupei i. Folosirea acestui indicator permite să se compare seriile empirice între ele sau cu distribuţiile teoretice. * ni(%() .frecvenţa relativă a grupei i.2 .5 3 3. exprimată procentual.5 4 4. . exprimată sub formă de i coeficient.1. muncitori 60 50 40 30 20 10 0 0 1.Poligonul frecvenţelor Se calculează cu relaţia: n* = i ni i =1 ∑ ni k sau n*(%) = i ni i =1 ∑ ni k ⋅ 100 unde: ni . Nr.

4.0 2.STATISTICA i =1 ∑ ni k .33 90.5 . j = 1.00 100.67 10. i. în funcţie de sensul în care se face însumarea frecvenţelor: a) ascendent sau crescător (tabelul 4. semicercul.67 58. .00 20.67 10.00 32.33 41. j =1 i Arată numărul total al unităţilor care au valoarea caracteristicii mai mică sau egală cu limita superioară a intervalului i.67 26..1.00 - 100.5 2.0 .1. coloana a patra)frecvenţa cumulată a unei grupe i este suma frecvenţelor intervalelor de la i la k: Fid = ∑nj j =i k Indică numărul total al unităţilor statistice pentru care valoarea caracteristicii este mai mare sau egală cu limita inferioară a intervalului i.2.33 12.00 90. 2.3.0 .1..2.1.frecvenţa cumulată a unei grupe i (Fia) este suma frecvenţelor primelor i intervale ale seriei: Fia = ∑ n j .00 100.3. .0 3.00 - Reprezentarea grafică se poate mai face prin intermediul diagramelor de structură: pătratul.33 73.2 Frecvenţe relative cumulate (%) crescător 2 descrescător 3 1.1.totalul frecvenţelor celor k grupe ale colectivităţii.0 4.1..5 . dreptunghiul.00 16. Frecvenţele cumulate pot fi calculate în două modalităţi.5 .4. Rezultatele calculului frecvenţelor relative pentru seria statistică din tabelul 4. Grupe de muncitori Frecvenţe după dotarea tehnică relative (%) (mil. coloana treia) .5 Total 9.5 3.0 .67 78.2.. cercul.00 9. b) descendent sau descrescător (tabelul 4.1. lei capital fix (ni*) pe muncitor) 0 1 Tabelul 4.33 21.1 sunt prezentate în tabelul 4.

2 INDICATORI MEDII Statistica încearcă să redea ceea ce este tipic.Poligonul frecvenţelor absolute cumulate frecvenţe relative cumulate (%) 105 90 75 60 45 30 15 0 1. înlăturând variaţiile întâmplătoare în evoluţia fenomenelor şi proceselor. coloanele trei şi patru). Reprezentarea grafică: poligonul frecvenţelor absolute cumulate crescător (ascendent) şi descrescător (descendent) sunt date în figura 4. conform formulelor precedente. lei/m. Indicatorii medii răspund acestui deziderat.1. comun şi general în evoluţia fenomenelor şi proceselor economice. în care se înlocuieşte nj cu nj* (vezi tabelul 4.2.1. exprimând printr-o măsură unică esenţa fenomenului.Poligonul frecvenţelor relative cumulate 4.5 Crescator Descrescator dotare tehnică (mil.4 .3 .1. tipic în manifestarea fenomenului considerat.) Figura 4.5 2 2. Figura 4. Variabilitatea deosebită a acestora în formele lor individuale de manifestare impune găsirea unor indicatori sintetici care să reunească valorile individuale. sintetizând ceea ce este comun.Seriile de distribuţie a frecvenţelor Frecvenţele cumulate se pot calcula şi pe baza frecvenţelor relative. .4.5 4 4.5 3 3.1. Ei măsoară influenţa cauzelor esenţiale.1.3 iar poligonul frecvenţelor relative cumulate în figura 4.

U. • posibilitatea utilizării la calcule algebrice. • simplitatea şi rapiditatea calculului. Mediile se calculează utilizând toate valorile individuale şi se exprimă în unitatea de măsură a caracteristicii considerate. • forma adecvată a indicatorului.STATISTICA Pentru ca indicatorii medii să aibă conţinut real şi să fie reprezentativi pentru colectivitatea analizată este necesar să fie îndeplinite câteva condiţii: • omogenitatea colectivităţii. Yule. atunci când frecvenţele diferă între ele. Este valoarea tipică pentru reprezentarea unei colectivităţi. • semnificaţie clară. • media armonică. • media geometrică. atunci când datele sunt negrupate sau când frecvenţele tuturor grupelor sunt egale (se simplifică) sau sub formă ponderată. sintetizate astfel: • definire obiectivă. Necesităţile diverse ale analizei statistice şi natura diferită a caracteristicilor înregistrate au impus utilizarea practică a unor forme variate de medii. Indicatorii medii se pot prezenta sub formă simplă. • volum suficient de mare de date individuale. . Se consideră că un indicator mediu este adecvat dacă răspunde condiţiilor formulate de statisticianul G. dar este posibil să nu coincidă cu nici una din valorile individuale înregistrate de caracteristică în colectivitatea respectivă. • utilizarea tuturor valorilor individuale înregistrate. • media pătratică. Media este un indicator al tendinţei centrale care arată nivelul la care ar fi ajuns caracteristica dacă în toate cazurile individuale factorii esenţiali şi neesenţiali ar fi acţionat constant. dintre care mai frecvent întâlnite sunt: • media aritmetică. • stabilitatea (în cazul utilizării mai multor eşantioane de acelaşi volum extrase din aceeaşi colectivitate).

n.1 Media aritmetică Media aritmetică este rezultatul sintetizării într-o singură expresie numerică a tuturor nivelurilor individuale observate. fiind obţinută prin raportarea valorii totalizate a caracteristicii la numărul total al unităţilor. Acest tip de medie este indicat îndeosebi atunci când fenomenul supus cercetării înregistrează modificări aproximativ constante în progresie aritmetică. i =1 k ∑ ni unde: ni . se aplică formula de calcul a mediei aritmetice ponderate: x= i =1 k ∑ xi ⋅ ni .. xi reprezintă centrul de interval.2. ci pe intervale de variaţie.xn. . Centrul fiecărui interval se determină ca medie aritmetică simplă între limita superioară şi limita inferioară a intervalului respectiv. media aritmetică este acea valoare tipică ce poate substitui fiecare valoare individuală xi. n n Rezultă de aici formula de calcul a mediei aritmetice simple: x= i =1 ∑ xi n ... Fiind dată o caracteristică oarecare cu valorile x1. x2.numărul de valori distincte. k . În cazul în care fiecare valoare individuală xi are nu una.. În cazul în care unităţile nu sunt grupate pe variante. i = 1...Seriile de distribuţie a frecvenţelor 4. ci mai multe apariţii în cadrul colectivităţii analizate.frecvenţa (numărul de apariţii) al variantei xi... astfel încât: i =1 ∑ xi = n ⋅ x .

93 91. formula anterioară devine: i(%) i =1 ∑ ni k x = i =1 ∑ xi ⋅ n*(%) i 100 k Un exemplu de calcul al mediei aritmetice ponderate utilizând atât frecvenţele absolute.17 100.STATISTICA Se observă că indiferent de situaţie.2.2 Proprietăţile mediei aritmetice Media aritmetică prezintă mai multe proprietăţi.83 66. cât şi frecvenţele relative.00 395.96 ≈ 20 ani.33 4. Atunci când în locul frecvenţelor absolute folosim frecvenţe relative ( n* = ni ⋅100 ) .67 8.2. este prezentat în tabelul 4. studenţi xi ⋅ ni xin* ni(%) i (ni) 1 2 3 4 Vârsta (xi) 0 19 20 21 22 Total 5 16 2 1 24 95 320 42 22 479 20. Calculul vârstei medii într-o grupă de studenţi Tabelul 4.1. Vârsta medie este x = 479 / 24 = 19. .40 174.2. nivelul totalizat al caracteristicii se poate determina ca produs între nivelul mediu şi numărul unităţilor: i =1 k ∑ xi n = x ⋅ n în cazul datelor negrupate. Valoarea obţinută este foarte reprezentativă datorită omogenităţii colectivităţii.1 * Nr. nivelul totalizat se reprezintă grafic prin dreptunghi.84 4. Astfel exprimat.77 1333. i =1 ∑ xi ni = x ⋅ n în cazul datelor grupate.74 1995.

Seriile de distribuţie a frecvenţelor 1. unde: xmin . x1 = Κ = xi = Κ = x n = c . 4. x = c Demonstraţie: n⋅c =c n n n 2. xmax . Aşadar: x= i =1 ∑ xi n = i =1 ∑c n = xmin < x < xmax. Media oscilează în jurul grupei cu frecvenţa cea mai mare. În mod analog se demonstrează că x < x max .valoarea maximă. Într-un şir de valori egale. Media aritmetică este cuprinsă în intervalul de variaţie al caracteristicii pentru care se calculează. Demonstraţie: ∑ xi ⋅ ni ∑ ni x ⋅n ∑ xmin ⋅ ni unde Dar ∑ i i > ∑ ni ∑ ni ∑ xmin ⋅ ni = xmin ⋅ ∑ ni = x min ∑ ni ∑ ni x= Rezultă că x > xmin . 3. m Demonstraţie: . Suma algebrică a tuturor abaterilor individuale ale termenilor seriei de la media lor aritmetică este nulă: i =1 ∑ ( xi − x ) ⋅ ni = 0 .valoarea minimă a caracteristicii înregistrate. în cazul distribuţiei de frecvenţe. media aritmetică este egală cu acestea.

Dacă se divid toate frecvenţele cu o constantă g. Dacă se măresc (micşorează) toate valorile individuale din care se calculează media cu o constantă a.STATISTICA ∑ (xi − x )⋅ ni = ∑ xi ⋅ ni − ∑ x ⋅ ni = ∑ xi ⋅ ni − x ⋅ ∑ ni = ∑ xi ⋅ ni ⋅ n = x ⋅ n − x ⋅ n = 0 = ∑ xi ⋅ ni − ∑ i ∑ i i ∑ i i ∑ ni 5. media aritmetică se divide (multiplică) cu aceeaşi constantă h. noua lor medie aritmetică se măreşte (micşorează) cu aceeaşi valoare a. Dacă se împart (înmulţesc) toate valorile individuale cu o constantă h. ∑ ni ∑ ni ∑ ni ∑ ni 6. media aritmetică nu se modifică. Demonstraţie: ∑  xi   ⋅ ni 1 ∑ xi ⋅ ni x h = ⋅ = h ∑ ni h ∑ ni = h ⋅ ∑ xi ⋅ ni = h⋅ x ∑ ni ∑ (h ⋅ xi ) ⋅ ni ∑ ni 7. Demonstraţie: ∑ xi ⋅    1   g ⋅ ∑ xi ⋅ ni = =x 1  ni  ⋅ ∑ ni ∑  g g    ni g k  Dacă înlocuim constanta g cu suma frecvenţelor seriei  ∑ ni     i =1  obţinem formula de calcul a mediei aritmetice pe baza frecvenţelor relative: . Demonstraţie: ∑ (xi ± a ) ⋅ ni = ∑ xi ⋅ ni ± ∑ a ⋅ ni = x ± a ⋅ ∑ ni = x ± a .

Media produsului între două variabile independente este egală cu produsul mediilor celor două variabile: x⋅ y = x⋅ y Aceste proprietăţi sunt utilizate la calculul simplificat al mediei (5. x + y . 4. 6. 7) şi pentru verificarea corectitudinii calculului (1. este utilă aducerea şirului iniţial de valori într-o formă mai simplă. care să faciliteze calculele. Media aritmetică determinată pentru suma a două variabile independente este egală cu suma mediilor celor două variabile: x+ y = x+ y. în calculul mediei aritmetice pentru serii de distribuţie de frecvenţe pe intervale egale de grupare se poate utiliza următoarea formulă de calcul simplificat: . unde: x . 3).Seriile de distribuţie a frecvenţelor ∑ xi ⋅   ∑   ni  ∑ ni      ni  ∑ ni    = ∑ xi ⋅ n* i * ∑ ni = ∑ xi ⋅ n* i 8. y . 2. 9.media variabilei Z.2.3 Calculul simplificat al mediei aritmetice Întrucât în viaţa economică reală datele individuale din care se calculează media reprezintă deseori valori mari. Pentru aceasta.media variabilei X.media sumei celor două variabile. cu zecimale.

k . unităţi (ni ) 1 Centrul de interval (xi ) 2 xi − a h 3 xi − a ⋅ ni h 4 10 -14 14 . unde: xi .frecvenţa fiecărui interval i.2. . Un exemplu de aplicare a acestei formule se regăseşte în tabelul 4.numărul intervalelor de grupare.constantă egală cu valoarea centrului de interval care are frecvenţa maximă.18 18 . lei) 0 Nr.8 mil lei/unitate comercială. ni .2. h .22 22 .26 Total Date convenţionale 10 30 40 20 100 12 16 20 24 - -2 -1 0 1 - -20 -30 0 20 -30 Media vânzărilor este: x= − 30 ⋅ 4 + 20 = 18.STATISTICA x=  xi − a   ⋅ ni i =1  h  ∑ k i =1 ∑ ni k ⋅k + a .mărimea intervalului de grupare.centrele intervalelor de grupare (se calculează ca medie aritmetică simplă a capetelor fiecărui interval). Calcularea mediei vânzărilor lunare în unităţile comerciale dintr-o localitate Tabelul 4. 100 Aplicarea formulei obişnuite de calcul (media aritmetică ponderată) conduce la acelaşi rezultat. a .2 Vânzări (mil.2.

Substituind valorile individuale cu x   i media lor armonică ( xh ). Atunci când două variabile se află într-un raport de inversă proporţionalitate. 1 * ∑ ⋅ ni(%) i =1 xi k Fiind calculată din valorile inverse ale termenilor seriei..Seriile de distribuţie a frecvenţelor 4. iar pentru cealaltă media armonică. pentru una din variabile se va utiliza media aritmetică.n. . media armonică este mai mică decât cea aritmetică.. i = 1.. şi însumând termenii.4 Media armonică Media armonică a unui şir de valori xi. xh i =1 xi ∑ n De aici rezultă formula de calcul a mediei armonice simple: xh = n 1 ∑ i =1 xi n . se calculează din 1 valorile inverse   ale termenilor. În cazul seriilor de distribuţie de frecvenţe se utilizează media armonică ponderată: xh = i =1 k ∑ ni . media armonică devine: xh = 1 sau xh = 1 * ∑ ⋅ ni i =1 xi k 100 .2. ca valoare tipică a şirului. obţinem: 1 1 = n⋅ . k 1 ∑ ⋅ ni i =1 xi Dacă folosim frecvenţe relative.. dacă valorile seriei sunt pozitive.

STATISTICA Utilizarea mediei armonice este indicată în toate cazurile în care în cadrul colectivităţii analizate predomină valorile mici.1 . 1 ∑ ni ∑ ⋅ xi ⋅ ni xi Pentru a ilustra aplicarea acestei forme a mediei armonice. lei) 2 A B C D Total Date convenţionale 15.3).0 205.2. media armonică reprezintă mai bine aceste valori. după cum se poate demonstra cu uşurinţă: xh = ∑ xi ⋅ ni = ∑ xi ⋅ ni = x . Atunci când nu se cunosc frecvenţele absolute ni.00 - 58. Din evidenţa curentă cunoaştem preţul mediu şi valorea achiziţiilor pentru fiecare furnizor (tabelul 4.2.3 Valoarea achiziţiei (mil.50 24.25 26. ci produsele xini. considerăm cazul unui agent economic care îşi procură materia primă de la patru furnizori diferiţi. media armonică poate fi calculată cu relaţia: xh = i =1 k ∑ xi ⋅ ni . Furnizor 0 Preţ mediu (mii lei/kg) 1 Tabelul 4.2 62. Fiind mai mică decât media aritmetică.75 21. În practică. k 1 ∑ ⋅ xi ⋅ ni i =1 xi În acest caz. media armonică este egală cu media aritmetică.4 46.5 38. media armonică este frecvent folosită la calculul preţului mediu şi al indicelui mediu al preţurilor.

n i =1 de unde obţinem formula de calcul a mediei pătratice simple: xp = i =1 ∑ xi2 n n .5 + ⋅ 38 15.4 + ⋅ 46 .2 + ⋅ 62 .25 26 4.75 21. într-un şir de n termeni şi se însumează termenii. Dacă se înlocuieşte fiecare valoare individuală ridicată la pătrat ( xi2 ) cu media 2 pătratică x p . rezultă: 2 ∑ xi2 = n ⋅ x p . Media pătratică ponderată este: xp = i =1 ∑ xi2 ⋅ ni i =1 k ∑ ni k . 1 1 1 1 ⋅ 58. formula mediei pătratice ponderate devine: xp = i =1 ∑ xi2 ⋅ n* i k .1 = 20 .5 Media pătratică Se calculează din termenii seriei ridicaţi la pătrat.726 mii lei/kg.2. Folosind frecvenţe relative (ni* ) exprimate prin coeficienţi.Seriile de distribuţie a frecvenţelor Vom determina preţul mediu al materiei prime achiziţionate de agentul economic utilizând formula anterioară de calcul a mediei armonice: xh = 205.5 24 .

De exemplu. cu o medie de 284 milioane lei.. i = 1.. cum este cazul calculului abaterii medii pătratice (vezi paragraful 4. de aceea. ci media geometrică...4. se obţine: x1 ⋅ x2 ⋅ . De asemenea. neinfluenţată de semnul diferit al abaterilor. folosirea acestui tip de medie este justificată îndeosebi în situaţiile în care predomină valorile mari în cadrul colectivităţii pentru care se calculează media. ⋅ x g . cât şi negative.6 Media geometrică Dacă se înmulţesc toţi termenii unei serii statistice xi. 4. de unde: n ∏ xi = x g . i =1 n Pentru seriile de distribuţie de frecvenţe se aplică formula de calcul a mediei geometrice ponderate: x g = ∑ ni ∏ xi ni . mărimea profitului anual obţinut de agenţii economici dintr-un anumit domeniu de activitate se încadrează între 48 şi 576 milioane lei. este indicată atunci când se acordă o atenţie deosebită valorilor mari. media pătratică este întotdeauna mai mare decât cea aritmetică.. ⋅ x n = x g ⋅ x g ⋅ .2) şi atunci când valorile caracteristicii sunt atât pozitive. conform proprietăţilor mediei)...2. Dacă dorim să aflăm care este abaterea medie a agenţilor economici de la acest profit mediu nu vom calcula media aritmetică (ar fi nulă. i =1 k ..STATISTICA Fiind calculată din valorile individuale ridicate la pătrat. n şi se înlocuieşte fiecare valoare individuală cu media lor geometrică x g . i =1 n Rezultă formula de calcul a mediei geometrice simple: x g = n ∏ xi .

În funcţie de particularităţile seriei statistice analizate. dar este superioară celei armonice. deoarece între indici este posibilă relaţia de produs: xg = n ∏x i =1 n i = 1. Media geometrică este indicată şi în cazul valorilor care au tendinţă de creştere în progresie geometrică. Tipul de medie cel mai utilizat în practică este media aritmetică. formula de calcul a mediei geometrice simple devine: lg x g = i =1 ∑ lg xi n n În cazul mediei geometrice ponderate. Logaritmând.4 %. cum este cazul indicilor de dinamică. Folosirea mediei geometrice este obligatorie în situaţiile în care între termenii seriei nu este posibilă însumarea. . se mai pot calcula alte medii.15 = 1. Vom calcula media geometrică a celor doi indici de dinamică semestriali. De exemplu.08 ⋅ 1. prin logaritmare obţinem: lg x g = i =1 ∑ ni ⋅lg xi i =1 k ∑ ni k . cifra de afaceri a unui agent economic creşte cu 8 % în primul semestru al anului 2000 şi cu 15 % în cel de-al doilea semestru. Media geometrică este mai mică decât media aritmetică. Reprezintă mai bine valorile mici ale caracteristicii. ci produsul.Seriile de distribuţie a frecvenţelor Calculul acestui tip de medie se poate realiza cu ajutorul logaritmilor.114 Ritmul mediu de creştere pe cele două semestre a fost 11. Media aritmetică nu este indicată în acest caz (mărimi neînsumabile direct). Calculul nu este posibil dacă există valori negative sau nule.

candidat admis/respins. pornind de la distribuţia salariaţilor unei firme după numărul anilor de şcolarizare. plan de producţie realizat/nerealizat. .volumul colectivităţii statistice. structurându-se colectivitatea în unităţi cu valoarea caracteristicii sub/peste medie.2. În cazul unei variabile calitative se consideră o modalitate ca fiind forma directă de manifestare a caracteristicii iar toate celelalte modalităţi ca opusul formei directe de manifestare a caracteristicii.variantă opusă. răspunsul afirmativ. De exemplu. Conform notaţiilor din tabelul 4. • "0" . De exemplu.variantă pozitivă. În practică.frecvenţa (numărul) unităţilor care au varianta afirmativă. cele două variante ale caracteristicii alternative pot fi codificate cu: • "1" . N .2. Alteori.STATISTICA 4. orice variabilă poate fi exprimată sub formă alternativă dacă se împarte colectivitatea în două grupe după un anumit criteriu. N N unde: M . produs bun/rebut.7 Media caracteristicii alternative Caracteristica alternativă înregistrează numai două variante posibile de manifestare. persoană căsătorită/necăsătorită etc. în locul mediei se alege o valoare semnificativă a caracteristicii. i =1 k ∑ ni unde k = 2. formula anterioară devine: p= 1 ⋅ M + 0 ⋅ (N − M ) M = .4. se poate trece la distribuţia alternativă de tipul persoane cu/fără studii superioare. Pentru calculul mediei aritmetice a caracteristicii alternative utilizează formula mediei ponderate: x= i =1 k ∑ xi ⋅ ni . În vederea satisfacerii necesităţilor de calcul. răspuns negativ. Pentru variabilele numerice cel mai frecvent se utilizează criteriul mediei.

ceea ce afectează în mare măsură reprezentativitatea mediei. Variante 0 xi 1 Tabelul 4. Uneori. care arată ponderea unităţilor care îndeplinesc o anumită condiţie în total colectivitate. rezultând distribuţii asimetrice la dreapta sau la stânga. unităţile seriei au tendinţa de a se concentra la una din extremităţile seriei.Seriile de distribuţie a frecvenţelor După cum rezultă din această relaţie.3 INDICATORI DE POZIŢIE Din punctul de vedere al analizei statistice.4 ni 2 • afirmativ • negativ Total 1 0 - M N-M N 4. Alteori. mai puţin semnificative. • cuartilele. Pentru aceasta se calculează indicatorii medii de poziţie (de structură): • mediana. valorile extreme ale seriei sunt excesiv de îndepărtate de centrul seriei. • modul. . • decilele. este important şi modul în care sunt repartizate aceste valori. pe lângă informaţiile cu caracter sintetic privind valorile individuale. ceea ce le face sensibile la valorile extreme. Mediile se calculează pe baza tuturor valorilor individuale ale seriei.2. media caracteristicii alternative este o mărime relativă de structură.

suma frecvenţelor intervalelor anterioare celui median. în mod convenţional. jumătate sunt mai mari sau egali.3.1 Mediana Mediana este acea valoare a unei serii statistice ordonate crescător sau descrescător. ca medie aritmetică simplă a celor două valori din centrul seriei. Pentru seriile simple. Aşadar. Mediana este o mărime care depinde în primul rând de numărul termenilor. În cazul în care distribuţia de frecvenţe s-a obţinut prin gruparea pe intervale. hme . Pentru seriile de distribuţie de frecvenţe. nme . mediana se determină cu ajutorul următoarei formule: grupă a cărei frecvenţă cumulată este prima mai mare decât i =1 ∑ ni + 1 k  me−1 1 k ⋅  ∑ ni + 1 − ∑ ni  2   i =1 . calculul medianei parcurge următoarele etape: a) Se identifică grupa în care este inclusă mediana care este acea . dacă numărul termenilor este par. care împarte seria în două părţi egale.mărimea intervalului median.STATISTICA 4.frecvenţa intervalului median. me – indexul intervalului median.valoarea medianei. . 2 b) Se determină valoarea efectivă a medianei ţinând cont de modalitatea de grupare a datelor. Me = x0 + hme ⋅  i =1 nme unde: Me . x0 . mediana este termenul din mijloc (dacă seria are număr impar de termeni) sau se determină. mediana este valoarea din centrul seriei: jumătate din termeni sunt mai mici sau egali cu mediana. Mediana se exprimă în unitatea de măsură a caracteristicii respective. me −1 i =1 ∑ ni .limita inferioară a intervalului median.

3.5 .Seriile de distribuţie a frecvenţelor Gruparea comunelor după numărul locuitorilor în anul 1994 Tabelul 4. pag.1999 2000 . Aplicăm în continuare formula de calcul a medianei: Me = 1999. 2 Cumulând succesiv frecvenţele din coloana 2 a tabelului 4.4999. 1678 Rezultă că jumătate din comunele ţării au o populaţie sub 3681 locuitori.. până la obţinerea unui număr superior lui 1345. Pentru calcularea medianei este necesară redefinirea intervalului median (1999. anul 1995.5) trebuie să se afle în intervalul 2000 . De exemplu. 2 .5-4999. jumătate au o populaţie mai numeroasă.1.3.9999 10000 şi peste Total 40 364 1678 575 31 2688 1000 1000 3000 5000 5000 - 1 1 3 5 5 - Sursa: Anuarul statistic al României.5 + 3000 ⋅ 1344. se poate determina valoarea mediană a numărului de locuitori pe o comună.1 Număr locuitori Număr Mărimea Frecvenţe hi comune intervalulu k i = reduse 1000 (ni) i (hi) ni nri = 4 ki 40 364 560 115 6 - 0 1 2 3 sub 999 1000 . valoarea medianei este chiar varianta a cărei frecvenţă cumulată este prima mai mare decât 1 (∑ ni +1) .5 − ( 40 + 364 ) ≅ 3681 locuitori.4999 5000 . constatăm că mediana (termenul cu numărul 1344.92.5).1. utilizând datele din tabelul 4. Se determină întâi locul medianei: locul me = 2688 + 1 = 1344.3. În cazul datelor grupate pe variante.

Cuartilele sunt 3 valori care împart seria statistică în 4 părţi egale ( Q1 ÷ Q 3 ) . Aceşti indicatori sunt utilizaţi îndeosebi pentru seriile pronunţat asimetrice. Mediana poate fi determinată şi prin metoda grafică. decilele şi centilele. decile. Din acelaşi grup mai fac parte: cuartilele. Centilele sunt mărimile care împart seria statistică în 100 de părţi egale (C1 ÷C99) . mediana nu este influenţată de valorile extreme ale seriei.STATISTICA Spre deosebire de medie. Decilele sunt mărimile care împart seria statistică în 10 părţi egale (D1 ÷ D9 ) . centilele se calculează doar pentru seriile statistice cu număr mare de grupe şi cu amplitudine mare a variaţiei. care este de fapt mediana: lQ2 = Locul celei de a treia cuartile Q3 (cuartila superioară): lQ3 = .3. 4. Cuartilele. Proiecţia pe axa Ox a punctului de intersecţie a curbelor frecvenţelor cumulate crescător şi descrescător reprezintă mediana. mai ales. 2 4 3 (∑ ni + 1) . ca şi mediana. Locul primei cuartile Q1 (cuartila inferioară): lQ1 = 1 (∑ ni + 1) . se determină pe baza valorilor ordonate ale seriei statistice. Prima operaţie constă în localizarea celor trei cuartile. Acestea descriu poziţia anumitor termeni în cadrul seriei statistice. centile Mediana face parte din familia cuantilelor. Decilele şi. 4 Locul celei de a doua cuartile Q2.2 Cuartile. 4 2 (∑ ni + 1) = 1 (∑ ni + 1) . de aceea ea poate înlocui cu succes media atunci când apar valori aberante.

25 − (40 + 364) ≅ 2479 locuitori.suma frecvenţelor intervalelor care preced intervalul cuartilei inferioare.25 4 Rezultă că Q1 este localizată în intervalul (1999.3. 1678 Acest rezultat ne arată că 25 % din comune au o populaţie sub 2479 locuitori. Locul cuartilei inferioare: lQ1 = 2688 + 1 = 672. Utilizând datele din tabelul 4.5 + 3000 ⋅ 672 .5).Seriile de distribuţie a frecvenţelor Calculul efectiv al cuartilelor se face prin interpolare în cadrul intervalului în care a fost localizată fiecare cuartilă. Q1 = x0 + d Q1 ⋅  i =1 nQ1 Q2 = Me . ⋅ nQ 3 unde: x0 . d Q3 .limita inferioară a intervalului în care se află Q1. respectiv superioară. vom calcula în continuare valoarea cuartilei inferioare şi a celei superioare. Q3 = x0 + d Q3  q3 −1 3 k ⋅  ∑ ni + 1 − ∑ ni  4  i =1   i =1 .1. conform relaţiilor:  q1 −1 1 k ⋅  ∑ ni + 1 − ∑ ni  4   i =1 .5-4999. iar 75 % au o populaţie superioară acestui nivel. Valoarea cuartilei inferioare: Q1 = 1999. q1 −1 i =1 ∑ ni . q3 −1 i =1 ∑ ni . respectiv Q3. respectiv Q3. . d Q1 .mărimea intervalului în care se situează cuartila inferioară. nQ3 .frecvenţa intervalului în care se află Q1. nQ1 . respectiv superioare.

..STATISTICA Locul cuartilei superioare: Q3 = 3 ⋅ (2688 + 1) = 2016. d j −1 i =1 ∑ ni .5 + 3000 ⋅ 2016. j = 1. aceste rezultate arată că jumătate din comunele ţării au între 2479 şi 4883 locuitori. d . fiecare parte deţinând 10% din numărul unităţilor colectivităţii. Un sfert din comune depăşesc 4883 de locuitori.mărimea intervalului în care se află decila j. 9. Valoarea cuartilei superioare: Q3 = 1999. Decilele se determină prin intermediul unor operaţii asemănătoare celor folosite pentru mediană şi cuartile..frecvenţele intervalelor ce preced intervalul în care se află decila j . 4 Q3 aparţine intervalului (1999. D j = x0 + d ⋅ nD j unde: x0 . Decilele sunt în număr de nouă şi împart seria statistică ordonată în 10 părţi egale. Locul unei decile oarecare Dj este dat de relaţia: lD j =  j k ⋅  ∑ ni + 1 . Decila a cincea este mediana. n D j .5).5-4999..75 .   10  i =1  Valoarea decilei Dj:  d j −1 j k ⋅  ∑ ni + 1 − ∑ ni  10  i =1   i =1 . Totodată.frecvenţa intervalului în care se află decila j.75 − 404 ≅ 4883 1678 locuitori. în timp ce trei sferturi din comune au sub 4883 locuitori.limita inferioară a intervalului în care se află decila j.

apoi se determină valoarea efectivă a modulului. Din cele două vârfuri superioare ale coloanei respective se trasează diagonale spre punctele de intersecţie cu coloanele alăturate. El corespunde aşadar frecvenţei maxime. ∆1 + ∆2 ∆1 = nm0 − nm0 −1 . hm0 . nm0 . putem calcula numărul cel mai frecvent de locuitori într-o comună cu ajutorul modulului. Determinarea modulului se poate face şi pe cale grafică.3 Modulul Modulul (modul sau dominanta) reprezintă valoarea cel mai frecvent întâlnită în cadrul colectivităţii statistice analizate.frecvenţa intervalului modal.Seriile de distribuţie a frecvenţelor 4.modulul. Valoarea modulului este: M 0 = 1999.1. Proiecţia pe Ox a punctului de intersecţie a celor două diagonale este valoarea modulului.frecvenţa intervalului anterior.limita inferioară a intervalului modal. Intervalul modal este determinat pe baza frecvenţelor reduse (vezi coloana 4) deoarece seria are intervale neegale şi este intervalul 1999.mărimea intervalului modal. În seriile de intervale se stabileşte întâi intervalul modal (cel care are frecvenţa maximă). nm0 −1 . modulul este proiecţia pe axa Ox a vârfului poligonului frecvenţelor.5 + 3000 ⋅ 1314 = 3630 locuitori. ∆2 = nm0 − nm0 +1 . cu relaţia: Mo = x0 + hm0 ⋅ ∆1 . Pentru seriile de repartiţie pe variante. x0 . 2417 . modulul se localizează în intervalul corespunzător coloanei cu frecvenţă maximă. Se exprimă în unitatea de măsură a caracteristicii analizate.5 – 4999.5.3..frecvenţa intervalului următor. unde: Mo . Pentru seriile de repartiţie de frecvenţe. Folosind datele din tabelul 4. nm0 +1 .3. ceea ce îl face uşor de identificat în cazul seriilor simple.

Ele coincid în cazul unei distribuţii perfect simetrice. Dacă seria prezintă două sau mai multe frecvenţe maxime nealăturate şi. mediana şi modulul caracterizează tendinţa centrală şi forma de variaţie a caracteristicii. o fabrică de încălţăminte care doreşte să-şi fixeze structura producţiei în funcţie de mărimile cele mai solicitate. Dacă datele observării sunt înregistrate nediferenţiat în cadrul populaţiei. De exemplu. valoarea modului este chiar varianta cu frecvenţa cea mai mare. între medie. face un studiu al pieţei prin sondaj. în anumite situaţii. iar mediana va reprezenta mai bine o serie cu valori extreme excesiv de distanţate de restul valorilor. distribuţia de frecvenţe va avea două valori modale: cea mai mică reprezintă numărul la pantof preponderent la femei. În cazul unei serii de distribuţie a frecvenţelor obţinută prin gruparea pe variante.STATISTICA ∆1 = 1678 − 364 = 1314 ∆2 = 1678 − 575 = 1103 . spunem că seria este bimodală. Media. iar cea mai mare indică mărimea cu frecvenţă maximă la bărbaţi. întrucât nu includ în calcul toate valorile individuale. care impune separarea unităţilor colectivităţii în două distribuţii de frecvenţe. se defineşte un interval modal prin reunirea celor două intervale alăturate fără a putea calcula valoarea exactă a modului. Alegerea indicatorilor trebuie să corespundă esenţei fenomenului şi particularităţilor distribuţiei analizate. Dacă seria prezintă două frecvenţe maxime identice alăturate. Pentru distribuţiile moderat asimetrice. neegale. mediană şi modul există următoarea legătură: x − Mo = 3 ⋅ x − Me ( ) Gradul de precizie al medianei şi modulului este mai redus decât al mediei. trimodală etc. posibil. şi se calculează toate valorile modale. Cu toate acestea. De exemplu. Distribuţiile bimodale (cu două frecvenţe maxime) reprezintă o situaţie rar întâlnită. modulul va fi preferat mediei ca măsură a taliei la confecţii. ele pot înlocui media. .

ca indicator al tendinţei centrale. direcţi şi indirecţi. 4. • caracterizarea formei de repartiţie şi a variaţiei unei caracteristici. utilizând numai două valori simultan. esenţiali sau întâmplători. cu grad redus de variaţie. Acest lucru se întâmplă atunci când colectivitatea pentru care este calculată media prezintă o mare variaţie a valorilor individuale înregistrate. După complexitate şi numărul termenilor individuali implicaţi. • compararea seriilor de repartiţie. variantele individuale ale caracteristicii au valori apropiate de medie. Pentru a verifica măsura în care se abat variantele de la medie se calculează indicatorii variaţiei. Media este reprezentativă pentru o colectivitate statistică doar dacă este calculată din mărimi omogene.1 Indicatorii simpli ai variaţiei Aceşti indicatori încearcă să caracterizeze gradul de împrăştiere a termenilor unei serii statistice.4 INDICATORII VARIAŢIEI Fenomenele şi procesele economice au un grad ridicat de complexitate şi variabilitate datorită multitudinii de factori. • aplicarea testelor statistice. • testarea grupării corecte a datelor. media. . Indicatorii variaţiei asigură: • verificarea gradului de omogenitate a colectivităţii şi implicit a reprezentativităţii mediei. Se determină sub forma unor mărimi absolute sau relative (prin raportare la media seriei). • separarea modului de acţiune a factorilor esenţiali de cei întâmplători.Seriile de distribuţie a frecvenţelor 4. indicatorii variaţiei sunt incluşi în două categorii: simpli şi sintetici. utilizarea exclusivă a mediei în acest caz creează o imagine eronată a fenomenului analizat. poate să nu fie întotdeauna expresia esenţei fenomenului. Din această perspectivă.4. În acest caz. care le influenţează.

4.STATISTICA Amplitudinea absolută a variaţiei reprezintă diferenţa dintre valorile extreme ale caracteristicii înregistrate.4 4. .1 Sursa: Anuarul statistic al României.5 5.A. anul 1995.8 8. Se determină cu formula: A = xmax − xmin .7 7.9 12. Cehă Rep.2 10.5 10.0 16.7 5.61 5.1 Ţara 0 Rata şomajului (%) 1 Austria Belgia Bulgaria Canada Rep. Rata şomajului pe ţări* Tabelul 4.5 11.7 8.2 3.5 2.4 11.5 15.9 16.8 12.8 13. Coreea Danemarca Elveţia Finlanda Franţa Fosta RDG Fosta RFG Italia Japonia Norvegia Olanda Polonia Regatul Unit România *) Spania S. unde: xmax.2 11. Suedia Turcia Ungaria * Notă: 1994 6.6 6. xmin .U.5 17.valoarea cea mai mare.5 2. respectiv cea mai mică înregistrată de caracteristica statistică în cadrul seriei respective.

pentru a aprecia mai bine ce reprezintă distanţa valorilor extreme. Amplitudinea relativă a variaţiei permite comparaţii între serii statistice diferite.5 . De aceea.media aritmetică a caracteristicii. care au fost sistematizate pe intervale de grupare (tabelul 4.1.4. se calculează amplitudinea relativă a variaţiei.6 şi amplitudinea relativă a variaţiei: A% = Acest rezultat arată că distanţa între capetele seriei reprezintă 156.6% 24 15 ⋅ 100 = 156 . Unitatea de măsură este cea a caracteristicii pentru care se calculează. În cazul în care variaţia caracteristicii este sistematizată pe intervale de grupare. amplitudinea variaţiei este: A = 17.25% .Seriile de distribuţie a frecvenţelor Considerând seria statistică prezentată în tabelul 4. . amplitudinea absolută a variaţiei se calculează ca diferenţă între limita superioară a ultimului interval şi limita inferioară a primului interval: A = x L − xl Amplitudinea variaţiei prezintă dezavantajul utilizării exclusive a valorilor extreme care pot fi depărtate de masa variantelor caracteristicii. x unde: x . cu formula: A% = A ⋅ 100 . Se exprimă în procente. 9 .2) pentru a facilita calculele.4. comparativ cu ceea ce este tipic.25% din medie.5 = 15%. o valoare relativ ridicată. se poate determina rata medie a şomajului: x= 231 = 9 .2. Utilizând datele referitoare la rata şomajului pe ţări. caracteristic pentru variabila înregistrată.

96 34.11.33 -27.6 188.17 35.5.5 14.5 .4.8.8 455.4 6. .6 10.STATISTICA Tabelul 4.5 8.17.6 la un maxim de 6.5 Total 6 4 6 3 5 24 4 7 10 13 16 50 24 28 60 39 80 231 -5. conform relaţiei: d i = xi − x .5 . _ Abaterile individuale pot fi pozitive sau negative şi se măsoară cu aceeaşi unitate de măsură ca şi caracteristica analizată.5 .4 10.4 2. Abaterile individuale relative (di%) se calculează raportând abaterile absolute la nivelul mediu al caracteristicii: d i(%) = di x _ ⋅ 100 .14.68 204.5 11. ţări şomajului (%) (ni) 0 1 xi 2 xi ni 3 xi − x 4 di% 5 xi − x ⋅ ni ( xi −x)2 ⋅ ni 6 7 2.4 3.6 0.4 - -58. chiar dacă este comparată cu media.0 0.6 -2.) : dmax + = xmax .4. reprezintă o informaţie insuficientă privind gradul de împrăştiere.42 66.= xmin . Semnificative pentru gradul de împrăştiere a termenilor sunt îndeosebi abaterea maximă pozitivă (dmax + ) şi negativă (dmax .5 .67 - 33.x . În exemplul considerat (tabelul 4.2 Rata Nr.2 27.5 5. valori relativ mari dacă le comparăm cu media.08 4.2) abaterile individuale variază de la un minim de -5.5 .4.2 32 88.x dmax .64 Întrucât distanţa valorilor extreme. se calculează şi abaterile individuale absolute (di) ale termenilor seriei (xi) de la medie ( x ).

Toţi indicatorii prezentaţi anterior au dezavantajul că oferă informaţii parţiale. luate în valoare absolută. d = ∑ xi − x ⋅ n* i i =1 .2 Indicatorii sintetici ai variaţiei Aceşti indicatori reunesc toate abaterile individuale ale termenilor seriei într-o mărime unică.Seriile de distribuţie a frecvenţelor Şi în acest caz ne interesează abaterile extreme: d max +(%) = d max + x ⋅ 100 ⋅ 100 d max −(%) = d max − x Se exprimă în procente (tabelul 4. Modalitatea concretă în care se realizează această sinteză poate fi diferită.pentru serii de frecvenţe relative exprimate prin coeficienţi. 4. n d = i =1 ∑ xi − x ⋅ ni i =1 k ∑ ni .pentru serii simple. Pentru a exprima variaţia totală sunt necesari indicatorii sintetici. de aceea există mai multe tipuri de indicatori.4.4.pentru serii cu frecvenţe absolute. conform relaţiei: d = i =1 k ∑ xi − x n . ale tuturor termenilor seriei statistice de la media lor.2). Abaterea medie liniară reprezintă o medie aritmetică. simplă sau ponderată. k . limitate privind gradul de împrăştiere a valorilor caracteristicii. Acest indicator arată dimensiunile relative ale abaterilor individuale comparativ cu ceea ce este caracteristic pentru colectivitatea respectivă (media). calculată din abaterile individuale. în măsură să exprime sintetic variaţia totală.

STATISTICA

d=

∑x
i =1

k

i

− x ⋅ n *(%) i 100

- pentru serii de frecvenţe relative exprimate procentual.

În formula de calcul a abaterii medii liniare abaterile individuale sunt considerate în valoare absolută, deoarece, în caz contrar, suma lor ponderată ar fi nulă, conform proprietăţilor mediei aritmetice. Pentru exemplul considerat (tabelul 4.4.2.), abaterea medie liniară este: _ 88,6 = 3,69% . d= 24 Aşadar, rata şomajului în ţările considerate se abate în medie cu 3,69 unităţi de la medie. Având în vedere valoarea mediei (9,6), abaterea este semnificativă. Deoarece, în analiza variaţiilor individuale, mai importante sunt abaterile mari în valoare absolută, media pătratică este cea mai indicată. Abaterea medie pătratică se calculează ca medie pătratică, simplă sau ponderată, a abaterilor individuale absolute ale termenilor seriei de la media lor aritmetică:
i =1
k

σ=

∑ ( xi − x ) 2
n
- pentru serii simple;
_

n

_

σ=

i =1

∑ ( x i − x ) 2 ⋅ ni
i =1

∑ ni

k

- pentru serii de frecvenţe absolute;

σ = ∑ xi − x ⋅ n* i
i =1

k

(

)2

- pentru serii de frecvenţe relative exprimate sub formă de coeficienţi;

σ=

i =1

k 2 ∑ (xi − x ) ⋅ n*(%) - pentru serii de frecvenţe relative i

exprimate procentual.

100

Seriile de distribuţie a frecvenţelor

Se exprimă în unitatea de măsură a caracteristicii, ceea ce o face improprie comparaţiilor. Abaterea medie pătratică este întotdeauna mai mare decât abaterea medie liniară, deoarece media pătratică este întotdeauna mai mare decât cea aritmetică. Această relaţie de inegalitate se poate verifica pentru exemplul considerat:

σ=

455,64 = 4 ,36% deci σ > d 24

Raportul dintre abaterea medie liniară şi abaterea medie pătratică se apropie de 0,8 în cazul seriilor care tind către repartiţia normală. Pentru seria statistică analizată în acest exemplu, raportul este 0,846. Cât de însemnată este abaterea medie, numai comparaţia cu media o poate arăta. Această comparaţie se realizează prin intermediul coeficientului de variaţie (v), care se calculează ca raport între abaterea medie pătratică şi media aritmetică:
v=

σ
x
_

⋅ 100.

O altă variantă de calcul:
v= d x
_

⋅ 100.

Se exprimă în procente, ceea ce face posibilă comparaţia între serii statistice de variabile statistice exprimate în unităţi de măsură diferite. Întrucât anumite serii statistice pot fi mai bine reprezentate de mediană sau modul, în numitorul formulei de calcul al coeficientului de variaţie media poate fi înlocuită prin mediană sau modul. Cu cât valoarea coeficientului de variaţie este mai apropiată de zero cu atât seria statistică este mai omogenă şi, în consecinţă, media este mai reprezentativă pentru colectivitatea respectivă. În literatura de specialitate se avansează nivelul de 35 - 40 % ca limită maximă admisibilă pentru coeficientul de variaţie. În situaţia unor valori mai mari ale indicatorului, media nu mai este suficient de reprezentativă. Soluţia care se impune este împărţirea colectivităţii în subgrupe omogene.

STATISTICA

În exemplul nostru:
v= 4,36 ⋅ 100 = 45,4% 9 ,6

Aşadar, colectivitatea considerată în acest exemplu este eterogenă. Ţările incluse în analiză (vezi tabelul 4.4.1) sunt foarte diferite din punct de vedere al nivelului de dezvoltare şi al sistemului economic specific, ceea ce determină diferenţe mari în mărimea indicatorului considerat. Se poate încerca o grupare în: ţări dezvoltate, ţări mai puţin dezvoltate şi fostele ţări socialiste. Dispersia este un alt indicator sintetic al variaţiei care se calculează ca medie aritmetică, simplă sau ponderată, a pătratelor abaterilor termenilor faţă de media lor:
i =1

σ2 =

∑ ( xi − x ) 2
n
k _

n

_

- pentru serii simple;

σ2 =

i =1

∑ ( x i − x ) 2 ⋅ ni
i =1 k

∑ ni

k

- pentru serii de frecvenţe absolute;

σ 2 = ∑ xi − x ⋅ n* i
i =1
k

(

)2

- pentru serii de frecvenţe relative exprimate sub formă de coeficienţi;

σ 2 = i =1

∑ (xi − x )

2

⋅ n*(%) i

100

- pentru serii de frecvenţe relative exprimate procentual.

Dispersia are acelaşi conţinut informaţional ca abaterea medie pătratică, reprezentând practic pătratul acesteia.

Seriile de distribuţie a frecvenţelor Efectuând câteva transformări simple. În exemplu considerat anterior dispersia este: σ 2 = 18. Proprietăţile dispersiei • Atunci când se măreşte (micşorează) fiecare termen al seriei cu o constantă “a” valoarea dispersiei nu se modifică. Demonstraţie∗: ∑ [(xi − a ) − (x − a )] ⋅ ni 2 i ∑ ni i = ∑ (xi − a − x + a ) ⋅ ni 2 i ∑ ni i = ∑ (xi − x ) ⋅ ni 2 i ∑ ni i =σ2 * Se folosesc proprietăţile mediei .pentru serii simple. se poate stabili formula de calcul a dispersiei prin metoda momentelor iniţiale: σ 2 = i =1 k ∑ xi n n 2 − x 2 . Nu are unitate de măsură.pentru serii de frecvenţe relative exprimate sub formă de coeficienţi.985. 2 σ2 = ∑x i =1 k ⋅ n* − x i 2 .pentru serii de frecvenţe absolute. σ2 = i =1 2 ∑ xi ⋅ ni i =1 ∑ ni 2 i k − x .

• Dispersia faţă de o constantă “a” este mai mare decât dispersia calculată faţă de medie cu pătratul diferenţei dintre medie şi constanta respectivă: 2 2 σ a = σ x + ( x − a )2 . h ∑ ni ∑ ni 2 ( ) i i Analog se poate demonstra proprietatea în cazul multiplicării termenilor cu o constantă. 2 σ x . . _ Demonstraţie**: 2 σa = = ∑ (xi − x )   ∑ (xi − x ) ∑ ni 2 ∑ ( xi − a ) = ∑ ni 2 2 ⋅ ni 2 + 2 ⋅ xi − x ⋅ x − a + x − a  ⋅ ni   = ∑ fi ( ∑ [(xi − x ) + (x − a )] = ∑ ni 2 ⋅ ni = )( ) ( ) ⋅ ni +0+ (x − a )2 ⋅ ∑ ni = σ 2 + (x − a )2 ∑ ni x ** Se va folosi următoarea proprietate a mediei: suma algebrică a tuturor abaterilor termenilor seriei de la medie este nulă.dispersia calculată faţă de medie. Demonstraţie∗: x x 2 1 ⋅ x − x ⋅ ni ∑  i −  ⋅ ni  h h 2 ∑ i σ2 i  h  i = = 2 .STATISTICA • Dacă se înmulţesc (împart) toţi termenii seriei cu o constantă “h”.dispersia calculată faţă de o constantă a. dispersia se multiplică (divide) de h2 ori. 2 unde: σ a .

Calcularea dispersiei pentru seria statistică prezentată anterior. utilizând formula de calcul simplificat (tabelul 4. _ Această formulă se utilizează în cazul seriilor cu intervale de variaţie egale.3 ni 1 xi − a h 2  xi − a    ⋅ ni  h  3 2 4 7 10 13 16 Total 6 4 6 3 5 24 -2 -1 0 1 2 - 24 4 0 3 20 51 . Este recomandată alegerea unei constante "a" egală cu mărimea centrului de interval care corespunde frecvenţei maxime şi a unei constante "h" de mărimea intervalului de grupare.Seriile de distribuţie a frecvenţelor Consecinţă: 2 2 σ x = σ a − ( x − a ) 2.4.4. 24 Tabelul 4.) conduce la următorul rezultat: σ2 = xi 0 51 2 ⋅ 3 − ( 9.3. Formula uşurează calculele pentru seriile cu valori mari ale caracteristicii.6 − 10 )2 = 18.97. _ Ultimele două proprietăţi se regăsesc în formula de calcul simplificat al dispersiei:  xi − a   ⋅ ni i =1  h  k 2 2 σx = ∑ i =1 ∑ ni k ⋅ h 2 − ( x− a )2 .

Abaterea este cu atât mai însemnată cu cât mărimea intervalelor de grupare este mai mare.. ca în figura* următoare: f x1 x2 Uneori. Analiza indicatorilor tendinţei centrale şi a indicatorilor variaţiei trebuie să se facă în mod combinat. două serii statistice pot avea aceeaşi dispersie.mărimea intervalelor de grupare egale. 1990. . 69. Economica. Statistique descriptive. Interpretarea lor izolată poate conduce la erori. seriile statistice au aceeaşi medie. De exemplu. 12 unde: h . Paris. pag. Sheppard propune următoarea relaţie: 2 σ 2 = σ calculat − h2 . dar medii diferite.STATISTICA Gruparea datelor statistice pe intervale de variaţie uşurează în mare măsură calculul indicatorilor de variaţie dar determină diferenţe faţă de mărimea indicatorilor corespunzători calculaţi pe baza datelor negrupate. dar dispersii diferite ca în această figură*: f x x * După: Bernard Py. În situaţii de acest fel se recomandă folosirea formulei lui Sheppard pentru a corecta mărimea dispersiei.

) se calculează ca pondere a unităţilor care îndeplinesc o condiţie (variantă afirmativă) în total colectivitate: p= M .numărul total al unităţilor statistice din colectivitate. N . Media caracteristicii alternative (vezi paragraful 4.7.2. indicatorii statistici calculaţi pentru caracteristica alternativă au o formă particulară. respectiv 0. Numărul unităţilor care nu îndeplinesc condiţia (varianta negativă) este N-M.Seriile de distribuţie a frecvenţelor DISPERSIA CARACTERISTICII ALTERNATIVE Caracteristica alternativă este o variabilă care admite numai două variante (DA/NU) codificate cu 1. Media caracteristicii alternative este o mărime relativă de structură: frecvenţă relativă. Din această cauză.numărul de apariţii a variantei afirmative a caracteristicii. iar ponderea lor este: q= N −M M = 1− = 1− p N N Frecvenţele absolute şi relative ale variantelor sunt prezentate în tabelul următor: Variantele caracteristicii alternative 0 Valoarea caracteristicii alternative 1 Frecvenţe absolute (ni) 2 Tabelul 4. N unde: M .4 Frecvenţe relative (ni*) 3 Afirmativ Negativ Total 1 0 - M N-M N p 1-p 1 .4.

4 obţinem: σ2 = p ∑ (x i =1 2 i − p ) ⋅ n * = (1 − p ) ⋅ p + (0 − p ) (1 − p ) = i 2 2 2 = p ⋅ (1 − p ) ⋅ (1 − p + p ) = p ⋅ (1 − p ) Abaterea medie pătratică a caracteristicii alternative este radical din dispersie: σp = p ⋅ (1 − p ) 4. conform relaţiei: Me − Q1 = Q3 − Me . De regulă. 2 Această relaţie arată că. Mărimea acestei abateri poate fi măsurată cu ajutorul unor indicatori bazaţi pe cele trei cuartile. într-o serie perfect simetrică. mediana este egală cu media aritmetică a cuartilelor extreme. Astfel.4. Abaterea intercuartilică reprezintă media abaterilor cuartilelor extreme (Q1. Seriile perfect simetrice prezintă o aşezare simetrică a cuartilelor faţă de mediană şi îndeplinesc anumite condiţii.4. seriile empirice se abat de la acest model al simetriei perfecte şi relaţiile anterioare nu se verifică. numiţi indicatori ai variaţiei intercuartilice. Rezultă de aici că: 2 ⋅ Me = Q1 + Q3 ⇒ Me = Q1 + Q3 .3 Variaţia intercuartilică şi interdecilică Cunoaşterea relaţiilor care se stabilesc între indicatorii medii de poziţie într-o repartiţie perfect simetrică permite interpretarea modului de distribuţie a frecvenţelor în repartiţiile empirice. distanţa dintre mediană şi cuartila inferioară (Q1) este egală cu distanţa dintre cuartila superioară (Q3) şi mediană. Q3) de la mediană: AQ = (Me − Q1 ) + (Q3 − Me) 2 = Q3 − Q1 2 .STATISTICA Aplicând formula de calcul a dispersiei (în varianta care utilizează frecvenţe relative exprimate prin coeficienţi) pentru datele din tabelul 4.

1] = Me 2 ⋅ Me Cu cât distanţa dintre cuartilele extreme este mai mică în raport cu mediana.Seriile de distribuţie a frecvenţelor Abaterea intercuartilică se măsoară cu aceeaşi unitate de măsură ca variabila analizată. cu atât coeficientul de variaţie interdecilică va avea o valoare mai apropiată de 1. raportând abaterea intercuartilică la mediană: Vq = Qd Q3 − Q1 unde Vq ∈ [0 . D9). ceea ce nu permite comparaţii între serii statistice diferite din punctul de vedere al unităţilor de măsură. Se obţine astfel coeficientul de variaţie interdecilică: AD D9 − D1 unde VD ∈ [0 . VD = . Pentru asigurarea comparabilităţii între serii statistice diferite. Acest interval include 80 % din termenii seriei. Abaterea interdecilică este media abaterilor decilelor extreme faţă de mediană: AD = (Me − D1 ) + (D9 − Me) 2 = D9 − D1 . analiza poate fi adâncită prin calcularea distanţei dintre decilele extreme (D1. indicatorul se calculează şi în varianta relativă. 2 Interpretarea acestui indicator se bazează pe faptul că într-o serie perfect simetrică decilele extreme (ca şi cuartilele extreme) sunt egal depărtate de mediană: Me − D1 = D9 − Me . prin împărţire la mediană. Coeficientul de variaţie intercuartilică remediază acest dezavantaj. Indicatorii variaţiei intercuartilice pot oferi o măsură semnificativă a seriilor cu un nivel redus de asimetrie. cu atât coeficientul ia valori mai mici. Pentru seriile cu asimetrie pronunţată şi cu un număr mare de grupe. comparativ cu 50 % în cazul intervalului intercuartilic. 1] = Me 2 ⋅ Me Cu cât seria are o tendinţă mai pronunţată de asimetrie.

În caz contrar. iar în cadrul fiecărei grupe astfel formate. în funcţie de care s-a realizat gruparea. În situaţii de acest fel. se vor calcula indicatori de variaţie pentru fiecare grupă şi pe întreaga colectivitate. Atunci când factorul esenţial (înregistrat) este determinant. Conţinutul tabelului îl formează frecvenţele nij care reflectă numărul unităţilor statistice care aparţin grupei i după variaţia factorului de grupare x şi subgrupei j după variaţia caracteristicii y.4 Indicatorii variaţiei în colectivităţile împărţite în grupe În colectivităţile împărţite în grupe se pot calcula atât medii pe grupe.4. acesta explică abaterile mediilor de grupă de la media generală. ei acţionează în interiorul fiecărei grupe. Analiza variaţiei în colectivităţile împărţite în grupe porneşte de la o repartiţie bidimensională de frecvenţe. cât şi o medie a colectivităţii totale.4. variaţia dintre grupe este mult mai mare decât variaţia din interiorul grupelor. În mod corespunzător. se face o nouă împărţire în funcţie de variaţia caracteristicii y. Indicatorii de variaţie pe întreaga colectivitate se pot calcula fie făcând abstracţie de faptul că ea este compusă din mai multe grupe. . Se obţin astfel distribuţiile condiţionate ale variabilei y în funcţie de factorul de grupare x. Factorii care determină variaţia caracteristicii sunt de două tipuri: • un factor esenţial. Datele sunt înregistrate pentru două caracteristici (x şi y) la nivelul fiecărei unităţi a colectivităţii. Rezultatele grupării sunt înregistrate într-un tabel cu dublă intrare (vezi tabelul 4. cât şi la nivelul grupelor. fiind cauza abaterilor termenilor individuali de la media grupei din care fac parte. reprezentaţi de ansamblul tuturor celorlalţi factori care influenţează variaţia caracteristicii date. fie luând în calcul variaţia din interiorul grupelor şi variaţia dintre grupe. analiza se desfăşoară atât pe ansamblul colectivităţii. Unităţile sunt împărţite pe grupe în funcţie de caracteristica x (factor principal de grupare). factorii neesenţiali (neînregistraţi) au o influenţă mai puternică.STATISTICA 4. • factorii neesenţiali.5).

nrm ni.5 Dispersii de grupă σi2 2 σ1 Μ y1 Μ xi xr Total unităţi pe subgrupe (n. Fiecare din cele trei abateri va fi sintetizată pe ansamblul colectivităţii printr-un indicator de variaţie... n. j j =1 m .1 .) n1.. r m yi Μ σi2 Μ yr n....j) ni1 .. n1j .. yj .m 2 σr i =1 j =1 ∑ ∑ nij y σ2 y Variaţia totală a caracteristicii poate fi analizată în următoarele direcţii: − abaterile valorilor individuale dintr-o grupă de la media grupei respective (yj.4. n.y ).yi ). Μ Μ Medii de grupă yi Tabelul 4. ym n11 . ∑ (y j − y ) m 2 σ = 2 y j =1 ⋅ n. . Dispersia totală se calculează pe baza tuturor abaterilor individuale stabilite faţă de media colectivităţii totale.. n1m Μ Μ Total unităţi pe grupe (ni.j .... nij .. − abaterile mediilor de grupă de la media colectivităţii totale ( yi . nrj . j ∑ n... nr. nfim nr1 ..y ).Seriile de distribuţie a frecvenţelor Grupe după x x1 Μ Μ Subgrupe după y yi .. Între cele trei componente există următoarea relaţie: (y j − y ) = (y j − y i ) + (y i − y ) care se verifică la nivelul fiecărei unităţi statistice din colectivitate.. − abaterile tuturor valorilor individuale de la media colectivităţii totale (yj...

. r . Dispersia totală reuneşte influenţele tuturor factorilor (esenţiali şi neesenţiali) care determină variaţia caracteristicii y. unde: y i . Media colectivităţii totale este: i =1 y= ∑ y i ⋅ ni .media pe total. i =1 r ∑ ni . r – numărul grupelor.. conform relaţiei: ∑ (y j − y i ) ⋅ nij m 2 σ i2 = j =1 ∑ nij j =1 m . y . r. Dispersiile pe grupe reflectă influenţa factorilor aleatori care acţionează în interiorul grupelor. n. ∑ nij j =1 nij – frecvenţele condiţionate de variaţia combinată a caracteristicilor x şi y. Dispersia grupei se calculează pe baza abaterilor tuturor variantelor dintr-o grupă faţă de media lor de grupă. ni.frecvenţele subgrupelor formate după variaţia caracteristicii y.numărul subgrupelor.. iar mediile pe grupe sunt: ∑ y j ⋅ nij yi = j =1 m m .mediile pe grupe (medii condiţionate). i = 1. m .STATISTICA unde: yj .j .valorile caracteristicii distribuită în funcţie de un factor de grupare x.. determinând variaţia valorilor unde: . – volumul grupelor formate după variaţia caracteristicii de grupare x.

Dacă grupele sunt egale ca volum se foloseşte media aritmetică simplă. 2 σ 2 = σ y/ x +σ 2 y Măsura influenţei factorului de grupare x asupra variaţiei caracteristicii y este dată de gradul de determinaţie (R2). Dispersiile tuturor grupelor sunt sintetizate în media dispersiilor de grupă. . Cu cât o grupă este mai omogenă. r Dispersia dintre grupe măsoară influenţa factorului de grupare.Seriile de distribuţie a frecvenţelor individuale. Media dispersiilor de grupă se calculează ca o medie aritmetică a dispersiilor tuturor grupelor. iar dacă volumul diferă de la o grupă la alta se calculează ca medie aritmetică ponderată conform relaţiei următoare: 2 i =1 σ 2/ r = σ = y ∑ σ i2 ⋅ ni . cu atât factorul de grupare x are un rol mai important. σ 2/ x = δ 2 = y i =1 ∑ (yi − y ) ⋅ ni . r Dispersia dintre grupe se calculează pe baza abaterilor mediilor de grupă de la media colectivităţii totale. Acesta se calculează ca raport între dispersia dintre grupe şi dispersia totală: R2 = σ 2/ x y σ2 y ⋅ 100 Se consideră că factorul de grupare x influenţează hotărâtor variaţia factorului determinat y dacă R2 > 50 %. Cu cât este mai mare. cu atât σ i2 va fi mai mic. Regula adunării dispersiilor este următoarea: dispersia colectivităţii totale este egală cu media dispersiilor de grupă plus dispersia dintre grupe. r 2 i =1 ∑ ni . i =1 r ∑ ni .

233 56.559 9.STATISTICA Gradul de nedeterminaţie arată în ce proporţie influenţează factorii aleatori (neînregistraţi) variaţia caracteristicii y. determinate pe grupe şi pe total. pe clase de mărime.436 23. coeficienţii de variaţie calculaţi la nivelul grupelor sunt mai mici decât coeficientul de variaţie pe total: vi < v i = 1. calculaţi după relaţiile: . în anul 1996 Grupe de agenţi Subgrupe de clase de mărime.249 250 şi peste 0 1 2 3 4 5 ⋅ 100 unde . vom aplica regula de adunare a dispersiilor pe exemplul distribuţiei bidimensionale din tabelul următor: Numărul agenţilor economici din administraţie după forma de proprietate. după economici după forma numărul de salariaţi (persoane) Total de proprietate 0-9 10 . se pot obţine informaţii referitoare la gradul de omogenitate al acestora cu ajutorul coeficienţilor de variaţie corespunzători. anul 1997.407 9.49 50 .499 3258 Sursa: Anuarul statistic al României. Dacă structurarea colectivităţii pe grupe după variaţia caracteristicii X s-a efectuat corect.la nivelul grupei vi = σi v= σ yi pe total ⋅ 100 unde σ i = σ i2 σ = σ2 y Comparând coeficienţii de variaţie la nivelul grupelor putem aprecia că cea mai omogenă este grupa pentru care indicatorul menţionat ia valoarea minimă.669 .152 47 26 Total 43. 345 8 353 33.232 .administraţie publică 20.452 3. Se calculează ca raport între media dispersiilor de grupă şi dispersia totală: N2 = σ2 ⋅ 100 σ2 y R 2 + N 2 = 100% Pe baza mediilor şi a abaterilor medii pătratice.administraţie privată 23. r În cele ce urmează.

Seriile de distribuţie a frecvenţelor Mediile de grupă reprezintă în acest caz numărul mediu de salariaţi într-o unitate de administraţie publică. 350.78 + (350 − 30) 2 ⋅ 345 .233 ≅ 20 salariaţi 56.669 Dispersiile de grupă: ∑ (y j − y i ) m 2 σ i2 = j =1 ⋅ nij ∑ nij j =1 m 2 σ1 = (5 − 30)2 ⋅ 20407 + (30 − 30)2 ⋅ 9452 + (150 − 30)2 ⋅ 3232 + 33436 = 2829.436 + 5 ⋅ 23. 30. 150.98 33436 (5 − 5)2 ⋅ 23152 + (30 − 5)2 ⋅ 47 + (150 − 5)2 ⋅ 26 + (350 − 5)2 ⋅ 8 = 2 σ2 = 23233 = 65. respectiv privată: ∑ y j ⋅ nij yi = j =1 m m . 5 ⋅ 20407 + 30 ⋅ 9452 + 150 ⋅ 3232 + 350 ⋅ 345 y1 = ≅ 30 salariaţi 33436 5 ⋅ 23152 + 30 ⋅ 47 + 150 ⋅ 26 + 350 ⋅ 8 y2 = ≅ 5 salariaţi 23233 Media numărului de salariaţi într-o unitate. i =1 r ∑ ni . r = 30 ⋅ 33.centrele de interval ale distribuţiei după y: 5. pe total administraţie: i =1 y= ∑ y i ⋅ ni . ∑ nij j =1 unde: yj .

j = ∑ n. = 151.79 ⋅ 23233 = 1696.73 Întrucât media dispersiilor de grupă este mult mai mare decât dispersia dintre grupe.STATISTICA Media dispersiilor de grupă: σ = 2 i =1 ∑ σ i2 ⋅ ni .25 + 1696 . y ( ) .25 Dispersia totală: ∑ (y j − y ) m 2 σ = 2 y j =1 ⋅ n. i =1 r r ∑ ni . rezultă că împărţirea unităţilor din administraţie după forma de proprietate nu este un factor hotărâtor pentru numărul mediu de angajaţi R 2 / x = 8. r = 2829.03 2 2 σ y = σ y / x + σ ⇔ 1848. j j =1 m (5 − 20)2 ⋅ 43559 + (30 − 20)2 ⋅ 9499 + 56669 56669 Regula adunării dispersiilor: 2 + (150 − 20)2 ⋅ 3258 + (350 − 20)2 ⋅ 353 = 1848.03 ≅ 151. (30 − 20)2 ⋅ 33436 + (5 − 20)2 23233 = = 56669 ∑ ni .98 ⋅ 33436 + 65.73 56669 Dispersia dintre grupe: σ 2 y/ x = i =1 ∑ (y i − y ) r i =1 2 ⋅ ni .18% .

... indicatorii respectivi se calculează folosind formule de calcul pentru o serie simplă. Dacă grupele sunt egale între ele ca volum... n*i1 .. . n*i2 . xr Total y1 n*11 n*21 .4. 100 . n*ij ... n*rm 100. r ... … . n*r2 … .. yj n*1j n*2j . iar suma lor este egală cu 1 sau 100%. xi ..(%) * ∑ σ i2 ⋅ ni .. 100 ..Seriile de distribuţie a frecvenţelor Regula de adunare a dispersiilor se poate aplica şi în cazul seriilor cu frecvenţe relative prezentate în tabele de forma:Tabelul 4.... Dacă volumul....... diferă de la o grupă la alta atunci trebuie să se folosească frecvenţele pe grupe. Dispersia de grupă se calculează astfel: σ i2 = ∑ ( y j − y i ) 2 n* sau σ i2 = ij j =1 m ∑ ( y j − yi ) 2 n* (%) ij j =1 m 100 Pentru a calcula nivelul mediu pe total..... n*im . trebuie să se cunoască structura pe grupe a colectivităţii.. Pentru a sintetiza variaţia la nivelul grupelor într-un singur indicator se calculează media dispersiilor de grupă: σ 2 = i =1 în care n i .. n*r1 y2 n*12 n*22 .6 Valorile caracteristicii de grupare X Cracteristica Y Frecvenţe relative (%) Total (%) Ponderea grupei (ni(%)) x1 x2 ... ni(%) . media dispersiilor de grupă şi dispersia dintre grupe.. nr(%) 100 În acest caz se calculează indicatorii medii de variaţie cu ajutorul formulelor în care frecvenţele se exprimă sub forma de greutăţi specifice.(%) * 100 reprezintă greutatea specifică a fiecărei grupe faţă de total... n*rj … … … … … … … ym n*1m n*2m . … . 100 n1(%) n2(%) ...

. xr Nr ....M1 M1 N1 x2 N2 .... y = i i =1 r i =1 ∑ yi n* i r 100 Dispersia dintre grupe se calculează după formula: 100 Dispersia pe total se calculează folosind regula de adunare a dispersiilor.. .. În cazul folosirii frecvenţelor relative trebuie să se cunoască atât structura seriilor componente cât şi structura pe grupe a colectivităţii totale.. xi Ni ..M2 M2 N2 ..Mr Mr Nr Total N-M M N i =1 δ 2 = ∑ ( yi − y )2 n* sau δ 2 = i r i =1 ∑ ( yi − y )2 n*(%) i r Indicatorii medii şi ai variaţiei calculaţi pe baza acestui tabel sunt prezentaţi în cele ce urmează.STATISTICA Pentru calculul dispersiei dintre grupe şi a dispersiei faţă de total este necesară calcularea mediei pe întreaga colectivitate: y = ∑ yi n* sau... În cazul în care colectivitatea este împărţită în grupe şi se studiază variaţia unei caracteristici alternative tabelul cu dublă intrare are următoarea formă: Tabelul 4.7 Valorile Total caracteristicii Variantele caracteristicii de grupare X analizate Y y1=0 y2=1 x1 N1 . .. .4. . .Mi Mi Ni .. ..

2 Media dispersiilor de grupă ( σ p ) se calculează ca o medie ponderată a dispersiilor grupelor în care a fost împărţită colectivitatea: 2 σp = i =1 ∑ σ 2i N i p i =1 r ∑ Ni r în care Ni .  Ni    qi .reprezintă numărul total al unităţilor observate în fiecare grupă.frecvenţele relative ale unităţilor care nu posedă caracteristica în fiecare grupă. Dispersia dintre grupe pentru o caracteristică alternativă 2 ( δ p ) se calculează pe baza abaterilor mediilor caracteristicii alternative din fiecare grupă şi media pe întreaga colectivitate: 2 δp = i =1 ∑ ( pi − p ) 2 N i i =1 r ∑ Ni r în care p este media caracteristicii alternative pe întreaga colectivitate M ). (p= N .reprezintă media caracteristicii alternative pentru grupa i  M   pi = i  .Seriile de distribuţie a frecvenţelor Dispersia de grupă pentru o caracteristică alternativă ( σ 2 ) se p i calculează după relaţia: σ 2 = pi qi sau σ 2 = pi ( 1 − pi ) p p i i în care : pi .

În acest caz. acţiunea factorilor întâmplători are caracter regulat. care are frecvenţa maximă. 4. poligonul frecvenţelor) oferă o primă imagine asupra gradului de asimetrie.5. Distribuţia perfect simetrică se caracterizează prin egalitatea dintre medie.5 INDICATORII ASIMETRIEI Seriile empirice cu care lucrează statistica tind deseori către modelul repartiţiei normale. astfel încât acţiunea lor se repartizează uniform. f x = Me = M0 Fig. Frecvenţele se distribuie simetric la dreapta şi la stânga valorii centrale. în ambele sensuri.1 Distribuţia perfect simetrică x . Graficul are formă “ de clopot ” (fig.STATISTICA Dispersia totală a caracteristicii alternative ( σ 2 ) se calculează p pe baza celor două greutăţi specifice (p.5. faţă de medie. care este o distribuţie perfect simetrică. q) din colectivitatea totală: σ 2 = p⋅q p Regula adunării dispersiilor se păstrează şi în cazul unei caracteristici alternative: 2 2 σ 2 =σ p +δ p p 4. mediană şi modul. Comparaţia între medie şi indicatorii tendinţei centrale permite interpretarea gradului de asimetrie a unei distribuţii de frecvenţe.).1. 4. Graficul (histograma.

media este semnificativă pentru valorile mari ale caracteristicii. Pentru acest tip de distribuţie de frecvenţe. 4.5. valorile mari sunt mult distanţate faţă de medie.5.2 Asimetrie pozitivă Mo M e x x Asimetria negativă (fig.3) este specifică seriilor de distribuţie de frecvenţe în care predomină valorile mari ale caracteristicii. 4. f Fig. de unde rezultă următoarea relaţie de inegalitate: Mo < Me < x . termenii cu valori mici ai seriei statistice nu sunt bine reprezentaţi. f x M eM o Fig. 4. astfel încât: x < Me < Mo În acest caz. media reprezintă mai bine valorile mici ale seriei.2) este caracteristică acelor colectivităţi în care predomină valorile mici ale caracteristicii.Seriile de distribuţie a frecvenţelor Asimetria pozitivă (fig. dimpotrivă. 4.3 Asimetrie negativă x . care sunt predominante.5.

în două variante: a) ca raport între asimetria absolută şi abaterea medie pătratică: C as = x − Mo _ σ unde C as ∈ (-1. Ambii coeficienţi au valori > 0 când distribuţia de frecvenţe are asimetrie pozitivă şi valori < 0 în cazul asimetriei negative. . k Drel = 2) Coeficienţii de asimetrie Pearson Cel mai frecvent. 1) Pentru seriile cu intervale de grupare mari sau inegale se mai calculează şi densitatea de repartiţie a frecvenţelor absolute/relative pentru fiecare interval în parte. ca raport între frecvenţa absolută/relativă şi mărimea intervalului: Dabs = ni . Seriile de distribuţie moderat asimetrice au valoarea coeficientului de asimetrie |Cas| < 0. în condiţiile unui anumit grad de împrăştiere a unităţilor colectivităţii (măsurat prin abaterea medie pătratică). Pentru serii perfect simetrice valoarea lor este zero. 1) _  3 ⋅  x − Me     unde C ′ ∈ (-3. 3) b) C as ′ =  as σ şi se utilizează pentru distribuţii uşor asimetrice.STATISTICA Distribuţiile de frecvenţe care sunt numai uşor asimetrice verifică următoarea legătură între medie. mediană şi modul: Mo = x − 3 ⋅ ( x − Me ) . Măsurarea asimetriei se bazează pe indicatori care compară media cu mediana (sau modulul).3 şi |Cas' |< 1. în practică se utilizează coeficienţii de asimetrie Pearson. k n* i .

Coeficienţii β1 şi β 2 reflectă intensitatea concentrării frecvenţelor în centrul distribuţiei. µ 4 sunt momente centrate de ordinul 2. astfel: • curbă leptocurtică f x .Seriile de distribuţie a frecvenţelor Pearson propune şi alţi indicatori de asimetrie. Gradul de boltire a distribuţiei este măsurat de coeficientul β 2 . µ 3 . respectiv 3 şi 4. indicaţi pentru seriile foarte mari: β1 = β2 = unde: 2 µ3 3 µ2 µ4 2 µ2 x − x ⋅ ni µ2 = ∑ i ( ∑ ni )2 3 (dispersia) (x − x ) µ3 = ∑ i ∑ ni ⋅ ni x − x ⋅ ni µ4 = ∑ i ( ∑ ni )4 Mărimile µ 2 .

1] Coeficientul Bowley utilizează distanţele dintre decile: CB = unde C B ∈ [− 1. de regulă. seria tinde către distribuţia perfect simetrică. în statistică. Semnul + sau . curba este normală. 3) Coeficienţii de asimetrie intercuartilică şi interdecilică Coeficientul Yule foloseşte distanţele dintre cuartile ca măsură a asimetriei.3 în valoare absolută indică o asimetrie pronunţată. Analiza concentrării se bazează pe curba de concentrare denumită şi curba lui Lorenz care se construieşte. 4. pentru repartiţiile . se înţelege faptul că o pondere mică din colectivitate deţine o pondere mare din valoarea variabilei studiate. • curbă platicurtică β 2 < 3 f x Atunci când β 2 = 3. Valori mai mari de 0.al indicatorului se referă la tipul asimetriei: pozitivă sau negativă. 1] Când aceşti coeficienţi au valori apropriate de zero. conform relaţiei: CY = (Q3 − Me) − (Me − Q1 ) (Q3 − Me) + (Me − Q1 ) (D9 − Me) − (Me − D1 ) (D9 − Me) + (Me − D1 ) unde CY ∈ [− 1.6 INDICATORII CONCENTRĂRII Prin concentrare.STATISTICA În cazul curbei leptocurtice β 2 > 3. La caracterizarea statistică a concentrării se pot folosi: metoda grafică şi măsurarea concentrării prin indicatori statistici adecvaţi.

Unind succesiv două câte două puncte alăturate prin segmente de dreaptă se obţine curba de concentrare. Acest tip de grafic se construieşte în sistem de axe. Cel mai frecvent utilizat este coeficientul de concentrare propus de statisticianul italian Corado Gini potrivit relaţiei: C= ∑ g i2 unde i = 1.100)) se numeşte arie de concentrare. Determinarea greutăţii specifice care exprimă ponderea nivelului totalizator al fiecărei grupe în total xi ni ⋅ 100 ). 4.1 ..0) şi (100. n  1  Coeficientul Gini ia valori în intervalul  . Cu cât această arie este mai mare cu atât concentrarea este mai puternică. 3. Construirea curbei de concentrare. Pentru a reda în expresie numerică mărimea gradului de concentrare se calculează indicatori statistici adecvaţi.gic(%)) se reprezintă grafic printr-un punct. ( g i* = ∑ xi ni 5. adică repartiţia studiată este . Suprafaţa mărginită de curba de concentrare şi dreapta egalităţii perfecte a frecvenţelor (diagonala care uneşte punctele de coordonate (0. Atunci când cele  n  n unităţi au ponderi egale în colectivitate. 6. Calcularea greutăţilor specifice cumulate crescător (gic*). în cadranul I.Seriile de distribuţie a frecvenţelor construite pe intervale de grupare şi presupune parcurgerea următoarelor etape: 1. Calcularea frecvenţelor relative n ni * = i ⋅ 100 ∑ ni 2. Fiecare pereche de valori (Fi(%). Pe axa OX se reprezintă frecvenţele relative cumulate iar pe OY greutăţile specifice cumulate. Calculul frecvenţelor relative cumulate crescător (Fi(%)). Determinarea nivelului totalizat al caracteristicii pe fiecare grupă (xini) şi pe total colectivitate (Σxini).

Când se recomandă utilizarea densităţii de repartiţie? 9. C=1. Cu cât coeficientul de concentrare este mai aproape de limita inferioară. Struck: C= n ∑ g i2 − 1 n −1 Interpretarea valorii acestui coeficient se face în intervalul [0. 2. iar dacă variabila cercetată se n concentrează într-o singură unitate.STATISTICA absolut uniformă. Cum se calculează densitatea de repartiţie? 8. dominantă)? Cum se stabileşte locul modului în cazul grupării pe variante? Cum se stabileşte locul modului în cazul grupării pe intervale? . 5. 4. rezultă C = 1 . Ce reprezintă 11.1 Întrebări recapitulative 1. O apropiere de limita superioară sugerează o concentrare pe un anumit tip sau pe câteva tipuri calitative.1]. 3. 12.7. 14.7 ÎNTREBĂRI ŞI TESTE-GRILĂ 4. Ce reprezintă xi ni ? 10. 6. el exprimă o mai uniformă repartizare a elementelori colectivităţii pe tipurile calitative observate. 4. Pentru a înlătura dezavantajul legat de faptul că limita inferioară este variabilă depinzând de numărul termenilor seriei se foloseşte un alt indicator de concentrare propus de R. Ce înţelegeţi prin frecvenţe absolute? Ce înţelegeţi prin frecvenţe relative? Ce înţelegeţi prin frecvenţe cumulate? Cum se obţine valoarea centralizată la nivelul grupei? Cum se obţine valoarea centralizată la nivelul ansamblului? Cum se determină indicatorul de nivel al caracteristicii de grupare în cazul distribuţiilor de frecvenţe obţinute prin gruparea pe intervale? 7. ∑x n i i ? Care sunt indicatorii tendinţei centrale? Ce înţelegeţi prin mod (modul. 13.

26. 23. 18. 20. 19. 37. 16. 34. 21. 38. 29. 27.Seriile de distribuţie a frecvenţelor 15. 33. 22. 28. 32. 30. 35. cum se continuă analiza? Când se recomandă utilizarea modului ca o alternativă la media aritmetică? Ce grafic se poate utiliza pentru estimarea modului? Ce înţelegeţi prin mediană? Cum se determină locul medianei pentru o distribuţie de frecvenţe rezultată prin gruparea pe variante? Cum se determină locul medianei pentru o distribuţie de frecvenţe rezultată prin gruparea pe intervale? Cum se determină valoarea medianei pentru o distribuţie de frecvenţe rezultată prin gruparea pe variante? Cum se determină valoarea medianei pentru o distribuţie de frecvenţe rezultată prin gruparea pe intervale? Ce grafic se poate utiliza pentru estimarea medianei? Când se recomandă utilizarea medianei ca o alternativă la media aritmetică? În ce situaţie mediana reprezintă singura alternativă pentru calcularea mediei unei caracteristici statistice? Cum se defineşte media aritmetică? Ce condiţii trebuie să îndeplinească datele statistice din care se calculează media aritmetică? Care este principalul dezavantaj al mediei aritmetice? Care este principalul avantaj al mediei aritmetice? Ce criterii se folosesc pentru verificarea corectitudinii calculului mediei aritmetice? Care sunt principalele proprietăţi ale mediei aritmetice? Când se recomandă folosirea formulei de calcul simplificat în calculul mediei? Pe ce proprietăţi ale mediei se bazează formula de calcul simplificat? Pe ce proprietate a mediei se bazează calculul mediei aritmetice cu frecvenţe relative? . 17. 36. 31. Cum se determină modul în cazul grupării pe variante? Cum se determină modul în cazul grupării pe intervale? Când se recomandă utilizarea modului? În ce caz nu poate fi calculat modul ca indicator al tendinţei centrale? O serie de distribuţie de frecvenţe poate avea mai multe moduri? Dacă da. 24. 25.

Ce tip de medie se poate utiliza pentru denaturarea realităţii în sens pozitiv? 52. Când se recomandă utilizarea mediei pătratice? Exemplificaţi.STATISTICA 39. Când se recomandă utilizarea mediei geometrice? Exemplificaţi. Ce înţelegeţi prin asimetrie? 61. Ce reprezintă media pătratică? 46. Cum se calculează mărimea relativă la nivelul ansamblului din mărimi relative parţiale de acelaşi tip în cazul în care se cunosc numărătorii din care s-au calculat mărimile parţiale? 54. 49. Ce tip de medie se poate utiliza pentru denaturarea realităţii în sens negativ? 53. Ce sunt decilele? 59. 50. Cum se calculează media de medii parţiale? 41. Care este relaţia între indicatorii tendinţei centrale când predomină valorile mici ale seriei? . Cum se calculează mărimea relativă la nivelul ansamblului din mărimi relative parţiale de acelaşi tip în cazul în care se cunosc numitorii din care s-au calculat mărimile parţiale? 55. 45. Ce reprezintă media geometrică? 48. Ce reprezintă media armonică? 43. Ce condiţie trebuie respectată la calcularea mediei geometrice din medii geometrice parţiale? Exemplificaţi. Ce sunt cuartilele? 58. 51. Cum se calculează media geometrică de medii geometrice parţiale? Exemplificaţi. Din ce categorie de indicatori face parte mediana? 56. Ce tipuri de frecvenţe se pot folosi la calculul mediei aritmetice? 40. Când se utilizează media armonică ca formă transformată a mediei aritmetice? Exemplificaţi. Ce sunt cuantilele? 57. Ce relaţii pot exista între indicatorii tendinţei centrale? 42. Care este relaţia între indicatorii tendinţei centrale când predomină valorile mici ale seriei? 62. 47. Când se recomandă utilizarea mediei armonice? 44. Ce sunt centilele? 60.

Ce semnificaţie are gradul de determinaţie? 83. Cum trebuie să fie variaţia la nivelul fiecărei grupe faţă de variaţia pe total în seriile de distribuţie bidimensionale? 81.Seriile de distribuţie a frecvenţelor 63. Ce semnificaţie are dispersia pe total? 80. Când o serie este simetrică? 66. Ce relaţie este între abaterea medie liniară şi abaterea medie pătratică în cazul unei distribuţii normale? 74. Care este cel mai potrivit indicator pentru caracterizarea variaţiei unei caracteristici statistice? 71. Care este corecţia lui Sheppard şi ce condiţii trebuie îndeplinite pentru a putea fi utilizată? 75. Ce semnificaţie are media dispersiilor de grupă? 79. Cum se calculează şi cum se interpretează coeficienţii de asimetrie propuşi de Pearson? 68. Când se utilizează amplitudinea absolută a variaţiei? 72. Ce indicatori se pot calcula pe baza regulii de adunare a dispersiilor? 82. Ce relaţie există între indicatorii tendinţei centrale când seria este uşor asimetrică? 67. Cum se calculează şi ce semnificaţie are media caracteristicii alternative? 69. Când se recomandă utilizarea abaterii medii pătratice? 76. Când o serie este perfect simetrică? 65. Ce semnificaţie are gradul de nedeterminaţie? . Cum se calculează şi ce semnificaţie are dispersia caracteristicii alternative? 70. Când se recomandă utilizarea abaterii medii liniare? 73. Care este regula de adunare a dispersiilor? 77. Care este relaţia între indicatorii tendinţei centrale când seria este perfect simetrică? 64. Ce semnificaţie are dispersia dintre grupe? 78.

b) mediana. c) o măsură a asimetriei. e) o măsură a omogenităţii. c) dispersia. c) pătratică. c) pătratică. În cazul în care predomină valorile mici ale caracteristicii se utilizează media: a) aritmetică. 5. Indicatorul care redă ceea ce este esenţial şi tipic într-o colectivitate este: a) modul. d) coeficientul de variaţie.2 Teste-grilă 1. d) geometrică.STATISTICA 4. 2. b) indicator de corelaţie.7. e) media. 4. 3. d) mediana. Valorile aberante (anormal de mari sau mici) nu influenţează: a) media. În cazul în care termenii seriei statistice au valori pozitive şi negative se utilizează media: a) aritmetică. d) geometrică. b) coeficientul de variaţie. b) armonică. d) un indicator economic. b) armonică. c) dispersia. . Media aritmetică reprezintă: a) indicator al tendinţei centrale.

În cazul în care nu este posibilă însumarea termenilor seriei statistice se utilizează media: a) aritmetică. b) xh = x p . În cazul în care termenii seriei statistice au valori negative sau nule nu se utilizează media: a) aritmetică. d) geometrică. Între media armonică ( xh ) şi media pătratică ( x p ). 7. calculate pentru aceeaşi serie statistică. c) x < x p . d) nu se pot compara. c) xh < x p .Seriile de distribuţie a frecvenţelor 6. d) geometrică. b) x = x p . 9. b) armonică. d) nu se pot compara. c) pătratică. 8. există relaţia: a) xh > x p . există relaţia: a) x > x p . c) pătratică. calculate pentru aceeaşi serie statistică. Între media aritmetică ( x ) şi media geometrică (c). b) armonică. .

d) 3%. iar studenţii 175 cm. Care este înălţimea medie în grupa respectivă dacă ponderea studentelor este 60%? a) 170cm. b) 1%.5 mil. d) 20%. b) 169cm. Preţul unui produs a crescut în medie cu 1% lunar în primul semestru al anului şi cu 2% lunar în semestrul al doilea. c) 2%. lei? a) 50%. 12. .STATISTICA 10. Studentele dintr-o grupă au înălţimea medie de 165 cm. lei. iar cel al muncitorilor de 2.lei. c) 25%. salariul mediu al personalului de administraţie este de 4. d) dominanta seriei. c) 165cm. La o firmă. 11. e) nu se poate calcula. d) 175cm. b) moda. Valoarea caracteristicii statistice care se întâlneşte cel mai frecvent în cadrul seriei statistice nu este: a) modulul.5%. e) modul. c) mediana. 13. dacă salariul mediu lunar al firmei este de 3 mil. Creşterea medie lunară pe întregul an a fost: a) 1. Care este ponderea personalului de administraţie.5 mil. b) 30%.

c) modul.+3.9. Denumiţi mărimea medie cea mai indicată a se calcula în acest caz.1.10.8. 108%. d) media geometrică.-4. Tipul de medie cel mai indicat a se calcula în acest caz este: a) aritmetică. Într-un magazin de încălţăminte au fost vândute într-o zi 10 perechi de pantofi având următoarele mărimi: 38.35.-2.39. 17. b) armonică. b) armonică.37.Seriile de distribuţie a frecvenţelor 14. b) armonică.9.38.111%. d) geometrică. 16. 112%. b) media armonică. c) pătratică.120%. 15.38. 106%. Denumiţi tipul de medie cel mai indicat a se calcula în acest caz.+1.+1. .8. Notele obţinute de un student într-o sesiune de examene au fost: 7. e) mediana. a) aritmetică.39. c) pătratică.36. a) media aritmetică. Temperaturile înregistrate la ora prânzului la o staţie meteo în prima săptămână din luna decembrie au fost(grade celsius): -2. Dinamica producţiei realizate de o firmă în primele şase luni ale anului a fost: 110%. c) pătratică. Denumiţi tipul de medie pe care va prefera studentul să o calculeze în acest caz.37.38. d) geometrică. a) aritmetică. d) geometrică.

20. d) nu se poate calcula. c) 1. b) medie armonică. Cele 10 hoteluri dintr-un oraş au fost evaluate astfel: 2 hoteluri3stele. 5 hoteluri-2stele. 19. 3 hoteluri-1stea. dacă se adaugă la fiecare termen 30 de unităţi şi totodată se împarte la 11 care va fi noua medie obţinută? a) 30. 375. Încasările lunare obţinute de magazinele dintr-o reţea de distribuţie au fost (mil.5%. b) 330. respectiv 20% dintre cei 150 de participanţi la un alt curs s-au pronunţat pentru desfiinţarea cursului de statistică. Ştiind că media aritmetică simplă a zece termeni este 300. 1684. c) mediană. Ce procent mediu de studenţi este favorabil desfiinţării cursului de statistică? a) 17. b) 3 stele. a) medie aritmetică. 420. c) 18. 21. lei): 450. d) nici una.9 stele. b) 18%. .STATISTICA 18. 15% dintre cei 100 de participanţi la un curs. La două anchete în rândul studenţilor. 390. d) 300. Precizaţi care este valoarea medie cea mai indicată a se calcula.5%. 398. 405. c) 270. d) 17%. Care este valoarea medie pe total? a) 2 stele.

3. d) 8.12. b) 67.9. d)7. astfel: .4.zona B: 20%.Seriile de distribuţie a frecvenţelor 22. d) 60 km/oră. e) 9. .26 km/oră. 25. 50 km/oră. 24. respectiv 100 mii persoane . respectiv 150 mii persoane.5 km/oră. d) 18. c) 65.zona A: 15%. O maşină parcurge 4 porţiuni egale ale unui traseu cu vitezele de 40 km/oră. c) 7.8. Ce loc au ocupat gimnastele în medie? a) 9. Stabiliţi ponderea medie a şomerilor pe total regiune. Distribuţia studenţilor dintr-o grupă după nota la examenul de statistică este: Nota Nr. La un concurs de gimnastică cele 7 participante din România au ocupat următoarele locuri: 11.5. 80 km/oră şi 100 km/oră. c) 17.2.65. 23. b) 17. b) 8. În două zone ale unei regiuni s-au stabilit următoarele ponderi ale şomerilor şi numărul total de şomeri. a) 18.5. studenţi 4 2 5 4 6 6 7 8 8 5 9 4 10 1 Total 30 Valoarea mediană este: a) 5. b) 6.7 km/oră. c) 7. Care a fost viteza medie pe întregul drum? a) 59.

e) mai mari decât mediana. d) cuartila superioară. b) mai mici decât cuartila a treia. . d) cuprinse între cuartila inferioară şi cuartila superioară. Trei pătrimi din valorile individuale ale unei serii statistice sunt mai mari decât: a) cuartila inferioară. b) modul. d) cuantilele. Nu sunt indicatori medii de poziţie: a) mediana. c) mediana. d) cuartila superioară. Indicatorii tendinţei centrale sunt: a) media mediana. modul. 29. b) modul. sunt: a) mai mari decât cuartila inferioară. Jumătate din valorile individuale ale unei caracteristici. c) cuartilele. c) egale cu mediana. d) decilele. 30.modul. b) mediana. 28. 27. situate în centrul seriei statistice. c) cuartilele. b) cuartila a treia. c) mediana. e) media aritmetică. 25% din valorile individuale ale unei serii statistice sunt mai mari decât: a) cuartila inferioară.STATISTICA 26.

b) histograma. c) dispersia dintre grupe este mai mică decât media dispersiilor de grupă. b) histograma. Pentru calculul grafic al modului se folosesc: a) diagramele frecvenţelor cumulate crescător sau descrescător. d) diagramele de volum.Seriile de distribuţie a frecvenţelor 31. e) dispersia dintre grupe este egală cu media dispersiilor de grupă. Caracterizarea gradului de împrăştiere a unităţilor purtătoare ale caracteristicii se realizează cu: a) indicatorii simpli şi sintetici ai variaţiei. În cazul unei distribuţii condiţionate a variabilei Y în funcţie de un factor de grupare X este adevărată în orice situaţie relaţia: a) dispersia generală este egală cu suma dintre media dispersiilor de grupă şi dispersia dintre grupe. Pentru a măsura gradul de omogenitate a unei serii statistice utilizăm: a) abaterea medie pătratică. 35. d) dispersia dintre grupe este mai mare decât dispersia totală. 34. b) regula de adunare a dispersiilor. e) indicatorii medii de poziţie. c) diagramele prin benzi. c) coeficientul de variaţie. d) indicii de dinamică. b) media. d) coeficientul de corelaţie. Pentru calculul grafic al medianei se folosesc: a) diagramele frecvenţelor cumulate crescător sau descrescător. d) diagramele de volum. c) indicii teritoriali. c) diagramele prin coloane. b) dispersia dintre grupe este mai mare decât media dispersiilor de grupă. 33. 32. e) mediana. .

Alegeţi combinaţia corectă: A(a. c) diferenţa dintre dispersia totală şi dispersia dintre grupe.d). c) oda este mai mică decât media. 39. b) dispersia dintre grupe. 38. e) mediana şi modul sunt egale. . b) mediana este superioară mediei. e) mediana şi modul sunt egale.b.e).b. Distribuţiile unidimensionale perfect simetrice verifică relaţiile: a) media este inferioară modulului. d) media este egală cu cuartila a doua. D(a.c). D(a. d) dispersia totală. Alegeţi combinaţia corectă: A(a.d. e) nu se poate calcula. 37. C(b. B(e. e) media dispersiilor de grupă.STATISTICA 36. d) media este mai mică decât cuartila a doua.c). B(a.e). În cazul unei distribuţii condiţionate a variabilei Y în funcţie de un factor de grupare X variaţia caracteristicii Y sub influenţa factorilor esenţiali se măsoară prin: a) dispersiile de grupă. În cazul unei distribuţii condiţionate a variabilei Y în funcţie de un factor de grupare X variaţia caracteristicii Y sub influenţa factorilor întâmplători se măsoară prin: a) dispersiile de grupă. c) moda este mai mică decât media.b.e).e). C(b.d). d) dispersia totală. Seriile statistice în care predomină valorile mari ale caracteristicii verifică relaţiile: a) media este inferioară modulului.b. c) diferenţa dintre dispersia totală şi dispersia dintre grupe.d. b) dispersia dintre grupe. b) mediana este superioară mediei.b.

iar într-o altă secţie productivitatea medie este 50 cu abatere medie liniară de 5. 41.Seriile de distribuţie a frecvenţelor 40.Care colectivitate este mai omogenă? a) secţia I.c.b. c) abaterii medii pătratice. b) dispersiei. . Valoarea coeficientului de variaţie este invers proporţională cu mărimea: a) mediei. care este mărimea dispersiei dintre grupe? a) 250. Într-o secţie a unei unităţi economice productivitatea medie este de 40 bucăţi pe muncitor. c) negativ asimetrică. C(d. 44. b) dispersia dintre grupe. Distribuţia este: a) simetrică. c) diferenţa dintre dispersia totală şi dispersia dintre grupe. b) 150. B(a. b) pozitiv asimetrică. d) au acelaşi nivel de omogenitate. dar cei mai mulţi studenţi au 21 de ani. c) 200. Valoarea raportului de nedeterminaţie este direct proporţională cu: a) variaţia caracteristicii Y sub influenţa factorilor întâmplători.c). Alegeţi combinaţia corectă: A(a. 43.e). c) nici una nu este omogenă. d) dispersia totală. cu o abatere medie liniară de 4 bucăţi. b) secţia II. 42. Dacă valoarea raportului de determinaţie este 60% şi media dispersiilor de grupă 100. e) media dispersiilor de grupă. d) abaterii medii liniare. Într-o grupă de studenţi vârsta medie este de 23 ani.e).

40.c. 39. 24.b. 3. 28. 6.c.d. 21.B.c. 5.a.c. 7.a. 30. 34.a.c. 14. 8.c.a. 23.d.c.e. 42. d) preponderenţa valorilor mici ale caracteristicii.b. 18. Soluţii: 1. 19. 2.b. 22.b.c. 38. 25.b. 43. Mărimea negativă a coeficientului de asimetrie indică: a) o legătură inversă. 11. 9.a.d. 15.d.b. 45.33. 13.a. 12. 27.a. 16.b. 17.a. 32. 26.e.a. 35.d.d.b.a.c. 31. 29.c. b) o legătură directă. 41. 10. 36.b. c) preponderenţa valorilor mari ale caracteristicii. .a.c. 37.a. 44. 20.c.a. 4. e) o asimetrie foarte mare.c.b.STATISTICA 45.