Professional Documents
Culture Documents
SERIILE DE DISTRIBUŢIE
A FRECVENŢELOR
48
50
40
30
30 25
18
20 14 15
10
0
1,5 2 2,5 3 3,5 4 4,5
dotare tehnica (mil.lei/m)
60
Nr. muncitori
50 48
40
30 30
25
20 18
14 15
10
0 0 0
1,5 2 2,5 3 3,5 4 4,5
dotare tehnica (mil.lei/m)
Se calculează cu relaţia:
ni ni
n*i = k
sau n*i(%) = k
⋅ 100
∑ ni ∑ ni
i =1 i =1
k
∑ ni - totalul frecvenţelor celor k grupe ale colectivităţii.
i =1
Rezultatele calculului frecvenţelor relative pentru seria statistică
din tabelul 4.1.1 sunt prezentate în tabelul 4.1.2.
Tabelul 4.1.2
Grupe de muncitori Frecvenţe Frecvenţe relative cumulate (%)
după dotarea tehnică relative (%)
(mil. lei capital fix (ni*) crescător descrescător
pe muncitor)
0 1 2 3
1,5 - 2,0 9,33 9,33 100,00
2,0 - 2,5 12,00 21,33 90,67
2,5 - 3,0 20,00 41,33 78,67
3,0 - 3,5 32,00 73,33 58,67
3,5 - 4,0 16,67 90,00 26,67
4,0 - 4,5 10,00 100,00 10,00
Total 100,00 - -
frecvenţe 105
relative 90
cumulate 75 Crescator
(%) 60 Descrescator
45
30
15
0
1.5 2 2.5 3 3.5 4 4.5
unde:
ni - frecvenţa (numărul de apariţii) al variantei xi;
k - numărul de valori distincte.
k
∑ xi ni = x ⋅ n în cazul datelor grupate.
i =1
Astfel exprimat, nivelul totalizat se reprezintă grafic prin
dreptunghi.
Atunci când în locul frecvenţelor absolute folosim frecvenţe
relative ( n* = ni ⋅100 ) , formula anterioară devine:
i(%) k
∑ ni
i =1
k
∑ xi ⋅ n*i(%)
x = i =1
100
Un exemplu de calcul al mediei aritmetice ponderate utilizând atât
frecvenţele absolute, cât şi frecvenţele relative, este prezentat în tabelul
4.2.1. Vârsta medie este x = 479 / 24 = 19,96 ≈ 20 ani. Valoarea obţinută
este foarte reprezentativă datorită omogenităţii colectivităţii.
x=
∑ xi ⋅ ni
∑ ni
Dar ∑ i i >
x ⋅n ∑ xmin ⋅ ni unde
∑ ni ∑ ni
∑ xmin ⋅ ni = xmin ⋅ ∑ ni = x
min
∑ ni ∑ ni
Rezultă că x > xmin .
În mod analog se demonstrează că x < x max .
3. Media oscilează în jurul grupei cu frecvenţa cea mai mare, în
cazul distribuţiei de frecvenţe.
4. Suma algebrică a tuturor abaterilor individuale ale termenilor
seriei de la media lor aritmetică este nulă:
m
∑ ( xi − x ) ⋅ ni = 0 .
i =1
Demonstraţie:
STATISTICA
∑ (xi − x )⋅ ni = ∑ xi ⋅ ni − ∑ x ⋅ ni = ∑ xi ⋅ ni − x ⋅ ∑ ni =
= ∑ xi ⋅ ni −
∑ xi ⋅ ni ⋅ n = x ⋅ n − x ⋅ n = 0
∑ i ∑ i i ∑ i i
∑ ni
5. Dacă se măresc (micşorează) toate valorile individuale din care
se calculează media cu o constantă a, noua lor medie aritmetică se
măreşte (micşorează) cu aceeaşi valoare a.
Demonstraţie:
∑ (xi ± a ) ⋅ ni = ∑ xi ⋅ ni ± ∑ a ⋅ ni = x ± a ⋅ ∑ ni = x ± a .
∑ ni ∑ ni ∑ ni ∑ ni
6. Dacă se împart (înmulţesc) toate valorile individuale cu o
constantă h, media aritmetică se divide (multiplică) cu aceeaşi constantă h.
Demonstraţie:
xi
∑ ⋅ ni
1 ∑ xi ⋅ ni x
h = ⋅ =
∑ ni h ∑ ni h
∑ (h ⋅ xi ) ⋅ ni =
h ⋅ ∑ xi ⋅ ni
= h⋅ x
∑ ni ∑ ni
7. Dacă se divid toate frecvenţele cu o constantă g, media
aritmetică nu se modifică.
Demonstraţie:
ni 1
∑ xi ⋅ ⋅ ∑ xi ⋅ ni
g = g =x
ni 1
∑ ⋅ ∑ ni
g g
k
Dacă înlocuim constanta g cu suma frecvenţelor seriei ∑ ni
i =1
obţinem formula de calcul a mediei aritmetice pe baza frecvenţelor
relative:
Seriile de distribuţie a frecvenţelor
ni
∑ xi ⋅
∑ ni = ∑ xi ⋅ n*i = ∑ xi ⋅ n*i
ni
∑
∑ n*i
∑ ni
k xi − a
∑ ⋅ ni
i =1 h
x= k
⋅k + a ,
∑ ni
i =1
unde: xi - centrele intervalelor de grupare (se calculează ca medie
aritmetică simplă a capetelor fiecărui interval);
ni - frecvenţa fiecărui interval i;
a - constantă egală cu valoarea centrului de interval care are
frecvenţa maximă;
h - mărimea intervalului de grupare;
k - numărul intervalelor de grupare.
Un exemplu de aplicare a acestei formule se regăseşte în tabelul
4.2.2.
Calcularea mediei vânzărilor lunare
în unităţile comerciale dintr-o localitate
Tabelul 4.2.2
Vânzări Nr. unităţi Centrul de xi − a xi − a
(mil. lei) (ni ) interval (xi ) ⋅ ni
h h
0 1 2 3 4
10 -14 10 12 -2 -20
14 - 18 30 16 -1 -30
18 - 22 40 20 0 0
22 - 26 20 24 1 20
Total 100 - - -30
Date convenţionale
xh =
∑ xi ⋅ ni = ∑ xi ⋅ ni = x .
1
∑ ⋅ xi ⋅ ni ∑ ni
xi
Pentru a ilustra aplicarea acestei forme a mediei armonice,
considerăm cazul unui agent economic care îşi procură materia primă de
la patru furnizori diferiţi. Din evidenţa curentă cunoaştem preţul mediu şi
valorea achiziţiilor pentru fiecare furnizor (tabelul 4.2.3).
Tabelul 4.2.3
Furnizor Preţ mediu Valoarea achiziţiei
(mii lei/kg) (mil. lei)
0 1 2
A 15,75 58,4
B 21,50 46,2
C 24,25 62,5
D 26,00 38,0
Total - 205,1
Date convenţionale
Seriile de distribuţie a frecvenţelor
de unde:
n
n
∏ xi = x g .
i =1
xg = n ∏x
i =1
i
= 1,08 ⋅ 1,15 = 1,114
Tabelul 4.2.4
Variante xi ni
0 1 2
• afirmativ 1 M
• negativ 0 N-M
Total - N
4.3.1 Mediana
Q2 = Me ,
3 k q3 −1
⋅ ∑ ni + 1 − ∑ ni
4
Q3 = x0 + d Q3 ⋅ i =1 i =1 ,
nQ 3
4.3.3 Modulul
∆2 = nm0 − nm0 +1 ,
unde: Mo - modulul;
x0 - limita inferioară a intervalului modal;
nm0 - frecvenţa intervalului modal;
nm0 −1 - frecvenţa intervalului anterior;
nm0 +1 - frecvenţa intervalului următor;
hm0 - mărimea intervalului modal.
(
x − Mo = 3 ⋅ x − Me )
Gradul de precizie al medianei şi modulului este mai redus decât al
mediei, întrucât nu includ în calcul toate valorile individuale. Cu toate acestea, în
anumite situaţii, ele pot înlocui media. De exemplu, modulul va fi preferat
mediei ca măsură a taliei la confecţii, iar mediana va reprezenta mai bine o serie
cu valori extreme excesiv de distanţate de restul valorilor.
Alegerea indicatorilor trebuie să corespundă esenţei fenomenului şi
particularităţilor distribuţiei analizate.
Seriile de distribuţie a frecvenţelor
Tabelul 4.4.2
Rata Nr. ţări xi xi ni xi − x di% xi − x ⋅ ni ( xi −x)2 ⋅ ni
şomajului (%) (ni)
0 1 2 3 4 5 6 7
2,5 - 5,5 6 4 24 -5,6 -58,33 33,6 188,2
5,5 - 8,5 4 7 28 -2,6 -27,08 10,4 27,0
8,5 - 11,5 6 10 60 0,4 4,17 2,4 0,96
11,5 - 14,5 3 13 39 3,4 35,42 10,2 34,68
14,5 - 17,5 5 16 80 6,4 66,67 32 204,8
Total 24 50 231 - - 88,6 455,64
k
d = ∑ xi − x ⋅ n*i - pentru serii de frecvenţe relative
i =1 exprimate prin coeficienţi;
STATISTICA
∑x i
− x ⋅ n *i (%)
- pentru serii de frecvenţe relative
d= i =1
( )2
k
σ = ∑ xi − x ⋅ n*i - pentru serii de frecvenţe relative
i =1 exprimate sub formă de coeficienţi;
i =1 exprimate procentual.
σ=
100
Seriile de distribuţie a frecvenţelor
În exemplul nostru:
4,36
v= ⋅ 100 = 45,4%
9 ,6
Aşadar, colectivitatea considerată în acest exemplu este eterogenă.
Ţările incluse în analiză (vezi tabelul 4.4.1) sunt foarte diferite din punct
de vedere al nivelului de dezvoltare şi al sistemului economic specific,
ceea ce determină diferenţe mari în mărimea indicatorului considerat. Se
poate încerca o grupare în: ţări dezvoltate, ţări mai puţin dezvoltate şi
fostele ţări socialiste.
Dispersia este un alt indicator sintetic al variaţiei care se
calculează ca medie aritmetică, simplă sau ponderată, a pătratelor
abaterilor termenilor faţă de media lor:
n _
∑ ( xi − x ) 2
i =1
σ2 = - pentru serii simple;
n
k _
∑ ( x i − x ) 2 ⋅ ni
i =1
σ2 = k
- pentru serii de frecvenţe absolute;
∑ ni
i =1
( )2
k
- pentru serii de frecvenţe relative
σ 2 = ∑ xi − x ⋅ n*i exprimate sub formă de coeficienţi;
i =1
∑ (xi − x )
k 2
⋅ n*i(%)
- pentru serii de frecvenţe relative
σ 2 = i =1
100 exprimate procentual.
Proprietăţile dispersiei
i
= i
= i
=σ2
∑ ni ∑ ni ∑ ni
i i i
Consecinţă:
_
σ x2 = σ a2 − ( x − a ) 2.
Ultimele două proprietăţi se regăsesc în formula de calcul
simplificat al dispersiei:
2
k xi − a
∑ ⋅ ni _
i =1 h
σ x2 = k
⋅ h 2 − ( x− a )2 .
∑ ni
i =1
h ⋅ ni
h
0 1 2 3
4 6 -2 24
7 4 -1 4
10 6 0 0
13 3 1 3
16 5 2 20
Total 24 - 51
STATISTICA
x
x1 x2
Uneori, seriile statistice au aceeaşi medie, dar dispersii diferite ca
în această figură*:
* După: Bernard Py., Statistique descriptive, Economica, Paris, 1990, pag. 69.
Seriile de distribuţie a frecvenţelor
Tabelul 4.4.4
Variantele Valoarea Frecvenţe Frecvenţe relative
caracteristicii caracteristicii absolute (ni*)
alternative alternative (ni)
0 1 2 3
Afirmativ 1 M p
Negativ 0 N-M 1-p
Total - N 1
STATISTICA
σ 2p = ∑ (x − p ) ⋅ n *i = (1 − p ) ⋅ p + (0 − p ) (1 − p ) =
2 2 2
i
i =1
= p ⋅ (1 − p ) ⋅ (1 − p + p ) = p ⋅ (1 − p )
Abaterea medie pătratică a caracteristicii alternative este radical
din dispersie:
σp = p ⋅ (1 − p )
Tabelul 4.4.5
Grupe Subgrupe după y Total unităţi Medii de Dispersii de
după x yi ... yj ... ym pe grupe grupă grupă
(ni.) yi σi2
x1 n11 ... n1j ... n1m n1. y1 σ12
Μ Μ Μ
Μ Μ
xi ni1 ... nij ... nfim ni.
Μ Μ yi σi2
Μ
xr nr1 ... nrj ... nrm nr. Μ
Μ
yr
σ r2
Total unităţi r m
pe subgrupe n.1 ... n.j ... n.m ∑ ∑ nij y σ 2y
(n.j) i =1 j =1
∑ (y j − y )
m 2
⋅ n. j
2 j =1
σ =y m
,
∑ n. j
j =1
STATISTICA
∑ (y j − y i ) ⋅ nij
m 2
j =1
σ i2 = m
,
∑ nij
j =1
iar mediile pe grupe sunt:
m
∑ y j ⋅ nij
j =1
yi = m
, i = 1,..., r,
∑ nij
j =1
unde: nij – frecvenţele condiţionate de variaţia combinată a
caracteristicilor x şi y.
Dispersiile pe grupe reflectă influenţa factorilor aleatori care
acţionează în interiorul grupelor, determinând variaţia valorilor
Seriile de distribuţie a frecvenţelor
2
∑ σ i2 ⋅ ni .
i =1
σ 2y / r = σ = r
∑ ni .
i =1
∑ (yi − y ) ⋅ ni .
r 2
i =1
σ 2y / x = δ 2 = r
∑ ni .
i =1
Dispersiile de grupă:
∑ (y j − y i )
m 2
⋅ nij
j =1
σ i2 = m
∑ nij
j =1
σ 12 =
(5 − 30)2 ⋅ 20407 + (30 − 30)2 ⋅ 9452 + (150 − 30)2 ⋅ 3232 +
33436
+
(350 − 30) 2
⋅ 345
= 2829,98
33436
σ 22 =
(5 − 5)2 ⋅ 23152 + (30 − 5)2 ⋅ 47 + (150 − 5)2 ⋅ 26 + (350 − 5)2 ⋅ 8 =
23233
= 65,78
STATISTICA
r
∑ σ i2 ⋅ ni .
2 i =1 2829,98 ⋅ 33436 + 65,79 ⋅ 23233
σ = r
= = 1696,73
56669
∑ ni .
i =1
∑ (y i − y )
r 2
⋅ ni .
σ 2
= i =1
=
(30 − 20 )2 ⋅ 33436 + (5 − 20 )2 23233
=
y/ x r 56669
∑ ni .
i =1
= 151,25
Dispersia totală:
∑ (y j − y )
m 2
⋅ n. j
σ = 2 j =1
=
(5 − 20)2 ⋅ 43559 + (30 − 20)2 ⋅ 9499 +
y m 56669
∑ n. j
j =1
+
(150 − 20)2 ⋅ 3258 + (350 − 20)2 ⋅ 353 = 1848,03
56669
Regula adunării dispersiilor:
2
σ y2 = σ y2 / x + σ ⇔ 1848,03 ≅ 151,25 + 1696 ,73
Întrucât media dispersiilor de grupă este mult mai mare decât
dispersia dintre grupe, rezultă că împărţirea unităţilor din administraţie
după forma de proprietate nu este un factor hotărâtor pentru numărul
(
mediu de angajaţi R 2y / x = 8,18% . )
Seriile de distribuţie a frecvenţelor
m
∑ ( y j − yi ) 2 n*ij(%)
j =1
σ i2 = ∑ ( y j − y i ) 2 n*ij sau σ i2 =
j =1 100
Pentru a calcula nivelul mediu pe total, media dispersiilor de
grupă şi dispersia dintre grupe, trebuie să se cunoască structura pe grupe a
colectivităţii. Dacă grupele sunt egale între ele ca volum, indicatorii
respectivi se calculează folosind formule de calcul pentru o serie simplă.
Dacă volumul, diferă de la o grupă la alta atunci trebuie să se folosească
frecvenţele pe grupe.
Pentru a sintetiza variaţia la nivelul grupelor într-un singur
indicator se calculează media dispersiilor de grupă:
r
∑ σ i2 ⋅ ni .(%) *
σ 2 = i =1
100
*
în care n i .(%) reprezintă greutatea specifică a fiecărei grupe faţă de total.
STATISTICA
σ 2p = pi qi sau σ 2p = pi ( 1 − pi )
i i
în care :
pi - reprezintă media caracteristicii alternative pentru grupa i
M
pi = i ;
Ni
qi - frecvenţele relative ale unităţilor care nu posedă caracteristica
în fiecare grupă.
Media dispersiilor de grupă ( σ p2 ) se calculează ca o medie
ponderată a dispersiilor grupelor în care a fost împărţită colectivitatea:
r
∑ σ 2pi N i
i =1
σ p2 = r
∑ Ni
i =1
în care Ni - reprezintă numărul total al unităţilor observate în fiecare
grupă.
Dispersia dintre grupe pentru o caracteristică alternativă
2
( δ p ) se calculează pe baza abaterilor mediilor caracteristicii alternative
din fiecare grupă şi media pe întreaga colectivitate:
r
∑ ( pi − p ) 2 N i
i =1
δ p2 = r
∑ Ni
i =1
în care p este media caracteristicii alternative pe întreaga colectivitate
M
(p= ).
N
STATISTICA
x = Me = M0 x
Fig. 4.5.1 Distribuţia perfect simetrică
Seriile de distribuţie a frecvenţelor
Mo M e x x
Fig. 4.5.2 Asimetrie pozitivă
x M eM o x
n*i
Drel = .
k
2) Coeficienţii de asimetrie Pearson
Cel mai frecvent, în practică se utilizează coeficienţii de asimetrie
Pearson, în două variante:
a) ca raport între asimetria absolută şi abaterea medie pătratică:
_
x − Mo
C as = unde C as ∈ (-1, 1)
σ
_
3 ⋅ x − Me
b) C as ′ = unde C ′ ∈ (-3, 3)
as
σ
şi se utilizează pentru distribuţii uşor asimetrice.
Ambii coeficienţi au valori > 0 când distribuţia de frecvenţe are
asimetrie pozitivă şi valori < 0 în cazul asimetriei negative. Pentru serii
perfect simetrice valoarea lor este zero.
Seriile de distribuţie moderat asimetrice au valoarea coeficientului
de asimetrie |Cas| < 0,3 şi |Cas' |< 1.
Seriile de distribuţie a frecvenţelor
µ2 = ∑ i
(
x − x ⋅ ni )2 (dispersia)
∑ ni
(x − x )
µ3 = ∑ i
3
⋅ ni
∑ ni
µ4 = ∑ i
(
x − x ⋅ ni )4
∑ ni
Mărimile µ 2 , µ 3 , µ 4 sunt momente centrate de ordinul 2,
respectiv 3 şi 4.
Coeficienţii β1 şi β 2 reflectă intensitatea concentrării
frecvenţelor în centrul distribuţiei.
Gradul de boltire a distribuţiei este măsurat de coeficientul β 2 ,
astfel:
• curbă leptocurtică
f
x
STATISTICA
x
Atunci când β 2 = 3, curba este normală.
C= ∑ g i2 unde i = 1, n
1
Coeficientul Gini ia valori în intervalul ,1 . Atunci când cele
n
n unităţi au ponderi egale în colectivitate, adică repartiţia studiată este
STATISTICA
1
absolut uniformă, rezultă C = , iar dacă variabila cercetată se
n
concentrează într-o singură unitate, C=1.
Pentru a înlătura dezavantajul legat de faptul că limita inferioară
este variabilă depinzând de numărul termenilor seriei se foloseşte un alt
indicator de concentrare propus de R. Struck:
n ∑ g i2 − 1
C=
n −1
Interpretarea valorii acestui coeficient se face în intervalul [0,1].
Cu cât coeficientul de concentrare este mai aproape de limita inferioară, el
exprimă o mai uniformă repartizare a elementelori colectivităţii pe tipurile
calitative observate. O apropiere de limita superioară sugerează o
concentrare pe un anumit tip sau pe câteva tipuri calitative.
63. Care este relaţia între indicatorii tendinţei centrale când seria
este perfect simetrică?
64. Când o serie este perfect simetrică?
65. Când o serie este simetrică?
66. Ce relaţie există între indicatorii tendinţei centrale când seria
este uşor asimetrică?
67. Cum se calculează şi cum se interpretează coeficienţii de
asimetrie propuşi de Pearson?
68. Cum se calculează şi ce semnificaţie are media caracteristicii
alternative?
69. Cum se calculează şi ce semnificaţie are dispersia caracteristicii
alternative?
70. Care este cel mai potrivit indicator pentru caracterizarea
variaţiei unei caracteristici statistice?
71. Când se utilizează amplitudinea absolută a variaţiei?
72. Când se recomandă utilizarea abaterii medii liniare?
73. Ce relaţie este între abaterea medie liniară şi abaterea medie
pătratică în cazul unei distribuţii normale?
74. Care este corecţia lui Sheppard şi ce condiţii trebuie îndeplinite
pentru a putea fi utilizată?
75. Când se recomandă utilizarea abaterii medii pătratice?
76. Care este regula de adunare a dispersiilor?
77. Ce semnificaţie are dispersia dintre grupe?
78. Ce semnificaţie are media dispersiilor de grupă?
79. Ce semnificaţie are dispersia pe total?
80. Cum trebuie să fie variaţia la nivelul fiecărei grupe faţă de
variaţia pe total în seriile de distribuţie bidimensionale?
81. Ce indicatori se pot calcula pe baza regulii de adunare a
dispersiilor?
82. Ce semnificaţie are gradul de determinaţie?
83. Ce semnificaţie are gradul de nedeterminaţie?
STATISTICA
4.7.2 Teste-grilă
18. Ştiind că media aritmetică simplă a zece termeni este 300, dacă
se adaugă la fiecare termen 30 de unităţi şi totodată se împarte
la 11 care va fi noua medie obţinută?
a) 30;
b) 330;
c) 270;
d) 300.
24. În două zone ale unei regiuni s-au stabilit următoarele ponderi
ale şomerilor şi numărul total de şomeri, astfel:
- zona A: 15%, respectiv 100 mii persoane
- zona B: 20%, respectiv 150 mii persoane.
Stabiliţi ponderea medie a şomerilor pe total regiune.
a) 18;
b) 17;
c) 17,65;
d) 18,5.
26. Trei pătrimi din valorile individuale ale unei serii statistice sunt
mai mari decât:
a) cuartila inferioară;
b) cuartila a treia;
c) mediana;
d) cuartila superioară.
27. 25% din valorile individuale ale unei serii statistice sunt mai
mari decât:
a) cuartila inferioară;
b) modul;
c) mediana;
d) cuartila superioară.
40. Într-o grupă de studenţi vârsta medie este de 23 ani, dar cei mai
mulţi studenţi au 21 de ani. Distribuţia este:
a) simetrică;
b) pozitiv asimetrică;
c) negativ asimetrică.
Soluţii:
1.a; 2.e; 3.b; 4.c; 5.b; 6.d; 7.d; 8.c; 9.a; 10.c; 11.c; 12.b; 13.a; 14.d; 15.c;
16.c; 17.c; 18.a; 19.a; 20.c; 21.b; 22.a; 23.b; 24.c; 25.c; 26.a; 27.d; 28.d;
29.a; 30.e; 31.a; 32.b.33.a; 34.c; 35.a; 36.c; 37.b; 38.B; 39.b; 40.b; 41.a;
42.d; 43.a; 44.b; 45.c.