Professional Documents
Culture Documents
Tema 2. Estadística Descriptiva Unidimensional - E.Motellón
Tema 2. Estadística Descriptiva Unidimensional - E.Motellón
Estadística descriptiva
unidimensional
Material de suport docent de les sessions teòriques elaborat a
partir de la bibliografia referenciada al Pla docent de l’assignatura
Els conceptes clau d’aquest bloc són els següents: dades agrupades, dades
sense agrupar, distribució de freqüències, taula de freqüències, freqüències
absoluta, relativa, absoluta acumulada i relativa acumulada, interval, límit
inferior, límit superior, marca de classe, amplada, alçada, estadístic, mesura de
posició, moda, mediana, mitjana aritmètica, mitjana ponderada, quantils,
quartils, decils, percentils, mesura de dispersió, recorregut o rang, recorregut
interquartílic, variància, desviació típica o estàndard, coeficient de variació,
gràfic de sectors, de barres, d’escala, de caixa («box plot»), de tija i fulles,
histograma, mesura de forma, coeficient de simetria, coeficient d’apuntament,
coeficient de curtosi, concentració, equidistribució, corba de Lorenz, índex de
Gini, transformacions lineals, canvi d’origen, canvi d’escala, tipificació o
estandardització”
Pla docent de l’assignatura
E. Motellón
Estadística econòmica i empresarial I
ÍNDEX
2.1. Tabulació
• Presentació de les dades
• Ordenació de les dades i concepte de freqüència absoluta
• Taula de freqüències amb dades agrupades en intervals i amb dades sense agrupar
• Interval: límit inferior i superior, marca de classe, amplada, alçada
• Freqüència relativa
• Freqüència absoluta i relativa acumulades
• Freqüència relativa
• Freqüència absoluta i relativa acumulades
Objectiu:
Facilitar la interpretació i l’anàlisi de les dades obtingudes pel
mesurament o observació de variable o atribut
Freqüència
Gènere
Absoluta (nre.) Relativa (%)
Home 4 4/10=0,4=40%
Dona 6 6/10=0,6=60%
Mida mostra 10
Estadística econòmica i empresarial I E. Motellón
2.1. Tabulació.
Tipus de taules de freqüències
En funció(≠ valors q pot prendre variable i nre. d'observacions)
X (variable) ; xi (observació) ; N (nre. total d’observacions)
OBSERVACIONS
POQUES MOLTES
variables discretes
variables discretes
o continues
OBSERVACIONS
POQUES MOLTES
0 1 1 2 3 0 0 4 4 2
2 3 1 0 3 2 1 1 0 4
0 1 1 2 3 0 0 4 4 2
2 3 1 0 3 2 1 1 0 4
0 1 1 2 3 0 0 4 4 2
2 3 1 0 3 2 1 1 0 4
0
1
2
3
4
0 1 1 2 3 0 0 4 4 2
2 3 1 0 3 2 1 1 0 4
X ni
Nombre de valors
Propietats: diferents de la variable X
∑n = n + n i 1 2
+…+ nk = N
i=1
Total d’observacions
(grandària de la mostra o població)
Freqüència absoluta (valor xi o
modalitat ai apareix ni vegades)
0 1 1 2 3 0 0 4 4 2
2 3 1 0 3 2 1 1 0 4
X ni
Interpretació de la Freqüència Absoluta (ni):
0 5 n1: Del total d’empreses enquestades, hi ha 5 q no han fet cap patent.
1 5 n2: 5 empreses q només han patentat una innovació.
2 4
Aquestes categories són les que més vegades és presenten a la mostra
3 3
donat que són les que tenen una major freqüència absoluta
4 3
20 5+5+4+3+3=20=N
0 1 1 2 3 0 0 4 4 2
2 3 1 0 3 2 1 1 0 4
X ni fi
n1 5
0 5 0.25 f1 = = = 0.25
N 20
1 5 0.25
2 4 0.20
3 3 0.15
4 3 0.15
20
0 1 1 2 3 0 0 4 4 2
2 3 1 0 3 2 1 1 0 4
X ni fi
0 5 0.25
1 5 0.25
2 4 0.20
3 3 0.15
4 3 0.15
20 1 0.25+0.25+0.2+0.15+0.15=1
0 1 1 2 3 0 0 4 4 2
2 3 1 0 3 2 1 1 0 4
X ni fi
Quin % d’empreses han registrat 4 patents?
0 5 0.25
Resultat: 15%
1 5 0.25
2 4 0.20 Quina probabilitat hi ha que en escollir una
3 3 0.15 empresa a l'atzar de la nostra mostra
aquesta hagi registrat 4 patents?
4 3 0.15
20 1 Resultat: 15 %
0 1 1 2 3 0 0 4 4 2
2 3 1 0 3 2 1 1 0 4
X ni fi Ni
0 5 0.25 5
1 5 0.25 10 10=5+5 → N2= n1+n2
2 4 0.20 14
3 3 0.15 17
4 3 0.15 20
20 1
Propietats
Per a la 1r valor/categoria de la variable (x1):
N1 = n1 Freqüència absoluta acumulada = Freqüència absoluta
€
N k = n1 + n 2 + ... + n k = N
0 1 1 2 3 0 0 4 4 2
2 3 1 0 3 2 1 1 0 4
X ni fi Ni
0 5 0.25 5 N 1= n 1
1 5 0.25 10
2 4 0.20 14
3 3 0.15 17
4 3 0.15 20 Nk= N
20 1
0 1 1 2 3 0 0 4 4 2
2 3 1 0 3 2 1 1 0 4
X ni fi Ni Fi
F2=0.50=10/20=N2/N
0 5 0.25 5 0.25
1 5 0.25 10 0.50 F2=0.50=0.25+0.25= f1+f2
2 4 0.20 14 0.70
3 3 0.15 17 0.85
4 3 0.15 20 1
20 1
Propietats:
1r valor/categoria de la variable (x1):
€ F1 = f1 Freqüència relativa acumulada = Freqüència relativa
Propietats:
k
€ F1 = f1 Fk = f1 + f 2 + … + f k = ∑ f i =1
i =1
Fk = 1 n1 + n2 + … + nk N k N
Fk = = = =1
Estadística econòmica i empresarial I
N N N E. Motellón
Exemple: Taules de freqüències
Interessats en l’estudi del nombre de patents que realitza un sector determinat.
Seleccionem 20 empreses i obtenim les següents dades
0 1 1 2 3 0 0 4 4 2
2 3 1 0 3 2 1 1 0 4
X ni fi Ni Fi
0 1 1 2 3 0 0 4 4 2
2 3 1 0 3 2 1 1 0 4
X ni fi Ni Fi
Quin % d’empreses han realitzat
0 5 0.25 5 0.25 com a màxim una patent?
2 4 0.20 14 0.70
Quina probabilitat hi ha que en
3 3 0.15 17 0.85 escollir una empresa a l'atzar de la
4 3 0.15 20 1 nostra mostra aquesta hagi
registrat 1 o menys patents?
20 1
Resultat: 50%
Estadística econòmica i empresarial I E. Motellón
Exemple: Taules de freqüències
Interessats en l’estudi del nombre de patents que realitza un sector determinat.
Seleccionem 20 empreses i obtenim les següents dades
0 1 1 2 3 0 0 4 4 2
2 3 1 0 3 2 1 1 0 4
X ni fi Ni Fi
I la probabilitat de haver registrat
tres o més patents?
0 5 0.25 5 0.25
Resultat: 30%
1 5 0.25 10 0.50
2 4 0.20 14 0.70 F3=0.7 (realitzar 0,1 o 2 patents)
4 3 0.15 20 1
20 1
X ni fi Ni Fi
x1 n1 f1 N1=n1 F1=f1
x2 n2 f2 N2=n1+n2 F2=f1+f2
x3 n3 f3 N3=n1+n2+n3 F3=f1+f2+f3
… … … … …
xk nk fk Nk=n1+n2+n3+…+nk=N Fk=f1+f2+f3+…+fk=1
N 1
X ni fi Ni Fi
Fins ara hem treballat amb dades individuals pq
xla
1 variable
n1 d’estudi
f1 prenia pocs valors
N1=n 1 diferents F1=f1
x2 n2 f2 N2=n1+n2 F2=f1+f2
Què passa si la nostra variable pren un nombre elevat de valors?
x3 n3 f3 N3=n1+n2+n3 F3=f1+f2+f3
… … … … …
Elaboració d’una taula de freqüències amb dades
xk nk agrupades
fk en3+…+n
Nk=n1+n2+n intervals
k=N Fk=f1+f2+f3+…+fk=1
N 1
Consideracions inicials
1. Objectiu: agrupar els valors de la variable en un nre. d'intervals
que no sigui excessivament gran
5. €
Marca de classe (ci): Punt representatiu (mitjà) de l’interval
Li + Li−1 €
ci =
2
Estadística econòmica i empresarial I E. Motellón
2.1. Tabulació.
Creació d’intervals
X
(L0,L1]
(L1,L2]
(L2,L3]
(L3,L4]
(L4,L5]
(L7,L6]
X
(0,20]
(20,40]
(40,60]
(60,80]
(80,100]
(100,120]
X ni
(0,20] 8
X ni
(0,20] 1
(20,40] 5
(40,60] 4
(60,80] 5
(80,100] 3
(100,120] 2
?
X ni
Empresa amb despesa de 40.000 €?
(0,20] 1
(20,40] 5
(40,60] 4
(60,80] 5
(80,100] 3
(100,120] 2
N=20 ?
ni
X ni fi fi =
N
(0,20] 1 0.05 1/20
(20,40] 5 0.25 5/20
N=20 1 ?
X ni fi Ni
(0,20] 1 0.05 1 N1=n1=1
N=20 1
Ni
X ni fi Ni Fi Fi = = f1 + f2 + + fi
N
(0,20] 1 0.05 1 0.05 F1=N1/N=f1
N=20 1
Li−1 + Li
X ni fi Ni Fi ci ci =
2
(0,20] 1 0.05 1 0.05 10 c1=(0+20)/2
N=20 1
X ni fi Ni Fi ci ai ai = Li + Li−1
(0,20] 1 0.05 1 0.05 10 20 c1=20-0
N=20 1
X ni fi Ni Fi ci ai hi
(0,20] 1 0.05 1 0.05 10 €20 0.05
(20,40] 5 0.25 6 0.30 30 20 0.25
(40,60] 4 0.20 10 0.50 50 20 0.20
(60,80] 5 0.25 15 0.75 70 20 0.25
(80,100] 3 0.15 18 0.90 90 20 0.15
(100,120] 2 0.1 20 1 110 20 0.10
N=20 1
X ni fi Ni Fi ci ai hi
(0,20] 1 0.05 1 0.05 10 €20 0.0025
(20,40] 5 0.25 6 0.30 30 20 0.0125
(40,60] 4 0.20 10 0.50 50 20 0.0100
(60,80] 5 0.25 15 0.75 70 20 0.0125
(80,100] 3 0.15 18 0.90 90 20 0.0075
(100,120] 2 0.1 20 1 110 20 0.0050
N=20 1
0 5 0.25
1 5 0.25 3
2 4 0.20
3 3 0.15
4 3 0.15 1
2
20 1
Gràfic amb Gràfic amb
freqüències = freqüencies
absolutes relatives
Nota: Adequat per variable qualitatives nominals
Estadística econòmica i empresarial I E. Motellón
2.2. Representació gràfica.
Dades quantitatives sense agrupar
2. Gràfic de barres
Sobre l’eix horitzontal els valors de la variable X, aixecar sobre cadascun dels
punts una barra l’alçada de la qual sigui igual a la seva freqüència (absoluta o
relativa). Buit entre barres per indicar els valors que no són possibles
Patents registrades Gràfic de barres amb freqüències absolutes
X ni fi 6
0 5 0.25 5
1 5 0.25 4
2 4 0.20 3
3 3 0.15 2
4 3 0.15 1
20 1
0
0 1 2 3 4
Nota: Adequat per variable qualitatives
Estadística econòmica i empresarial I E. Motellón
2.2. Representació gràfica.
Dades quantitatives sense agrupar
2. Gràfic de barres
Sobre l’eix horitzontal els valors de la variable X, aixecar sobre cadascun dels
punts una barra l’alçada de la qual sigui igual a la seva freqüència (absoluta o
relativa). Buit entre barres per indicar els valors que no són possibles
Patents registrades Gràfic de barres amb freqüències relatives
X ni fi 0.30
0 5 0.25 0.25
1 5 0.25 0.20
2 4 0.20 0.15
3 3 0.15
0.10
4 3 0.15
0.05
20 1
0.00
0 1 2 3 4
Nota: Adequat per variable qualitatives
Estadística econòmica i empresarial I E. Motellón
2.2. Representació gràfica.
Dades quantitatives sense agrupar
3. Gràfic d’escala
Representació de les freqüències acumulades. Pren forma d’una escala
integrada per graons que pugen des del nivell zero de les freqüències fins al
màxim (N per absolutes i 1 per relatives).
Patents registrades Gràfic d’escala amb freqüències absolutes acumulades
X ni fi 20
0 5 0.25 16
1 5 0.25
12
2 4 0.20
3 3 0.15 8
4 3 0.15 4
20 1
0
0 1 2 3 4
Nota: Adequat per variable qualitatives ordinals
Estadística econòmica i empresarial I E. Motellón
2.2. Representació gràfica.
Dades quantitatives sense agrupar
3. Gràfic d’escala
Representació de les freqüències acumulades. Pren forma d’una escala
integrada per graons que pugen des del nivell zero de les freqüències fins al
màxim (N per absolutes i 1 per relatives).
Patents registrades Gràfic d’escala amb freqüències relatives acumulades
X ni fi 1.00
0 5 0.25 0.80
1 5 0.25
0.60
2 4 0.20
3 3 0.15 0.40
4 3 0.15 0.20
20 1
0.00
0 1 2 3 4
Nota: Adequat per variable qualitatives ordinals
Estadística econòmica i empresarial I E. Motellón
2.2. Representació gràfica.
Dades quantitatives sense agrupar
4. Diagrama de caixa (Box-Plot)
Sintetitza en un gràfic diverses mesures estadístiques
Valor màxim
no atípic
80,00
1,5RI
60,00 Q3(0,75)
Valors atípics
(outliers) RI =Q3-Q1
40,00 Mediana = Q2(0,5)
Q1(0,25)
1,5RI
20,00 Valor mínim
no atípic
EDAD
Casos per
Tall Valor Tall Fulles fulles
18 18 18
1 10 8 3 19 19 19
1 10 9 3 19 19 19
1 10 9 3
1 10 9 3 19 19 19
Freqüència
6
• Amplada rectangle = amplada interval
4
• Àrea proporcional a ni de classe
2
0
(0,20] (20,40] (40,60] (60,80] (80,100] (100,120]
0.4
• Punt central de base = marca de classe
Freqüència
0.3
• Amplada rectangle = amplada interval
0.2
• Àrea proporcional a ni de classe
0.1
0
(0,20] (20,40] (40,60] (60,80] (80,100] (100,120]
6
5
4
3
2
1
0
(0,20] (20,40] (40,60] (60,80] (80,100] (100,120]
Estadística econòmica i empresarial I E. Motellón
2.2. Representació gràfica.
Dades quantitatives agrupades
7. Polígon de freqüències no acumulades
Unint els punts mitjos (marca de classe de l’interval) situats a la part
superior del rectangles de d'histograma (freqüències relatives)
Polígon de freqüències absolutes de la despesa en innovació
0.5
0.4
Freqüència
0.3
0.2
0.1
0
(0,20] (20,40] (40,60] (60,80] (80,100] (100,120]
Estadística econòmica i empresarial I E. Motellón
2.2. Representació gràfica.
Dades quantitatives agrupades
8. Polígon de freqüències acumulades
Unint els punts mitjos (marca de classe de d'interval) situats a la part
superior del rectangles de d'histograma (freqüència absoluta acumulada)
Polígon de freqüències acumulades de la despesa en innovació
20
18
16
14
Freqüència
12
10
8
6
4
2
0
(0,20] (20,40] (40,60] (60,80] (80,100] (100,120]
Estadística econòmica i empresarial I E. Motellón
2.2. Representació gràfica.
Dades quantitatives agrupades
8. Polígon de freqüències acumulades
Unint els punts mitjos (marca de classe de d'interval) situats a la part
superior del rectangles de d'histograma (freqüència absoluta acumulada)
Polígon de freqüències acumulades de la despesa en innovació
20
18
16
14
Freqüència
12
10
8
6
4
2
0
(0,20] (20,40] (40,60] (60,80] (80,100] (100,120]
Estadística econòmica i empresarial I E. Motellón
2.2. Representació gràfica.
Dades quantitatives agrupades
8. Polígon de freqüències acumulades
Unint els punts mitjos (marca de classe de d'interval) situats a la part
superior del rectangles de d'histograma (freqüència relativa acumulada)
Polígon de freqüències acumulades de la despesa en innovació
1
0.9
0.8
0.7
Freqüència
0.6
0.5
0.4
0.3
0.2
0.1
0
(0,20] (20,40] (40,60] (60,80] (80,100] (100,120]
Estadística econòmica i empresarial I E. Motellón
2.2. Representació gràfica.
Dades quantitatives agrupades
8. Polígon de freqüències acumulades
Unint els punts mitjos (marca de classe de d'interval) situats a la part
superior del rectangles de d'histograma (freqüència relativa acumulada)
Polígon de freqüències acumulades de la despesa en innovació
1
0.9
0.8
0.7
Freqüència
0.6
0.5
0.4
0.3
0.2
0.1
0
(0,20] (20,40] (40,60] (60,80] (80,100] (100,120]
Estadística econòmica i empresarial I E. Motellón
Tema 2.3. Mesures de síntesi
• Mesures de posició o localització
• Mesures de dispersió absolutes i relatives
• Mesures de forma
• Concentració versus Equidistribució
• Transformacions lineals
Tendència Tendència
central no central
Mitjana aritmètica Quartils
Mediana Decils
Moda Percentils
Mitjana geomètrica
Mitjana harmònica
Mitjana quadràtica
Estadística econòmica i empresarial I E. Motellón
2.3.1 Mesures de posició central.
Mitjana aritmètica
∑x n i i K
x= i=1
= ∑ xi f i
N i=1
X ni fi
0 5 0.25
1 5 0.25
2 4 0.20
3 3 0.15
4 3 0.15
N=20
∑x n i i K
∑(x − x ) =∑ x − ∑ x =∑ x − N x = ∑ x − N
i i i i
i=1
N
= ∑ xi − ∑ xi = 0
i=1 i=1 i=1 i=1 i=1 i=1 i=1
X ni fi Propietat 1
0 5 0.25
1 5 0.25
2 4 0.20
3 3 0.15
4 3 0.15
N=20
∑x n i i K
∑(x − x ) =∑ x − ∑ x =∑ x − N x = ∑ x − N
i i i i
i=1
N
= ∑ xi − ∑ xi = 0
i=1 i=1 i=1 i=1 i=1 i=1 i=1
∑x n i i K
xi! = xi + a
N N N N N N
∑ x! ∑ ( x + a ) ∑ x + ∑ a ∑ x ∑ a
i i i i
i=1 i=1 i=1 i=1 i=1 i=1
x! = = = = + =
N N N N N
N
∑x
N ⋅a
i
i=1
= + = x +a
N N
Estadística econòmica i empresarial I E. Motellón
Exemple: Mitjana aritmètica
Interessats en l’estudi del nombre de patents que realitza un sector determinat.
Seleccionem 20 empreses i obtenim les següents dades
0 1 1 2 3 0 0 4 4 2
2 3 1 0 3 2 1 1 0 4
Propietat 3
X ni a=2 b=4
0 5 2 4
1 5 3 5
2 4 4 6
3 3 5 7
4 3 6 8
N=20
∑x n i i K
xi! = axi
N N N
∑ x! ∑(ax )i i a ∑ xi
i=1 i=1 i=1
x! = = = = ax
N N N
∑x n i i K
∑ xi ni
si xi → x = i =1
N
∑x n i i K
X = edat = 20;20;20;20;20
N =5
Llavors :
N
∑x i
20 + 20 + 20 + 20 + 20
x= i=1
= = 20
N 5
K
∑x n i i
20 ⋅ 5
x= i=1
= = 20
N 5
∑x n i i K
N A x A + N B xB + ... + N Z xZ
x= donde N A + N B + ... + N Z = N
N
∑x n i i K
N A x A + N B xB + ... + N Z xZ
x= donde N A + N B + ... + N Z = N
N
Demostració: N A + NB = N
k
∑x n i i K
k k k k
∑ z n ∑( x + y ) n ∑ x n ∑ y n
i i i i i i i i i
i=1 i=1 i=1 i=1
z= = = + =x+y
N N N N
∑ i
(x − a) 2
és mínim si a = x
i=1
∑x n i i K
Mitjana aritmètica x=
N
= ∑x f
i=1
i i
i=1
Avantatges
• Considera tots els valors de la variable
• És una mesura calculable tant en escales d'interval com de raó
• Pren sempre un valor únic
• Representa el centre de gravetat de la distribució
• Sol ser la mesura de posició central més adequada per a
distribucions en escala d'intervals o de proporcions
Inconvenients
• Es veu afectada pels valors extrems que poden distorsionar el seu
valor fent-ho poc representatiu
Estadística econòmica i empresarial I E. Motellón
Exemple: mitjana i valors extrems
1 2 3 4 5 6 7 8 9
X 600 900 1200 850 2100 600 2300 790 4800
Y 600 900 1200 850 2100 600 2300 790 1900
N k
∑x w ∑x w n i i i i i
x = i =1 = i =1
N K
∑ i =1
wi
∑ i =1
wi
Nota 9 6 8 6
Pes (w) 1 2 2 3
Tendència Tendència
central no central
Mitjana aritmètica Quartils
Mediana Decils
Moda Percentils
x N /2 + x( N /2)+1
• N par, mitjana aritmètica de dos valors centrals: Me =
2
Dades Tipus II: primer valor de la variable que ocupa el lloc Ni ≥ N/2
∑ x −k
i=1
i mínima si k = Me
Tendència Tendència
central no central
Mitjana aritmètica Quartils
Mediana Decils
Moda Percentils
Avantatges:
Donat q per calcular-la no requereix l'ordenació de la variable, és la mesura
de posició més representativa (i única) de les variables qualitatives nominals
Inconvenients:
• En el seu càlcul no intervenen totes les observacions de la variable
• La dificultat de obtenir-la en variables continues. Mo ≈ 3Me − 2x
Estadística econòmica i empresarial I E. Motellón
2.3.1 Mesures de posició central.
Relació entre mitjana, mediana i moda
x = Me = Mo → Distribució simètrica
x Xi
50% observacions 50% observacions
Centre de gravetat
Mo Me x Centre de gravetat Xi
50% observacions 50% observacions
Centre de gravetat x Me Mo Xi
Inconvenients (exemple)
ni
Mo x Mo X
Me
Estadística econòmica i empresarial I E. Motellón
2.3. Mesures de posició.
Introducció
Estadístics
Tendència Tendència
central no central
Mitjana aritmètica Quartils
Mediana Decils
Moda Percentils
Valor q el 75% de les dades són anteriors a ell i el 25% són posteriors
Valor q el 20% de les dades són anteriors a ell i el 80% són posteriors
• ..........
• ..........
∑(x − x ) ⋅ n ∑(x − x )⋅ n
1
i i i i
El moment central (m1), o respecte a la
m1 = i=1
= i=1
=0
N N mitjana, de ordre 1 és sempre 0
k
(
∑ ix − x ) 2
⋅ ni Aquesta és l'expressió de la variància
m2 = i=1
(estadístic de dispersió)
N
Estadística econòmica i empresarial I E. Motellón
k k Demostració
∑(x − x ) ⋅ n ∑(x − x )⋅ n
1
i i i i
m1 = i=1
= i=1
=0
N N
k k k k k
2. d∑ ( xi − x ) ni ∑ x n ∑ xn ∑ x n
i i i i i ∑n i
i=1 i=1 i=1 i=1 i=1
= − = −x =x−x =0
N N N N N
Recordatori:
Tendència Tendència
central no central
Mitjana aritmètica Quartils
Mediana Decils
Moda Percentils
Absoluta Relativa
DISPERSIÓ (variabilitat):
• Major o menor separació dels valors de la variable respecte a un
altre que sigui la seva síntesi
Mesures de dispersió
(estadístics q quantifiquen el grau de dispersió
de X entorn de la seva tendència central)
Estadística econòmica i empresarial I E. Motellón
2.3.2 Mesures de dispersió.
Introducció
Absoluta Relativa
Avantatge:
• La forma més senzilla d’indicar la dispersió
Inconvenients:
• Molt simple, només utilitza dos valors de la variable
• Molt sensible als valors extrems (outliers)
• Només recomanable si els valors és distribueixen uniformement
Estadística econòmica i empresarial I E. Motellón
2.3.2 Mesures de dispersió.
Rang interquartílic (RI)
Absoluta Relativa
∑(x − x ) ∑(x
i
2 2
i
− 2xi x + x 2 )
1. S = 2 i=1
= i=1
=
N N
N N N N
∑x 2
i
∑x ∑x i
2
∑x 2
i
Nx 2
i=1 i=1 i=1
= − 2x + = i=1 − 2xx + =
N N N N N
N N
∑x 2
i
∑x 2
i
− Nx 2
i=1 2 i=1
= −x =
N N
k k
2 2
2
∑ ( xi − x ) ni ∑ i ni
x k
2. S = i =1
= i =1
− x = ∑ ( xi − x ) 2 f i
2
N N i =1
Estadística econòmica i empresarial I E. Motellón
k
2
2.3.2 Mesures de dispersió. (
∑ ix − x ) ni
Variància (S2) S2 = i =1
N
Característiques:
1. Mesura de la variabilitat o dispersió de les dades
d’una variable respecte a la mitjana aritmètica
2. Coincideix amb el moment central de 2n ordre (m2)
3. Si xi=k ∀1=1,2,...,k , llavors S2=0
4. S2≥0
5. No li afecten els canvis d'origen xi → S x2 i
xi 2
S x2i S x2i S xi
xiʹʹ = → S xiʹʹ = 2 → S xiʹʹ = =
k k k2 k
Estadística econòmica i empresarial I E. Motellón
2.3. Mesures de síntesi.
Introducció
Estadístics
Absoluta Relativa
• Habitualment s’expressa en %
S
CV = ·100
x
Propietats:
1. És una mesura adimensional
2. Representa en nre. de vegades que la S conté la x
3. Mesura q utilitza tota la ! de la variable
4. Cota inferior és 0 (màxima representativitat de la mitjana)
5. Quan x = 0 no és significatiu
6. Sí li afecten els canvis d’origen
7. No li afecten els canvis d’escala
• Apuntament – curtosis
• Coeficient de curtosis
Simetria Curtosis
Simetria
Hi ha un nombre igual de valors a ambdós costats d’un eix
perpendicular que la divideix.
∑(x − x ) n
3
i i
1 i=0 m3
g1 = 3 · = 3
S N S
∑(x − x ) n
3
i i
1 m3
g1 = 3 · i=0 =
S N S3
⎡ K 3 K K
⎛ K
⎞ ⎤
3
⎢ ∑ x1 ni ∑ xi ni ∑ x1 ni ∑ xi ni ⎟ ⎥
2
1 ⎢ i=0 ⎜
g1 = 3 · − i=0 · i=0 + 2 ⎜ i=0 ⎟ ⎥
S ⎢ N N N ⎜ N ⎟ ⎥
⎢ ⎜⎝ ⎟⎠ ⎥
⎢⎣ ⎥⎦
1
(
g1 = 3 · a3 − 3a1a2 + 2a13
S
)
Estadística econòmica i empresarial I E. Motellón
2.3. Mesures de síntesi.
Introducció
Estadístics
Simetria Curtosis
∑(x − x ) n
K 4
4
∑( x − x ) n
i i 1 i=0 i i
m4
i=0
= 3·S 4
g2 = 4 · −3= 4 −3
N S N S
Índex de Gini
Corba de Lorenz
Exemple:
Disposem de la distribució W de N individus (ordenada)
x1 ≤ x2 ≤ x3 ≤ x4 ≤ ... ≤ xn
Situacions extremes:
1. Concentració màxima: 1 individu percep tota la massa salarial
x1 = x2 = x3 = x4 = ... = xn −1 = 0 xn ≠ 0
2. Concentració mínima: Tots els individus reben el mateix salari
x1 = x2 = x3 = x4 = ... = xn ➞ equidistribució
150 5738200
Com es reparteixen els Com es reparteixen
treballadors en grups els salaris
(Fi)
Estadística econòmica i empresarial I E. Motellón
2.3.4 Mesures de concentració.
Càlcul de pi i qi
xi ni Ni ui=xi·ni Ui= ui+Ui-1 pi=(Ni/N)·100 qi=(Ui/Uk)·100
… … … … … … …
… … … … … … …
… … … … … … …
… … … … … … …
pk=(Nk/N)·100 qk=(Uk/Uk)·100
Estadística econòmica i empresarial I E. Motellón
2.3.4 Mesures de concentració.
Càlcul de pi i qi
Amb l’opció b) dels punts 4 i 6
150 5738200
Procés:
pi qi 100
14.00 6.84 90
80
30.67 15.73
70
50.67 30.37 60
62.00 40.00 q i 50
72.00 51.76 40
30
84.00 67.45
20
93.33 82.57 10
100.00 100.00 0
0 10 20 30 40 50 60 70 80 90 100
pi
pi qi
100
14 0
90
30 0
80
50 0
70
62 0
60
72 0
qi 50
84 0
40
90 0
30
93 0
20
95 0
10
96 0
0
97 0 0 10 20 30 40 50 60 70 80 90 100
98 0 pi
99 100
pi
pi
1. Corba situada necessàriament per sota de la bisectriu (recta OB ),
atès q la distribució està ordenada de menor a major
2. Per ordenació de menor a major, la corba tindrà sempre una tendència
creixent, partint del punt de l’origen (0,0) fins arribar al màxim (100,100)
3. Corba de concentració mínima (equidistribució) coincideix
amb la bisectriu OB, donat que qi = pi
4. La corba de concentració màxima formada pels costats del quadre OA AB
5. + a prop corba de Lorenz de la bisectriu OB à + equitativa (- concentració)
Estadística econòmica i empresarial I E. Motellón
2.3.4 Mesures de concentració.
Índex de Gini (Ig)
k −1
∑(p − q )
i =1
i i
∑p
i =1
i
150 k −1 k −1
k −1 ∑p
i =1
i = 406,67 ∑ ( p − q ) = 111,94
i =1
i i
∑(p − q )
i =1
i i
111,94
Ig = k −1
= = 0,2753
406,67
∑p
i =1
i
qi 50 qi 50 qi 50
40 40 40
30 30 30
20 20 20
10 10 10
0 A 0 A 0 A
O0 10 20 30 40 50 60 70 80 90 100 O0 10 20 30 40 50 60 70 80 90 100 O0 10 20 30 40 50 60 70 80 90 100
pi pi pi
Ig < Ig Ig = 0 Ig = 1
Major concentració Concentració mínima Concentració màxima
(distribució + equitativa) (equidistribució)
90
B 90
B
80 80
70 70
60 60
qi 50 qi 50
40 40
30 30
20 20
10 10
0 A 0 A
O0 10 20 30 40 50 60 70 80 90 100 O0 10 20 30 40 50 60 70 80 90 100
pi pi
100 100
90
B 90
B
80 80
70 70
60 60
qi 50 qi 50
40 40
30 30
20 20
10 10
0 A 0 A
O0 10 20 30 40 50 60 70 80 90 100 O0 10 20 30 40 50 60 70 80 90 100
pi pi
Objectiu:
Establir els valors dels estadístics de la variable transformada
sense repetir tots els càlculs
Transformacions:
• Canvis d’origen. Si a tots els valors que pren una variable
X +a = Xʹ li sumem (restem) una constant a
i i
Transformacions:
• Canvis d’origen. Si a tots els valors que pren una variable
X + a = X ʹ Com?
i
li sumem (restem) una constant a
i
Afecta No afecta
x , Mo, Me, Qr / K RI , Re , S x2 , S x
Canvis d’origen CV Ap , g1 , g 2
Ig
CV
x , Mo, Me, Qr / K
Canvis d’escala Ap , g1 , g 2
Re , RI , S x2 , S x
Ig
Objectiu:
Generar nova variable (Z), a partir dels valor de la variable (X),
que presenti les següents característiques:
1. z = 0
2. S 2 = 1 , SZ = 1
Z
Com?
Xi − x
Variable estandaritzada,
normalitzada, tipificada
Zi =
SX
Estadística econòmica i empresarial I E. Motellón
2.4 Transformacions lineals. Xi − x
Zi =
Estandarització o tipificació SX
Resultat:
Solució:
En termes absoluts el graduat B guanya més que l’A, Però, en relació
al conjunt dels empleats de cada ESA l'individu A ocupa millor posició
Estadística econòmica i empresarial I E. Motellón
Com a RECORDATORI final ...