You are on page 1of 189

TEMA 2.

Estadística descriptiva
unidimensional
Material de suport docent de les sessions teòriques elaborat a
partir de la bibliografia referenciada al Pla docent de l’assignatura

Estadística econòmica i empresarial I


Grau d’Economia
Facultat d’Economia i Empresa
Universitat de Barcelona

Autora: Elisabet Motellón Corral


Professora Associada
Departament d’Econometria, Estadística i Economia Aplicada
Objectiu del Tema 2:

“En aquest bloc temàtic es presenten les principals tècniques d’estadística


descriptiva unidimensional que han de permetre a l’estudiant de saber tabular i
construir una taula de freqüències a partir d’un conjunt de dades, conèixer les
diferents mesures descriptives per sintetitzar la informació, i els avantatges i
inconvenients de cadascuna, així com les diferents possibilitats de
representació gràfica de les dades.

Els conceptes clau d’aquest bloc són els següents: dades agrupades, dades
sense agrupar, distribució de freqüències, taula de freqüències, freqüències
absoluta, relativa, absoluta acumulada i relativa acumulada, interval, límit
inferior, límit superior, marca de classe, amplada, alçada, estadístic, mesura de
posició, moda, mediana, mitjana aritmètica, mitjana ponderada, quantils,
quartils, decils, percentils, mesura de dispersió, recorregut o rang, recorregut
interquartílic, variància, desviació típica o estàndard, coeficient de variació,
gràfic de sectors, de barres, d’escala, de caixa («box plot»), de tija i fulles,
histograma, mesura de forma, coeficient de simetria, coeficient d’apuntament,
coeficient de curtosi, concentració, equidistribució, corba de Lorenz, índex de
Gini, transformacions lineals, canvi d’origen, canvi d’escala, tipificació o
estandardització”
Pla docent de l’assignatura
E. Motellón
Estadística econòmica i empresarial I
ÍNDEX
2.1. Tabulació
• Presentació de les dades
• Ordenació de les dades i concepte de freqüència absoluta
• Taula de freqüències amb dades agrupades en intervals i amb dades sense agrupar
• Interval: límit inferior i superior, marca de classe, amplada, alçada
• Freqüència relativa
• Freqüència absoluta i relativa acumulades

2.2. Representació gràfica


• Dades qualitatives sense agrupar: diagrama de sectors, de barres, d’escala, de caixa
(box plot) i de tija i fulles
• Dades qualitatives agrupades: histograma, polígon de freqüències no acumulades i
polígon de freqüències acumulades

2.3. Mesures de síntesi


• Mesures de posició o localització
• Mesures de dispersió absolutes i relatives
• Concentració versus equidistribució

2.4. Transformacions lineals


Estadística econòmica i empresarial I E. Motellón
Tema 2.1. Tabulació
• Presentació de les dades
• Ordenació de les dades i concepte de freqüència absoluta
• Taula de freqüències amb dades agrupades en intervals i amb dades
sense agrupar
• Interval: límit inferior i superior, marca de classe, amplada, alçada

• Freqüència relativa
• Freqüència absoluta i relativa acumulades

(veure Conceptes bàsics 2.pdf)


Estadística econòmica i empresarial I E. Motellón
2.1. Tabulació.
Taula de freqüències
Ordenació, classificació i agrupació de sèries estadístiques

Objectiu:
Facilitar la interpretació i l’anàlisi de les dades obtingudes pel
mesurament o observació de variable o atribut

Construcció de distribució de freqüències


Primera fase del descriptiu, desprès de l’obtenció de dades
(2a etapa de l’anàlisi estadístic)

Estadística econòmica i empresarial I E. Motellón


2.1. Tabulació.
Dades desordenades i ordenades
Variable: Gènere → 2 valors (modalitats): H = Home
D = Dona
Mostra
DHHDDHDDDH
Equival
HHHHDDDDDD

Freqüència
Gènere
Absoluta (nre.) Relativa (%)
Home 4 4/10=0,4=40%

Dona 6 6/10=0,6=60%
Mida mostra 10
Estadística econòmica i empresarial I E. Motellón
2.1. Tabulació.
Tipus de taules de freqüències
En funció(≠ valors q pot prendre variable i nre. d'observacions)
X (variable) ; xi (observació) ; N (nre. total d’observacions)

Tipus I: reduït nombre d’observacions amb valors tots diferents


x1, x2, …, xN-1, xN

Tipus II: nombre elevat d’observacions amb nre. reduït de valors.


Treballarem amb dades individuals (nivell educatiu dels ocupats)
x1, x2, …, xk on k<N

Tipus III: nombre elevat d’observacions i de valors. Treballarem


amb dades agrupades (salari dels ocupats)
Estadística econòmica i empresarial I E. Motellón
2.1. Tabulació.
Tipus de taules de freqüències

OBSERVACIONS
POQUES MOLTES

POCS Dades individuals Dades individuals


Tipo II Habitualment
Tipo I
VALORS

variables discretes

MOLTS (sense sentit) Tipo


Dades III
agrupades

variables discretes
o continues

Estadística econòmica i empresarial I E. Motellón


2.1. Tabulació.
Tipus de taules de freqüències

OBSERVACIONS
POQUES MOLTES

POCS Dades individuals Dades individuals


VALORS

MOLTS (sense sentit) Dades agrupades

Construcció de taula de freqüències formalment diferent,


encara que la metodologia és la mateixa
Estadística econòmica i empresarial I E. Motellón
2.1. Tabulació.
Freqüències

— Freqüència Absoluta (ni)

— Freqüència Relativa (fi)

— Freqüència Absoluta Acumulada (Ni)

— Freqüència Relativa Acumulada (Fi)

Estadística econòmica i empresarial I E. Motellón


2.1. Tabulació.
Creació de taules de freqüències (etapes)

1a. Etapa: Ordenació dels diferents valors de la variable X

Estadística econòmica i empresarial I E. Motellón


Exemple: Taules de freqüències
Interessats en l’estudi del nombre de patents que realitza un sector determinat.
Seleccionem 20 empreses i obtenim les següents dades

0 1 1 2 3 0 0 4 4 2
2 3 1 0 3 2 1 1 0 4

Estadística econòmica i empresarial I E. Motellón


Exemple: Taules de freqüències
Interessats en l’estudi del nombre de patents que realitza un sector determinat.
Seleccionem 20 empreses i obtenim les següents dades

0 1 1 2 3 0 0 4 4 2
2 3 1 0 3 2 1 1 0 4

• Variable a analitzar: “nombre de patents” (X)


• 20 observacions (N)
• Variable X (nre. de patents) pot prendre 5 valors diferents (k = 5)
0,1, 2, 3, 4

Estadística econòmica i empresarial I E. Motellón


Exemple: Taules de freqüències
Interessats en l’estudi del nombre de patents que realitza un sector determinat.
Seleccionem 20 empreses i obtenim les següents dades

0 1 1 2 3 0 0 4 4 2
2 3 1 0 3 2 1 1 0 4

0
1
2
3
4

Estadística econòmica i empresarial I E. Motellón


2.1. Tabulació.
Creació de taules de freqüències (etapes)

2a. Etapa: Càlcul de la Freqüència Absoluta (ni)


Nombre de vegades q es repeteix un valor d’una variable
o una modalitat d’un atribut

Estadística econòmica i empresarial I E. Motellón


Exemple: Taules de freqüències
Interessats en l’estudi del nombre de patents que realitza un sector determinat..
Seleccionem 20 empreses i obtenim les següents dades

0 1 1 2 3 0 0 4 4 2
2 3 1 0 3 2 1 1 0 4

X ni

0 5 El valor “0” apareix 5 vegades:


Freqüència absoluta de valor “0” = 5
1 5
2 4
3 3
4 3 El valor “4” apareix 3 vegades:
Freqüència absoluta de valor “4” = 3

Estadística econòmica i empresarial I E. Motellón


2.1. Tabulació.
Creació de taules de freqüències (etapes)

2a. Etapa: Càlcul de la Freqüència Absoluta (ni)


Nombre de vegades q es repeteix un valor d’una variable
o una modalitat d’un atribut

Nombre de valors
Propietats: diferents de la variable X

∑n = n + n i 1 2
+…+ nk = N
i=1
Total d’observacions
(grandària de la mostra o població)
Freqüència absoluta (valor xi o
modalitat ai apareix ni vegades)

Estadística econòmica i empresarial I E. Motellón


Exemple: Taules de freqüències
Interessats en l’estudi del nombre de patents que realitza un sector determinat.
Seleccionem 20 empreses i obtenim les següents dades

0 1 1 2 3 0 0 4 4 2
2 3 1 0 3 2 1 1 0 4

X ni
Interpretació de la Freqüència Absoluta (ni):
0 5 n1: Del total d’empreses enquestades, hi ha 5 q no han fet cap patent.
1 5 n2: 5 empreses q només han patentat una innovació.
2 4
Aquestes categories són les que més vegades és presenten a la mostra
3 3
donat que són les que tenen una major freqüència absoluta
4 3
20 5+5+4+3+3=20=N

Estadística econòmica i empresarial I E. Motellón


2.1. Tabulació.
Creació de taules de freqüències (etapes)

3a. Etapa: Càlcul de la Freqüència Relativa (fi)


Freqüència absoluta entre el total de les observacions
ni
fi = i = 1,...,k
N

Estadística econòmica i empresarial I E. Motellón


Exemple: Taules de freqüències
Interessats en l’estudi del nombre de patents que realitza un sector determinat.
Seleccionem 20 empreses i obtenim les següents dades

0 1 1 2 3 0 0 4 4 2
2 3 1 0 3 2 1 1 0 4

X ni fi

n1 5
0 5 0.25 f1 = = = 0.25
N 20
1 5 0.25
2 4 0.20
3 3 0.15
4 3 0.15
20

Estadística econòmica i empresarial I E. Motellón


2.1. Tabulació.
Creació de taules de freqüències (etapes)

3a. Etapa: Càlcul de la Freqüència Relativa (fi)


Freqüència absoluta entre el total de les observacions
ni
fi = i = 1,...,k
N
Propietat:
K
K n1 n 2 n

∑f =1 ∑ f i = f1 + f 2 + ... + f k = +
N N
+ ... + k =
N
i i=1
i=1
Propietat de la ⎡ n1 + n 2 + ... + n k ⎤ N
Freqüència Absoluta
=⎢ ⎥ = =1
⎣ N ⎦ N

€ Estadística econòmica i empresarial I E. Motellón


Exemple: Taules de freqüències
Interessats en l’estudi del nombre de patents que realitza un sector determinat.
Seleccionem 20 empreses i obtenim les següents dades

0 1 1 2 3 0 0 4 4 2
2 3 1 0 3 2 1 1 0 4

X ni fi

0 5 0.25
1 5 0.25
2 4 0.20
3 3 0.15
4 3 0.15
20 1 0.25+0.25+0.2+0.15+0.15=1

Estadística econòmica i empresarial I E. Motellón


2.1. Tabulació.
Creació de taules de freqüències (etapes)

3a. Etapa: Càlcul de la Freqüència Relativa (fi)


Freqüència absoluta entre el total de les observacions
ni
fi = i = 1,...,k
N
Propietat:
K
• Facilita comparació amb altres distribucions

∑f i =1 • És una mesura de la probabilitat
i=1

€ Estadística econòmica i empresarial I E. Motellón


Exemple: Taules de freqüències
Interessats en l’estudi del nombre de patents que realitza un sector determinat.
Seleccionem 20 empreses i obtenim les següents dades

0 1 1 2 3 0 0 4 4 2
2 3 1 0 3 2 1 1 0 4

X ni fi
Quin % d’empreses han registrat 4 patents?
0 5 0.25
Resultat: 15%
1 5 0.25
2 4 0.20 Quina probabilitat hi ha que en escollir una
3 3 0.15 empresa a l'atzar de la nostra mostra
aquesta hagi registrat 4 patents?
4 3 0.15
20 1 Resultat: 15 %

Estadística econòmica i empresarial I E. Motellón


2.1. Tabulació.
Creació de taules de freqüències (etapes)

3a. Etapa: Càlcul de la Freqüència Relativa (fi)


Freqüència absoluta entre el total de les observacions
ni
fi = i = 1,...,k
N
Propietat:
K
• Facilita comparació amb altres distribucions

∑f i =1 • És una mesura de la probabilitat
i=1 • Per calcular fi , N ha de ser prou gran
• N<50 + adequat donar ni (nre. de casos)

€ Estadística econòmica i empresarial I E. Motellón


2.1. Tabulació.
Creació de taules de freqüències (etapes)

4a. Etapa: Càlcul de la Freqüències Acumulades


4.1. Freqüència Absoluta Acumulada (Ni)
Nombre d’observacions o dades amb un valor ≤ al valor considerat
N i = n1 + n 2 + ... + n i i = 1,...,k

Estadística econòmica i empresarial I E. Motellón


Exemple: Taules de freqüències
Interessats en l’estudi del nombre de patents que realitza un sector determinat.
Seleccionem 20 empreses i obtenim les següents dades

0 1 1 2 3 0 0 4 4 2
2 3 1 0 3 2 1 1 0 4

X ni fi Ni

0 5 0.25 5
1 5 0.25 10 10=5+5 → N2= n1+n2

2 4 0.20 14
3 3 0.15 17
4 3 0.15 20
20 1

Estadística econòmica i empresarial I E. Motellón


2.1. Tabulació.
Creació de taules de freqüències (etapes)

4a. Etapa: Càlcul de la Freqüències Acumulades


4.1. Freqüència Absoluta Acumulada (Ni)
Nombre d’observacions o dades amb un valor ≤ al valor considerat
N i = n1 + n 2 + ... + n i i = 1,...,k

Propietats
Per a la 1r valor/categoria de la variable (x1):
N1 = n1 Freqüència absoluta acumulada = Freqüència absoluta

N k = n1 + n 2 + ... + n k = N

Per al darrer valor/categoria de la variable (xk):


€ Freqüència absoluta acumulada = Total observacions
Estadística econòmica i empresarial I E. Motellón
Exemple: Taules de freqüències
Interessats en l’estudi del nombre de patents que realitza un sector determinat.
Seleccionem 20 empreses i obtenim les següents dades

0 1 1 2 3 0 0 4 4 2
2 3 1 0 3 2 1 1 0 4

X ni fi Ni

0 5 0.25 5 N 1= n 1
1 5 0.25 10
2 4 0.20 14
3 3 0.15 17
4 3 0.15 20 Nk= N
20 1

Estadística econòmica i empresarial I E. Motellón


2.1. Tabulació.
Creació de taules de freqüències (etapes)

4a. Etapa: Càlcul de la Freqüències Acumulades


4.2. Freqüència Relativa Acumulada (Fi) → 2 opcions:
• Freqüència absoluta acumulada entre el total d’observacions
• Suma de les freqüències relatives dels valors ≤ al valor considerat
Ni
Fi = = fii + f 2 + ... + f k i = 1,...,k
N

Estadística econòmica i empresarial I E. Motellón


Exemple: Taules de freqüències
Interessats en l’estudi del nombre de patents que realitza un sector determinat.
Seleccionem 20 empreses i obtenim les següents dades

0 1 1 2 3 0 0 4 4 2
2 3 1 0 3 2 1 1 0 4

X ni fi Ni Fi

F2=0.50=10/20=N2/N
0 5 0.25 5 0.25
1 5 0.25 10 0.50 F2=0.50=0.25+0.25= f1+f2

2 4 0.20 14 0.70
3 3 0.15 17 0.85
4 3 0.15 20 1
20 1

Estadística econòmica i empresarial I E. Motellón


2.1. Tabulació.
Creació de taules de freqüències (etapes)

4a. Etapa: Càlcul de la Freqüències Acumulades


4.2. Freqüència Relativa Acumulada (Fi) → 2 opcions:
• Freqüència absoluta acumulada entre el total d’observacions
• Suma de les freqüències relatives dels valors ≤ al valor considerat
Ni
Fi = = fii + f 2 + ... + f k i = 1,...,k
N

Propietats:
1r valor/categoria de la variable (x1):
€ F1 = f1 Freqüència relativa acumulada = Freqüència relativa

Fk = 1 Darrer valor/categoria de la variable (xk):


Freqüència absoluta acumulada = 1
Estadística econòmica i empresarial I E. Motellón
2.1. Tabulació.
Creació de taules de freqüències (etapes)

4a. Etapa: Càlcul de la Freqüències Acumulades


4.2. Freqüència Relativa Acumulada (Fi) → 2 opcions:
• Freqüència absoluta acumulada entre el total d’observacions
• Suma de les freqüències relatives dels valors ≤ al valor considerat
Ni
Fi = = fii + f 2 + ... + f k i = 1,...,k
N

Propietats:
k
€ F1 = f1 Fk = f1 + f 2 + … + f k = ∑ f i =1
i =1
Fk = 1 n1 + n2 + … + nk N k N
Fk = = = =1
Estadística econòmica i empresarial I
N N N E. Motellón
Exemple: Taules de freqüències
Interessats en l’estudi del nombre de patents que realitza un sector determinat.
Seleccionem 20 empreses i obtenim les següents dades

0 1 1 2 3 0 0 4 4 2
2 3 1 0 3 2 1 1 0 4

X ni fi Ni Fi

0 5 0.25 5 0.25 F1= f1


1 5 0.25 10 0.50
2 4 0.20 14 0.70
3 3 0.15 17 0.85
4 3 0.15 20 1 Fk= Nk/N = 1
20 1

Estadística econòmica i empresarial I E. Motellón


Exemple: Taules de freqüències
Interessats en l’estudi del nombre de patents que realitza un sector determinat.
Seleccionem 20 empreses i obtenim les següents dades

0 1 1 2 3 0 0 4 4 2
2 3 1 0 3 2 1 1 0 4

X ni fi Ni Fi
Quin % d’empreses han realitzat
0 5 0.25 5 0.25 com a màxim una patent?

1 5 0.25 10 0.50 Resultat: 50%

2 4 0.20 14 0.70
Quina probabilitat hi ha que en
3 3 0.15 17 0.85 escollir una empresa a l'atzar de la
4 3 0.15 20 1 nostra mostra aquesta hagi
registrat 1 o menys patents?
20 1
Resultat: 50%
Estadística econòmica i empresarial I E. Motellón
Exemple: Taules de freqüències
Interessats en l’estudi del nombre de patents que realitza un sector determinat.
Seleccionem 20 empreses i obtenim les següents dades

0 1 1 2 3 0 0 4 4 2
2 3 1 0 3 2 1 1 0 4

X ni fi Ni Fi
I la probabilitat de haver registrat
tres o més patents?
0 5 0.25 5 0.25
Resultat: 30%
1 5 0.25 10 0.50
2 4 0.20 14 0.70 F3=0.7 (realitzar 0,1 o 2 patents)

3 3 0.15 17 0.85 1 - 0.7 = 0.3 = 30%

4 3 0.15 20 1
20 1

Estadística econòmica i empresarial I E. Motellón


2.1. Tabulació.
Creació de taules de freqüències (etapes)

X ni fi Ni Fi

x1 n1 f1 N1=n1 F1=f1

x2 n2 f2 N2=n1+n2 F2=f1+f2

x3 n3 f3 N3=n1+n2+n3 F3=f1+f2+f3

… … … … …

xk nk fk Nk=n1+n2+n3+…+nk=N Fk=f1+f2+f3+…+fk=1

N 1

Estadística econòmica i empresarial I E. Motellón


2.1. Tabulació.
Creació de taules de freqüències (etapes)

X ni fi Ni Fi
Fins ara hem treballat amb dades individuals pq
xla
1 variable
n1 d’estudi
f1 prenia pocs valors
N1=n 1 diferents F1=f1

x2 n2 f2 N2=n1+n2 F2=f1+f2
Què passa si la nostra variable pren un nombre elevat de valors?
x3 n3 f3 N3=n1+n2+n3 F3=f1+f2+f3

… … … … …
Elaboració d’una taula de freqüències amb dades
xk nk agrupades
fk en3+…+n
Nk=n1+n2+n intervals
k=N Fk=f1+f2+f3+…+fk=1

N 1

Estadística econòmica i empresarial I E. Motellón


2.1. Tabulació.
Dades agrupades

Consideracions inicials
1. Objectiu: agrupar els valors de la variable en un nre. d'intervals
que no sigui excessivament gran

2. Perdem informació. Només sabrem en nre. d'observacions q hi


ha en cada interval però no el valor exacte d'aquestes observacions

3. Intervals creats de forma artificial per l’investigador/a pq les


dades es recullen de forma individualitzada

Estadística econòmica i empresarial I E. Motellón


2.1. Tabulació.
Creació d’intervals

1. Decisió sobre el nre. de classes (intervals)


No existeix cap regla, però es suggereix emprar: 2 N
Però si N=100 tindríem q fer 20 intervals i és excessiu.

Què s’entén per un nombre excessiu? En general 15 intervals com



a màxim. Per tant, és una decisió ad hoc (segons la circumstància).

Estadística econòmica i empresarial I E. Motellón


2.1. Tabulació.
Creació d’intervals

1. Decisió sobre el nre. de classes (intervals)


No existeix cap regla, però es suggereix emprar: 2 N
rang
2. Amplada de l’interval (ai) ⟶ ai =
nº de classes

Rang (Recorregut) = (valor +gran de X) – (valor +petit de X)

ReX = MaxX – MinX



• Si nombre intervals predefinits, tenim automàticament ai
• Si ai predefinida, tenim automàticament nombre intervals

Estadística econòmica i empresarial I E. Motellón


2.1. Tabulació.
Creació d’intervals

1. Decisió sobre el nre. de classes (intervals)


No existeix cap regla, però es suggereix emprar: 2 N
rang
2. Amplada de l’interval (ai) ⟶ ai =
nº de classes

3. Interval definit pels seus extrems ⟶ (Li−1 , Li ] ]Li−1 , Li ]

€ Extrem superior Extrem inferior


(obert) (tancat)

(a,b] = ]a,b] a fora del interval i b sí pertany

Estadística econòmica i empresarial I E. Motellón


2.1. Tabulació.
Creació d’intervals

1. Decisió sobre el nre. de classes (intervals)


No existeix cap regla, però es suggereix emprar: 2 N
rang
2. Amplada de l’interval (ai) ⟶ ai =
nº de classes

3. Interval definit pels seus extrems ⟶ (Li−1,L1 ] ]Li−1,L1 ]

4. ai pot ser constant o €


variable. Per tant, ai = Li − Li−1
Exemple: €
En estudi de Wmensual poques observacions entre 5500€ i 12000€.

Útil: (5500-12000], independentment de la grandària de la resta d’intervals

Estadística econòmica i empresarial I E. Motellón


2.1. Tabulació.
Creació d’intervals

1. Decisió sobre el nre. de classes (intervals)


No existeix cap regla, però es suggereix emprar: 2 N
rang
2. Amplada de l’interval (ai) ⟶ ai =
nº de classes

3. Interval definit pels seus extrems ⟶ (Li−1,L1 ] ]Li−1,L1 ]

4. ai pot ser constant o €


variable. Per tant, ai = Li − Li−1

5. €
Marca de classe (ci): Punt representatiu (mitjà) de l’interval
Li + Li−1 €
ci =
2
Estadística econòmica i empresarial I E. Motellón
2.1. Tabulació.
Creació d’intervals

6. Alçada d’un interval (hi). Important quan l'amplitud dels


intervals és variable per la realització de gràfics.
n f
hi = i ; hi = i
ai ai

Superfície del rectangle de Superfície del rectangle de


l'histograma, coincideixi amb l'histograma, coincideixi amb
la freqüència absoluta la freqüència relativa

Estadística econòmica i empresarial I E. Motellón


2.1. Tabulació.
Creació d’intervals

6. Alçada d’un interval (hi). Important quan l'amplitud dels


intervals és variable per la realització de gràfics.
n f
hi = i ; hi = i
ai ai

7. Selecció punt inicial (L0). Límit inferior de l'interval +petit


(el primer).
Recomanació: Valor mínim de X o preveure valor inferior

8. Selecció punt final. Límit superior de l’interval + gran


(l’ últim)
Recomanació: Incloure valor màxim de X o preveure valor superior

Estadística econòmica i empresarial I E. Motellón


Exemple: Taules de freqüències
amb dades agrupades
Interessats en l’estudi de la despesa en innovació que va realitzar al darrer
trimestre les empreses de la mostra (dades en milers d’euros)
73 76 38 59 108 8 71 63 32 39
92 47 51 83 91 74 42 109 24 36

• Variable a analitzar: “despesa en innovació” (X)


• 20 observacions (N)
• Variable X: Variable continua discretalitzada
• Amplitud de l’interval (ai) constant i igual a 20

Estadística econòmica i empresarial I E. Motellón


Exemple: Taules de freqüències
amb dades agrupades
Interessats en l’estudi de la despesa en innovació que va realitzar al darrer
trimestre les empreses de la mostra (dades en milers d’euros)
73 76 38 59 108 8 71 63 32 39
92 47 51 83 91 74 42 109 24 36

X
(L0,L1]
(L1,L2]
(L2,L3]
(L3,L4]
(L4,L5]
(L7,L6]

Estadística econòmica i empresarial I E. Motellón


Exemple: Taules de freqüències
amb dades agrupades
Interessats en l’estudi de la despesa en innovació que va realitzar al darrer
trimestre les empreses de la mostra (dades en milers d’euros)
73 76 38 59 108 8 71 63 32 39
92 47 51 83 91 74 42 109 24 36

X
(0,20]
(20,40]
(40,60]
(60,80]
(80,100]
(100,120]

Estadística econòmica i empresarial I E. Motellón


Exemple: Taules de freqüències
amb dades agrupades
Interessats en l’estudi de la despesa en innovació que va realitzar al darrer
trimestre les empreses de la mostra (dades en milers d’euros)
73 76 38 59 108 8 71 63 32 39
92 47 51 83 91 74 42 109 24 36

X ni
(0,20] 8

(20,40] 24, 32, 36, 38, 39


(40,60] 42, 47, 51, 59
(60,80] 64, 71, 73, 74, 76

(80,100] 83, 91, 92

(100,120] 108, 109

Estadística econòmica i empresarial I E. Motellón


Exemple: Taules de freqüències
amb dades agrupades
Interessats en l’estudi de la despesa en innovació que va realitzar al darrer
trimestre les empreses de la mostra (dades en milers d’euros)
73 76 38 59 108 8 71 63 32 39
92 47 51 83 91 74 42 109 24 36

X ni
(0,20] 1
(20,40] 5
(40,60] 4
(60,80] 5
(80,100] 3
(100,120] 2
?

Estadística econòmica i empresarial I E. Motellón


Exemple: Taules de freqüències
amb dades agrupades
Interessats en l’estudi de la despesa en innovació que va realitzar al darrer
trimestre les empreses de la mostra (dades en milers d’euros)
73 76 38 59 108 8 71 63 32 39
92 47 51 83 91 74 42 109 24 36

X ni
Empresa amb despesa de 40.000 €?
(0,20] 1
(20,40] 5
(40,60] 4
(60,80] 5
(80,100] 3
(100,120] 2
N=20 ?

Estadística econòmica i empresarial I E. Motellón


Exemple: Taules de freqüències
amb dades agrupades
Interessats en l’estudi de la despesa en innovació que va realitzar al darrer
trimestre les empreses de la mostra (dades en milers d’euros)
73 76 38 59 108 8 71 63 32 39
92 47 51 83 91 74 42 109 24 36

ni
X ni fi fi =
N
(0,20] 1 0.05 1/20
(20,40] 5 0.25 5/20

(40,60] 4 0.20€ 4/20

(60,80] 5 0.25 5/20

(80,100] 3 0.15 3/20

(100,120] 2 0.1 2/20

N=20 1 ?

Estadística econòmica i empresarial I E. Motellón


Exemple: Taules de freqüències
amb dades agrupades
Interessats en l’estudi de la despesa en innovació que va realitzar al darrer
trimestre les empreses de la mostra (dades en milers d’euros)
73 76 38 59 108 8 71 63 32 39
92 47 51 83 91 74 42 109 24 36

X ni fi Ni
(0,20] 1 0.05 1 N1=n1=1

(20,40] 5 0.25 6 N2=n1+n2=6


(40,60] 4 0.20 10 N3=n1+n2+n3=10
(60,80] 5 0.25 15 N4=n1+n2+n3+n4=15

(80,100] 3 0.15 18 N5=n1+n2+n3+n4+n5=15

(100,120] 2 0.1 20 N6=n1+n2+n3+n4+n5+n6=20

N=20 1

Estadística econòmica i empresarial I E. Motellón


Exemple: Taules de freqüències
amb dades agrupades
Interessats en l’estudi de la despesa en innovació que va realitzar al darrer
trimestre les empreses de la mostra (dades en milers d’euros)
73 76 38 59 108 8 71 63 32 39
92 47 51 83 91 74 42 109 24 36

Ni
X ni fi Ni Fi Fi = = f1 + f2 + + fi
N
(0,20] 1 0.05 1 0.05 F1=N1/N=f1

(20,40] 5 0.25 6 0.30 F2=N2/N=f1+f2


(40,60] 4 0.20 10 0.50 Propietats
F3=N3/N=f1+f2+f3
(60,80] 5 0.25 15 0.75 F4=N4/N=f1+f2+f3+f4

(80,100] 3 0.15 18 0.90 F5=N5/N=f1+f2+f3+f4+f5

(100,120] 2 0.1 20 1 F6=N6/N=f1+f2+f3+f4+f5+f6

N=20 1

Estadística econòmica i empresarial I E. Motellón


Exemple: Taules de freqüències
amb dades agrupades
Interessats en l’estudi de la despesa en innovació que va realitzar al darrer
trimestre les empreses de la mostra (dades en milers d’euros)
73 76 38 59 108 8 71 63 32 39
92 47 51 83 91 74 42 109 24 36

Li−1 + Li
X ni fi Ni Fi ci ci =
2
(0,20] 1 0.05 1 0.05 10 c1=(0+20)/2

(20,40] 5 0.25 6 0.30 30 c2=(20+40)/2


(40,60] 4 0.20 10 0.50 50 Propietats
c3=(40+60)/2
(60,80] 5 0.25 15 0.75 70 c4=(60+80)/2

(80,100] 3 0.15 18 0.90 90 c5=(80+100)/2

(100,120] 2 0.1 20 1 110 c6=(100+120)/2

N=20 1

Estadística econòmica i empresarial I


Exemple: Taules de freqüències
amb dades agrupades
Interessats en l’estudi de la despesa en innovació que va realitzar al darrer
trimestre les empreses de la mostra (dades en milers d’euros)
73 76 38 59 108 8 71 63 32 39
92 47 51 83 91 74 42 109 24 36

X ni fi Ni Fi ci ai ai = Li + Li−1
(0,20] 1 0.05 1 0.05 10 20 c1=20-0

(20,40] 5 0.25 6 0.30 30 20 c2=40-20

(40,60] 4 0.20 10 0.50 50 20 c3=60-40


(60,80] 5 0.25 15 0.75 70 20 c4=80-60

(80,100] 3 0.15 18 0.90 90 20 c5=100-80

(100,120] 2 0.1 20 1 110 20 c6=120-100

N=20 1

Estadística econòmica i empresarial I


Exemple: Taules de freqüències
amb dades agrupades
Interessats en l’estudi
• Quina probabilitat de que
hi ha la despesa en innovació
en escollir una empresa que va realitzar
a l'atzar al darrer
de la nostra
mostra tingui
trimestre una despesa
les empreses de laen innovació
mostra (dadesinferior a 40.000€?
en milers d’euros)
Resultat: 30%
73 76 hi 38
• Quina probabilitat 59 en108
ha que 8 una71empresa
escollir 63 32 39 hagi realitzat
a l'atzar
una despesa
92 en47innovació
51 83entre9180.000
74 i 100.000
42 109 €?24 36
Resultat: 15%
X ni fi Ni Fi ci ai
(0,20] 1 0.05 1 0.05 10 20
(20,40] 5 0.25 6 0.30 30 20
(40,60] 4 0.20 10 0.50 50 20
(60,80] 5 0.25 15 0.75 70 20
(80,100] 3 0.15 18 0.90 90 20
(100,120] 2 0.1 20 1 110 20
N=20 1

Estadística econòmica i empresarial I


Exemple: Taules de freqüències
amb dades agrupades
Interessats en l’estudi de la despesa en innovació que va realitzar al darrer
trimestre les empreses de la mostra (dades en milers d’euros)
73 76 38 59 108 8 71 63 32 39
ni
92 47 51 83 91 74 42 109 24 36 hi =
ai

X ni fi Ni Fi ci ai hi
(0,20] 1 0.05 1 0.05 10 €20 0.05
(20,40] 5 0.25 6 0.30 30 20 0.25
(40,60] 4 0.20 10 0.50 50 20 0.20
(60,80] 5 0.25 15 0.75 70 20 0.25
(80,100] 3 0.15 18 0.90 90 20 0.15
(100,120] 2 0.1 20 1 110 20 0.10
N=20 1

Estadística econòmica i empresarial I


Exemple: Taules de freqüències
amb dades agrupades
Interessats en l’estudi de la despesa en innovació que va realitzar al darrer
trimestre les empreses de la mostra (dades en milers d’euros)
73 76 38 59 108 8 71 63 32 39
fi
92 47 51 83 91 74 42 109 24 36 hi =
ai

X ni fi Ni Fi ci ai hi
(0,20] 1 0.05 1 0.05 10 €20 0.0025
(20,40] 5 0.25 6 0.30 30 20 0.0125
(40,60] 4 0.20 10 0.50 50 20 0.0100
(60,80] 5 0.25 15 0.75 70 20 0.0125
(80,100] 3 0.15 18 0.90 90 20 0.0075
(100,120] 2 0.1 20 1 110 20 0.0050
N=20 1

Estadística econòmica i empresarial I


2.1. Tabulació.
Dades qualitatives

Qualitatives nominals (Observacions només és poden classificar)


• Taules amb dades individuals
o Normalment poques categories
o No és poden agrupar en intervals

• No calcular les freqüències acumulades (ni absolutes ni relatives)

Qualitatives ordinals (classificació + ordenació)


• Taules amb dades individuals i agrupades
• És poden calcular freqüències acumulades (absolutes i relatives)

Estadística econòmica i empresarial I E. Motellón


2.1. Tabulació.
Comentaris addicionals

Determinar distribució de freqüències necessitem:


• Diferents valors q pren la variable (xi)
• Total d’observacions (N)
• Qualsevol de les freqüències (ni, fi, Ni, Fi)
X ni fi Ni Fi
ni
fi =
0 5 =5/20 =5 =(5/20) N
1 5 =5/20 =5+5 =(5+5)/20

2 4 =4/20 =5+5+4 =(5+5+4)/20

3 3 =3/20 =5+5+4+3 =(5+5+4+3)/20

4 3 =3/20 =5+5+4+3+3 =(5+5+4+3+3)/20 €


20
Estadística econòmica i empresarial I E. Motellón
2.1. Tabulació.
Comentaris addicionals

Determinar distribució de freqüències necessitem:


• Diferents valors q pren la variable (xi)
• Total d’observacions (N)
• Qualsevol de les freqüències (ni, fi, Ni, Fi)
ni
X ni fi Ni Fi f i = → ni = N ⋅ f i
N
0 =20*0.05 0.05
1 =20*0.25 0.25
2 =20*0.20 0.20
3 =20*0.25 0.25 €
4 =20*0.15 0.15
20
Estadística econòmica i empresarial I E. Motellón
2.1. Tabulació.
Comentaris addicionals

Determinar distribució de freqüències necessitem:


• Diferents valors q pren la variable (xi)
• Total d’observacions (N)
• Qualsevol de les freqüències (ni, fi, Ni, Fi)
X ni fi Ni Fi n1 = N1
0 =5 5
ni = N i − N i−1 ∀i = 2,3,…,n
1 =10-5 10
2 =14-10 14
3 =17-14 17
4 =20-17 20

Estadística econòmica i empresarial I E. Motellón


2.1. Tabulació.
Comentaris addicionals

Determinar distribució de freqüències necessitem:


• Diferents valors q pren la variable (xi)
• Total d’observacions (N)
• Qualsevol de les freqüències (ni, fi, Ni, Fi)
Ni
X ni fi Ni Fi Fi = → N i = Fi ⋅ N
0 =0.25*20 0.25
N
1 =0.50*20 0.50
2 =0.70*20 0.70
3 =0.70*20 0.85
4 =1*20 1
20
Estadística econòmica i empresarial I E. Motellón
Tema 2.2. Representació gràfica
• Dades quantitatives sense agrupar: diagrama de sectors, de
barres, d’escala, de caixa (box plot) i de tija i fulles

• Dades quantitatives agrupades: histograma, polígon de freqüències


no acumulades i polígon de freqüències acumulades

(veure Conceptes bàsics 2.pdf)

Estadística econòmica i empresarial I E. Motellón


2.2. Representació gràfica.
Introducció

Representació gràfica proporciona de forma ràpida i visual


una idea aproximada de l’aspecte que s’estudia.

Auxiliars de la interpretació, i les conclusions s’haurien


d’obtenir de l’estudi de la taula estadística

Representació gràfica en funció de la tipus de dades


— Quantitatives discretes o continues
— Qualitatives nominals o ordinals

— Dades sense agrupar


— Dades agrupades

Estadística econòmica i empresarial I E. Motellón


2.2. Representació gràfica.
Introducció
• Dades quantitatives sense agrupar
1. Sectors
2. Barres
3. Escala
4. Diagrama de caixa (Box-Plot)
5. Tall i fulles

• Dades quantitatives agrupades


6. Histograma
7. Polígon de freqüències no acumulades
8. Polígon de freqüències acumulades

Estadística econòmica i empresarial I E. Motellón


2.2. Representació gràfica.
Dades quantitatives sense agrupar
1. Gràfic de sectors
Cercle apareix dividit en sectors de manera que els angles i, per tant, les
àrees respectives siguin proporcionals a les freqüències (absolutes o relatives)
Patents registrades 4
X ni fi 0

0 5 0.25
1 5 0.25 3

2 4 0.20
3 3 0.15
4 3 0.15 1
2
20 1
Gràfic amb Gràfic amb
freqüències = freqüencies
absolutes relatives
Nota: Adequat per variable qualitatives nominals
Estadística econòmica i empresarial I E. Motellón
2.2. Representació gràfica.
Dades quantitatives sense agrupar
2. Gràfic de barres
Sobre l’eix horitzontal els valors de la variable X, aixecar sobre cadascun dels
punts una barra l’alçada de la qual sigui igual a la seva freqüència (absoluta o
relativa). Buit entre barres per indicar els valors que no són possibles
Patents registrades Gràfic de barres amb freqüències absolutes
X ni fi 6

0 5 0.25 5

1 5 0.25 4
2 4 0.20 3
3 3 0.15 2
4 3 0.15 1
20 1
0
0 1 2 3 4
Nota: Adequat per variable qualitatives
Estadística econòmica i empresarial I E. Motellón
2.2. Representació gràfica.
Dades quantitatives sense agrupar
2. Gràfic de barres
Sobre l’eix horitzontal els valors de la variable X, aixecar sobre cadascun dels
punts una barra l’alçada de la qual sigui igual a la seva freqüència (absoluta o
relativa). Buit entre barres per indicar els valors que no són possibles
Patents registrades Gràfic de barres amb freqüències relatives
X ni fi 0.30
0 5 0.25 0.25
1 5 0.25 0.20
2 4 0.20 0.15
3 3 0.15
0.10
4 3 0.15
0.05
20 1
0.00
0 1 2 3 4
Nota: Adequat per variable qualitatives
Estadística econòmica i empresarial I E. Motellón
2.2. Representació gràfica.
Dades quantitatives sense agrupar
3. Gràfic d’escala
Representació de les freqüències acumulades. Pren forma d’una escala
integrada per graons que pugen des del nivell zero de les freqüències fins al
màxim (N per absolutes i 1 per relatives).
Patents registrades Gràfic d’escala amb freqüències absolutes acumulades
X ni fi 20
0 5 0.25 16
1 5 0.25
12
2 4 0.20
3 3 0.15 8

4 3 0.15 4
20 1
0
0 1 2 3 4
Nota: Adequat per variable qualitatives ordinals
Estadística econòmica i empresarial I E. Motellón
2.2. Representació gràfica.
Dades quantitatives sense agrupar
3. Gràfic d’escala
Representació de les freqüències acumulades. Pren forma d’una escala
integrada per graons que pugen des del nivell zero de les freqüències fins al
màxim (N per absolutes i 1 per relatives).
Patents registrades Gràfic d’escala amb freqüències relatives acumulades
X ni fi 1.00
0 5 0.25 0.80
1 5 0.25
0.60
2 4 0.20
3 3 0.15 0.40

4 3 0.15 0.20
20 1
0.00
0 1 2 3 4
Nota: Adequat per variable qualitatives ordinals
Estadística econòmica i empresarial I E. Motellón
2.2. Representació gràfica.
Dades quantitatives sense agrupar
4. Diagrama de caixa (Box-Plot)
Sintetitza en un gràfic diverses mesures estadístiques
Valor màxim
no atípic
80,00

1,5RI

60,00 Q3(0,75)
Valors atípics
(outliers) RI =Q3-Q1
40,00 Mediana = Q2(0,5)
Q1(0,25)
1,5RI
20,00 Valor mínim
no atípic

EDAD

Estadística econòmica i empresarial I E. Motellón


2.2. Representació gràfica.
Dades quantitatives sense agrupar
4. Diagrama de caixa (Box-Plot)

Simetria Asimetria Asimetria


dreta esquerra

Estadística econòmica i empresarial I E. Motellón


2.2. Representació gràfica.
Dades quantitatives sense agrupar
5. Gràfic tall i fulles
Procediment semi-gràfic + útil quan la mostra no és molt gran.
Avantatge: - arbitrari que histograma i + senzill de construir

Estadística econòmica i empresarial I E. Motellón


2.2. Representació gràfica.
Dades quantitatives sense agrupar
5. Gràfic tall i fulles
Procediment semi-gràfic + útil quan la mostra no és molt gran.
Avantatge: - arbitrari que histograma i + senzill de construir

Casos per
Tall Valor Tall Fulles fulles
18 18 18
1 10 8 3 19 19 19
1 10 9 3 19 19 19
1 10 9 3
1 10 9 3 19 19 19

Estadística econòmica i empresarial I E. Motellón


2.2. Representació gràfica.
Dades quantitatives agrupades
6. Histograma
Conjunt de rectangles juxtaposats amb les següents característiques:
Histograma de la despesa en innovació (ni)
10
• Eix horitzontal escala adequada i uniforme
8
• Punt central de base = marca de classe

Freqüència
6
• Amplada rectangle = amplada interval
4
• Àrea proporcional a ni de classe
2

0
(0,20] (20,40] (40,60] (60,80] (80,100] (100,120]

Nota: Si els intervals tenen amplades diferents (ai) s’ha de calcular


l’alçada (hi) pq les superfícies coincideixin amb les freqüències.
Estadística econòmica i empresarial I E. Motellón
2.2. Representació gràfica.
Dades quantitatives agrupades
6. Histograma
Conjunt de rectangles juxtaposats amb les següents característiques:
Histograma de la despesa en innovació (fi)
• Eix horitzontal escala adequada i uniforme 0.5

0.4
• Punt central de base = marca de classe

Freqüència
0.3
• Amplada rectangle = amplada interval
0.2
• Àrea proporcional a ni de classe
0.1

0
(0,20] (20,40] (40,60] (60,80] (80,100] (100,120]

Nota: Si els intervals tenen amplades diferents (ai) s’ha de calcular


l’alçada (hi) pq les superfícies coincideixin amb les freqüències.
Estadística econòmica i empresarial I E. Motellón
2.2. Representació gràfica.
Dades quantitatives agrupades
7. Polígon de freqüències no acumulades
Unint els punts mitjos (marca de classe de l’interval) situats a la part
superior del rectangles de d'histograma (freqüències absolutes)
Polígon de freqüències absolutes de la despesa en innovació
10
9
8
7
Freqüència

6
5
4
3
2
1
0
(0,20] (20,40] (40,60] (60,80] (80,100] (100,120]
Estadística econòmica i empresarial I E. Motellón
2.2. Representació gràfica.
Dades quantitatives agrupades
7. Polígon de freqüències no acumulades
Unint els punts mitjos (marca de classe de l’interval) situats a la part
superior del rectangles de d'histograma (freqüències relatives)
Polígon de freqüències absolutes de la despesa en innovació
0.5

0.4
Freqüència

0.3

0.2

0.1

0
(0,20] (20,40] (40,60] (60,80] (80,100] (100,120]
Estadística econòmica i empresarial I E. Motellón
2.2. Representació gràfica.
Dades quantitatives agrupades
8. Polígon de freqüències acumulades
Unint els punts mitjos (marca de classe de d'interval) situats a la part
superior del rectangles de d'histograma (freqüència absoluta acumulada)
Polígon de freqüències acumulades de la despesa en innovació
20
18
16
14
Freqüència

12
10
8
6
4
2
0
(0,20] (20,40] (40,60] (60,80] (80,100] (100,120]
Estadística econòmica i empresarial I E. Motellón
2.2. Representació gràfica.
Dades quantitatives agrupades
8. Polígon de freqüències acumulades
Unint els punts mitjos (marca de classe de d'interval) situats a la part
superior del rectangles de d'histograma (freqüència absoluta acumulada)
Polígon de freqüències acumulades de la despesa en innovació
20
18
16
14
Freqüència

12
10
8
6
4
2
0
(0,20] (20,40] (40,60] (60,80] (80,100] (100,120]
Estadística econòmica i empresarial I E. Motellón
2.2. Representació gràfica.
Dades quantitatives agrupades
8. Polígon de freqüències acumulades
Unint els punts mitjos (marca de classe de d'interval) situats a la part
superior del rectangles de d'histograma (freqüència relativa acumulada)
Polígon de freqüències acumulades de la despesa en innovació
1
0.9
0.8
0.7
Freqüència

0.6
0.5
0.4
0.3
0.2
0.1
0
(0,20] (20,40] (40,60] (60,80] (80,100] (100,120]
Estadística econòmica i empresarial I E. Motellón
2.2. Representació gràfica.
Dades quantitatives agrupades
8. Polígon de freqüències acumulades
Unint els punts mitjos (marca de classe de d'interval) situats a la part
superior del rectangles de d'histograma (freqüència relativa acumulada)
Polígon de freqüències acumulades de la despesa en innovació
1
0.9
0.8
0.7
Freqüència

0.6
0.5
0.4
0.3
0.2
0.1
0
(0,20] (20,40] (40,60] (60,80] (80,100] (100,120]
Estadística econòmica i empresarial I E. Motellón
Tema 2.3. Mesures de síntesi
• Mesures de posició o localització
• Mesures de dispersió absolutes i relatives
• Mesures de forma
• Concentració versus Equidistribució
• Transformacions lineals

(veure Conceptes bàsics 2.pdf)

Estadística econòmica i empresarial I E. Motellón


2.3. Mesures de síntesi.
Introducció

• La utilització d’estadístics (valors numèrics que calculem a


partir de les dades, si és possible abans d’agrupar-les) permet
evitar alguna de les arbitrarietats de taules i gràfics.

• Normalment es treballa amb diferents estadístics que


recullen característiques d’interès dels fenòmens analitzats.

• Per exemple, estadístics de:


– posició: central i localització
– dispersió: absoluta i relativa
– forma (simetria i curtosi) i concentració
Estadística econòmica i empresarial I E. Motellón
2.3. Mesures de síntesi.
Introducció

• Estadístic, mesura d’interès q serà operativa si compleix


tres condicions:
1. En la seva determinació intervenen tots el valors de X
2. Sempre calculable
3. Única per cada distribució de freqüències

• Mesures referides a la mostra: contrastar-les i inferir-les


a la població

Estadística econòmica i empresarial I E. Motellón


2.3. Mesures de síntesi.
Introducció

Estadística econòmica i empresarial I E. Motellón


2.3.1 Mesures de posició o localització
• Mesures de tendència central
• Mitjana aritmètica, mediana i moda
• Relació entre mitjana aritmètica, mediana i moda
• Mesures de tendència no central
• Quartils
• Decils
• Percentils
• Moments

Estadística econòmica i empresarial I E. Motellón


2.3. Mesures de síntesi.
Introducció
Estadístics

Posició Dispersió Forma Concentració

Tendència Tendència
central no central
Mitjana aritmètica Quartils
Mediana Decils
Moda Percentils
Mitjana geomètrica
Mitjana harmònica
Mitjana quadràtica
Estadística econòmica i empresarial I E. Motellón
2.3.1 Mesures de posició central.
Mitjana aritmètica

∑x n i i K
x= i=1
= ∑ xi f i
N i=1

Estadística econòmica i empresarial I E. Motellón


Exemple: Mitjana aritmètica
Interessats en l’estudi del nombre de patents que realitza un sector determinat.
Seleccionem 20 empreses i obtenim les següents dades
0 1 1 2 3 0 0 4 4 2
2 3 1 0 3 2 1 1 0 4

X ni fi
0 5 0.25
1 5 0.25
2 4 0.20
3 3 0.15
4 3 0.15
N=20

Estadística econòmica i empresarial I E. Motellón


2.3.1 Mesures de posició central. k

∑x n i i K

Mitjana aritmètica x= i=1


N
= ∑ xi f i
i=1
Propietats (I)
1. La suma de les desviacions de totes les observacions de la variable respecte a la
N
mitjana és 0
N N N N N ∑x i N N

∑(x − x ) =∑ x − ∑ x =∑ x − N x = ∑ x − N
i i i i
i=1
N
= ∑ xi − ∑ xi = 0
i=1 i=1 i=1 i=1 i=1 i=1 i=1

R Pq mitjana és el veritable valor central de la distribució: centre de gravetat i punt


d’equilibri de la distribució

Estadística econòmica i empresarial I E. Motellón


Exemple: Mitjana aritmètica
Interessats en l’estudi del nombre de patents que realitza un sector determinat.
Seleccionem 20 empreses i obtenim les següents dades
0 1 1 2 3 0 0 4 4 2
2 3 1 0 3 2 1 1 0 4

X ni fi Propietat 1
0 5 0.25
1 5 0.25
2 4 0.20
3 3 0.15
4 3 0.15
N=20

Estadística econòmica i empresarial I E. Motellón


2.3.1 Mesures de posició central. k

∑x n i i K

Mitjana aritmètica x= i=1


N
= ∑ xi f i
i=1
Propietats (I)
1. La suma de les desviacions de totes les observacions de la variable respecte a la
N
mitjana és 0
N N N N N ∑x i N N

∑(x − x ) =∑ x − ∑ x =∑ x − N x = ∑ x − N
i i i i
i=1
N
= ∑ xi − ∑ xi = 0
i=1 i=1 i=1 i=1 i=1 i=1 i=1

2. L’expressió matemàtica que representa la mitjana aritmètica coincideix amb el


moment ordinari (o respecte l’origen) de 1r ordre “a1”
a1 = x

Estadística econòmica i empresarial I E. Motellón


Exemple: Mitjana aritmètica
Interessats en l’estudi del nombre de patents que realitza un sector determinat.
Seleccionem 20 empreses i obtenim les següents dades
0 1 1 2 3 0 0 4 4 2
2 3 1 0 3 2 1 1 0 4
Propietat 2
X ni a=2 b=4
0 5 2 4
1 5 3 5
2 4 4 6
3 3 5 7
4 3 6 8
N=20

Estadística econòmica i empresarial I E. Motellón


2.3.1 Mesures de posició central. k

∑x n i i K

Mitjana aritmètica x= i=1


N
= ∑ xi f i
i=1
Propietats (II)
3. La mitjana aritmètica queda afectada pels canvis d’origen. Si a tots els valors que
pren una variable li sumem (restem) una constant a, la mitjana aritmètica queda
augmentada (disminuïda) en aquesta constant

xi! = xi + a
N N N N N N

∑ x! ∑ ( x + a ) ∑ x + ∑ a ∑ x ∑ a
i i i i
i=1 i=1 i=1 i=1 i=1 i=1
x! = = = = + =
N N N N N
N

∑x
N ⋅a
i
i=1
= + = x +a
N N
Estadística econòmica i empresarial I E. Motellón
Exemple: Mitjana aritmètica
Interessats en l’estudi del nombre de patents que realitza un sector determinat.
Seleccionem 20 empreses i obtenim les següents dades
0 1 1 2 3 0 0 4 4 2
2 3 1 0 3 2 1 1 0 4
Propietat 3
X ni a=2 b=4
0 5 2 4
1 5 3 5
2 4 4 6
3 3 5 7
4 3 6 8
N=20

Estadística econòmica i empresarial I E. Motellón


2.3.1 Mesures de posició central. k

∑x n i i K

Mitjana aritmètica x= i=1


N
= ∑ xi f i
i=1
Propietats (III)
4. La mitjana aritmètica queda afectada pels canvis d’escala. Si a tots els valors que
pren una variable li vam multipliquem (dividim) una constant a, la mitjana
aritmètica queda multiplicada (dividida) en aquesta constant

xi! = axi
N N N

∑ x! ∑(ax )i i a ∑ xi
i=1 i=1 i=1
x! = = = = ax
N N N

Estadística econòmica i empresarial I E. Motellón


2.3.1 Mesures de posició central. k

∑x n i i K

Mitjana aritmètica x= i=1


N
= ∑ xi f i
i=1
Propietats (IV)
5. En base a les propietats 3 i 4:
N

∑ xi ni

si xi → x = i =1
N

i definim: xiʹ = axi + b , llavors x = axi + b

Estadística econòmica i empresarial I E. Motellón


2.3.1 Mesures de posició central. k

∑x n i i K

Mitjana aritmètica x= i=1


N
= ∑ xi f i
i=1
Propietats (V)
6. Si una variable pren sempre el mateix valor, la mitjana aritmètica serà igual a aquest
valor constant

X = edat = 20;20;20;20;20
N =5
Llavors :
N

∑x i
20 + 20 + 20 + 20 + 20
x= i=1
= = 20
N 5
K

∑x n i i
20 ⋅ 5
x= i=1
= = 20
N 5

Estadística econòmica i empresarial I E. Motellón


2.3.1 Mesures de posició central. k

∑x n i i K

Mitjana aritmètica x= i=1


N
= ∑ xi f i
i=1
Propietats (VI)
7. Si el total d'observacions està dividit en subgrups de diferents grandàries, Ni, tal
que , ∑ N i = N dels quals es coneix la seva corresponent mitjana aritmètica. La
mitjana aritmètica del total d'observacions es pot calcular a partir de les mitjanes
aritmètiques parcials ponderades per les seves respectives grandàries mostrals.

N A x A + N B xB + ... + N Z xZ
x= donde N A + N B + ... + N Z = N
N

Estadística econòmica i empresarial I E. Motellón


Exemple: Mitjana aritmètica
Interessats en l’estudi del nombre de patents que realitza un sector determinat.
Seleccionem 20 empreses i obtenim les següents dades
0 1 1 2 3 0 0 4 4 2
2 3 1 0 3 2 1 1 0 4
Propietat 7
X ni XA nj
0 5 0 5
1 5 1 5
2 4 2 4
3 3 NA=14
4 3 XB nl
N=20 3 3
4 3
NB=6
Estadística econòmica i empresarial I E. Motellón
2.3.1 Mesures de posició central. k

∑x n i i K

Mitjana aritmètica x= i=1


N
= ∑ xi f i
i=1
Propietats (VI)
7. Si el total d'observacions està dividit en subgrups de diferents grandàries, Ni, tal
que ,∑ N i = N dels quals es coneix la seva corresponent mitjana aritmètica. La
mitjana aritmètica del total d'observacions es pot calcular a partir de les mitjanes
aritmètiques parcials ponderades per les seves respectives grandàries mostrals.

N A x A + N B xB + ... + N Z xZ
x= donde N A + N B + ... + N Z = N
N

Demostració: N A + NB = N
k

∑x n i i "#(x1n1 ) +... + (x j n j )$% + "#(x j+1n j+1 ) +... + (xk nk )$%


i=1
x= =
N N
Estadística econòmica i empresarial I E. Motellón
2.3.1 Mesures de posició central. k

∑x n i i K

Mitjana aritmètica x= i=1


N
= ∑ xi f i
i=1
Propietats (VII)
8. La mitjana aritmètica d’una suma és la suma de mitjanes aritmètiques.

k k k k

∑ z n ∑( x + y ) n ∑ x n ∑ y n
i i i i i i i i i
i=1 i=1 i=1 i=1
z= = = + =x+y
N N N N

9. La mitjana aritmètica és la quantitat que fa mínima la suma del quadrat de les


desviacions respecte a un valor
k

∑ i
(x − a) 2
és mínim si a = x
i=1

Estadística econòmica i empresarial I E. Motellón


Exemple: Propietats mitjana
Heu contractat una empresa per realitzar una campanya de publicitat.
L'empresa contractada us dóna un pressupost on s'especifica que el
salari mensual d'un publicista novell és de 850€ i el salari d'un
publicista qualificat de 1350€. Al final del projecte l’empresa de
publicitat ha pagat un salari mitjà de 966.07 €. Quants publicistes
novells han emprat en la vostra campanya i quants publicistes qualificats
han participat en ella?

Estadística econòmica i empresarial I E. Motellón


2.3.1 Mesures de posició central. k

∑x n i i K

Mitjana aritmètica x=
N
= ∑x f
i=1
i i
i=1
Avantatges
• Considera tots els valors de la variable
• És una mesura calculable tant en escales d'interval com de raó
• Pren sempre un valor únic
• Representa el centre de gravetat de la distribució
• Sol ser la mesura de posició central més adequada per a
distribucions en escala d'intervals o de proporcions

Inconvenients
• Es veu afectada pels valors extrems que poden distorsionar el seu
valor fent-ho poc representatiu
Estadística econòmica i empresarial I E. Motellón
Exemple: mitjana i valors extrems

Es disposa del W mensual del 9 treballadors en dos centres de treball.


Calcula la mitjana aritmètica i comenta els seus resulta

1 2 3 4 5 6 7 8 9
X 600 900 1200 850 2100 600 2300 790 4800
Y 600 900 1200 850 2100 600 2300 790 1900

Estadística econòmica i empresarial I E. Motellón


2.3.1 Mesures de posició central.
Mitjana aritmètica ponderada

N k

∑x w ∑x w n i i i i i

x = i =1 = i =1
N K

∑ i =1
wi
∑ i =1
wi

Estadística econòmica i empresarial I E. Motellón


Exemple: Mitjana ponderada
En procés de selecció d'una empresa es fan quatre proves puntuades del
0 a 10 cadascuna d'elles. Si un aspirant ha obtingut un 9 a la Prova1, un
6 a la Prova2, a 8 en la Prova3 i a la Prova4 un 6.
1. Quin és la nota mitjana de l'aspirant?
2. Si la prova 2 i 3 puntuen el doble que la resta i la quarta el triple.
Canvia la nota mitjana?

1) La nota mitjana de l’aspirant és 7.25 punts

Nota 9 6 8 6
Pes (w) 1 2 2 3

2) La incorporació de les ponderacions a les diferents proves suposa una


modificació de la seva nota mitjana que ara és de 6.87 punts
Estadística econòmica i empresarial I E. Motellón
2.3. Mesures de síntesi.
Introducció
Estadístics

Posició Dispersió Forma Concentració

Tendència Tendència
central no central
Mitjana aritmètica Quartils
Mediana Decils
Moda Percentils

Estadística econòmica i empresarial I E. Motellón


2.3.1 Mesures de posició central.
Mediana
Valor que ocupa el centre de la distribució. Valor tal q, ordenades les
dades de forma creixent o decreixent, deixa per damunt i per sota el mateix
nombre d'observacions. Me té associada una Ni = N/2
Dades tipus I
• N senar, valor de la variable que ocupa posició (N+1)/2: Me = x( N+1)/2

x N /2 + x( N /2)+1
• N par, mitjana aritmètica de dos valors centrals: Me =
2
Dades Tipus II: primer valor de la variable que ocupa el lloc Ni ≥ N/2

Dades Tipus III: detectar el interval medià (acumula la freqüència N/2)


N
− N i−1
Me = Li−1 + 2 ·ai
ni
Estadística econòmica i empresarial I E. Motellón
2.3.1 Mesures de posició central.
Mediana
Propietats:
1. Fa mínima la suma de totes les desviacions absolutes
N

∑ x −k
i=1
i mínima si k = Me

2. No l’afecta l'existència de valors extrems/atípics


(era la gran inconveniència de la mitjana aritmètica)

3. Es pot calcular (té sentit) per dades qualitatives ordinals

⟶ Mitjana aritmètica i mediana diferiran molt quan les distribucions siguin


molt asimètriques (suggereix q dades són heterogènies)

Estadística econòmica i empresarial I E. Motellón


2.3. Mesures de síntesi.
Introducció
Estadístics

Posició Dispersió Forma Concentració

Tendència Tendència
central no central
Mitjana aritmètica Quartils
Mediana Decils
Moda Percentils

Estadística econòmica i empresarial I E. Motellón


2.3.1 Mesures de posició central.
Moda
Valor de la variable amb major freqüència (absoluta o relativa). Aquell q
més vegades és repeteix. Al diagrama de barres, la barra amb més alçada.

Casos particulars: Distribucions sense moda, bimodals, trimodals o, amb


caràcter general, multimodals

Avantatges:
Donat q per calcular-la no requereix l'ordenació de la variable, és la mesura
de posició més representativa (i única) de les variables qualitatives nominals

Inconvenients:
• En el seu càlcul no intervenen totes les observacions de la variable
• La dificultat de obtenir-la en variables continues. Mo ≈ 3Me − 2x
Estadística econòmica i empresarial I E. Motellón
2.3.1 Mesures de posició central.
Relació entre mitjana, mediana i moda

1. Tres mesures de posició (tendència central) que persegueixen sintetitzar


la informació que disposem (observacions) en un únic valor
2. No tenen perquè coincidir

3. Proporcionen informació complementaria, no substitutives


4. En f(relació entre elles) podem analitzar la simetria de la distribució

x = Me = Mo → Distribució simètrica

Mo < Me < x → Distribució asimètrica a la dreta ( positiva)

Mo > Me > x → Distribució asimètrica a l 'esquerra (negativa)


Estadística econòmica i empresarial I E. Motellón
2.3.1 Mesures de posició central.
Relació entre mitjana, mediana i moda
ni
ni + elevada

x Xi
50% observacions 50% observacions

Centre de gravetat

El valor que més es repeteix (Moda), també deixa el 50% d'observacions a


cada costat (Mediana) i és el centre de gravetat de la distribució (Mitjana
aritmètica)
x = Me = Mo → Distribució simètrica
Estadística econòmica i empresarial I E. Motellón
2.3.1 Mesures de posició central.
Relació entre mitjana, mediana i moda
ni
ni + elevada

Mo Me x Centre de gravetat Xi
50% observacions 50% observacions

La Mitjana aritmètica i la Mediana estan a la dreta de la Moda, llavors la


distribució presenta asimetria a la dreta o positiva

Mo < Me < x → Distribució asimètrica a la dreta ( positiva)

Estadística econòmica i empresarial I E. Motellón


2.3.1 Mesures de posició central.
Relació entre mitjana, mediana i moda
ni
ni + elevada

Centre de gravetat x Me Mo Xi

50% observacions 50% observacions

La Mitjana aritmètica i la Mediana estan a l’ esquerra de la Moda, llavors la


distribució presenta asimetria a l’esquerra o negativa

Mo > Me > x → Distribució asimètrica a l 'esquerra (negativa)

Estadística econòmica i empresarial I E. Motellón


2.3.1 Mesures de posició central.
Relació entre mitjana, mediana i moda

Per a corbes de freqüències unimodals lleugerament asimètriques, es té la


següent relació empírica entre la mitjana, la mediana i la moda:
(Mitjana-Moda)=3(Mitjana-Mediana)

Inconvenients (exemple)
ni

Mo x Mo X
Me
Estadística econòmica i empresarial I E. Motellón
2.3. Mesures de posició.
Introducció
Estadístics

Posició Dispersió Forma Concentració

Tendència Tendència
central no central
Mitjana aritmètica Quartils
Mediana Decils
Moda Percentils

Estadística econòmica i empresarial I E. Motellón


2.3.1 Mesures de posició no central.
Introducció

Són els quantils que són valors de la variable que divideixen la


distribució en parts amb igual nombre d’observacions.

En f(percentatge en la partició) els quantils més utilitzats són:


• Quartils
• Decils
• Percentils

Nota: ordenar el conjunt de dades

Estadística econòmica i empresarial I E. Motellón


2.3.1 Mesures de posició no central.
Cuartils

Els 3 valors de la variable (Q1,Q2,Q3) que permeten dividir la distribució


en 4 parts iguals (contenen el 25% dels valors de la distribució)

• Q1 ocupa el lloc N/4


Valor q el 25% de les dades són anteriors a ell i el 75% són posteriors

• Q2 ocupa el lloc 2N/4 (mediana=N/2)

• Q3 ocupa el lloc 3N/4

Valor q el 75% de les dades són anteriors a ell i el 25% són posteriors

Estadística econòmica i empresarial I E. Motellón


2.3.1 Mesures de posició no central.
Decils
Són els 9 valors de la variable que divideixen la distribució en
10 parts iguals (contenen el 10% dels valors de la distribució)

• D1 ocupa el lloc N/10

• D2 ocupa el lloc 2N/10

Valor q el 20% de les dades són anteriors a ell i el 80% són posteriors
• ..........

• D9 ocupa el lloc 9N/10

Estadística econòmica i empresarial I E. Motellón


2.3.1 Mesures de posició no central.
Percentils

Són els 99 valors de la distribució que divideixen la distribució


en 100 parts iguals (contenen el 1% dels valors de la distribució)

• P1 ocupa el lloc N/100


Valor q el 1% de les dades són anteriors a ell i el 99% són posteriors

• P2 ocupa el lloc 2N/100

• ..........

• P99 ocupa el lloc 99N/100


Valor q el 99% de les dades són anteriors a ell i el 1% són posteriors

Estadística econòmica i empresarial I E. Motellón


Moments (I)
• Valors que caracteritzen totalment a una distribució
• 2 distribucions són iguals si tenen tots els seus moments igual

• Es calculen com a potencies successives de la variable observada

• Expressió general: Sent:


k xi: valors de la variable
r
∑ (x − O )
i =1
i t ⋅ ni Ot: origen arbitrari
Mr = r: ordre del moment (0,1,2,3,...)
N
ni: freqüència absoluta de xi
N: Total d’observacions
• Dos tipus:

– Respecte al origen (ordinaris)

– Respecte a la mitjana aritmètica (centrals)

Estadística econòmica i empresarial I E. Motellón


Moments (II)
1. Respecte al origen (ar)à Origen (Ot) = 0
k k
r r
∑ ( xi − Ot ) ⋅ ni
i =1
∑ i ⋅ ni
x
i =1
ar = = ∀r = 0,1,2...
N N
k k
0
∑x
i =1
i ⋅ ni
N ∑n
i =1
i El moment ordinari (a0), o respecte al origen,
a0 = = = =1 d’ordre 0 és sempre 1
N N N
k k
1
∑x
i =1
i ⋅ ni ∑ x ⋅n
i =1
i i El moment ordinari (a1), o respecte al origen,
a1 = = =x d’ordre 0 és sempre la mitjana aritmètica
N N
k
2
∑x
i =1
i ⋅ ni
a2 =
N
Estadística econòmica i empresarial I E. Motellón
Moments (II)
1. Respecte a la x (mr)à Origen (Ot) = x
k k
r
∑ (x − O )
i =1
i t
r
⋅ ni ∑ (x
i =1
i )
− xi ⋅ ni
mr = = ∀r = 0,1,2...
N N
k k
0
∑ (x
i =1
i )
− xi ⋅ ni ∑n
N
i =1
i
El moment central (m0), o respecte a la
m0 = = = =1
N N N mitjana, de ordre 0 és sempre 1
k k

∑(x − x ) ⋅ n ∑(x − x )⋅ n
1
i i i i
El moment central (m1), o respecte a la
m1 = i=1
= i=1
=0
N N mitjana, de ordre 1 és sempre 0
k
(
∑ ix − x ) 2
⋅ ni Aquesta és l'expressió de la variància
m2 = i=1
(estadístic de dispersió)
N
Estadística econòmica i empresarial I E. Motellón
k k Demostració
∑(x − x ) ⋅ n ∑(x − x )⋅ n
1
i i i i
m1 = i=1
= i=1
=0
N N

1. Propietat de la mitjana: suma de les desviacions dels valors de la variable


respecte a la mitjana es sempre 0
N k
0
∑( xi − x ) = 0 → ∑( xi − x ) ni = 0 → m1 = N
=0
i=1 i=1

k k k k k
2. d∑ ( xi − x ) ni ∑ x n ∑ xn ∑ x n
i i i i i ∑n i
i=1 i=1 i=1 i=1 i=1
= − = −x =x−x =0
N N N N N

Estadística econòmica i empresarial I E. Motellón


Moments (IV)
Propietats

1. Tots els moments d’ordre 0 (ordinaris i centrals) són igual a la unitat


m0 = 1 / a0 = 1
M0 = 1

2. Tots els moments centrals (mr) es poden expressar en funció dels


moments ordinaris o respecte l'origen
⎛ r⎞ i r
mr = ∑ ⎜ i ⎟ a1 ar−i (−1)i Exemple
i=0 ⎝ ⎠

Estadística econòmica i empresarial I E. Motellón


Exemple 2a propietat dels moments

núm. combinatori “r sobre i”

Recordatori:

Estadística econòmica i empresarial I E. Motellón


Exemple 2a propietat dels moments

Estadística econòmica i empresarial I E. Motellón


Exemple 2a propietat dels moments

Estadística econòmica i empresarial I E. Motellón


2.3.2 Mesures de dispersió
• Mesures de dispersió absoluta
• Recorregut o rang, recorregut inerquartílic, variància, desviació
típica o estàndard

• Mesures de dispersió relativa


• Coeficient de variació de Pearson

Estadística econòmica i empresarial I E. Motellón


2.3. Mesures de síntesi.
Introducció
Estadístics

Posició Dispersió Forma Concentració

Tendència Tendència
central no central
Mitjana aritmètica Quartils
Mediana Decils
Moda Percentils

Estadística econòmica i empresarial I E. Motellón


2.3. Mesures de síntesi.
Introducció
Estadístics

Posició Dispersió Forma Concentració

Absoluta Relativa

Estadística econòmica i empresarial I E. Motellón


2.3.2 Mesures de dispersió.
Introducció
Fins a quin punt són representatius els estadístics de tendència
central?
⟶ Dades + agrupades (- dispersió)⇒ + representativa x

DISPERSIÓ (variabilitat):
• Major o menor separació dels valors de la variable respecte a un
altre que sigui la seva síntesi

• x no suficient: necessitem saber si es representativa de la distribució

Mesures de dispersió
(estadístics q quantifiquen el grau de dispersió
de X entorn de la seva tendència central)
Estadística econòmica i empresarial I E. Motellón
2.3.2 Mesures de dispersió.
Introducció

1. Mesures de dispersió ABSOLUTES (unitats de mesures)


• Recorregut (rang): màxim-mínim
• Rang interquartilic: tercer quartil (Q3) – primer quartil (Q1)
• Variància
• Desviació estàndard
• etc.

2. Mesures de dispersió RELATIVES (indicadors adimensionals)


• Coeficient de variació
• etc.

Estadística econòmica i empresarial I E. Motellón


2.3. Mesures de síntesi.
Introducció
Estadístics

Posició Dispersió Forma Concentració

Absoluta Relativa

Recorregut Coeficient de variació


Rang Interquartílic (de Pearson)
Variància
Desviació Estàndard

Estadística econòmica i empresarial I E. Motellón


2.3.2 Mesures de dispersió.
Recorregut o rang (Re)
Diferència entre el valor màxim i mínim de la variable
Re = Max xi − Min xi i = 1,..., n

Dades tipus III (agrupades): Re = Lk − L0

Avantatge:
• La forma més senzilla d’indicar la dispersió

Inconvenients:
• Molt simple, només utilitza dos valors de la variable
• Molt sensible als valors extrems (outliers)
• Només recomanable si els valors és distribueixen uniformement
Estadística econòmica i empresarial I E. Motellón
2.3.2 Mesures de dispersió.
Rang interquartílic (RI)

Diferència entre el primer quartil (Q1) i el tercer quartil (Q3)


RI = Q3 − Q1

Quant menor és el recorregut interquartílic, menor dispersió


presenta la variable

Indica q en un interval de longitud RI estan compreses el 50% de


les observacions centrals (+ representatiu q Re pq no està afectat
per la presencia de valors extrems)

Estadística econòmica i empresarial I E. Motellón


2.3. Mesures de síntesi.
Introducció
Estadístics

Posició Dispersió Forma Concentració

Absoluta Relativa

Recorregut Coeficient de variació


Rang Interquartílic (de Pearson)
Variància
Desviació Estàndard

Estadística econòmica i empresarial I E. Motellón


2.3.2 Mesures de dispersió.
Variància (S2)
• Mesura l'error que cometem en triar a la mitjana aritmètica
com valor representatiu de la distribució
k
2
(
∑ ix − x ) ni
S2 = i =1
N
• Mesura el grau de variabilitat de les dades de la distribució
d’una variable quantitativa respecte a la mitjana aritmètica

• ∆ valor ⇒ ∇ pèrdua de representativitat de la x


(valors + allunyats d’aquesta mesura de posició central)

Estadística econòmica i empresarial I E. Motellón


k
2
2.3.2 Mesures de dispersió. (
∑ ix − x ) ni
Variància (S2) S2 = i =1
N
Formes alternatives d'expressar-la:
N N

∑(x − x ) ∑(x
i
2 2
i
− 2xi x + x 2 )
1. S = 2 i=1
= i=1
=
N N
N N N N

∑x 2
i
∑x ∑x i
2
∑x 2
i
Nx 2
i=1 i=1 i=1
= − 2x + = i=1 − 2xx + =
N N N N N
N N

∑x 2
i
∑x 2
i
− Nx 2
i=1 2 i=1
= −x =
N N
k k
2 2

2
∑ ( xi − x ) ni ∑ i ni
x k
2. S = i =1
= i =1
− x = ∑ ( xi − x ) 2 f i
2

N N i =1
Estadística econòmica i empresarial I E. Motellón
k
2
2.3.2 Mesures de dispersió. (
∑ ix − x ) ni
Variància (S2) S2 = i =1
N
Característiques:
1. Mesura de la variabilitat o dispersió de les dades
d’una variable respecte a la mitjana aritmètica
2. Coincideix amb el moment central de 2n ordre (m2)
3. Si xi=k ∀1=1,2,...,k , llavors S2=0
4. S2≥0
5. No li afecten els canvis d'origen xi → S x2 i

xiʹ = xi + k → S x2iʹ = S x2i


Si a tots els valors de la variable
els sumem (restem) una constant xiʹʹ = xi − k → S x2iʹʹ = S x2i

Estadística econòmica i empresarial I E. Motellón


Demostració

Propietat 5 de S2. No li afecten els canvis d'origen

Estadística econòmica i empresarial I E. Motellón


k
2
2.3.2 Mesures de dispersió. (
∑ ix − x ) ni
Variància (S2) S2 = i =1
N
Característiques:
1. Mesura de la variabilitat o dispersió de les dades
d’una variable respecte a la mitjana aritmètica
2. Coincideix amb el moment central de 2n ordre (m2)
3. Si xi=k ∀1=1,2,...,k , llavors S2=0
4. S2≥0
5. No li afecten els canvis d'origen xi → S x2 i

xiʹ = xi + k → S x2iʹ = S x2i


xiʹʹ = xi − k → S x2iʹʹ = S x2i

6. Sí li afecten els canvis d'escala xi → S x2i


xiʹ = xi ⋅ k → S x2iʹ = S x2i ⋅ k 2
Si a tots els valors de la variable els
multipliquem (dividim) per una constant xi 2
S x2i
xiʹʹ = → S xiʹʹ = 2
Estadística econòmica i empresarial I k k E. Motellón
Demostració

Propietat 6 de S2. Sí li afecten els canvis d’escala

Estadística econòmica i empresarial I E. Motellón


k
2
2.3.2 Mesures de dispersió. (
∑ ix − x ) ni
Variància (S2) S2 = i =1
N
Inconvenients:
2
• Donat q utilitza les desviacions al quadrat ( xi − x ) ,
la seva unitat de mesura és la de la variable original al quadrat.

• Dificulta la seva interpretació

Solució: DESVIACIÓ ESTÀNDARD


k
2
(
∑ ix − x ) ni
S = + S2 = + i =1 u.m. X = u.m. x = u.m. S
N
Estadística econòmica i empresarial I E. Motellón
k
2
2.3.2 Mesures de dispersió. (
∑ ix − x ) ni
i =1
Desviació Estàndard (S) S=
N
Característiques:
2
1. No pot ser negativa: S x = + S x ≥ 0
2. Igual que la variància, el valor més petit que pot prendre és 0
3. Igual que la variància, també es pot obtenir a partir dels
moments ordinaris S = m2 = a2 − a12
4. No li afecten els canvis d’origen
5. Sí li afecten els canvis d’escala
xi → S x2i → S xi = S x2i

xiʹ = xi ⋅ k → S x2iʹ = S x2i ⋅ k 2 → S xiʹ = S x2i ⋅ k 2 = S xi k

xi 2
S x2i S x2i S xi
xiʹʹ = → S xiʹʹ = 2 → S xiʹʹ = =
k k k2 k
Estadística econòmica i empresarial I E. Motellón
2.3. Mesures de síntesi.
Introducció
Estadístics

Posició Dispersió Forma Concentració

Absoluta Relativa

Recorregut Coeficient de variació


Rang Interquartílic (de Pearson)
Variància
Desviació Estàndard

Estadística econòmica i empresarial I E. Motellón


2.3.2 Mesures de dispersió.
Coeficient de variació de Pearson (CV)

• Quocient entre la desviació estàndard i la mitjana aritmètica


S
CV =
x

• Habitualment s’expressa en %
S
CV = ·100
x

interpretació: variació del x% respecte a la mitjana

Estadística econòmica i empresarial I E. Motellón


2.3.2 Mesures de dispersió. CV =
S
Coeficient de variació de Pearson (CV) x

Propietats:
1. És una mesura adimensional
2. Representa en nre. de vegades que la S conté la x
3. Mesura q utilitza tota la ! de la variable
4. Cota inferior és 0 (màxima representativitat de la mitjana)
5. Quan x = 0 no és significatiu
6. Sí li afecten els canvis d’origen
7. No li afecten els canvis d’escala

Estadística econòmica i empresarial I E. Motellón


2.3.3 Mesures de forma
• Asimetria – Simetria
• Coeficient de Fisher
• Coeficient de Pearson

• Apuntament – curtosis
• Coeficient de curtosis

Estadística econòmica i empresarial I E. Motellón


2.3. Mesures de síntesi.
Introducció
Estadístics

Posició Dispersió Forma Concentració

Simetria Curtosis

Coeficient de Pearson Coeficient de curtosis


Coeficients de Fisher

Estadística econòmica i empresarial I E. Motellón


2.3.3 Mesures de forma.
Mesures d’asimetria

Mesuren grau de simetria o d’asimetria d’una distribució sense


representar-la gràficament

Simetria
Hi ha un nombre igual de valors a ambdós costats d’un eix
perpendicular que la divideix.

Estadística econòmica i empresarial I E. Motellón


2.3.3 Mesures de forma.
Mesures d’asimetria. Coeficient de Pearson
Indicador adimensional per distribucions unimodals i campaniformes
x − Mo
Ap =
S
• Si Ap= 0 Distribució simètrica
• Si Ap> 0 Distribució asimètrica positiva (esbiaixada a la dreta)
• Si Ap< 0 Distribució asimètrica negativa (esbiaixada a l’esquerra)

ü Relació empírica entre Mitjana, Mediana i Moda: x − Mo ≅ 3( x − Me)


3( x − Me)
Ap =
S
I si la distribució no és unimodal i campaniforme?
Estadística econòmica i empresarial I E. Motellón
2.3.3 Mesures de forma.
Mesures d’asimetria. Coeficient de Fisher
Indicador adimensional aplicable a totes les distribucions estadístiques
K

∑(x − x ) n
3
i i
1 i=0 m3
g1 = 3 · = 3
S N S

• Si g1= 0 Distribució simètrica


Mo = Me = x

• Si g1> 0 Distribució asimètrica positiva (esbiaixada a la dreta)


Mo < Me < x

• Si g1< 0 Distribució asimètrica negativa (esbiaixada a l’esquerra)


Mo > Me > x
Estadística econòmica i empresarial I E. Motellón
2.3.3 Mesures de forma.
Mesures d’asimetria. Coeficient de Fisher
K

∑(x − x ) n
3
i i
1 m3
g1 = 3 · i=0 =
S N S3

⎡ K 3 K K
⎛ K
⎞ ⎤
3

⎢ ∑ x1 ni ∑ xi ni ∑ x1 ni ∑ xi ni ⎟ ⎥
2
1 ⎢ i=0 ⎜
g1 = 3 · − i=0 · i=0 + 2 ⎜ i=0 ⎟ ⎥
S ⎢ N N N ⎜ N ⎟ ⎥
⎢ ⎜⎝ ⎟⎠ ⎥
⎢⎣ ⎥⎦

1
(
g1 = 3 · a3 − 3a1a2 + 2a13
S
)
Estadística econòmica i empresarial I E. Motellón
2.3. Mesures de síntesi.
Introducció
Estadístics

Posició Dispersió Forma Concentració

Simetria Curtosis

Coeficient de Pearson Coeficient de curtosis


Coeficients de Fisher

Estadística econòmica i empresarial I E. Motellón


2.3.3 Mesures de forma.
Mesures de curtosis (g2)

Estadística econòmica i empresarial I E. Motellón


2.3.3 Mesures de forma.
Mesures d’asimetria
Indicador adimensional que mesura les deformacions en sentit
vertical (apuntament) respecte a la normal.
K

∑(x − x ) n
K 4
4
∑( x − x ) n
i i 1 i=0 i i
m4
i=0
= 3·S 4
g2 = 4 · −3= 4 −3
N S N S

• Si g2= 0 Distribució mesocúrtica (normal)


• Si g2> 0 Distribució leptocúrtica (apuntada)
• Si g2< 0 Distribució platicúrtica (aplanada)

Estadística econòmica i empresarial I E. Motellón


2.3.4 Mesures de concentració
• Concentració versus equidistribució
• Corba de Lorenz
• Índex de Gini

Estadística econòmica i empresarial I E. Motellón


2.3. Mesures de síntesi.
Introducció
Estadístics

Posició Dispersió Forma Concentració

Índex de Gini
Corba de Lorenz

Estadística econòmica i empresarial I E. Motellón


2.3.4 Mesures de concentració.
Introducció. Concentració vs Equidistribució
En estadística, CONCENTRACIÓ relacionada amb el grau
d’igualtat o d’equitat en el repartiment d’una variable
Concentració NO com a antònim de dispersió

Molt rellevant en C. Socials


• Igualtat en distribució salaris, rendes, etc.
• Equitat en repartiments inversions, ajuts, etc.

X molt concentrada: pocs individus es queden amb la majoria del


repartiment de la variable (renda, salaris, inversions, ajuts, etc.)

pi: com es reparteix la població en categories (= Fi)


qi: com es reparteix la variable
Estadística econòmica i empresarial I E. Motellón
2.3.4 Mesures de concentració.
Introducció. Concentració vs Equidistribució
Objectiu: mesurar el grau de repartiment del valor total d’una variable

Exemple:
Disposem de la distribució W de N individus (ordenada)
x1 ≤ x2 ≤ x3 ≤ x4 ≤ ... ≤ xn
Situacions extremes:
1. Concentració màxima: 1 individu percep tota la massa salarial
x1 = x2 = x3 = x4 = ... = xn −1 = 0 xn ≠ 0
2. Concentració mínima: Tots els individus reben el mateix salari
x1 = x2 = x3 = x4 = ... = xn ➞ equidistribució

Estadística econòmica i empresarial I E. Motellón


2.3.4 Mesures de concentració.
Càlcul de pi i qi
1. Ordenar els valors (xi) de menor a major i calcular les Ni
2. Calcular el total de la variable que rep el grup d’individus amb ni
ui=xi·ni
3. Suma de tot el repartiment de la variable Uk (en exemple W seria la massa salarial)
4. Dos opcions:
a. Calcular el repartiment de la variable en termes acumulats: Ui = ui-1+ui
b. Relativitzar la xifra de ui à si = ui/Uk
5. Calcular pi: Freqüència relativa acumulada expressada en % (pi=(Ni/N)·100)
6. Calcular qi: Proporció acumulada del valor total de la variable per als diferents
grups, expressada en %
1) qi = Ui/Uk Ui= Salari acumulat del grup i-èsim
Uk= Total massa salarial
2) qi = si-1+si
Estadística econòmica i empresarial I E. Motellón
2.3.4 Mesures de concentració.
Càlcul de pi i qi
xi ni Ni ui=xi·ni Ui= ui+ui-1 pi=(Ni/N)·100 qi=(Ui/U)·100

18700 21 21 392700 392700 14.00 6.84

20400 25 46 510000 902700 30.67 15.73

28000 30 76 840000 1742700 50.67 30.37

32500 17 93 552500 2295200 62.00 40.00

45000 15 108 675000 2970200 72.00 51.76

50000 18 126 900000 3870200 84.00 67.45

62000 14 140 868000 4738200 93.33 82.57

100000 10 150 1000000 5738200 100.00 100.00

150 5738200
Com es reparteixen els Com es reparteixen
treballadors en grups els salaris
(Fi)
Estadística econòmica i empresarial I E. Motellón
2.3.4 Mesures de concentració.
Càlcul de pi i qi
xi ni Ni ui=xi·ni Ui= ui+Ui-1 pi=(Ni/N)·100 qi=(Ui/Uk)·100

x1 n1 N1 u1=x1·n1 U1= u1 p1=(N1/N)·100 q1=(U1/Uk)·100

x2 n2 N2 u2=x2·n2 U2= u2+u1 p2=(N2/N)·100 q2=(U2/Uk)·100

… … … … … … …

… … … … … … …

xi ni Ni ui=xi·ni Ui= ui+ui-1+…+u1 pi=(Ni/N)·100 qi=(Ui/Uk)·100

… … … … … … …

… … … … … … …

xk nk Nk uk=xk·nk Uk= uk+uk-1+…+u1 100 100

pk=(Nk/N)·100 qk=(Uk/Uk)·100
Estadística econòmica i empresarial I E. Motellón
2.3.4 Mesures de concentració.
Càlcul de pi i qi
Amb l’opció b) dels punts 4 i 6

xi ni ui=xi·ni si=(ui/Uk)·100 Ui= ui+Ui-1 qi=(Ui/U)·100 qi=qi-1+si

18700 21 392700 6.84 392700 6.84 6.84

20400 25 510000 8.89 902700 15.73 15.73

28000 30 840000 14.64 1742700 30.37 30.37

32500 17 552500 9.63 2295200 40.00 40.00

45000 15 675000 11.76 2970200 51.76 51.76

50000 18 900000 15.68 3870200 67.45 67.45

62000 14 868000 15.13 4738200 82.57 82.57

100000 10 1000000 17.43 5738200 100.00 100.00

150 5738200

Estadística econòmica i empresarial I E. Motellón


2.3.4 Mesures de concentració.
Corba de Lorenz

Representació gràfica del repartiment de la variable. Compara pi


(com es reparteix la població) amb qi (com es reparteix la variable)

Procés:

1. Dibuixem quadre (costats dividits en una escala que va del 0 al 100)


2. Costat inferior eix d’ordenades (vertical): valors de qi
3. Costat esquerre eix d’abscisses (horitzontal): valors de pi
4. Projectar, en aquest eixos, punts formats per les coordenades que
marquen els punts de concentració: pi i qi
5. Unim punts formant una corba poligonal (corba de Lorenz)

Estadística econòmica i empresarial I E. Motellón


2.3.4 Mesures de concentració.
Corba de Lorenz

pi qi 100
14.00 6.84 90
80
30.67 15.73
70
50.67 30.37 60
62.00 40.00 q i 50
72.00 51.76 40
30
84.00 67.45
20
93.33 82.57 10
100.00 100.00 0
0 10 20 30 40 50 60 70 80 90 100

pi

Estadística econòmica i empresarial I E. Motellón


2.3.4 Mesures de concentració.
Corba de Lorenz

pi qi
100
14 0
90
30 0
80
50 0
70
62 0
60
72 0
qi 50
84 0
40
90 0
30
93 0
20
95 0
10
96 0
0
97 0 0 10 20 30 40 50 60 70 80 90 100

98 0 pi
99 100

Estadística econòmica i empresarial I E. Motellón


2.3.4 Mesures de concentració.
Corba de Lorenz
100
90
pi qi
80
14.00 14.00
70
30.67 30.67 60
50.67 50.67 qi 50
62.00 62.00 40
72.00 72.00 30
84.00 84.00 20
93.33 93.33 10
100.00 100.00 0
0 10 20 30 40 50 60 70 80 90 100

pi

Estadística econòmica i empresarial I E. Motellón


2.3.4 Mesures de concentració.
Corba de Lorenz
100
B
90
80 x1 ≤ x2 ≤ x3 ≤ x4 ≤ ... ≤ xn
70
60
⇒ Sempre s’ha de complir que qi ≤ pi
qi 50
40
30
corba q representa distribució
20 + equitativa (- concentració)
10
0
A
O 0 10 20 30 40 50 60 70 80 90 100

pi
1. Corba situada necessàriament per sota de la bisectriu (recta OB ),
atès q la distribució està ordenada de menor a major
2. Per ordenació de menor a major, la corba tindrà sempre una tendència
creixent, partint del punt de l’origen (0,0) fins arribar al màxim (100,100)
3. Corba de concentració mínima (equidistribució) coincideix
amb la bisectriu OB, donat que qi = pi
4. La corba de concentració màxima formada pels costats del quadre OA AB
5. + a prop corba de Lorenz de la bisectriu OB à + equitativa (- concentració)
Estadística econòmica i empresarial I E. Motellón
2.3.4 Mesures de concentració.
Índex de Gini (Ig)
k −1

∑(p − q )
i =1
i i

Expressió numèrica de l’anàlisi de concentració: Ig = k −1

∑p
i =1
i

• Índex de Gini pren valors compresos entre 0 i 1: 0 ≤ Ig ≤ 1


– Ig = 0 ⇒ Concentració mínima (equidistribució) à qi = pi
x1 = x2 = x3 = x4 = ... = xn
– Ig = 1 ⇒ Concentració màxima
x1 = x2 = x3 = x4 = ... = xn −1 xn ≠ 0
qi = 0, ∀i = 1,2,..., k − 1, i qk ≠ 0 (qk = 100%)
• Sí li afecten els canvis d’origen
• No li afecten els canvis d’escala
Estadística econòmica i empresarial I E. Motellón
Exemple: Índex de Gini
xi ni Ni pi qi pi-qi

18700 21 21 14.00 6.84 7.16

20400 25 46 30.67 15.73 14.94

28000 30 76 50.67 30.37 20.30

32500 17 93 62.00 40.00 22.00

45000 15 108 72.00 51.76 20.24

50000 18 126 84.00 67.45 16.55

62000 14 140 93.33 82.57 10.76

100000 10 150 100.00 100.00 ---

150 k −1 k −1

k −1 ∑p
i =1
i = 406,67 ∑ ( p − q ) = 111,94
i =1
i i

∑(p − q )
i =1
i i
111,94
Ig = k −1
= = 0,2753
406,67
∑p
i =1
i

Estadística econòmica i empresarial I E. Motellón


2.3.4 Mesures de concentració.
Corba de Lorenz i Índex de Gini

Ig proper a 0 ⇒ corba de Lorenz + a prop de diagonal (bisectriu)


Ig proper a 1 ⇒ corba de Lorenz + a lluny de diagonal
100
B 100
B 100
B
90 90 90
80 80 80
70 70 70
60 60 60

qi 50 qi 50 qi 50
40 40 40
30 30 30
20 20 20
10 10 10
0 A 0 A 0 A
O0 10 20 30 40 50 60 70 80 90 100 O0 10 20 30 40 50 60 70 80 90 100 O0 10 20 30 40 50 60 70 80 90 100

pi pi pi

Ig < Ig Ig = 0 Ig = 1
Major concentració Concentració mínima Concentració màxima
(distribució + equitativa) (equidistribució)

Estadística econòmica i empresarial I E. Motellón


2.3.4 Mesures de concentració.
Corba de Lorenz i Índex de Gini
100 100

90
B 90
B
80 80

70 70

60 60

qi 50 qi 50

40 40

30 30

20 20

10 10

0 A 0 A
O0 10 20 30 40 50 60 70 80 90 100 O0 10 20 30 40 50 60 70 80 90 100

pi pi
100 100
90
B 90
B
80 80
70 70
60 60

qi 50 qi 50
40 40
30 30
20 20
10 10
0 A 0 A
O0 10 20 30 40 50 60 70 80 90 100 O0 10 20 30 40 50 60 70 80 90 100

pi pi

Ig= superfície OB / superfície OAB

Estadística econòmica i empresarial I E. Motellón


Tema 2.4. Transformacions lineals
• Canvis d’escala
• Canvis d’origen
• Estandarització i tipificació

(veure Conceptes bàsics 2.pdf)

Estadística econòmica i empresarial I E. Motellón


2.4 Transformacions lineals.
Canvis d’origen i canvis d’escala
Situació:
X analitzada experimenta algun tipus de transformació

Objectiu:
Establir els valors dels estadístics de la variable transformada
sense repetir tots els càlculs

Transformacions:
• Canvis d’origen. Si a tots els valors que pren una variable
X +a = Xʹ li sumem (restem) una constant a
i i

• Canvis d’escala. Si a tots els valors que pren una variable


Xi ·b = Xi′′ els multipliquem (dividim) per una constant b
Estadística econòmica i empresarial I E. Motellón
2.4 Transformacions lineals.
Canvis d’origen i canvis d’escala
Situació:
X analitzada experimenta algun tipus de transformació
Afecten aquestes transformacions
Objectiu:
als estadístics
Establir analitzats?
els valors dels estadístics de la variable transformada
sense repetir tots els càlculs

Transformacions:
• Canvis d’origen. Si a tots els valors que pren una variable
X + a = X ʹ Com?
i
li sumem (restem) una constant a
i

• Canvis d’escala. Si a tots els valors que pren una variable


Xi ·b = Xi′′ els multipliquem (dividim) per una constant b
Estadística econòmica i empresarial I E. Motellón
2.4 Transformacions lineals.
Canvis d’origen i canvis d’escala

Afecta No afecta

x , Mo, Me, Qr / K RI , Re , S x2 , S x
Canvis d’origen CV Ap , g1 , g 2
Ig
CV
x , Mo, Me, Qr / K
Canvis d’escala Ap , g1 , g 2
Re , RI , S x2 , S x
Ig

Estadística econòmica i empresarial I E. Motellón


2.4 Transformacions lineals.
Canvis d’origen i canvis d’escala

Estadística econòmica i empresarial I E. Motellón


2.4 Transformacions lineals.
Canvis d’origen i canvis d’escala
Situació:
Comparar valors de diferents variables que estan expressades en distintes
u.m. o també les posicions relatives que ocupen determinats valors

Objectiu:
Generar nova variable (Z), a partir dels valor de la variable (X),
que presenti les següents característiques:
1. z = 0
2. S 2 = 1 , SZ = 1
Z

Com?
Xi − x
Variable estandaritzada,
normalitzada, tipificada
Zi =
SX
Estadística econòmica i empresarial I E. Motellón
2.4 Transformacions lineals. Xi − x
Zi =
Estandarització o tipificació SX

Resultat:

— Centrem les variables al mateix punt (= centre de gravetat)


i les dotem de la mateixa escala (desviació típica)

— Valors tipificats: perden la unitat de la variable (Z adimensional)

Propietat: fer comparable individus q


pertanyen a distintes distribucions
(fins i tot expressades en ≠ u.m.)

Estadística econòmica i empresarial I E. Motellón


Exemple estandarització o tipificació

Dos graduats en economia en el mateix sector d’activitat.


- Individu A guanya 30.000€ i treballa a l’Empresa T

- Individu B guanya 35.000€ i treballa a l’Empresa P

En ambdues situacions WGraduat > WMitjà. Però, quin graduat ocupa


una millor posició relativa dintre de la seva empresa?

Solució:
En termes absoluts el graduat B guanya més que l’A, Però, en relació
al conjunt dels empleats de cada ESA l'individu A ocupa millor posició
Estadística econòmica i empresarial I E. Motellón
Com a RECORDATORI final ...

— Aquest material s’utilitza com a guia per realitzar les sessions


presencials a l’aula. NO són els apunts de l’assignatura.

— Reviseu amb atenció el document “Conceptes bàsics 2” penjat al


campus, en ell trobareu un major detall de la informació referida al
tema 2 publicada al Pla docent (contingut, objectius, conceptes
claus, bibliografia, etc.)

— No oblideu ampliar els coneixements. Trobareu la bibliografia


recomanada a la biblioteca de la Facultat, conjuntament amb un
ampli ventall de manuals d’estadística també interessants.

Estadística econòmica i empresarial I E. Motellón

You might also like