You are on page 1of 32

Tema 2

Anàlisi
descriptiva de les
dades
2.1. DISTRIBUCIÓ de FREQÜÈNCIES
d’una VARIABLE

La freqüència absoluta d’un valor xk de la variable


(k = 1, ... , K)
és el nombre de vegades que apareix / obtenim / observem
aquest valor en una distribució.
Notació: nk

Propietats: 0  nk  N
K
n1  n2    nK   nk  N
k 1
La freqüència relativa d’un valor xk de la variable
(k = 1, ... , K)
és el quocient entre la seva freqüència absoluta (nk)
i la mida de la mostra / població (N).
nk
Notació: fk fk 
N
· fk és el tant per 1 d’observacions que prenen el valor xk .
· Multiplicant fk per 100 obtenim el percentatge corresponent.

Propietats: 0  fk  1
K
f1  f 2    f K   f k  1
k 1
La freqüència absoluta acumulada d’un valor xk de la variable
(k = 1, ... , K)
és el nombre d’observacions que presenten el valor xk
o un valor inferior a xk .
k
Notació: Nk N k  n1  n2    nk   n j
j 1

N1  n1 ; N 2  n1  n2 ;

5
N 5  n1  n2    n5   n j
j 1
Anàlogament, definim Fk , freqüència relativa acumulada
d’un valor xk de la variable (k = 1, ... , K):

k
Fk  f1  f 2    f k   f j
j 1

F1  f1 ; F2  f1  f 2 ;

5
F5  f1  f 2    f 5   f j
j 1
Exemple 1:
xk: Antiguitat (anys) nk : Conductors
1 2
2 8
3 12
4 14
5 4

Població:
Mida de la població:
Mostra:
V. estadística:
Tipus v. estadística:
Exemple 1:
xk: Antiguitat (anys) nk : Conductors
1 2
2 8
3 12
4 14
5 4

Població: Conductors d’una companyia d’autobusos


Mida de la població: 40 conductors
Mostra: No cal
V. estadística: Antiguitat (en anys)
Tipus v. estadística: Quantitativa “discreta”
xk nk Nk fk Fk fk (%) Fk (%)
1 2
2 8
3 12
4 14
5 4
40

5
N  n1  n2    n5   nk  40
k 1
xk nk Nk fk Fk fk (%) Fk (%)
1 2 2 0,05 0,05 5% 5%
2 8 10 0,2 0,25 20 % 25 %
3 12 22 0,3 0,55 30 % 55 %
4 14 36 0,35 0,9 35 % 90 %
5 4 40 0,1 1 10 % 100 %
40 1 100 %

               
DISTRIBUCIÓ de FREQÜÈNCIES
TAULA de FREQÜÈNCIES i de PERCENTATGES
2.2. REDUCCIÓ de DADES.
AGRUPACIÓ en INTERVALS
Exemple 2:
Alçada dels alumnes matriculats d’Estadística I.
Treballarem amb una mostra de 100 individus.
Població: Alumnes matriculats d’Estadística I
Mida de la població: No la sabem
Mostra: 100 estudiants
V. estadística: Alçada (en metres)
Tipus v. estadística: Quantitativa contínua

Problema: x1  1,76 m; x2  1,773 m; x3  1,768 m; ...


Necessitat d’agrupar les dades en INTERVALS.
Alçada
nk Nk fk Fk
Lk-1 ; Lk
[1,50; 1,60] 20
(1,60; 1,70] 40
(1,70; 1,80] 25
(1,80; 1,90] 15
Comentari 1:
Si en lloc de treballar amb una variable quantitativa
contínua ho féssim amb una quantitativa discreta que pot
prendre molts valors diferents, també hauríem de treballar
amb dades agrupades en INTERVALS.
Exemples:
Cotxes que surten de Barcelona cada cap de setmana
Oients diaris d’un programa de ràdio
Fotocòpies que es fan mensualment al Servei de reprografia
Comentari 2:

a ; b  x  R a  x  b
1,60 ; 1,70  x  R 1,60  x  1,70
I k  Lk 1 , Lk   x  R Lk 1  x  Lk 
Lk 1 : extrem inferior de l' interval k
Lk : extrem superior de l' interval k
1,70  1,60 ; 1,70
1,70  1,70 ; 1,80
Comentari 3:
Treballant amb intervals estalviem feina, guanyem eficàcia,
millorem la presentació però perdem informació.
Els 20 individus de l’interval I1 = [1,50 ; 1,60],
quant mesuren exactament?
Lk 1  Lk
Marca de classe: xk 
2
xk és el punt mig de l’interval Ik .
A l’hora de fer càlculs, considerarem que els 20 individus
de l’interval I1 mesuren
1,50  1,60
x1   1,55 m cadascun
2
Alçada
xk nk Nk fk Fk
Lk-1 ; Lk
[1,50; 1,60] 1,55 20 20 0,2 0,2
(1,60; 1,70] 1,65 40 60 0,4 0,6
(1,70; 1,80] 1,75 25 85 0,25 0,85
(1,80; 1,90] 1,85 15 100 0,15 1
100 1

Comentari 4:
Hem treballat amb intervals de la mateixa amplitud:
ck : amplitud de l’interval Ik
c1 = c2 = c3 = c4 = 0,10 m → amplitud constant
De vegades treballarem amb intervals d’amplitud variable.
2.3. REPRESENTACIONS GRÀFIQUES
Exemple 3:

Mitjà de transport nk: Alumnes fk (%): Percentatge


A peu 162 32,40%
Bicicleta 186 37,20%
Cotxe 68 13,60%
Autobús 84 16,80%
500 100,00%
Mitjà de transport nk: Alumnes fk (%): Percentatge
A peu 162 32,40%
Bicicleta 186 37,20%
Cotxe 68 13,60%
Autobús 84 16,80%
500 100,00%
1. DIAGRAMA de SECTORS CIRCULARS

A peu: 500  360º 162  360º


x  117 º
162  x 500
186 en bici y 186  360º
En bici:  y  134º
500 360º 500
Mitjà de transport nk: Alumnes fk (%): Percentatge Sector circular
A peu 162 32,40% 117º
Bicicleta 186 37,20% 134º
Cotxe 68 13,60% 49º
Autobús 84 16,80% 60º
500 100,00% 360º

Au- Mitjà de transport


tobús
17% A peu
Cotxe 32%
14%

Bicicleta
37%
2. DIAGRAMA de RECTANGLES (de BARRES)

· Base de longitud constant


· Altura proporcional a la freqüència absoluta
· Per tant: Àrea proporcional a la freqüència absoluta

Mitjà de transport
200
180
160
140
nk: alumnes

120
100
80
60
40
20
0
A peu Bicicleta Cotxe Autobús
3. PICTOGRAMA
3. PICTOGRAMA
3. PICTOGRAMA
4. HISTOGRAMA (dades agrupades en intervals)

“L’àrea del rectangle és proporcional


a la freqüència de l’interval.”

Tornem a l’exemple 2: Alçada


nk
Lk-1 ; Lk

[1,50; 1,60] 20

(1,60; 1,70] 40

(1,70; 1,80] 25

(1,80; 1,90] 15
100
4. HISTOGRAMA (dades agrupades en intervals)
45

40

35

30
Alumnes

25

20

15

10

1,50 1,60 1,70 1,80 1,90 Alçada (en m)


4. HISTOGRAMA (dades agrupades en intervals)

“L’àrea del rectangle és proporcional


a la freqüència de l’interval.”

Exemple 4:
Lk-1 ; Lk nk

[0; 5] 10
(5; 8] 30
(8; 14] 30
(14; 16] 30
Intervals
d’amplitud variable 100
Necessitem una nova mesura: dk, densitat de freqüència
nk freqüència (individus de l' interval)
dk  
ck amplitud de l' interval
· dk és el nombre d’individus que corresponen per cada
unitat de mesura de la variable.
· dk ens dóna l’altura del rectangle en un histograma
Lk-1 ; Lk nk ck dk: densitat de freqüència
[0; 5] 10
(5; 8] 30
(8; 14] 30
(14; 16] 30
100
Lk-1 ; Lk nk ck dk: densitat de freqüència

[0; 5] 10 5 2
(5; 8] 30 3 10
(8; 14] 30 6 5
(14; 16] 30 2 15
100

“dk ens dóna


l’altura del rectangle
en un histograma.”
4. HISTOGRAMA (intervals d’amplitud no constant)
16

14

12

10
dk

0 5 8 14 16 X
5. POLÍGON DE FREQÜÈNCIES ACUMULADES / OGIVA

Tornem a l’exemple 2: Intervals d’amplitud constant

Alçada
nk Nk
Lk-1 ; Lk
[1,50; 1,60] 20 20
(1,60; 1,70] 40 60
(1,70; 1,80] 25 85
(1,80; 1,90] 15 100
100
5. POLÍGON DE FREQÜÈNCIES ACUMULADES / OGIVA
120

100

80
Alumnes

60

40

20

1,50 1,60 1,70 1,80 1,90


Alçada (en m)
5. POLÍGON DE FREQÜÈNCIES ACUMULADES / OGIVA

Tornem a l’exemple 4: Intervals d’amplitud no constant

Lk-1 ; Lk nk Nk

[0; 5] 10 10
(5; 8] 30 40
(8; 14] 30 70
(14; 16] 30 100
100
5. POLÍGON DE FREQÜÈNCIES ACUMULADES / OGIVA

120

100

80
Nk

60

40

20

0 5 8 14 16 X

You might also like