You are on page 1of 19

Estadsticadescriptiva

ndexs estadstics
ndexsestadstics

BioestadsticaFMCSReusURV

Curs201516

Definicions

Variable qualitativa: s aquella variable que expressa


qualitats o caracterstiques.
caracterstiques

Qualitativa ordinal: la variable pren valors ordenats


seguint una escala establerta a priori. P.ex: escala
likert (molt lleu, lleu, moderat, fort, molt fort).

Qualitativa nominal: la variable pren valors que no


poden ser ordenats. P.ex: el color dels ulls.

BioestadsticaFMCSReusURV

Curs201516

Definicions

Variable quantitativa: s aquella variable que pot


mesurar se en la seva forma habitual.
mesurarse
habitual

Variable discreta: la variable pren valors en un rang


especfic de nmeros enters (Z). P.ex: nmero de fills.

Variable continua: la variable pren valors en un rang


especfic de nmeros reals (R). P.ex: alada.

BioestadsticaFMCSReusURV

Curs201516

Tipusdevariables

Estatcivil

ndexdemassacorporal
Nmerocaigudes
Grupsanguini
Nmerodeganglisafectats
Fumador (S/ No)
Fumador(S/No)
Fumador(Mai,Habitual,Exfumador)
Fumador(No,<1paquet,1paquet,msdunpaquet)

BioestadsticaFMCSReusURV

Curs201516

Parmetresiestadstics

Parmetre: s una quantitat numrica calculada sobre una


poblaci.
Per exemple: lalada mitjana dels individus dun pas.

la idea s resumir tota la informaci que hi ha a la poblaci


amb nombres (parmetres).

Estadstic: s una q
quantitat numrica calculada sobre una mostra.

si un estadstic sutilitza per aproximar un parmetre a


lestadstic se lanomena estimador.

BioestadsticaFMCSReusURV

Curs201516

Mostreig

El que en realitat
li
ens interessa,
i
conixer
s
i
un parmetre
t de
d la
l
poblaci, per la dificultat est en estudiar tots els individus de la
poblaci. En conseqncia fem el clcul dun estimador sobre la
mostra i confiem que sapropi al valor del parmetre que en
realitat volem calcular.
Ms endavant veurem com elegir mostres per poder aconseguir
que lestimador i el parmetre sapropin, s a dir que lerror que
fem sigui petit.

BioestadsticaFMCSReusURV

Curs201516

Estadsticsdecentralitzaci

Moda:Moselvalorovalorsmsfreqents
Mitjana: x
Mediana:Me
Mitjanageomtrica:MG

BioestadsticaFMCSReusURV

Curs201516

Mitjana(media,moyen,mean)

Mitjana: s la mitjana aritmtica (promig) dels valors duna


variable. Suma dels valors dividit per la mida de la mostra.
Mitjana de 2,2,3,7 s (2+2+3+7)/4=35

Mesura adequada quan les dades sagrupen simtricament


respecte a la mitjana.
mitjana
Molt sensible als valors extrems.
s el centre de gravetat de les dades

BioestadsticaFMCSReusURV

Curs201516

Formulesdeclcul

Dadessenseagruparenintervals:x1,x2,...,xn
Mitjana
Dadesagrupadesenintervals:
utilitzarlamateixaformulaperlesx
l
l
f
l
l
l
i seranles
marquesdeclasse (puntmigdelinterval)iniles
freqnciesdelinterval.
Variable
ni
L0 L1
x1
n1
L1 L2
x2
n2
...
Lk1 Lk
xk
nk

x =

x
n

x =

x n
n
i

i i
i

niacumulada
N1
N2
Nk

n
BioestadsticaFMCSReusURV

Curs201516

Exemple

Pes
[40 50)
[40
[50 60)
[60 70)
[70 80)
[80 90)

x
45
55
65
75
85

ni
5
10
21
11
5

ni ac.
5
15
36
47
52

[90 100)
[90
[100 130)

95
115

3
3
58

55
58

BioestadsticaFMCSReusURV

Curs201516

x n
n
i

i i
i

45 x 5 55 x10 115 x 3
69'3
58

10

Mediana

Mediana (median) s un valor que divideix a les observacions en


dos grups amb el mateix nombre dindividus (percentil 50). Si el
nombre de dades s parell sagafa la mitjana de les dues dades
centrals.
Mediana de1,2,4,5,6,6,8 s5
Mediana de1,2,4,5,6,6,8,9s(5+6)/2=55
Mesura adequada quan les dades sn asimtriques. No s
sensible als valors extrems.
Mediana de 1,2,4,5,6,6,800 s 5. La mitjana s 1177 !!

BioestadsticaFMCSReusURV

Curs201516

11

mediana

BioestadsticaFMCSReusURV

Curs201516

12

Mitjanageomtrica(geometricmean)

sunaalternativaalamedianaquanhihadistribucionsmolt
asimtriques o les dades presenten un creixement exponencial
asimtriquesolesdadespresentenuncreixementexponencial

Elseuvalormaisermsgranquelamitjanaaritmtica

Estransformenelsvalorsoriginalsambelsseuslogaritmesies
calculalamitjanaaritmtica.Pertornaralaescalaoriginales
calculalantilogaritme.

BioestadsticaFMCSReusURV

13

Curs201516

Mitjanageomtrica

s una mesura de tendncia central que es defineix com larrel


ensima del producte dels n valors observats de xi

MG = x g =

log MG =

x1 . x2 . x 3 ... x n =

(log x ) / n

i=1

xi

MG = anti log (log xi ) / n


representaelproductedetotselsvalorsdelavariable
BioestadsticaFMCSReusURV

Curs201516

14

Efectedelatransformacilogartmica

BioestadsticaFMCSReusURV

Curs201516

15

Clculdelamitjanageomtrica

MG=10 0158 =0695g/l

BioestadsticaFMCSReusURV

Curs201516

16

Exempledemitjanageomtrica
0
Factor de creixement

1h

-100

N bactries

2h

10%
110

30%
143

3h

4h

5h

50% 100% 200%


215
429 1287

1400
1200

n
nbacteries

1000
800
600
400
200
0
0

10%

BioestadsticaFMCSReusURV

30%
50%
%decreixement

100%

200%

17

Curs201516

Exempledemitjanageomtrica
0
Factor de creixement
N bactries

1h

-100

Mitjanaaritmtica=78%

BioestadsticaFMCSReusURV

2h

10%
110

30%
143

3h

4h

5h

50% 100% 200%


215
429 1287

Mitjanageomtrica=67%

Curs201516

18

Exempledemitjanageomtrica
1400
1200

nbacteries

1000

Mitjanaaritmtica78%

800
600
400

Mitjanageomtrica67%

200
0
0

BioestadsticaFMCSReusURV

10%

30%
50%
%decreixement
%
de creixement

100%

200%

Curs201516

19

Estadsticsdeposici:percentilsiquartils

Percentil dordrek
Lamedianaselpercentil50
Elpercentildordre15deixapersotaseuel15%deles
observacionsiperdamuntel85%

Quartils:Divideixenlamostraen4grupsambfreqnciessimilars.
Primerquartil=Percentil25
Segonquartil=Percentil50=mediana
Tercerquartil=Percentil75

BioestadsticaFMCSReusURV

Curs201516

20

10

Estadsticdeposici

Percentil70:

BioestadsticaFMCSReusURV

Curs201516

21

Mesuresdeposici:Centilsopercentils

El percentil (de ordre) k correspon al valor de la variable que deixa


per sota el k per 100 dels subjectes de la poblaci. Per tant
divideixen la distribuci en cent parts.

El percentil que ocupa un subjecte indica la seva posici en relaci


a la resta d'individus del grup.

Quan la distribuci correspon a valors o puntuacions d'un grup


normatiu ((de referncia),
), els p
percentils descriuen la p
posici q
que
ocuparia dins del grup de referncia un determinat subjecte.

BioestadsticaFMCSReusURV

Curs201516

22

11

BioestadsticaFMCSReusURV

23

Curs201516

Diagramadecaixa
190

Tendnciacentral:mediana
mxim

180

Dispersi:amplitudinterquartil
Q3
Mediana

170

Asimetria

Q1

Valorsanmals15x(Q3 Q1)

160

mnim

Valorsextrems3x(Q3 Q1)

150
N=

200

ESTATURA

BioestadsticaFMCSReusURV

Curs201516

24

12

Diagramadecaixa

Localitzaelcentredeladistribuci:mediana
Representaladisposicidelapartcentral(50%central)dela
di t ib i l
distribuci:longituddelacaixa.
it d d l
i
Commsapuntadaladistribucimsestretaslacaixa.
Formadelcentredeladistribuci:posicidelamedianadinsdela
caixa.
Permetobservarlespossiblesasimetriesdeladistribuci:longitud
delescuesdeladistribuci.
Detecta valors extrems allunyats o outliers :15 x (Q3 Q1)
Detectavalorsextrems,allunyatsooutliers:15x(Q3
Q1)
(quartilsuperioriinferior).
Detectavalorsmoltallunyatsofaroutsideextreme:3x(Q3
Q1).

BioestadsticaFMCSReusURV

Curs201516

25

Comparacidegrups

BioestadsticaFMCSReusURV

Curs201516

26

13

Variabilitatodispersi

ElsestudiantsdeBioestadsticarebendiferentsqualificacionsenlassignatura
(variabilitat).Perqu?

Diferncies individuals en el coneixement de la matria


Difernciesindividualsenelconeixementdelamatria.

Perexemplesuposemquetotselsalumnestenenelmateixnivellde
coneixement.Lesnotesserienlesmateixes?Seguramentno.
Dormirpoceldiadelexamen,elcroissantnoeramassaboilifamal..

Lexamennosunamesuraperfectadelconeixement.

Enalgunapreguntadifcil,esdubtaentrevariesopcionsilatzardecideixla
dolenta.

Difernciesindividualsenl'habilitat peraferunexamen.
Variabilitat per error de mesura
Variabilitatpererrordemesura.

Variabilitatperatzar,aleatorietat.

BioestadsticaFMCSReusURV

27

Curs201516

smoltsensiblealsvalorsextrems:

Min150iMax225.Elrangs225150=75

Ranginterquartlic
g
q
sladistnciaentreelprimeritercer
quartil
Rangintercuartlic=P75 P25
BioestadsticaFMCSReusURV

Curs201516

P75

Mx.

0.04

P50

0.03

25%

0.02

Min150iMax195.Elrangs195150=45

P25

25% 25%

25%

Rango intercuartlico
0.01
1

Mn.

Rango
0.00

Mesurenlavariabilitatdelesdades,
independentmentdelasevacausa.
AmplitudoRang:
Difernciaentreobservacionsextremes.

0.0
05

Mesuresdedispersi

150

160

170

180

190

28

14

Varincia(variancia,variance)

mitjana de la suma dels quadrats de les diferencies entre cada valor


d la
de
l variable
i bl (x
( i) i la
l mitjana
itj
aritmtica
it ti de
d la
l distribuci
di t ib i

t com unitat de mesura el quadrat de la variable que descriu.


( x - x ) 2 + ( x . - x ) 2 + ( x - x ) 2 + .... + ( xn - x ) 2
1
2
3
2
=
s =
n-1

sx2 =

( xi - x )2
n -1

BioestadsticaFMCSReusURV

i= n

( x
i =1

-x)

n-1

SCx
n -1
29

Curs201516

Desviaciestndard(StandardDeviation)

Arrel quadrada de la varincia.


t les mateixes unitats que els valors que descriu.
es simbolitza per s, n-1,DE (desviaci estndard), DT (desviaci
tpica) o SD (standard deviation).

s = s2
s=
BioestadsticaFMCSReusURV

_ 2
(x - x )
i
=
n -1
Curs201516

2
(

)
x
i
x2 i
n
n -1
30

15

0.01

0.02

0.02

0.03

0.03

0.04

0.0
04

0.05

0.05

Dispersiendistribucionssimtriquesonormals

0.01

xs
68.5 %

x 2s

0.00

0.00

95 %

150

160

170

180

190
150

BioestadsticaFMCSReusURV

180

190

31

Curs201516

95 %

0.1

x 2s

x s

x 2s

71 %

94 %

0.0

xs
66 %

0.0

0.1

0.2

0.2

0.3

0.3

Dadesquasinormals
Leixxmesuratendesviacionstpiques

-2

-1

-3

-2

-1

xs
68 %

0.1

0.2

0.2

0.3

0.3

0.4

-3

0.1

x 2s
94 %

x s

x 2s

70 %

94 %

0.0

170

Centratenlamitjanaiunadesviacitpicadedistnciahiha
aproximadamentel68%delasobservacions.
Aduesdesviacionstpiquestenimel95%(aprox.)

0.0

160

-3

-2

-1

BioestadsticaFMCSReusURV

-3

Curs201516

-2

-1

32

16

Coeficientdevariaci

slaraentreladesviacitpicailamitjana.Mesura
quina mida t la desviaci tpica respecte la mitjana
quinamidatladesviacitpicarespectelamitjana.
CV =

desviaci tpica
mitjana

sfreqentmostrarlaenpercentatges.Perexemple:
s
freqent mostrarla en percentatges Per exemple:
Silamitjanas80iladesviacitpica20aleshoresCV
=20/80=0,25=25%(variabilitatrelativa).

BioestadsticaFMCSReusURV

Curs201516

33

Exemple:coeficientdevariaci
Sitenimduesvariablestalque
Lavariablextunamitjanade4iunadesviacide05
ilavariableytunamitjanade20iunadesviacide25
Quinadelesdosvariablespresentamsvariabilitat?

BioestadsticaFMCSReusURV

Curs201516

34

17

Asimetria
Hihadiferentsestadsticsqueserveixenperdetectarasimetria.
Basatenladifernciaentreestadsticsdetendnciacentral.
Basatenladifernciaentreel1ri2nquartilsiel2niel3r.

Enfuncidelsignedelestadsticdiremquelasimetrriaspositiva o
negativa.
Distribucisimtrica asimetranulla.

0.15
5
0.05

0.1

0.05

0.2

0.10

0.10

0.3

0.15

0.4
4

0.20

0.5

0.20

xs

xs
78 %
0.00

xs
66 %

0.0

0.00

78 %

10

12

14

16

18

20

-2

-1

BioestadsticaFMCSReusURV
x

Curs201516
x

10

12

14

35

Curtosi

Lacurtosiensindicaelgraud'apuntamentd'una
distribucirespectealadistribucinormalogaussiana.

0.4
0.2

0.5

0.1

1.0

0.2

0.6

1.5

0.3

0.8

2.0

Coeficientdecurtosi
a4<0platicrtica(aplanada)
a4 =0mesocrtica(normal)
a4 >0leptocrtica(apuntada)

x s

xs

x s

68 %
0.0

82 %

0.0

0.0

57 %

0.0

0.2

0.4

0.6

BioestadsticaFMCSReusURV

0.8

1.0

-3

-2

-1

Curs201516

-2

-1

36

18

Resumsobreestadstics

Centralitzaci

Moda,mitjanaaritmtica,medianaimitjanageomtrica.
Dispersi

Indiquenelsvalorsalvoltantdelsqualssagrupenlesdades.
Indiquenlamajoromenorconcentracidelesdadesrespecteales
mesuresdecentralitzaci.

Rang,ranginterquartlic, varincia,desviacitpicaicoeficientdevariaci
Posici:Quartils

Divideixen un conjunt ordenat de dades en grups amb la mateixa


quantitat dindividus o amb un nombre determinat.

percentils quartils decils


percentils,quartils,decils,...

Forma

Coeficientdasimetria
Coeficientdapuntamentocurtosis

BioestadsticaFMCSReusURV

Curs201516

37

19

You might also like