You are on page 1of 4

Bioestadística 2022-2023 Claudia Pedrosa Machordom

TEMA 1: ESTADÍSTICA DESCRIPTIVA

L’estadística és aquella ciència que s’encarrega de recollir, analitzar, interpretar, presentar i organitzar
dades. Se’n coneixen dos tipus:

- Estadística descriptiva: s’utilitza en resumir dades d’una mostra o població mitjançant índexs
com la mitjana, la mediana o la desviació estàndard.
- Estadística inferencial: s’utilitza per extreure conclusions a partir de les dades que estan
subjectes a variació aleatòria. Ho farem relacionant o bé comparant variables.

En aquest estudis és important conèixer altres conceptes com:

- Població: conjunt de tots els possibles elements que participen d’un experiment.
- Mostra: Subconjunt d’elements d’una població. La seua tria pot ser aleatòria o no.
- Variable: característica mesurable dels elements.

1. ESTADÍSTICA DESCRIPTIVA

Una variable és una característica observable que varia entre els diferents individus com l’edat, sexe,
alçada, pressió arterial...

- Qualitatives/Categòrica
o Nominals: Variables en les que cada categoria o valor correspon a una característica o
qualitat de l’individu. Els possibles valors són excloents.
▪ Exemple: Grup sanguini, sexe o infart de miocardi [si o no]
o Ordinals: variables en les que cada categoria o valor correspon a una característica o
qualitat de l’individu, però els possibles valors tenen un ordre.
▪ Exemple: nivell d’estudis, satisfacció i tabaquisme...
- Quantitativa
o Continua: variables en les que cada valor correspon realment a un número (no
esglaonat)
▪ Exemple: edat, pes, alçada o pressió sistòlica arterial.
o Discreta: el rang dels possibles valors són finits i enters.
▪ Exemple: nº de visites darrer any, fills...

Per resumir dades d’una mostra o població mitjançant estadístics s’utilitza mesures com la tendència
central, de dispersió o de posició.

2. ESTADÍSTICS DE TENDÈNCIA CENTRAL


- Mitjana aritmètica (media): correspon al sumatori de tots els valors de la variable dividits pel
número total d’observacions. : si ens referim a població.
o La mitjana es veu afectada pels valors extrems per aquest motiu es considera poc
robusta en aquestos casos.
Exemple:

Exemple:

Quan s’hi presenten mostres amb moltes dades


es poden agrupar en intervals per facilitar els
càlculs:

1
Bioestadística 2022-2023 Claudia Pedrosa Machordom

- Mediana: correspon al valor central del conjunt ordenat de les observacions. És el valor que deixa
la meitat de les observacions per sobre i per sota.
Exemple: {64, 79, 82, 96, 110} → la mediana és 82 kg.
{64, 82, 96, 110} → (82+96)/2 = 89 kg.
- Moda: correspon al valor més freqüent del conjunt de observacions. Pot ser modal o bimodal.
- Mitjana geomètrica: correspon a l’arrel enèsima del productori de tots els valors de la variable.

Exemple:

o Avantatges:
▪ Considera tots els valors de la distribució.
▪ Menys sensible que la mitjana aritmètica als valors extrems.
▪ Serveix quan hi ha distribucions molt asimètriques o les dades presenten un
creixement exponencial.
o Desavantatges:
▪ Té un significat menys intuïtiu.
▪ El càlcul és més complicat.
▪ Si un valor és 0, <0, llavors aquesta s’anul·la o no queda determinada.

3. ESTADÍSTICS DE DISPERSIÓ
- Variància: correspon a la mitjana de la suma de quadrats de la diferència entre cada valor i la
mitjana. És el promig de la distància de les meues dades al centre, elevant-ho al quadrat per
evitar els valors negatius ja que aquestes poden estar per sobre o per sota del valor central.
o Quan parlem de població a l’hora de dividir-lo pel número total li restarem -1 per fer-lo
més petit.
o Fórmula:

- Desviació estàndard: és l’arrel de la variància.


- Coeficient de variació: és la raó entre la desviació estàndard i la mitjana aritmètica.
o Aquest estadístic pren valors entre 0 i 1. Quan el valor s’apropa al 0 podem observar un
poca variabilitat i per tant les dades de la mostra estan compactades. En canvi, quan
pren valors propers a 1 significa que la mostra està molt dispersada i per tant la mitjana
perd fiabilitat.

4. ESTADÍSTICS DE FORMA

Asimetria quan les cues de la distribució no presentin la mateixa longitud. Hi podem representar resultats
d’exàmens, mortalitat, riquesa...

! IMPORTANT (POSSIBLE EXAMEN): En asimetries és important


comprovar i comparar si la mitjana és major o menor que la mediana
degut als valors extrems possibles de les mostres que hi poden afectar.
Curtosi: mesura el grau d’apuntament de la distribució d’una variable.

2
Bioestadística 2022-2023 Claudia Pedrosa Machordom

5. ESTADÍSTICS DE POSICIÓ

Ens informen de quin lloc ocupa un determinat valor d’una variable en el conjunt ordenat de les dades.

- Percentil p: és aquella valor de la mostra, tal que el % de les observacions queda per sota d’ell i
el 100-% de les observacions queden per sobre.
Exemple: el percentil 15 deixa per sota el 15% de les observacions i per sobre el 85% de les
observacions.
o Els percentils no estan limitats a quarts a diferència dels quartils (25-50-75).

*QUARTILS

El segon quartil resultaria ser la mediana ja que en posiciona la meitat de les mostres per sobre i sota del
valor calculat.

Com calcular els quartil 1 i 3 ?

- Pars: 35 40 45 50 50 52,5 55 60 65 70 70
- Imparells: 35 35 40 45 50 50 55 60 65 70 70

6. PRESENTACIÓ DELS RESULTATS

- Taules de freqüència: és la presentació en forma de taula de les freqüències absolutes i relatives


d’una variable CATEGÒRICA NOMINAL o ORDINAL.

o Freqüència absoluta: número de vegades que apareix un determinat valor o categoria.


o Freqüència relativa: és el quocient entre la freqüència absoluta d’una determinada
categoria i el total de les dades.
o Freqüència absoluta acumulada: és la suma de les freqüències absolutes d’un número
determinat de categories.
o Freqüència relativa acumulada: és la suma de les freqüències relatives d’un número
determinat de categories.

Fórmules:

3
Bioestadística 2022-2023 Claudia Pedrosa Machordom

- Diagrama de sectors: L’àrea de cada categoria és proporcional a la


seua freqüència.
o Pensat per variables CATEGÒRIQUES NOMINALS.

- Diagrama de barres: format per rectangles d’alçada proporcional el números d’observacions de


cada categoria.
o Pensat per variables CATEGÒRIQUES ORDINALS.
o (Quan ha de pagar un pare per un servei o en
qüestions de salut)

- Histograma: s’utilitza per VARIABLES CONTINUES


agrupades per classes.
o Base del rectangle: és el rang de l’interval de classe.
o L’alçada: és la freqüència de cada interval
o Superfície: és proporcional a la freqüència dels valors representats.

- Diagrama de caixes:

Exemple: 1 2 3 4 5 5 5 5 8 9 10
o Mediana (Q2): 5
o Q1: 3
o Q3: 8
o Rang interquartílic = Q3 - Q1 = 8-3 = 5
o 1,5* IQR= 1,5 *5 = 7,5
o 3* IQR = 3*5 =15
▪ Les multiplicacions aquestes
serveixen per a la construcció
del boxplot.

- Si a la mostra hi ha valors per sobre del valor calculat a partir de → Q3 + 1,5* IQR; els marcarem
amb una rodona i els anomenarem ATÍPICS (outliers): plausible/possible.
- Si a la mostra hi ha valors per sobre de Q3 + 3* IQR; els marcarem amb una estrella i els
anomenarem com EXTREMS (far outliers): No plausible/ no possible

- Si a la mostra hi ha valors més menuts que Q1 + 1,5* IQR; els marcarem amb una rodona i els
anomenarem ATÍPICS.
- Si a la mostra hi ha valors més menuts que Q1 + 3* IQR; els marcarem amb una estrella i els
anomenarem com EXTREMS.

You might also like