Professional Documents
Culture Documents
L’estadística és aquella ciència que s’encarrega de recollir, analitzar, interpretar, presentar i organitzar
dades. Se’n coneixen dos tipus:
- Estadística descriptiva: s’utilitza en resumir dades d’una mostra o població mitjançant índexs
com la mitjana, la mediana o la desviació estàndard.
- Estadística inferencial: s’utilitza per extreure conclusions a partir de les dades que estan
subjectes a variació aleatòria. Ho farem relacionant o bé comparant variables.
- Població: conjunt de tots els possibles elements que participen d’un experiment.
- Mostra: Subconjunt d’elements d’una població. La seua tria pot ser aleatòria o no.
- Variable: característica mesurable dels elements.
1. ESTADÍSTICA DESCRIPTIVA
Una variable és una característica observable que varia entre els diferents individus com l’edat, sexe,
alçada, pressió arterial...
- Qualitatives/Categòrica
o Nominals: Variables en les que cada categoria o valor correspon a una característica o
qualitat de l’individu. Els possibles valors són excloents.
▪ Exemple: Grup sanguini, sexe o infart de miocardi [si o no]
o Ordinals: variables en les que cada categoria o valor correspon a una característica o
qualitat de l’individu, però els possibles valors tenen un ordre.
▪ Exemple: nivell d’estudis, satisfacció i tabaquisme...
- Quantitativa
o Continua: variables en les que cada valor correspon realment a un número (no
esglaonat)
▪ Exemple: edat, pes, alçada o pressió sistòlica arterial.
o Discreta: el rang dels possibles valors són finits i enters.
▪ Exemple: nº de visites darrer any, fills...
Per resumir dades d’una mostra o població mitjançant estadístics s’utilitza mesures com la tendència
central, de dispersió o de posició.
Exemple:
1
Bioestadística 2022-2023 Claudia Pedrosa Machordom
- Mediana: correspon al valor central del conjunt ordenat de les observacions. És el valor que deixa
la meitat de les observacions per sobre i per sota.
Exemple: {64, 79, 82, 96, 110} → la mediana és 82 kg.
{64, 82, 96, 110} → (82+96)/2 = 89 kg.
- Moda: correspon al valor més freqüent del conjunt de observacions. Pot ser modal o bimodal.
- Mitjana geomètrica: correspon a l’arrel enèsima del productori de tots els valors de la variable.
Exemple:
o Avantatges:
▪ Considera tots els valors de la distribució.
▪ Menys sensible que la mitjana aritmètica als valors extrems.
▪ Serveix quan hi ha distribucions molt asimètriques o les dades presenten un
creixement exponencial.
o Desavantatges:
▪ Té un significat menys intuïtiu.
▪ El càlcul és més complicat.
▪ Si un valor és 0, <0, llavors aquesta s’anul·la o no queda determinada.
3. ESTADÍSTICS DE DISPERSIÓ
- Variància: correspon a la mitjana de la suma de quadrats de la diferència entre cada valor i la
mitjana. És el promig de la distància de les meues dades al centre, elevant-ho al quadrat per
evitar els valors negatius ja que aquestes poden estar per sobre o per sota del valor central.
o Quan parlem de població a l’hora de dividir-lo pel número total li restarem -1 per fer-lo
més petit.
o Fórmula:
4. ESTADÍSTICS DE FORMA
Asimetria quan les cues de la distribució no presentin la mateixa longitud. Hi podem representar resultats
d’exàmens, mortalitat, riquesa...
2
Bioestadística 2022-2023 Claudia Pedrosa Machordom
5. ESTADÍSTICS DE POSICIÓ
Ens informen de quin lloc ocupa un determinat valor d’una variable en el conjunt ordenat de les dades.
- Percentil p: és aquella valor de la mostra, tal que el % de les observacions queda per sota d’ell i
el 100-% de les observacions queden per sobre.
Exemple: el percentil 15 deixa per sota el 15% de les observacions i per sobre el 85% de les
observacions.
o Els percentils no estan limitats a quarts a diferència dels quartils (25-50-75).
*QUARTILS
El segon quartil resultaria ser la mediana ja que en posiciona la meitat de les mostres per sobre i sota del
valor calculat.
- Pars: 35 40 45 50 50 52,5 55 60 65 70 70
- Imparells: 35 35 40 45 50 50 55 60 65 70 70
Fórmules:
3
Bioestadística 2022-2023 Claudia Pedrosa Machordom
- Diagrama de caixes:
Exemple: 1 2 3 4 5 5 5 5 8 9 10
o Mediana (Q2): 5
o Q1: 3
o Q3: 8
o Rang interquartílic = Q3 - Q1 = 8-3 = 5
o 1,5* IQR= 1,5 *5 = 7,5
o 3* IQR = 3*5 =15
▪ Les multiplicacions aquestes
serveixen per a la construcció
del boxplot.
- Si a la mostra hi ha valors per sobre del valor calculat a partir de → Q3 + 1,5* IQR; els marcarem
amb una rodona i els anomenarem ATÍPICS (outliers): plausible/possible.
- Si a la mostra hi ha valors per sobre de Q3 + 3* IQR; els marcarem amb una estrella i els
anomenarem com EXTREMS (far outliers): No plausible/ no possible
- Si a la mostra hi ha valors més menuts que Q1 + 1,5* IQR; els marcarem amb una rodona i els
anomenarem ATÍPICS.
- Si a la mostra hi ha valors més menuts que Q1 + 3* IQR; els marcarem amb una estrella i els
anomenarem com EXTREMS.