Professional Documents
Culture Documents
- POBLACIÓ → conjunt complet d'individus a què es referirán les conclusions d'un estudi. OJO
perquè és fonamental que durant la planificació de l'estudi aquesta població objectiu o diana
quedi ben definida, ja que tota la feina que es realitzarà estarà destinat a contrastar la
hipòtesi i obtenir evidència empírica sobre com es presenten uns determinats aspectes i/o es
relacionen un conjunt de variables en aquestes poblacions. Tot aquest procès de contrastar i
obtenir es fa amb TÈCNIQUES ESTADÍSTIQUES
- MOSTRA → les poblacions acostumen a ser molt extenses o de difícil accés, per això es va
crear la mostra; inclou només una part (generalment petita) del dit conjunt inicial. Els
individus o subjectes que la integren són els participants, podent ser persones, animals o fins i
tot procediments o elements reals o abstractes. Quan escollim la mostra, és important
garantir que els individus compleixin tres principis bàsics: representativitat, idoneïtat i
accessibilitat
En aquest tema es revisen les principals estratègies que s'utilitzen en l'àmbit biosanitari per
resumir-descriure dades quantitatives. Els càlculs estadístics efectuats en una població s’anomenen
paràmetres, i solen simbolitzar-se mitjançant lletres gregues.
Objectiu → ajudar els investigadors a raonar sobre les condicions que han de complir les distribucions
per escollir adequadament les eines que millor representen la tendència central i la dispersió de les
observacions.
Com hem dit, hi ha diferents estratègies, una d’elles les representacions gràfiques, les quals ofereixen
una valuosa imatge visual dels aspectes més destacables a les distribucions de valors. Es tracta
d’elaborar distribució de freqüències, sèrie de classes predeterminades:
- categories → quan les dades son NO mètriques
- números → quan les dades son valors mètrics
- intervals de valors
Les representacions s'acompanyen d'estadístiques que sintetitzen de forma numèrica els aspectes
fonamentals de les sèries de valors: tendència central, dispersió i forma.
Pregunta examen → jo puc tenir una mitjana de la meva mostra? si, puc tenir una mitjana. I una DT
de la població? si, ja que si la mostra es representativa serà molt semblant a la de la població
Pregunta examen → diferencia entre parametres (POBLACIÓ) i estadístcis (MOSTRA). (Nosaltres
calcularem estimacions de parametres amb un error sempre)
Sabem que les variables discretes es mesuren de forma exacta i els valors intermedis no tenen sentit.
No obstant això, el resultat de mesurar una variable contínua mai no és exacte perquè està limitat per
la precisió de l'instrument de mesura utilitzat.
OJO amb les variables contínues que mesuren el temps transcorregut entre dues dates (com l'edat
cronològica o el temps de hospitalització). Pero tenen un biaix, per exemple jo tinc 16 anys, però
demà faig 17, per això tots els càlculs estadístics que es realitzin amb temps complerts inclouen un
biaix. Per tant, com a regla general, els temps transcorreguts sempre s'han de mesurar a partir de les
dates d'inici i final, per poder fer un càlcul amb alta precisió. En cas que l'edat exacta no sigui
coneguda, i només es disposi de temps transcorreguts, previ a qualsevol anàlisi estadística la variable
haurà de corregir-se en +0.5 unitats. (per tant diré que tinc 16.5 anys)
Moments Ordenacions
- Facils d’obtenir → el càlcul es basa en sumes - ordenar els subjectes segons el valor que presentin
- Els més utilitzats a la sèrie
- Dificil interpretació - Fàcil interpretació
- Quan hi ha SIMETRIA - Quan hi ha ASIMETRIA
- 4 indicadors estadistics de moments: mediana, - Diagrama de caixa
d’esviacio estandar, simetria i curtrosi - indicadors: percentils, min i max, rang, mediana,
amplitud interquartil i moda
4. Representacions gràfiques -
Diagrama de caixa
El diagrama de caixa és un gràfic presentat per Tukey. El diagrama de caixa es considera una
representació sintètica de la distribució alhora que permet veure'n les principals característiques:
tendència central, dispersió, asimetria i valors allunyats.
1. Dibuixem la caixa (cuadrada o rectangular) a partir
del quartil 1 i el 3 → això ens indica on es troba el
50%, on es troba la NORMALITAT
2. Dibuixem una traça horitzontal a l’interior de la
caixa a l’altura de la mediana → on es trobi la traça
ens indicara si hi ha simetria (està al mig de la caixa)
o asimètrica (més aprop d’un dels quartils)
3. Calculem els umbrals/limits → primer calculem el
llindar valors allunyats (cua superior): Q3 + 1.5 x
(Q3−Q1). Despres Llindar valors allunyats (cua
inferior): Q1 − 1.5(Q3−Q1). I finalment dins dels
valors optinguts en els umbrals escollim l’ultim valor
de les nostres dades que estan dins d’aquests
umbrals, això formarà els bigotis
4. Els valors que quedin fora dels bigotis seran els valors allunyats
El diagrama de caixa és molt útil per comparar distribucions de dades quantitatives en diferents grups
i/o per estudiar l'evolució d'una condició en diferents moments temporals.
Un dels avantatges del diagrama de caixa és que pot ser construït amb sèries relativament petites
(l'histograma necessita distribucions sensiblement més grans, amb almenys 40-50 subjectes, mentre
que el diagrama de caixa es pot construir a partir de 10 dades). Un altre avantatge del diagrama de
caixa és el tractament dels valors llunyans, ja que en facilita la identificació i els representa de forma
separada a la resta de la distribució.
L'histograma és una alternativa clàssica al diagrama de caixa per a dades contínues. Gràfic més
emprat durant dècades per a la representació de dades quantitatives contínues. Per dibuixar-ho es
parteix de les dades ordenades en una distribució de freqüències i, seguidament, s'agrupen els valors
en intervals de classe. Sobre cada interval es dibuixa un rectangle amb una àrea igual a la freqüència
corresponent. Si, a més, s'uneixen els punts mitjans de cada interval/rectangle d'un histograma,
s'obté el polígon de freqüències.
De vegades la representació de l'histograma és INCORRECTA perquè les alçades representen les
freqüències absolutes (recomptes) de la variable. Aquesta forma de representar el diagrama només és
correcta si els intervals que es representen (anomenats intervals de classe en aquest tipus de
representació) tenen la mateixa amplada.
Mostra 6-10 11-22 23-44 45-90 91-181 182-362 363-726 727-1453 1454-2909
Total linies 4 5 6 7 8 9 10 11 12
Quan les variables que es representen al gràfic tenen escala de mesura diferent i/o diferent rang de
variació, per facilitar la interpretació el que s'acostuma a fer és representar les dades estandarditzades
de la variable (per exemple, els valors z-estandarditzats que tenen mitja zero i desviació estàndard u).
Histograma → quantitatives discretes petites i ideal per comparar
OJO → Presentar la freqüència absoluta puntual com a mesura de la freqüència d'un esdeveniment,
tant per dades transversals com a longitudinals és incorrecta, perquè aporta una magnitud que no és
interpretable en termes clínics (la seva rellevància clínica sempre dependrà de la quantitat total de
subjectes a la mostra i població de referència).
Per això existeix la freqüència relativa d'un esdeveniment binari, també anomenada prevalença (p).
La prevalença representa la freqüència relativa de l'esdeveniment d'interès pel que fa al total dels
subjectes que formen part del grup d'estudi en un moment determinat del temps (és una mesura
ESTÀTICA). Característiques:
- Raó entre num de casos identificats respecte al total
- El seu rang de variació és 0 a 1
- Magnitud directament interpretable-comparable
De vegades, se sol presentar l'odds com a mesura per valorar la freqüència relativa amb dades
transversals. Característiques:
- quocient entre una proporció i la seva complementària, és a dir, quocient entre probabilitat
d'ocurrència i de no-ocurrència
- rang va de 0 a +infinit.
- Estima la freqüència d'un esdeveniment relativa als subjectes que no presenten aquest
esdeveniment.
Hi ha una regla matemàtica (equivalència) que permet obtenir l'odds a partir de la prevalença i la
prevalença a partir de l'odds:
En termes merament matemàtic-estadístics, és indiferent fer servir la prevalença o l'odds per estimar
la freqüència relativa d'un esdeveniment. No obstant això, en epidemiologia és habitual utilitzar la
prevalença perquè la seva interpretació acostuma a resultar més senzilla en termes clínics. Per tant,
l'odds no és un índex habitual en epidemiologia descriptiva. Sí que ho és la raó d'odds, que s'obté
com el quocient o raó entre dos odds i s'utilitza per valorar la magnitud d'una associació.
L'odds té una propietat important: si l'esdeveniment objecte d'estudi es presenta amb una freqüència
d'aparició molt baixa (baixa prevalença), el denominador (1−p) pràcticament val 1 i, en aquest cas, el
valor de la odds s'aproxima bé al valor de la prevalença.
- Absoluta: quantitat de gent que enmalalteix per unitat de temps (cada any, cada
mes…) per tant informe del ritme. Característiques:
· N0 representa els exposats a l'inici i N1 els exposats al final.
· At representa el temps transcorregut.
· La seva magnitud no és directament interpretable en termes clínic
L’absoluta no permet la comparació (si jo tinc 2000 participants en un estudi i 20 en un altre,
tot i aquesta diferencia donarà el mateix, això es una LIMITACIÓ)
- Relativa: és millor que l’absoluta, però te la limitaició de que assumeix que els
incidents es posen malalts justament al final. És el quocient entre la variació relativa
de Y respecte a la variació de X. Ens indica respecte quantes persones → ens permet
veure quin es el millor tractament o quina és la malaltia més greu. Característiques:
· N0 representa els exposats al començament.
· N1 representa els exposats al final.
· At representa el temps transcorregut.
· La seva magnitud és directament interpretable
- Central medial relativa: Millora de la limitació de la taxa relativa → Sabem que han
enmalaltit p.ex 25 persones en total, pero potser han enmalaltit totes al principi o al
final, per saber-ho amb exactitud. En aquesta fórmula estic afegint dades agregades,
pero si coneixem exactament quan van emmalaltir, encara podem millorar més la
fórmula
CONCLUSIÓ: Diferencia entre risc i taxa → el risc mesura l’eficacia o probabilitat d'emmalaltir, en canvi
les taxes inclouen el temps i dona per tant velocitat.
IMP EN EL EXAMEN DONAR RESPOSTA VERBAL
TRANSVERSALS LONGITUDINALS
fa = recompte
CAPÍTOL -3
1.Espai mostral i succés -
L’espai mostral d’un experiment aleatori consisteix en el conjunt de tots els elements que conformen
tots els possibles resultats de la realització de dit fenomen. Per exemple, l’espai mostral en un dau pot
sortir del 1 al 6, en una moneda cara o creu.
és un succes 2 succesos no es
impossible poden realitzar
simultaneament,
(si A és 2,4 i 6, el incompetibles
(és la unió/suma dels
(ha de ser A i b contrari seria 1,3 i 5)
2 → P(A)+ P(B)
simultáneamente)
3. Assignació de probabilitats -
La probabilitat es defineix com una funció que associa a cada succés A una determinada probabilitat
P(A) en l'interval de nombres reals [0,1], de manera que verifiqui els tres axiomes següents:
- La probabilitat de tot succés A és un valor igual o superior a 0 → P(A) > o igual 0
- La probabilitat del conjunt d’elements de l’espai mostral és igual a 1 → P(Ω) = 1
- Per a dos esdeveniments A i B mútuament excloents es compleix: P(A U B) = P(A) + P(B)
4. Probabilitat condicionada -
Probabilitat que passi un determinat succés A sabent que també ha passat l'esdeveniment B. Se
simbolitza com a P(A|B), i es calcula com:
Teorema de Bayes
Probabilitat condicional d'un esdeveniment aleatori A donat B.
Analisi de validesa:
La prova més exacte que existeix és gold standard i s'obté com a prova de referencia
- Sensibilitat → probabilitat d'encert en els malalts; com es comporta el meu test amb els
malalts, és a dir, si estas malalt quina probabilitat hi ha de que el meu test encerti
- Especificitat → capacitat del meu test de discriminar als sans dels malalts
Per una valoració/ conclusió de la validesa total podem utilitzar:
- Valor global → (verdades negatius + verdaders positius) / (total sans + total malalts)
- Index de Youden → especificitat + sensibilitat. Problema= potser es molt bo només amb un
dels 2 valors i tot i així dona 0,80
Selecció del millor punt de tall i validesa global de la prova: metodologia ROC
Existeixen 2 punts de tall que podem moure:
- Seleccionar un PT baix → Incrementa la sensibilitat però Decrementa l'especificitat
- Seleccionar un PT alt → Decrementa la sensibilitat però incrementa l'especificitat
(el pitjor PT seria en el mig ja que un 50/50 és la pitjor predicció que es pot tenir)
Una corba ROC és una representació gràfica per a un sistema de classificació binari en funció de la
variació del punt de tall. S'obté a partir de la sensibilitat i l'especificitat per a tots els punts de tall
possible. Consisteix a representar la sensibilitat (Se) a l'eix d'ordenades (Y) i el complement de
l'especificitat (1−Sp) a l'eix d'abscises (X). D'aquesta manera, l'àrea sota la corba ROC està compresa
entre 0,5 i 1, on 1 representa un valor diagnòstic perfecte i 0,5 és una prova sense capacitat
discriminatòria diagnòstica.
Interpretació del valor diagnòstic:
- [0.50, 0.60): Pobre
- [0.60, 0.75): Moderat.
- [0.75, 0.90): Bé.
- [0.90, 1.00): Excel·lent.
A la pràctica, quan es presenten els resultats d'una prova diagnòstica és important informar sobre la
validesa (sensibilitat, especificitat i àrea sota la corba ROC), i també del comportament clínic (valors
predictius). Per calcular aquests valors predictius s'utilitza el Teorema de Bayes: