You are on page 1of 13

CAPÍTOL -1

1. Fundaments estadística descriptiva -


És important diferenciar entre estadística descriptiva i estadística inferencial.
· DESCRIPTIVA → L’objectiu és obtenir resum clar i interpretable en termes pràctics dels aspectes
bàsics d'una sèrie de dades d’una mostra. Els objectius específics de la descripció de dades són:
1) obtenir un resum de la informació senzill i conceptualment significatiu
2) facilitar la realització dels posteriors anàlisis (per sugerir hipòtesis)

Consisteix en aplicar un conjunt de tècniques i procediments per obtenir resums elaborats i


"psicològicament significatius" a partir del conjunt d'informació disponible en un estudi. La
descriptiva és el pas inicial de l'etapa d'anàlisi estadística d'un projecte de recerca i s'estructura al
voltant de les fases següents:
1. Ordenar les sèries de dades
2. Classificar les observacions
3. Obtenir recomptes de valors i sintetitzar (de forma numèrica i/o gràfica) el conjunt de les
sèries.

· INFERENCIAL → conjunt de tècniques més complexes amb el propòsit de poder efectuar


deduccions i proposar evidències científiques sobre una població origen a partir de les dades
registrades en una mostra concreta.
Quan a partir d’una mostra treus una conclusió, estas fent estadística inferencial de com serà la
població:

- POBLACIÓ → conjunt complet d'individus a què es referirán les conclusions d'un estudi. OJO
perquè és fonamental que durant la planificació de l'estudi aquesta població objectiu o diana
quedi ben definida, ja que tota la feina que es realitzarà estarà destinat a contrastar la
hipòtesi i obtenir evidència empírica sobre com es presenten uns determinats aspectes i/o es
relacionen un conjunt de variables en aquestes poblacions. Tot aquest procès de contrastar i
obtenir es fa amb TÈCNIQUES ESTADÍSTIQUES
- MOSTRA → les poblacions acostumen a ser molt extenses o de difícil accés, per això es va
crear la mostra; inclou només una part (generalment petita) del dit conjunt inicial. Els
individus o subjectes que la integren són els participants, podent ser persones, animals o fins i
tot procediments o elements reals o abstractes. Quan escollim la mostra, és important
garantir que els individus compleixin tres principis bàsics: representativitat, idoneïtat i
accessibilitat
En aquest tema es revisen les principals estratègies que s'utilitzen en l'àmbit biosanitari per
resumir-descriure dades quantitatives. Els càlculs estadístics efectuats en una població s’anomenen
paràmetres, i solen simbolitzar-se mitjançant lletres gregues.
Objectiu → ajudar els investigadors a raonar sobre les condicions que han de complir les distribucions
per escollir adequadament les eines que millor representen la tendència central i la dispersió de les
observacions.
Com hem dit, hi ha diferents estratègies, una d’elles les representacions gràfiques, les quals ofereixen
una valuosa imatge visual dels aspectes més destacables a les distribucions de valors. Es tracta
d’elaborar distribució de freqüències, sèrie de classes predeterminades:
- categories → quan les dades son NO mètriques
- números → quan les dades son valors mètrics
- intervals de valors
Les representacions s'acompanyen d'estadístiques que sintetitzen de forma numèrica els aspectes
fonamentals de les sèries de valors: tendència central, dispersió i forma.
Pregunta examen → jo puc tenir una mitjana de la meva mostra? si, puc tenir una mitjana. I una DT
de la població? si, ja que si la mostra es representativa serà molt semblant a la de la població
Pregunta examen → diferencia entre parametres (POBLACIÓ) i estadístcis (MOSTRA). (Nosaltres
calcularem estimacions de parametres amb un error sempre)

1.2 Dades quantitatives discretes i contínues: precisió de les mesures -


La classificació de variables segons l'escala de mesura es realitza en els grups següents:

Sabem que les variables discretes es mesuren de forma exacta i els valors intermedis no tenen sentit.
No obstant això, el resultat de mesurar una variable contínua mai no és exacte perquè està limitat per
la precisió de l'instrument de mesura utilitzat.
OJO amb les variables contínues que mesuren el temps transcorregut entre dues dates (com l'edat
cronològica o el temps de hospitalització). Pero tenen un biaix, per exemple jo tinc 16 anys, però
demà faig 17, per això tots els càlculs estadístics que es realitzin amb temps complerts inclouen un
biaix. Per tant, com a regla general, els temps transcorreguts sempre s'han de mesurar a partir de les
dates d'inici i final, per poder fer un càlcul amb alta precisió. En cas que l'edat exacta no sigui
coneguda, i només es disposi de temps transcorreguts, previ a qualsevol anàlisi estadística la variable
haurà de corregir-se en +0.5 unitats. (per tant diré que tinc 16.5 anys)

2. Índexs estadístics: l'enfocament clàssic basat en moments .


Hi ha nombrosos índexs per sintetitzar sèries mètriques, a la pràctica es pot fer segons 2 òptiques
diferents i escollir una òptica o una altra no és imp, ja que una elecció inadequada comporta
l'obtenció de nums matemàtics que no tenen interpretació i/o que aporten mesures enganyoses.

Moments Ordenacions

- Facils d’obtenir → el càlcul es basa en sumes - ordenar els subjectes segons el valor que presentin
- Els més utilitzats a la sèrie
- Dificil interpretació - Fàcil interpretació
- Quan hi ha SIMETRIA - Quan hi ha ASIMETRIA
- 4 indicadors estadistics de moments: mediana, - Diagrama de caixa
d’esviacio estandar, simetria i curtrosi - indicadors: percentils, min i max, rang, mediana,
amplitud interquartil i moda

RESUM: hi ha vegades que la mitjana no


es repre de la mostra, pq? DISPERSIÓ de
les dades --> per mesurar disperssió
utilitzem desviació estàndard. Per tant la
mitjana sense la desviació estàndard no
es informativa, necessitem sabe la disperssió

2.1 Coeficient de variació -


En cas que les dades no segueixin llei Normal, els intervals centrals de valors s'han d'obtenir a partir
dels percentils de la distribució.
Una de les dificultats a l'hora d'interpretar la desviació estàndard és que aporta una estimació de la
dispersió de variable a les mateixes unitats de mesura en què ha estat mesurat el constructe. Això fa
que no sigui possible comparar la dispersió de dues distribucions si les dades s'han registrat amb
escales de mida diferents. Un dels índexs que permet comparar el grau de dispersió de distribucions
diferents és el coeficient de variació: CV = DE / mitjana
Les dues propietats bàsiques del coeficient de variació són:
a) serveix com a mesura de la relació entre l'arreglament de la mitjana i la variabilitat de la
variable
b) permet comparar dispersions per a diferents variables o grups de subjectes.

2.2 Distribució centrada i estandarditzada -


De vegades les distribucions de valors es canvien d'escala, centrant-les o estandarditzant-les.
- Variable centrada: s'obté sostraient a cada dada la corresponent mitjana→ Xc = (x − x̅).
La característica d'una variable centrada és que té una mitjana igual a zero.
- Variable estandarditzada: s'obté restant cada valor de la variable per la mitjana i dividint per
la desviació estàndard → Xz = (x − x̅)/DE.
La característica d’una variable estandarditzada és que té mitjana igual a zero i desviació
estàndard igual a 1.
Els avantatges són que disposem de dades independents de les unitats.

3. Interpretació dels percentils d'una distribució -


A l'àmbit sanitari és habitual interpretar la mesura registrada per a un subjecte comparant-la amb un
barem de referència que es presenta tabulat mitjançant puntuacions percentil, per exemple el pes, la
talla…
Interpretació percentil → el percetil 5 indica que de 100 puntacions, 5 estan per sota i 95 per sobre
Hi ha diferents mètodes per estimar els percentils d’una distribució. El més habitual a la pràctica és el
de “Haverage” o mitjana ponderada. El seu càlcul resulta laboriós, per això en el seu lloc,
desenvoluparem el càlculs de les cambres tal com va proposar JW.Tukey.

Càlcul manual de la mitjana i de les cambres: procediment de Tukey:


Una forma senzilla d'il·lustrar els quarts és a través de l’algoritme que va descriure John W. Tukey en el
seu famós text “Exploratory Data Analysis” (Tukey, 1977), que els va anomenar amb el terme anglès
“Hinges”.
• Càlcul de la mediana:
1) Calcular la posició de la mitjana. Posició → (n+1)/ 2 = (8+1)/ 2 = 4.5
2) Com que la mediana ocupa un valor intermedi se li assigna la mitjana aritmètica dels temps
de remissió de les posicions 4a i 5a: Mitjana = Q2 = (2+3)/2= 2.5 setmanes
• Càlcul del primer quart
- La mitjana permet dividir novament la distribució en dues meitats iguals. La primera meitat
ocupa les posicions 1a a 4a. La posició del primer quart és doncs (1a+4a)/2 = 2.5a
- Com que el primer quart correspon novament a una posició intermèdia, se li assigna la
mitjana aritmètica dels valors que ocupen posicions 2a i 3a. En aquest exemple, val:
Q1=(2+2)/2=2 setmanes
•Càlcul del tercer quart
- Seguint amb el raonament emprat per calcular Q1, el tercer ocupa posició (5a+8a)/2 = 6.5a
- Al tercer quart se li assigna la mitjana aritmètica dels temps que ocupen les posicions 6a i 7a:
Q3=(4+14)/2=9 setmanes
*Per simetria, el tercer quart també es calcula considerant que ocupa la posició -2.5a (des del final).

Altres índexs de posició


Hi ha nombrosos índexs descriptius que s'obtenen a partir de la sèrie ordenada de valors.
- Valors mínim i màxim: són el valor més baix i més alt de la distribució de valors. En anglès es
denominen mínimum and máximum values.
- Rang o amplitud: és la diferència entre els valors màxim i mínim de la distribució, i és una
mesura de dispersió. En anglès es denomina range.
- Amplitud interquartil: és la diferència entre els valors que corresponen als percentils 25 i 75
de la distribució (o entre els quarts primer i tercer si es calcula utilitzant el mètode de Tukey), i
també és una mesura de dispersió. En anglès es denomina interquartile range.
- Moda: és el valor que més es repeteix de la distribució (és a dir, sovint). Una distribució és
unimodal si té una moda, bimodal si en té dues, i així successivament. És un valor poc utilitzat
per descriure dades quantitatives, i sol emprar-se només en distribucions amb un rang molt
petit.

4. Representacions gràfiques -
Diagrama de caixa
El diagrama de caixa és un gràfic presentat per Tukey. El diagrama de caixa es considera una
representació sintètica de la distribució alhora que permet veure'n les principals característiques:
tendència central, dispersió, asimetria i valors allunyats.
1. Dibuixem la caixa (cuadrada o rectangular) a partir
del quartil 1 i el 3 → això ens indica on es troba el
50%, on es troba la NORMALITAT
2. Dibuixem una traça horitzontal a l’interior de la
caixa a l’altura de la mediana → on es trobi la traça
ens indicara si hi ha simetria (està al mig de la caixa)
o asimètrica (més aprop d’un dels quartils)
3. Calculem els umbrals/limits → primer calculem el
llindar valors allunyats (cua superior): Q3 + 1.5 x
(Q3−Q1). Despres Llindar valors allunyats (cua
inferior): Q1 − 1.5(Q3−Q1). I finalment dins dels
valors optinguts en els umbrals escollim l’ultim valor
de les nostres dades que estan dins d’aquests
umbrals, això formarà els bigotis
4. Els valors que quedin fora dels bigotis seran els valors allunyats
El diagrama de caixa és molt útil per comparar distribucions de dades quantitatives en diferents grups
i/o per estudiar l'evolució d'una condició en diferents moments temporals.
Un dels avantatges del diagrama de caixa és que pot ser construït amb sèries relativament petites
(l'histograma necessita distribucions sensiblement més grans, amb almenys 40-50 subjectes, mentre
que el diagrama de caixa es pot construir a partir de 10 dades). Un altre avantatge del diagrama de
caixa és el tractament dels valors llunyans, ja que en facilita la identificació i els representa de forma
separada a la resta de la distribució.

L'histograma és una alternativa clàssica al diagrama de caixa per a dades contínues. Gràfic més
emprat durant dècades per a la representació de dades quantitatives contínues. Per dibuixar-ho es
parteix de les dades ordenades en una distribució de freqüències i, seguidament, s'agrupen els valors
en intervals de classe. Sobre cada interval es dibuixa un rectangle amb una àrea igual a la freqüència
corresponent. Si, a més, s'uneixen els punts mitjans de cada interval/rectangle d'un histograma,
s'obté el polígon de freqüències.
De vegades la representació de l'histograma és INCORRECTA perquè les alçades representen les
freqüències absolutes (recomptes) de la variable. Aquesta forma de representar el diagrama només és
correcta si els intervals que es representen (anomenats intervals de classe en aquest tipus de
representació) tenen la mateixa amplada.

El diagrama de tija i fulla:


El diagrama de tija i fulla és una alternativa a l'histograma de Tukey per a dades quantitatives.
Permet disposar simultàniament de la distribució de freqüències de la variable i de la representació
gràfica. Per construir-lo només cal separar a cada dada l'últim dígit de la dreta (que constitueix la
fulla) del bloc de xifres restants (que formarà la tija).
1. Dividir en tija-full cada valor de la distribució
2. Agrupar en una línia les fulles amb una mateixa tija
3. El llindar per a dades allunyades es calcula amb la mateixa definició donada per Tukey per al
dibuix del diagrama de caixa. Es poden dibuixar diagrames amb 2 o 5 linies per tall:
- Si dibuixem 2 linies per tall:
· primera linia: fulles 0 a 4
· segona linia: fulles 5 a 9

- Si dibuixem 5 linies per tall:


· primera línea: hojas 0 y 1
· segunda línea: hojas 2 y 3
· tercera línea: hojas 4 y 5
· cuarta línea: hojas 6 y 7
· quinta línea: hojas 8 y 9
Quan hi ha dubtes, es pot fer servir la regla de Sturges, que indica el nombre de línies aproximades
que hauria de tenir un diagrama de tija-full en funció del nombre total de subjectes de la sèrie de
valors:

Mostra 6-10 11-22 23-44 45-90 91-181 182-362 363-726 727-1453 1454-2909

Total linies 4 5 6 7 8 9 10 11 12

El diagrama radial, radar o d'aranya:


Permet efectuar comparacions visuals entre grups de subjectes per a diverses variables quantitatives
simultàniament (es tracta, doncs, d'un gràfic multivariant). Consisteix a traçar els valors de cada
categoria en un eix independent que s'inicia al centre del gràfic i acaba a l'anell exterior. Es compon
d'una seqüència de radis equiangular, en què cada raig representa una de les variables. La longitud de
les dades d'un raig és proporcional a la magnitud de la variable que es representa. La posició relativa i
l'angle dels eixos acostumen a ser arbitraris.

Quan les variables que es representen al gràfic tenen escala de mesura diferent i/o diferent rang de
variació, per facilitar la interpretació el que s'acostuma a fer és representar les dades estandarditzades
de la variable (per exemple, els valors z-estandarditzats que tenen mitja zero i desviació estàndard u).
Histograma → quantitatives discretes petites i ideal per comparar

Diagrama de caixa → asimetria i dades quantitatives discretes

Diagrama de tija i fulla → dades quantitatives

Diagrama radial → comparació variables quantitatives simultaniament

Diagrama de dispressió (punts) associació entre variables


Diagrama de sectors → categoriques nominals o ordinals, veure porcions

L'ús de gràfics com a eina descriptiva


és una pràctica habitual perquè
facilita enormement la interpretació
de les dades de manera visual. Cada
cop es disposa de major nombre de
programes que inclouen plataformes
que simplifiquen i faciliten la seva
elaboració, i també és cada cop més
freqüent aconseguir també
representacions molt atractives a
nivell estètic. El problema s'esdevé
quan els usuaris d'aquests sistemes,
de manera involuntària (o no),
generen gràfics que fàcilment poden
induir a error. A continuació, es
presenten diversos exemples ficticis
de representacions gràfiques per a
dades quantitatives que s'han creat
de manera tendenciosa per induir
conclusions errònies.
CAPÍTOL -2
1. L'epidemiologia com a mitjà per descriure la freqüència d'un esdeveniment -
L'epidemiologia → disciplina te objecte d'estudi la distribució dels estats i/o esdeveniments
relacionats amb la salut, també dels seus determinants i factors de risc, en poblacions específiques
amb el propòsit de poder planificar i efectuar intervencions que garanteixin un adequat control dels
problemes de salut. Aquesta disciplina integra un conjunt d'eines i protocols d'actuació per a l'estudi
de la ocurrència, la distribució i els determinants que afecten la salut dels individus d’una
determinada població.
Hi ha diferents mètodes per realitzar investigacions epidemiològiques, segons els objectius concrets
que es plantegen.
- Si propòsit és la vigilància del procés → es planifiquen estudis de caràcter descriptiu per
estimar la freqüència i la distribució dels esdeveniments d'interès.
- Si propòsit és conèixer els factors determinants del procés → es desenvolupen estudis
analítics, els resultats dels quals aporten evidències sobre l'etiologia dels esdeveniments
objecte d'anàlisi i permeten per tant efectuar prediccions i controls de les variables que
incideixen en el benestar de les poblacions.
Els resultats dels estudis epidemiològics, tant de tipus descriptiu com analític, són de gran validesa en
àmbits tan rellevants com la administració de serveis i les polítiques de salut pública.
En aquest capítol s'ensenyen els indicadors de freqüència que s'utilitzen en epidemiologia per
descriure esdeveniments binaris (com presència-absència d'una determinada condició clínica,
èxit-fracàs d'un tractament, remissió-recidiva d'un procés). L'ús d'un índex o altre dependrà del tipus
de dades disponibles a l'estudi: transversals davant de longitudinals o de seguiment.
● PREVALENCIA → index estàtics, dades TRANSVERSALS; registres per a un moment
determinat del temps, el càlcul bàsic de la freqüència de l'esdeveniment és la proporció,
anomenada prevalença . Trobem:
- Rao de prevalencia
- Rao de odds

● INCIDÈNCIES → index dinàmics, dades LONGITUDINALS; registre continuat, pels subjectes es


calculen índexs que arrepleguen aspectes dinàmics del procés i que incorporen el seguiment
en el temps: incidències. Trobem:
- Rao de risc (o incidència acumulada)
- Rao de taxa

2. Freqüència d'un esdeveniment amb dades transversals: la prevalença -


La base dels càlculs en epidemiologia és la freqüència absoluta (fa)= recompte del nombre
d'esdeveniments identificats amb la condició objecte d'estudi. Característiques:
- És el num total de casos identificats
- El seu rang de variació és 0 a n
- Magnitud no interpretable-comparable

OJO → Presentar la freqüència absoluta puntual com a mesura de la freqüència d'un esdeveniment,
tant per dades transversals com a longitudinals és incorrecta, perquè aporta una magnitud que no és
interpretable en termes clínics (la seva rellevància clínica sempre dependrà de la quantitat total de
subjectes a la mostra i població de referència).

Per això existeix la freqüència relativa d'un esdeveniment binari, també anomenada prevalença (p).
La prevalença representa la freqüència relativa de l'esdeveniment d'interès pel que fa al total dels
subjectes que formen part del grup d'estudi en un moment determinat del temps (és una mesura
ESTÀTICA). Característiques:
- Raó entre num de casos identificats respecte al total
- El seu rang de variació és 0 a 1
- Magnitud directament interpretable-comparable
De vegades, se sol presentar l'odds com a mesura per valorar la freqüència relativa amb dades
transversals. Característiques:
- quocient entre una proporció i la seva complementària, és a dir, quocient entre probabilitat
d'ocurrència i de no-ocurrència
- rang va de 0 a +infinit.
- Estima la freqüència d'un esdeveniment relativa als subjectes que no presenten aquest
esdeveniment.
Hi ha una regla matemàtica (equivalència) que permet obtenir l'odds a partir de la prevalença i la
prevalença a partir de l'odds:

En termes merament matemàtic-estadístics, és indiferent fer servir la prevalença o l'odds per estimar
la freqüència relativa d'un esdeveniment. No obstant això, en epidemiologia és habitual utilitzar la
prevalença perquè la seva interpretació acostuma a resultar més senzilla en termes clínics. Per tant,
l'odds no és un índex habitual en epidemiologia descriptiva. Sí que ho és la raó d'odds, que s'obté
com el quocient o raó entre dos odds i s'utilitza per valorar la magnitud d'una associació.
L'odds té una propietat important: si l'esdeveniment objecte d'estudi es presenta amb una freqüència
d'aparició molt baixa (baixa prevalença), el denominador (1−p) pràcticament val 1 i, en aquest cas, el
valor de la odds s'aproxima bé al valor de la prevalença.

3. Freqüència d'un esdeveniment amb dades longitudinals: la incidencia -


Quan es disposa de registres longitudinals, el temps s'incorpora al càlcul i s'estimen incidències.
En aquests estudis els subjectes són avaluats en repetides ocasions durant un període de temps que
pot ser fix o variable. L'objectiu és identificar i registrar les variables objecte d'interès per determinar
la freqüència amb què apareixen els esdeveniments i la dinàmica del procés d'aparició d'aquests
esdeveniments i els correlats.
El registre més simple → avaluar els subjectes a l'inici i al final del seguiment. En aquests casos és
habitual calcular la proporció acumulada dels casos incidents (nous casos identificats durant el
període d'observació). Però si el registre és més detallat i inclou el moment temporal precís en què es
produeix cada esdeveniment, es poden estimar índexs que en el càlcul incorporin el temps
transcorregut fins que es presenta el succés i que per tant aportin una estimació de la velocitat
delprocés. Formalment, en els estudis epidemiològics descriptius amb seguiment, la freqüència dels
esdeveniments es mesura mitjançant la incidència, que es pot calcular a partir de riscos o de taxes.
● RISC → proporció acumulada de casos incidents durant el seguiment, i representa per tant la
probabilitat que en un subjecte exposat a l'inici del període presenti l'esdeveniment durant el
temps d'observació. Característiques:
- N0 representa els exposats a l'inici (persones que es poden posar malaltes) i N1 els
exposats al final (els que encara es poden posar malaltes al final).
- El seu rang de variació és de 0 a 1.
- La magnitud depenen del temps d'exposició → IMP especificar el temps, p.ex el risc
de patir la malaltia és del 25% al llarg d' 1 any (el temps que digui l'enunciat). ojo
perquè pot ser diuen el 35% dels pacients emmalaltiran. I es INCORRECTE falta dir en
QUIN TEMPS
El risc sempre ha d'anar acompanyat del període d'observació, ja que altrament no es
podria interpretar.
● TAXA → mesura de la dinàmica o velocitat amb què es presenten els esdeveniments durant
el seguiment. Hi ha dues definicions possibles per a la taxa:

- Absoluta: quantitat de gent que enmalalteix per unitat de temps (cada any, cada
mes…) per tant informe del ritme. Característiques:
· N0 representa els exposats a l'inici i N1 els exposats al final.
· At representa el temps transcorregut.
· La seva magnitud no és directament interpretable en termes clínic
L’absoluta no permet la comparació (si jo tinc 2000 participants en un estudi i 20 en un altre,
tot i aquesta diferencia donarà el mateix, això es una LIMITACIÓ)

- Relativa: és millor que l’absoluta, però te la limitaició de que assumeix que els
incidents es posen malalts justament al final. És el quocient entre la variació relativa
de Y respecte a la variació de X. Ens indica respecte quantes persones → ens permet
veure quin es el millor tractament o quina és la malaltia més greu. Característiques:
· N0 representa els exposats al començament.
· N1 representa els exposats al final.
· At representa el temps transcorregut.
· La seva magnitud és directament interpretable
- Central medial relativa: Millora de la limitació de la taxa relativa → Sabem que han
enmalaltit p.ex 25 persones en total, pero potser han enmalaltit totes al principi o al
final, per saber-ho amb exactitud. En aquesta fórmula estic afegint dades agregades,
pero si coneixem exactament quan van emmalaltir, encara podem millorar més la
fórmula

CONCLUSIÓ: Diferencia entre risc i taxa → el risc mesura l’eficacia o probabilitat d'emmalaltir, en canvi
les taxes inclouen el temps i dona per tant velocitat.
IMP EN EL EXAMEN DONAR RESPOSTA VERBAL

TRANSVERSALS LONGITUDINALS

fa = recompte

CAPÍTOL -3
1.Espai mostral i succés -
L’espai mostral d’un experiment aleatori consisteix en el conjunt de tots els elements que conformen
tots els possibles resultats de la realització de dit fenomen. Per exemple, l’espai mostral en un dau pot
sortir del 1 al 6, en una moneda cara o creu.

2. Operacions amb successos -

Unió de successos Interacció de Succés Succés impossible Succés


successos complementari o i succés segur incompatible
contrari

és un succes 2 succesos no es
impossible poden realitzar
simultaneament,
(si A és 2,4 i 6, el incompetibles
(és la unió/suma dels
(ha de ser A i b contrari seria 1,3 i 5)
2 → P(A)+ P(B)
simultáneamente)

3. Assignació de probabilitats -
La probabilitat es defineix com una funció que associa a cada succés A una determinada probabilitat
P(A) en l'interval de nombres reals [0,1], de manera que verifiqui els tres axiomes següents:
- La probabilitat de tot succés A és un valor igual o superior a 0 → P(A) > o igual 0
- La probabilitat del conjunt d’elements de l’espai mostral és igual a 1 → P(Ω) = 1
- Per a dos esdeveniments A i B mútuament excloents es compleix: P(A U B) = P(A) + P(B)

Les conseqüències de definició axiomàtica de la probabilitat són:


- La probabilitat de tot succés contrari és → P(A̅) = 1−P(A)
- La probabilitat del succés impossible és →

Segons això es compleix que:


- Si A i B són mútuament excloents
- Si A i B no són mútuament excloents

Per assignar probabilitats es pot recórrer a diferents definicions:

4. Probabilitat condicionada -
Probabilitat que passi un determinat succés A sabent que també ha passat l'esdeveniment B. Se
simbolitza com a P(A|B), i es calcula com:

Càlcul de probabilitat amb diagrama d’arbre i taula de contingencia


A partir d’aquesta taula podem calcular:
- Probabilitats marginals → es calcular dividints els marginals (totals) entre el total final(500)
- Probabilitats totals → els diferents valors de dins de la taula entre el total
- Probabilitats condicionals → el valor que sigui entre els marginals de columna

Teorema de Bayes
Probabilitat condicional d'un esdeveniment aleatori A donat B.

5. Procés de valoració duna prova diagnòstica -

Analisi de validesa:
La prova més exacte que existeix és gold standard i s'obté com a prova de referencia
- Sensibilitat → probabilitat d'encert en els malalts; com es comporta el meu test amb els
malalts, és a dir, si estas malalt quina probabilitat hi ha de que el meu test encerti
- Especificitat → capacitat del meu test de discriminar als sans dels malalts
Per una valoració/ conclusió de la validesa total podem utilitzar:
- Valor global → (verdades negatius + verdaders positius) / (total sans + total malalts)
- Index de Youden → especificitat + sensibilitat. Problema= potser es molt bo només amb un
dels 2 valors i tot i així dona 0,80

Selecció del millor punt de tall i validesa global de la prova: metodologia ROC
Existeixen 2 punts de tall que podem moure:
- Seleccionar un PT baix → Incrementa la sensibilitat però Decrementa l'especificitat
- Seleccionar un PT alt → Decrementa la sensibilitat però incrementa l'especificitat
(el pitjor PT seria en el mig ja que un 50/50 és la pitjor predicció que es pot tenir)
Una corba ROC és una representació gràfica per a un sistema de classificació binari en funció de la
variació del punt de tall. S'obté a partir de la sensibilitat i l'especificitat per a tots els punts de tall
possible. Consisteix a representar la sensibilitat (Se) a l'eix d'ordenades (Y) i el complement de
l'especificitat (1−Sp) a l'eix d'abscises (X). D'aquesta manera, l'àrea sota la corba ROC està compresa
entre 0,5 i 1, on 1 representa un valor diagnòstic perfecte i 0,5 és una prova sense capacitat
discriminatòria diagnòstica.
Interpretació del valor diagnòstic:
- [0.50, 0.60): Pobre
- [0.60, 0.75): Moderat.
- [0.75, 0.90): Bé.
- [0.90, 1.00): Excel·lent.

Analisi de rendiment clínic → valors predictius (capacitat predictiva del test:


- PV + → capacitat predectiva d'identificar malalts
- PV - → capacitat per discriminar sans

PROBLEMA → La capacitat predectiva depen de la PREVALENÇA si una malaltia és molt infreqüent,


les probes de cribatge s'equivoquen MOLT

A la pràctica, quan es presenten els resultats d'una prova diagnòstica és important informar sobre la
validesa (sensibilitat, especificitat i àrea sota la corba ROC), i també del comportament clínic (valors
predictius). Per calcular aquests valors predictius s'utilitza el Teorema de Bayes:

You might also like