You are on page 1of 10

REPÀS EXERCICIS EXAMEN 2020

1. (1p) En l'àmbit de l'aplicació de la IA en la medicina i la salut, expliqueu a què s'ha


denominat MEDICINA 4P.

La presència de tecnologies i avanços tecnològics ( com la IA) en la sanitat està impulsant a


una atenció sanitaria que és predictiva, participativa, personalitazada i proactiva, és el que es
coneix com a Medicina 4P.
- Personalitzada: l’atenció es centre en l’individu i en com optimitzar el benestar d’aquest
predint la malaltia i/o buscant tractaments personalitzats per prevenir-la.

- Predictiva: Identificació dels riscos genètics per a moltes malalties. Els signes de la malaltia
es reconeixen abans de que es manifesti, d’aquesta manera es poden planificar els efectes
amb antelació.

- Preventiva: les persones reben les eines per reconèixer els primers signes de la malaltia,
quan aquesta és més reversible.

- Participativa: el pacient està ben informat de la seva salut i per tant, està millorar preparat
per poder prendre les seves pròpies decisions sobre la seva salut. Això fa que la medicina
sigui molt més eficient.
 
Per la implementació d’una medicina que sigui predictiva, preventiva, participativa i
personalitzada és necessària la unió entre la salut i la tecnologia que es pot aconseguir a través
d’eines com la intel·ligència artificial.

2. (1p) En el aprenentatge basat en problemes, per a realitzar el plantejament del


problema des del punt de vista mèdic i formular una hipòtesi, cal consultar bibliografia.
Expliqueu la metodologia utilitzada per a fer el plantejament del problema i les fonts de
recerca d'informació que es van utilitzar (diferents a les transparències i les referències
addicionals proporcionades pel professor).

L'aprenentatge basat en problemes és una estratègia d’ensenyament que inverteix


l’organització tradicional dels processos d’aprenentatge.
3. (1p) A la següent taula es presenten els resultats obtinguts en un estudi de cohorts
sobre la relació entre el consum de tabac i el càncer de pulmó. Discutiu quina seria la
mesura d’associació pertinent per estudiar l’associació entre les dues variables.
Calculeu-ne una estimació puntual i interpreteu el resultat obtingut.

ESTUDI DE COHORTS: És el seguiment en el temps


d’un grup, uns quants están exposats a la malaltia i
altres no i de cada grup d’aquests uns quants tenen la
malaltia i altres no.

En aquest cas:

-Factor que volem estudiar: si apareix cáncer o no.


-L’exposició: fumador o no fumador.

Es comença l’estudi amb pacients sans (en aquest cas alguns fumadors i alguns no) i els hi fem
un seguiment, finalment sabrem quants dels que fumen han acabat desenvolupant la malaltia i
quants no.

QUÈ ENS DEMANA EL PROBLEMA?

1- Mesura d’associació
2- Estimació puntual + interpretació dels resultats.

Mesura d’associació: OR (Odds Ratio) o RR (Risc Relatiu)

- Odds Ratio: Amb la odds ratio no puc calcular incidències (casos nous de la malaltia)
perquè el disseny de l’estudi no m’ho permet perquè no hi ha un seguiment. L’utilitzarem
quan no es puguin calcular els casos nous (casos i controls). Sempre tendeix a
sobreestimar, surten valors més grans.

- Risc Relatiu: Quocient entre la incidencia dels exposats i els no exposats. És la mesura
d’associació que utilitzem en aquest tipus d’estudis de cohorts.

 Si RR=1, la incidència en el grup d’exposats al factor és igual a la incidència en el grup


de n exposats. No s’observa associació entre l’exposició al factor i la característica
(malaltia. 

 Si RR>1, la incidència en el grup d’exposats al factor és superior a la incidència en el


grup de no exposats. S’observa associació positiva entre l’exposició al factor i la
característica(malaltia). L’anomenem factor de risc. 
 Si RR>1, la incidència en el grup d’exposats al factor és inferior a la incidència en el
grup de no exposats. S’observa associació negativa entre l’exposició al factor i la
característica (malaltia). L’anomenem factor protector.

En aquest cas com que parlem d’un estudi de cohorts i hi ha un seguiment i per tant puc
quantificar els casos nous, és més adient calcular el risc relatiu.

ESTIMACIÓ PUNTUAL

L’exposició al tabac és un factor de risc pel cáncer de pulmó perquè fa que tinguis 5,51
vegades més probabilitats de patir cáncer que no pas els que no fumen.

Com més gran és la mida de la mostra més estrets són els intervals de confiança. Si tinc
mostres de mida petita, tindré intervals de confiança molt grans.

4. (1p) En un dels nombrosos articles que apareixen sobre proves diagnòstiques de la


covid’19, els autors estudien la prova RT-PCR i mostren els següents resultats:

4.1. Interpreteu l’estimació puntual i l’interval de confiança de la sensibilitat,


l’especificitat i la raó de versemblança positiva (positive likelihood ratio).

S= 61% De cada 100 malalts 61 tenen una PCR positiva, la resta serán falsos negatius.
790/1193

E= 94,84% De cada 100 no malalts 94,84 em surt una prova negativa. 1065/1067

RV+= 11,81 Sensibilitat/1-Especificitat  Ens indica quan més probable és un positiu en el


grup de malalts que en els de no malalts. Ens interessa que sigui el més gran posible. Aquest
11,81 significa que en el grup de malalts, de pacients que tenen covid, tenim 11,81 més de
possibilitats de tenir un positiu que no pas en el grup de no malalts.
La RV es calcularía 1- sensibilitat/ Especificitat  és quan més probable és un negatiu en el
grup de malalts que en el grup de no malalts. Ens interessa que sigui el més proper a 0.

El veritable valor de la sensibilitat es troba practicament segur (95%) dins el rang de valors que
hi ha a l’interval de confiança. Igual amb l’especificitat, etc.

4.2. En la població on hem pres aquesta mostra obtenim un individu amb resultat de la
RT-PCR positiu, quina és la probabilitat que realment tingui la covid’19? Serveix aquesta
probabilitat per un altre individu que ha donat positiu però que pertany a una altra
població diferent?

Sabem el resultat de la PCR però no la probabilitat de que tingui COVID. Volem saber quina és
la probabilitat de que realment tingui covid.

Probabilitat condicionada

No serveix perquè no pertany a la mateixa población, ja que en una altra población tindrpa una
altra prevalencia, que es calcula amb el teorema de Bayes.

4.3. A través de la corba ROC que es mostra, valoreu la utilitat d’aquesta prova
diagnòstica.

RESUM CORBES ROC

 Si la corba s’apropa al vèrtex superior esquerra (punt 0,1 del gràfic) millor discrimina
entre M i noM.
 Si la corba s’apropa a la diagonal, la prova no discrimina (és com decidir M i noM a
l’alzar).
 Quanta més àrea sota la corba (AUC), més bona discriminació entre M i noM.
 Problema de la determinació del punt de tall òptim. 

En aquest problema podem dir que aquesta prova diagnòstica no és gaire bona ja que la corba
esta allunyada del punt 0,1 del gràfic.
5. (1p) Sobre l’anàlisi estadístic de dades composicionals:

5.1. Definiu què són les dades composicionals i doneu-ne un exemple diferent al que
s’indica en l’apartat següent.

S’anomenen dades composicionals les dades vectorials que contenen informació relativa de les
diverses parts en què es considera dividit o classificat un cert total, és a dir, són vectors de
components estrictament positives i de suma constant.

Les dades composicionals apareixen sempre que es treballa amb magnituds relatives com
concentracions, proporcions, freqüències relatives, etc

Les unitats corresponents són, per exemple, grams per centímetre cúbic (g/cm3), mil·ligrams
per litre (mg/L), quilograms per hectàrea (kg/ha), percentatges (%), parts per unitat (ppu) o
parts per milió (ppm) de massa o de volum, etc.

Exemples de dades composicionals: proporció de mascles i famelles els quals els hi ha anat bé
un tractament. Concentracions de substàncies contaminants d’una ciutat. Etc

5.2. La captura de pantalla que teniu a continuació conté els resultats de l’anàlisi
composicional descriptiu de la composició de la microbiota intestinal amb 3 parts
(E=Escherichia coli proteobacteria, F1=Faecalibacterium prausnitzii Filogroup 1, F2
=Faecalibacterium prausnitzii filogroup 2) de dos grups de pacients (Grup 0: sans,
Grup3: amb malaltia de Crohn). Indiqueu quines són les diferències que observeu entre
els dos grups.

Tal i com veiem en les imatges, es mostren els resultats dels dos tipos de grups de pacients.
En el de l’esquerra, tenim els pacients del grup 0.0 on s’han agafat 47 mostres per estudiar-lo,
mentre que en el de la dreta, tenim els pacients del grup 3.0 en el qual s’han agafat 63 mostres.
En aquí ja podem veure que per fer l’estudi no s’han agafat el mateix nombre de mostres en un
grup que en l’altre per tant, com més mostres, més exemples de dades reals tindrem, que no
pas si agafem una mostra més petita com la de l’esquerra. Si calculessim l’interval de confiança
en els dos casos, el del grup 0.0 ens sortiria un interval de confiança més gran ja que la mostra
és més petita ( per tant més posibles valors “adequats”) en canvi, en el grup 3.0 com que la
quantitat de mostres és més gran el seu interval de confiança será més petit per tant més
concret.

Després veiem que les dades que s’han calculat del centre de les mostres pel que fa a la E-coli
tenim un valor més gran en el grup 3.0, en canvi per les altres dos malalties, tenim uns valors
més grans en la F1 i F2 del grup 0.0.

Pel que fa a la matriu veiem que els valors de les variàncies en general són més grans en la
mostra del grup 3.0 que no pas en el grup 0.0

Què volia dir el requadre en vermell? I el blau? Què més caldria explicar?
6. (1p) Amb les dades de l’estudi de Framingham sobre malalties cardiovasculars, hem
construït un model de regressió logística per explicar la variable cvd (esdeveniment
cardiovascular 1=si/0=no) a través de les variables:

 age1 (edat en anys) 


 cursmoke1 (1=Si/0=no)
 diabetes1 (1=Si/0=no) 
 sex1(1=male/0=female) 

Interpreteu els resultats que es mostren obtinguts amb l’R:

En aquest tipus d’estudis el que ens interessa és fixar-nos amb el p valor ja que aquest, té
relació amb la fiabilitat de l’estudi i la importancia clínica dels resultats.

Per tant, p és la probabilitat d'obtenir, per atzar, una diferència tan gran o més gran de
l'observada, complint-se que no hi hagi diferència real a la població de què provenen les
mostres.

- Si aquest valor de probabilitat és menor del 5% (0,05) és prou improbable que es degui a
l'atzar per rebutjar amb una seguretat raonable la H0 i afirmar que la diferència és real.
- Si és més gran del 5%, no tindrem la confiança necessària per poder negar que la
diferència observada sigui obra de l'atzar.

La hipòtesis nul·la és Ho: No hi ha regressió. Per tant, per un valor p < 2e-16, rebutjem Ho i
acceptem que hi ha regressió lineal. Com que acceptem que hi ha regressió, cal fer la
inferència sobre els coeficients de regressió parcials. . La hipòtesi nul·la H0: βi=0 diu que el
coeficient βi (o el terme independent β0) no és significativament diferent de 0. Mentre que la
hipòtesi alternativa H1: βi≠0 diu que aquest coeficient sí que ho és. A partir dels resultats que
ens dóna l’R, podem acceptar que tots aquests coeficients i el terme independent són
significativament diferents de 0.

Així doncs l’equació de regressió que obtenim és:

Y= -4.42+0,071x1 +0,285x2 + 1.316x3 – 0.87x4

Està bé? Que més puc dir?


7. (1p) Descriviu mitjançant un diagrama de flux la metodologia que empraríeu per a obtenir
un model predictiu a partir d’un conjunt de dades com el que es mostra a la figura. Cada fila
correspon a les dades d’un pacient. La descripció de les variables es proporciona a
continuació.

No en tenia ni idea, però jo seguiría algún exemple de passos així per obtener-lo.

Que s’sespera més que es respongui aquí?


8. (1p) Per predir la infertilitat de les dones, s’ha aprés la següent xarxa-neural a partir dels
registres històrics.

8.1. Quina és la sortida y per l’entrada (0.7, 0.8, 0, 0)? Suposeu una funció d’activació step
per a totes les neurones.

La funció d’activació Step no es pot aplicar a xarxes neuronals perque la seva derivada és 0
(excepte la derivada del punt 0 que no esta definida).

Aquesta funció indica que si la X < 0 la neurona será 0, pero quan X >= 0 donarà com a sortida
un 1.

8.2. Suposant que la classe real és 1, com es veurien modificats els pesos en la darrera
neurona? Suposar la regla delta de l’aprenentatge del perceptró ( i i i ω = ω +α(t − y)x ), i un
factor d’aprenentatge α =0.2.
9. (1p) Aplicar el clustering jeràrquic en les següents dades representatives dels hàbits d’una
població d’estudi. Indiqueu el tipus de distància i linkage que feu servir.
10. (1p) Explica breument que és el windowing i com s’aplica en dades longitudinals.
Apliqueu-lo en les següents dades amb una finestra w=3 dies, i solapament de 1 dia.

You might also like