You are on page 1of 10

Bioestadística. Curs 2023-2024. Grau de Biologia. UAB.

Entrega 1 de Pràctiques.

1. Feu la taula de freqüències de la variable TDP.

a) Quin és el nombre de pacients que tenen un dolor moderat?


El nombre de pacients amb dolor moderat és de 87 persones.

b) Quin és el percentatge de pacients que tenen un dolor alt?

El percentatge de pacients amb dolor alt és de 7.59%.

2. Converteix la variable TDP a factor, si encara no ho és, i reordena’l de


manera que tingui més sentit per tu. Justifica aquest ordre.

La variable TDP ja és un factor, només s’ha d’ordenar la variable de “baix”


i la de “moderat” de manera que sigui més visual i senzill entendre-ho
3. Ompliu la taula següent per a la variable Edat en funció de la variable
TDP:
Edat Molt Baix Baix Moderat Alt

Mitjana 55.69231 51.36000 53.51724 55.86957

Variància 69.10184 90.48000 88.74098 100.66403

Mediana 57 52 53 59

Percentil 10 43.0 41.0 41.0 40.4

Percentil 90 65.8 62.1 67.0 65.8

Mínim 35 29 37 34

Màxim 77 74 76 69
A partir de la taula anterior, contesteu a les següents preguntes:

a) Quins pacients tenen major variabilitat d’edat, els que tenen un TDP
baix o els qui el tenen Moderat?
Els que tenen un TDP baix tenen major variabilitat. Això és pot saber
mirant la variància, que és molt elevada.
b) Quin és el rang d’edat pels pacients que tenen un TDP Alt?
El rang d’edat es calcula restant el màxim valor amb el mínim, per
tant, 69 – 34 = 35. El rang és de 35.
c) Quin és el IQR d’edat pels pacients que tenen un TDP Molt Baix?
El rang interquartil (IQR) es calcula restant el quartil 75 amb el
quartil 25, és a dir, el IQR és de 11.
d) El 90% dels pacients amb TDP Moderat tenen una edat inferior a?
Aquests pacients tenen una edat inferior a 67 anys.
e) El 90% dels pacients amb TDP Baix tenen una edat superior a?
Aquests pacients tenen una edat superior a 41 anys però, inferior a
62.1 anys.
4. Feu un diagrama de barres de la variable TDP i poseu-li un títol adient.
Què hi ha, més pacients amb un TDP baix o pacients amb TDP alt?

Hi ha més pacients amb TDP baix que amb TDP alt.

5. Feu ara un diagrama de sectors de la variable TDP, posant-li un títol


adient.
6. Representeu l’histograma de la variable Edat i poseu-li un títol adequat.
A la vista del gràfic descriptiu, penseu que segueix una distribució
Normal? Raoneu la resposta.

El gràfic segueix una forma molt


semblant a la campana de Gauss,
on als extrems es troben valor
inferiors als del centre on hi ha
valors superiors. Per tant, si
que es pot afirmar que segueix
una distribució Normal.

7. Representeu un boxplot de la variable Edat en funció del sexe. Com sempre,


poseu-li un títol adient. Quina és la mitjana d’edat de les pacients que
són dones?
La mitjana d’edat de les dones
segons el bloxpot sembla ser
d’entre 50 i 65, i en realitzar
els càlculs pertinents, es pot
concretar un valor de 55.67 anys.
8. Recodifica la variable Edat, creant la variable Edat.cat de la següent
manera:
- de 0 a 35 anys: Joves
- de 36 a 60 anys: Adults
- de 61 a 85 anys: Grans

9. Repetiu els apartats 4 i 5 per aquesta nova variable.


10. Trobeu la recta de regressió de la variable Colesterol (variable resposta)
respecte la variable Edat (variable explicativa).

a) Quina és l’equació de la recta de regressió?


L’equació de la recta de
regressió és:
F(x) = 179.9675 + 4.2194x

b) Feu el diagrama de dispersió corresponent afegint la recta de regressió


al diagrama. Mirant aquest gràfic, creieu que el colesterol augmenta
en funció de l’edat?
El diagrama de dispersió mostra
que a mesura que l’edat de la
persona augmenta, el seu nivell
de colesterol també ho fa, per
tant hi ha una relació lineal.
Tot i això, aquesta relació és
bastant lleu ja que el núvol de
punts està força dispers.

c) La predicció del colesterol d’un pacient que té 35 anys és? I per un


pacient de 75?. Comenta els resultats.

Aquesta càlculs es realitzen segons l’equació anterior:


f(x) = 179.9675 + 1.2194x on la x és l’edat de la persona, per tant
substituïm:

Quantitat de colesterol per una persona de 35 anys:


f(35) = 179.9675 + 1.2194*(35)= 222,6465 mg/dL

Quantitat de colesterol per una persona de 75 anys:


f(75) = 179.9675 + 1.2194*(75)= 271.4225 mg/dL
11. Trobeu ara la recta de regressió de la variable Max Pulsacions (variable
resposta) respecte la variable Edat (variable explicativa). Feu el
diagrama de dispersió corresponent afegint la recta de regressió i comenteu
els resultats.

L’equació de la recta de
regressió és:
F (x) = 204.2892 - 1.0051x

Aquest diagrama de dispersió és


lineal i negatiu ja que la recta
tendeix cap a avall i a més, es pot
observar ja que a l’equació hi ha un
signe negatiu.
Per tant, l’edat i les pulsacions
màximes són linealment negatives i
que a mesura que el pacient es fa
gran , les seves pulsacions màximes
es redueixen.
12. Per acabar, feu el mateix amb les variables Colesterol (variable resposta)
i les PAR (variable explicativa). Feu el diagrama de dispersió´ pertinent,
afegint la recta de regressió´ i comenteu aquests resultats.

La recta de regressió és:


F(x) = 198.351 + 0.364x

En aquest gràfic s’observa una


regressió lineal positiva on hi
ha una relació entre PAR (pressió
arterial en repòs) i el
colesterol. Per tant, com és
colesterol hi haurà més pressió
arterial en repòs.
13. Calculeu la matriu de correlacions per a les variables Edat, PAR,
Colesterol i Max Pulsacions. Quines dues variables estan més
correlacionades? Quines menys? Interpreta els resultats.

Les dues variables més correlacionades són l’edat i les pulsacions màximes amb
un valor de –0.398521938.

Les dues variables menys correlacionades són el colesterol i les pulsacions


màximes amb un valor de –0,009939838.

Amb aquestes dades s’observa que l’edat és una variable molt importat per predir
les pulsacions màximes a diferencia de la variable colesterol que serà molt
dolenta. Aquest fet és degut a que la correlació positiva ideal seria 1 i la
negativa ideal -1, i quan hi a una correlació molt propera a 0 la relació és
nul·la. Per tant, com més propera sigui la correlació als valors 1 o –1, més
fiables seran els resultats de l’equació.

14. Considerant les dades obtingudes de l’apartat anterior, creieu que les
rectes de regressió calculades en els amb anterioritat tenen validesa?
Justifiqueu la vostra resposta.

En els resultats obtinguts es pot veure que les correlacions són molt dèbils
ja que els punts estan molt dispersos i es difícil concretar una línia de
regressió, tot i això, les dades tenen validesa i son fiables.

Per determinar la distancia dels punts a la recta de regressió i així comprovar


els resultats, es pot fer servir el coeficient de determinació (R2). Si per
exemple es calcula R2 de l’edat i les pulsacions màximes, dona un valor de
R2=0.152, sent aquest un valor dèbil.
15. Fes un interval de confiança per la mitjana de la variable Colesterol.
Consideres que els pacients als quals se’ls ha fet l’estudi tenen el
colesterol normal?

Interval de confiança del 95% = (240.4046 - 252.1235)


La mitjana de colesterol del 95% dels pacients és de 246.264 mg/dL, sent aquest
un nivell alt. Per tant, la majoria dels pacients no tenen el colesterol en
nivells ideals.

16. Fes un interval de confiança per la proporció de dones a les quals se’ls
ha fet l’estudi.

Interval de confiança del 95% = (0.2670185 – 0.3712311)

You might also like