Apunts Bioestadística

BIOESTADÍSTICA -1
T1.1: INTRODUCCIÓ.
Per què necessitem l’estadística?

 VARIABILITAT: és una característica intrínseca de les poblacions biològiques. La resposta a determinades condicions poden
veure’s afectades per molts factors:
 El control de les variables és essencial per un estudi fiable.
 Arribar a la evidència científica en estudis de salut és molt difícil: múltiples variables  d’entrada és correcte desconfiar
de la informació.
 IDEA DE DISTRIBUCIÓ: el pes dels nens entre 0-20 anys varia d’acord amb un patró de creixement. Per cada edat, podem
caracteritzar un valor mig i una certa distribució de pesos.
 Percentil: valor per sota del qual hi ha un cert nombre de gent.
 Sempre es refereix a una variable.
 Població objecte: ha de ser una població que es pugui generalitzar.
 Mostra: la selecció de la mostra i el criteri d’inclusió són factors clau. El biaix d’una mostra pot ser causat per la
subjectivitat, per tant, sempre ha de ser objectiva.
* FACTORS QUE PODEN INFLUENCIAR EN EL PES:

La estadística busca identificar un patró determinat
 Genètics: home/dona, constitució, metabolisme.
(model estadístic) que pugui ajudar a determinar
 Alimentació: dieta, beguda, estimulants (cafè, OH).
(preveure) el comportament d’una determinada
 Hàbits de salut: exercici, fumar, hores de son.
característica en funció de diversos factors.
* QUANT PESA UNA POMA?

 Depèn de: tipus, grau de desenvolupament, hores de sol, posició de l’arbre.
 El pes real pot veure’s afectat per l’error experimental: precisió de la balança, tècnica del experimentador.
Els diferents factors discutits no afectaran al pes, ni totes les pomes pesaran el mateix. En general, això no es cert (ni per
pomes, ratolins ni humans).
LA ESTADÍSTICA EN EL MÈTODE CIENTÍFIC.

 DEFINIR CLARAMENT ELS OBJECTIUS DEL ESTUDI: la població d’estudi, antecedents, etc.
 FASE DE DISENY: com procedirem?, metodologia de mesura, selecció de mostres, quants individus necessitem).
 RECOLECCIÓ I DISTRIBUCIÓ DE LES DADES: base de dades, tipo de variables, validació, filtres, estadística descriptiva, taules i
gràfics: explorar la variabilitat i els efectes dels possibles factors. Serveix com a exploració i no com a prova  per això s’ha
d’avaluar la hipòtesis.
 EVALUACIÓ D’HIPÒTESIS (inferència): fins a quin punt les dades confirmen les hipòtesis?.
 Finalitat: la finalitat bàsica dels mètodes estadístics és avaluar si les dades es comporten de manera consistent respecte a un
determinat model (hipòtesi), tenint en compte els efectes associats a diferents factors.
 Com avaluar les dades? (exemple).
 Disposem de 4 dietes diferents.  Es representa el pes dels pollastres als 21 dies.
 Volem determinar quina dieta proporciona un pes  Quina dieta és millor?.
final més elevat.
CONCLUSIONS.
 Necessitem mètodes objectius per guiar la obtenció de dades que ens permetin avaluar hipòtesis de treball.
 La variabilitat pròpia de cada experiment (error de mesura, factors externs, etc.) requereix mètodes estadístiques d’anàlisis.
 Hem de reduir la probabilitat d’equivocar-nos en la avaluació del resultat.
T1.2- DESCRIPTIVA DE DADES.
ESTUDI FRAMINGHAM.
 Estudi multicèntric: difícil extrapolació de dades.  Població d’interès: 30-74 anys sense malalties
 Estudi de malalties cardiovasculars. cardiovasculars.
 Seguiment: 12 anys.  Variables: edat, diabetis, fumar, tractament (o no)
pressió arterial, colesterol total, HDL.
MESURES.
 Mitjana: valor mig.
 Variància: quan més allunyats estan els valors de la mitjana, més gran es la variància.
 És una mesura de dispersió; la distància existent que hi ha de la mitjana.
 Interpretació:
BIOESTADÍSTICA -2
 Mediana: valor mig  té 50% amunt i avall. Quan coincideix amb la mitjana
és quan hi ha simetria de dades.
 Desviació estàndard.
 SEM.
Exemple: 25 47 48 59 60 63 70.
 Mitjana: 53.14
 Mediana: 59.
2 2 2
 Variància: [(25-53.14) +(47-53.14) [...] + (70-53.14) ]/7-1
* MANERES DE MESURAR:
o Nominal: %  nombre d’homes/dones, si/no, malalt/sa, etc.
 No es poden fer mitjanes.
 No son ordenables: no es poden ordenar les categories.
o Quantitatives: variables estadístiques que mesuren de manera numèrica i quantificable el conjunt d’observacions de la
mostra o població. Ex: altura d’homes adults, número de pupitres en una classe, etc.
 Discretes: no existeixen valors entremitjos entre dos valors consecutius de la variable.
 Ex: nº de fills d’una parella, d’accidents, notes acadèmiques, etc.
 Els números d’una escala de dolor no són dades quantitatives discretes.
 Quan es valora el grau de satisfacció (0: gens, 1: una mica, 2: bastant, 3: molt) són dades quantitatives
discretes.
 Contínues: existeixen valors entremig de dos valors consecutius de la variable.
 Ex: pes, concentració, temps, etc.
* VALORS NORMALS DE REFERÈNCIA: s’estudien grups
de persones (mostra) per tal de determinar el
comportament de diferents variables i la seva
associació amb patologies. Com a referència ràpida,
els valors que es fan servir pel colesterol són els
següents (mg/dl).
* HISTOGRAMA: distribució dels valors d’una variable quantitativa/valors

percentuals.
 Densitat: la suma de totes les columnes és igual 1.
* BOXPLOT: distribució d’una variable quantitativa (en aquest cas chol) en diferents grups definits per
una variable qualitativa (en aquest cas gender). Les línies vermelles indiquen els nivells de colesterol
que defineixen grups de risc, segons la classificació que hem discutit abans.
* GRÀFICA DE DISPERSIÓ: representa la variació conjunta de valors de dos variables quantitatives

(en aquest cas chol i hdl). El color dels punts identifica homes i dones. La grandària dels punts és
proporcional a l’edat.
* MEAN: Mitjana aritmètica

* QUANTILS: Valor de la variable per sota del que es troba un percentatge determinat dels valors mostrals. P.e. El quantil 75%
és 229. Això vol dir que el 75% dels valors de la mostra són iguals o inferiors a 229.
* QUARTILS: Són els quantils 25, 50 i 75.
* MEDIAN: Mediana, correspon al quantil 50.
* BOXPLOT: les caixes indiquen els quartils 25 i 75, mentre que la línia dins la caixa indica la mediana.
* TRANSFORMACIÓ DE VARIABLES: Afegim una nova variable (nivells) que indica si el colesterol està per sota de 200, entre
200 i 240, o per sobre de 240. Aquesta nova variable és un factor.
* DISTRIBUCIÓ DE VALORS DE COLESTEROL EN ELS GRUPS DE RISC: La nova variable nivells permet avaluar quina distribució
de valors té el colesterol en cada un dels grups de risc.
BIOESTADÍSTICA -3
CONCLUSIONS.
 En general, una variable tindrà una distribució més o  El valors d’una variable es poden associar a probabilitats
menys dispersa de valors. de patir una patologia mitjançant models estadístics.
 Podem determinar valors de referència calculant  En general, haurem de considerar diferents variables
percentils. per tal de fer bones prediccions.
S.2.1. ELEMENTS DEL DISSENY D’EXPERIMENTS
ESTUDIS EXPERIMENTALS.
 L'objectiu d'aquests estudis és comparar dos o més tractaments o bé intervencions terapèutiques, preventives o pal·liatives.
 Els estudis experimentals de tractaments que es fan amb persones s'anomenen assaigs clínics.
 Els assaigs clínics són els dissenys bàsics de la investigació en salut.
 Es caracteritzen pel control del factor d'estudi o exposició (generalment un tractament) per part dels investigadors.
 Els participants es distribueixen aleatòriament en els grups d'estudi per tal de garantir la comparabilitat dels subjectes en
totes les característiques relacionades amb les hipòtesis a comprovar.
 Els subjectes del grup intervenció reben el tractament o la intervenció que es desitja valorar, mentre que els subjectes del
grup control no són tractats o poden rebre un placebo o un tractament estàndard.
 Quan es troba una relació entre la variable d'exposició i efecte es pot establir amb força garanties una interpretació causal.
 Permet controlar les fonts de variabilitat.
 Primer de tot s’han de definir els grups el més equivalents possible  la variabilitat intrínseca es pot assegurar: grups repartits
a l’atzar.
Aspectes clau: Població objecte
 Població objectiu.  A quina població volem generalitzar les conclusions?
 Intervenció o exposició d'interès. o Humans.
 Comparació de les intervencions. o Homes de més de 50 anys amb risc cardiovascular.
 Resultats clau (com els mesurem operativament). o Mortalitat als hospitals públics.
 Temporalitat dels resultats i de la seva avaluació. o Eficàcia d’un fàrmac.
 Saber si l’efecte es més gran que X valor  llavors serà
quan existeix rellevància clínica.
Exemple: Àcid fòlic i defectes del tub neural: Estudi PREDIMED: Prevenció amb dieta mediterrània:
 Experimental, aleatoritzat, controlat, doble cec.  Experimental, aleatoritzat, controlat.
 Internacional (7 països), multicèntric (33 centres).  Nacional (Espanya), multicèntric (11 centres).
 1817 dones amb risc elevat de DTN.  7447 adults amb risc cardiovascular (diabetis tipus 2 o al
 4 grups de tractament: menys 3 factors de risc).
o A: àcid fòlic.  3 grups: 2 intervenció i 1 control:
o B: àcid fòlic + combinació de vitamines. • A: DM + oli oliva extra verge.
o C: grup control. • B: DM + fruits secs.
o D: combinació de vitamines. • C: grup control (dieta baixa en greixos).
 Variable de resultat: proporció de fetus amb DTN.  Variable de resultat: infart de miocardi o embòlia o mort per
malaltia cardiovascular.
Comparabilitat del subjectes d’estudi:
 Imprescindible per a demostrar l'efecte
d'una intervenció.
 Tècniques per a aconseguir-ho:
o Construcció aleatòria dels grups.
o Manteniment de la comparabilitat
durant l'experiment.
o Avaluació dels resultats a cegues (simple
cec, doble cec).
BIOESTADÍSTICA -4
Doble cec:
 En un doble cec, placebo-controlled clinical tiral  ni pacients/investigadors saben qui rep placebo i qui tractament.
 Per què?
o Pacients: no saben que estan rebent, i la seva creença de que pot passar, no influeix en els resultats.
o Investigadors: no poden donar pistes als pacients del que reben. Les seves expectatives de com haurien de ser els
resultats no influeix en els mateixos.
Efecte placebo: Millora observada com a resultat d’un tractament que no inclou un principi actiu específic. S’atribueix a la
resposta individual pel sols fet de sentir-se tractat.
Emmascarament: El fet de conèixer el tractament pot afectar l'avaluació del seu efecte:
 Si ho sap el pacient, pot afectar a la resposta al tractament
 Si ho sap l'investigador, pot afectar a la mesura de la resposta
 Si és possible, cal evitar que el pacient i el professional que l'ha de valorar coneguin quin tractament pren el pacient:
 Simple cec: el pacient no sap què està prenent.
 Doble cec: ni el pacient ni l'investigador saben què està prenent el pacient.
 Triple cec: ni el pacient ni l'investigador ni qui analitza les dades saben què està prenent el pacient.
Dificultats i limitacions dels estudis experimentals en ciències de la salut:

 Aspectes ètics: no es pot fer un experiment sobre els efectes de l'heroïna en persones.
 Dificultat en generalitzar els resultats quan els criteris d'inclusió dels individus en un experiment són restrictius.
 Dificultat en aconseguir que les persones prenguin un tractament o facin una dieta determinada durant molt de temps.
 Cost econòmic molt elevat.
DISSENY AMB DADES INDEPENDENTS.

 Es selecciona un conjunt d’individus.
 Es divideixen en dos grups (o més grups si existeixen varis tractaments) al atzar (control i tractament(s)).
 S’administra el tractament (grup tractament) i un placebo (Grup control).
 Es compara l’estat final.
 L’efecte del tractament es mesura estimant el IC de la diferència de la mitjana entre ambdós grups.
 Hipótesis: Las medias poblacionales son iguales (su diferencia es 0).

 P-valor indica que los resultados son compatibles con esta hipòtesis. Probabilidad de que, siendo cierta la hipótesis, se
obtenga una muestra cuyo resultado se aparte de lo esperado tanto o más de lo observado en este caso. En este ejemplo
p-valor=0.58. Por lo tanto en un 58% de muestras al azar obtenidas de grupos con la misma media (diferencia 0) se
obervaria una diferencia de medias como la observada o mayor.
 IC de la diferencia de medias: es (-1.46, 0.82). Este intervalo incluye el valor 0. Por lo tanto no podemos concluir que el
tratamiento modifique el valor medio.
Ejemplo:
 Ahora, obtenemos un p-valor de 2.4x10-11 (prácticamente 0) que nos indica que los resultados no son admissibles bajo la
hipótesis de igualdad de medias poblacionales (el tratamiento no modifica la respuesta).
 El IC establece que el aumento (efecto) de la media debido a la acción del tratamiento se situa entre 3.45 y 5.65.
 En un examen se pasan dos versiones (A y B). Se quiere verificar si la media de notas depende de la versión.
 Los datos no permiten concluir que existan diferencias en los resultados.
 En la base de datos birthwt (libreria MASS) se recoge el peso de recien nacidos y los datos de las madres. Queremos
verificar si el peso depende de si la madre es fumadora o no.
DISEÑO CON DATOS APAREADOS.

 Disponemos de un grupo de individuos y realizamos una medición en dos condiciones (por ejemplo antes y despues de un
tratamiento).
 En este caso, evaluaremos las diferencias entre ambas mediciones y verificaremos si la media de las diferencias es distinta
de cero.
Ejemplo:
Análisis:
 La media de las diferencias es positiva y mayor de cero.
 Podemos concluir que se produce una disminución despues del tratamiento.
BIOESTADÍSTICA -5
En un ensayo clínico se han definido dos grupos (1: Control, 2: Tratamiento). Se han distribuido al azar a los individuos del
estudio, recogiéndose la concentración de un metabolito de interés al inicio y al final del ensayo. El grupo control fue tratado con
un placebo.
 Verificar si los grupos son equivalentes al inicio del estudio.
 Estimar el efecto del placebo.
 Estimar el efecto del tratamiento.
Comparación del estado inicial en los dos grupos experimentales:

 Podemos concluir que el estado inicial de los dos grupos es similar.
 El efecto placebo puede evaluarse estiimando la media de la diferencia entre el estado Final y el Inicial.
o En este caso, el placebo tiene un cierto efecto.
o Puede deberse, por ejemplo, a la evolución propia de la enfermedad, a una mejora associada a factores
psicológicos, etc.
 Como disponemos de datos al inicio y al final, podemos estimar el efecto del tratamiento mediante el IC de la media de la
diferencia para dicho grupo (6.94, 11.83).
 Como el placebo tiene un cierto efecto (0.78,6.11), deberíamos restar este efecto.
 El efecto del tratamiento podria evaluarse mediante el IC de la diferencia de medias entre grupos al Final del tratamiento.
o Se compara Control y Tratamiento (es la opción que utiliza R). Esto da un IC negativo, indicando que el tratamiento
tiene una media superior entre 3.02 i 7.03 unidades.
o Podemos revertir la comparación seleccionando datos.
 Podemos evaluar mejor el efecto del tratamiento si comparamos la evolución (dif) para cada grupo.
 En este caso, dado que en el grupo control ya se aprecia un cierto aumento, el efecto del tratamiento se aprecia major
estimando la diferencia de las medias de variación en ambos grupos.
 La media de dif. En el grupo control estima el efecto placebo.

 La diferencia de medias al Final del tratamiento puede estimar el efecto del tratamiento cuando no disponemos de la
evolución en cada grupo.
 La media de dif. En el grupo de tratamiento estima el efecto del tratamiento (sin descontar el efecto placebo).
 La diferencia de medias de la evolución comparando ambos grupos estima el efecto del tratamiento descontando el
possible efecto placebo.
T.4: ESTUDIOS OBSERVACIONALES.
ESTUDIOS EXPERIMENTALES.
 El experimentador diseña un estudio con el objetivo de controlar al máximo las fuentes de variabilidad.
 Las condiciones del experimento están especificadas por el experimentador.
 Establecer el efecto de un tratamiento de nueva síntesis.
o Se escogen individuos de entre los que padecen una cierta enfermedad. La selección se realiza en base a unos
criterios de inclusión en el estudio.
o Se dividen al azar los sujetos en distintos grupos de estudio, en función de las condiciones que se quieran evaluar. Por
ejemplo, un grupo control y un grupo de tratamiento.
o Las condiciones de cada grupo se definen por el experimentador: Grupo control con placebo, Grupo experimental
tratado con el nuevo fármaco.
ESTUDIOS OBSERVACIONALES.
 En general, la información se obtiene en condiciones donde es muy difícil controlar las fuentes de variabilidad.
 Cierto tipo de pacientes muestran una mortalidad elevada por efecto del virus de la gripe A.
o ¿Qué factores pueden ser responsables de esta situación? ¿Pueden establecerse diferencias debidas a factores
genéticos?
 En esta situación, analizamos retrospectivamente a un conjunto de pacientes para establecer la posible relación
entre el problema y las causas.
 Debemos establecer un grupo de comparación. Por ejemplo, las personas infectadas de gripe A que cursan con
una afectación benigna.
 En este caso se trataría de un estudio de casos y controles.
 Realizamos una encuesta para determinar el grado de satisfacción de un determinado colectivo profesional respecto de sus
condiciones laborales.
 Comparamos la incidencia de una determinada enfermedad entre distintas comunidades.
BIOESTADÍSTICA -6
 ¿Existe relación entre el genotipo y la predisposición a la obesidad?
DISEÑO DE ENCUESTAS.
1. Elección de la muestra:
a. Cuestionario.
i. ¿Cómo preguntar?
ii. ¿Preguntas abiertas?
iii. Codificación.
iv. Considerar el procesamiento posterioir de la encuesta
b. Verificación:
i. Diseño de la base de datos.
ii. Excel.
iii. Bases de datos relacionales.
iv. R (data.frame).
2. En general se tratará de un estudio transversal.
ESTUDIOS DE COHORTES.
 Seleccionamos la muestra en función a una característica (género, hábito, exposición, etc.).
 Realizamos un estudio prospectivo.
o Seguimiento de la aparición de una enfermedad
 Validamos la diferencia (p.e. porcentaje de enfermos en cada grupo)
 Un estudio de cohortes es similar a un diseño experimental (aunque en general no se controlan las condiciones)
 Se considera la causa y se observa la aparición del problema
Riesgo relativo:
 El riesgo relativo no es más que un cociente de probabilidades
 Este método sólo se puede aplicar en el caso de estudios de cohortes.
 En los estudios de casos y controles, el riesgo relativo debe estimarse mediante el odds ratio.
Método:
ESTUDIOS DE CASOS Y CONTROLES

 Seleccionamos a los sujetos por la enfermedad y determinamos retrospectivamente si han estado expuestos al factor de
riesgo de interés.
 Ejemplo:
o Observamos un grupo de personas que presentan un cuadro importante de gastroenteritis.
o Sospechamos que el problema puede estar asociado a la ingesta de un determinado alimento.
o Seleccionamos un grupo de personas que no presentan gastroenteritis en condiciones similares (mismo hotel, p.e.)
o Recogemos cuanta gente ha ingerido el alimento sospechoso y no presenta gastroenteritis
o Calculamos la posible asociación (odds ratio)
El concepto de odds:
 Si un suceso tiene una probabilidad p, se
conoce como odds el cociente p/(1-p).
 Por lo tanto, se refiere a la razón entre la
probabilidad de que suceda respecto a la
probabilidad de que no suceda.
 Por ejemplo, si un 10% de los expuestos
a un material peligroso acaban
desarrollando problemas de piel, la odds
BIOESTADÍSTICA -7
será de 0.1/0.9, es decir de 1/9.
 Odds Ratio:
o El odds ratio mide la fuerza de la asociación entre casos y controles y la posible causa.
o El odds ratio es una buena aproximación al riesgo relativo cuando la enfermedad afecta a una proporción baja de
individuos.
 ¿Cómo se han obtenido los datos? ¿Qué diseño se ha utilizado?

 Si es un diseño de casos y controles, el porcentaje de enfermos
entre los expuestos NO TIENE SENTIDO.
o El número de enfermos lo decide el estudio. Los totales para
calcular porcentajes seria 244 enfermos y 242 no enfermos
 Si es un diseño de cohortes, el porcentaje de expuestos entre los
enfermos NO TIENE SENTIDO.
o Los totales válidos son 15 expuestos y 444 no expuestos.
Puntualizaciones sobre el concepto de riesgo:

 Básicamente entendemos como riesgo el hecho de que se incremente la probabilidad de padecer una enfermedad.
 En muchos métodos estadísticos se calcula el odds ratio como un indicador de riesgo, aunque su interpretación como
riesgo relative no es totalmente correcta.
 Más Adelante veremos cómo calcular los intervalos de confianza del riesgo relativo y del odds ratio.
 Un RR (o un odds ratio) igual a 1 indica que el factor considerado no modifica la probabilidad de padecer la enfermedad, y
que, por lo tanto, no es un factor de riesgo.
T5: PROBABILIDAD.
Si se va a realizar un estudio sobre la probabilidad de que salga cara o cruz en una moneda se podrá realizar de la siguiente
manera:
1. Tirar esta 100 veces y valorar el % de veces que sale cara o que sale cruz.
2. Lo común cuando una moneda es buena es que el % sea 50-50%, pero la probabilidad de que en 100 tiradas salgan justo 50
cara y 50 cruces es muy baja, ya que se baraja con muchas más combinaciones (Ej: 49-51;43-57...), dentro de la
probabilidad, que salgan 50 caras y 50 cruces es mayor que te salgan 30 caras y 20 cruces, pero aun así no saldrán siempre
50 caras y 50 cruces
Para entender mejor este hecho se puede comparar con su homólogo en una menor escala
1. Si el experimento se hace con tiradas de diez veces, la mayor probabilidad es que salgan 5 caras y 5 cruces en cada tirada,
pero esta cifra compite con cuatro más, por lo tanto, no saldrá este resultado siempre, pero al competir con menos
conjugaciones que si la tiras 100 veces es más fácil que el 50% se cumpla.
Pvalor:
Volviendo al primer ejemplo; si por ejemplo salen 60 caras, se debería calcular la probabilidad de que 𝑃𝑥 ≥ 60:
𝑷𝒙 ≥ 𝟔𝟎= P(x=60) + P(x=61)+P(x=62)…
Si la P tiene un valor muy pequeño (P<0,05) es que el valor que nos ha dado el experimento se aleja de manera SIGNIFICATIVA
de lo que esperabas (hipótesis nula), descartando la hipótesis teórica.
Ejemplos:
Hipótesis (probabilidad cara) Resultados Pvalor ¿Significativo?

P(c)=0,5 60 0,028 Sí
P(c)=0,5 90 4,7 × 10−13 Sí
P(c)=0,55 51 0,24 No
P(c)=0,57 51 0,13 No
*Pvalor calculado con Rstudio por el profe.
 En las últimas dos no se descarta la Hipótesis nula ¿Por qué?

Por el intervalo de confianza, el resultado que se tiene en ambos casos (51) es compatible con una serie de valores, esto se
calcula:
𝐍·(𝟏−𝐍) 0,51·(1−0,51) 0,51·0,49

𝐍 ± 𝟏, 𝟗𝟔√
𝐓𝟎𝐓𝐀𝐋
 0,51 ± 1,96√
100
 0,51 ± 1,96√ 100
(0,41;0,60)
BIOESTADÍSTICA -8
Cualquiera de los valores que se encuentren entre (0,41; 0,60) son compatibles con lo que se esperaba (no descartan hipótesis
nula (P>0,05)).
Por otro lado; cuanto más se tire la moneda, la proporción de tiradas se

asemejará más a la realidad teórica de 50% cara, 50% cruz (si tiras una vez y te
da cara el 100% será cara, y esa no es la realidad, si tiras 5 veces y da 3 caras y
dos cruces tampoco se asemeja excesivamente a la realidad, si tiras 100 veces
hay más probabilidad de que se asemeje más a la realidad).
Tanto las líneas rectas como las líneas curvas creadas por puntitos
representan el intervalo de predicción (no es lo mismo que el de confianza, el
de predicción no se realiza en torno al experimento, sino que representa los
datos teóricos, pero ambos tienen una confianza del 95%). La diferencia entre
las líneas azules y las curvas:
- Curvas: representa los valores según va evolucionando en el eje de

las x.
- Rectas: representa los valores finales.
Modelo binomial:
Supongamos que disponemos de un tratamiento que se ha probado clínicamente y que es efectivo en el 75% de los casos.
- De acuerdo con esta especificación, ¿cuáles son los resultados esperados cuando se administre a un conjunto de 10
pacientes?
- Suponga que se administra a 10 pacientes y que sólo es efectivo en 5 casos. ¿Contradice eso las especificaciones anteriores?
- ¿Cuál es el número mínimo de mejoras que se esperan?
- ¿Si aplicamos este tratamiento en un programa de salud a 1000 personas, qué porcentaje de mejoras esperamos observar?
- Supongamos que en los 10 casos no se han producido efectos secundarios. ¿Quiere decir esto que el medicamento no
produce efectos secundarios?
Distribución binomial: N= casos que se estudian.

Probabilidad de observar x veces un resultado de
probabilidad p cuando se hacen n observaciones X=valor que queremos estimar.
𝑥=probabilidad del suceso

n
P(X = x) = ( ) πx (1 − π)n−x
x
Ejemplo de clase: si hago 10 observaciones y la probabilidad es 0,75 ¿Cuál es la
probabilidad de que salga 7?
10
P(X = 7) = ( ) 0,757 (1 − 0,75)10−7
7
En el power: El evento de interés es la mejora del estado de salud del paciente.

La probabilidad de mejora es p = 0.75
La probabilidad de que mejoren x pacientes dentro de un total de 10 pacientes es:
Rstudio en clase:
1- n<- 10 3- dbinom (x,n,p) 2)) *Round significa que redondee a

p<-0,75 dos decimales
x<-7 4- Data.frame(0:n, CREO Q ESTE PASO ES PARA HACER
2- #P(X=x)enunabinomialB(n,) prob=round(dbinom(dbinom(0:n,n,p, UNA TABLA
dbinom= que la probabilidad sea “=”
pbinom= que la probabilidad sea menor o igual; restándole a 1 esto nos da la probabilidad de que sea mayor que el valor puesto (en
este caso 7).
BIOESTADÍSTICA -9
En el power:
Cálculo de la probabilidad de cada resultado:
Interpretación: espera que mejoren 7 de los 10 pacientes en el 25% de los
grupos.
Es decir: Si administramos el fármaco a muchos grupos de 10 pacientes, en
unos casos observaremos 8 mejoras, en otros 10, en otro 7, etc ... En el 25%
de los grupos observarán 7 mejoras
Suponga que se administra a 10 pacientes y que sólo es efectivo en 5 casos. ¿Esto

contradice las especificaciones anteriores?
Por lo tanto, es poco probable que pase (sólo en aproximadamente el 6% de los grupos
de 10 pacientes), pero no es imposible. Aunque se esperan más mejoras, en principio
este resultado no es incompatible con los datos del fármaco.
¿Cuál es la probabilidad de que se observen 4 o menos mejoras?

𝑃 𝑋 ≤ 4 = 𝑃 𝑋 = 0 + 𝑃 𝑋 = 1 + 𝑃 𝑋 = 2 + 𝑃 𝑋 = 3 + 𝑃(𝑋 = 4)
Rstudio:
Pbinom(4,10,0.75) 0,019
(Probabilidad de que salgan cuatro en un grupo de diez con una probabilidad de 0,75); 0,019 es el Pvalor, es decir, que el
experimento se aleja de la realidad teórica, por lo tanto podemos descartar la hipótesis nula; también representa el cuantil, es
decir, el 1,9% de los estudios que hagas con las mismas variables dará dicho resultado.
¿Cuál es el número mínimo de mejoras que se esperan en la mayoría (digamos el 95%) de los grupos?
Se trata de resolver el problema: 𝑃 𝑋 > 𝑥 = 0.95
De manera equivalent: 𝑃 𝑋 ≤ 𝑥 = 0.05
Esperamos, por tanto, que en el 95% de los grupos observen más de 5 mejoras
Esto corresponde al concepto de cuantiles:
El cuantil es el valor que corresponde a una probabilidad de encontrar resultados iguales o inferiores a este valor.
???qbinom??
Si aplicamos este tratamiento en un programa de salud a 1000 personas, qué porcentaje de mejoras esperamos observar?
El intervalo de normalidad (con probabilidad 0.95) del porcentaje que encontraremos en
una muestra se puede calcular como
Por lo tanto, podría ser que sólo un 69% mejorara. También podría ser que encontráramos que mejora un 80%. El intervalo
esperado compatible con un 75% teórico de mejoras se encuentra entre un 68% y un 82% con probabilidad 0.95.
Este cálculo realizado es la predicción teórica de la frecuencia relativa; es lo que se espera que pase a nivel teórico, por su
paret, el intervalo de confianza es propio de las muestras experimentales y puede variar, el intervalo de predicción no varía; de
hecho, la fórmula utilizada en este caso es la misma que la usada para el intervalo de confianza.
Supongamos que en los 10 casos no se han producido efectos secundarios. Quiere decir esto que el medicamento no produce
efectos secundarios?
En principio, si en una muestra de tamaño n observamos x resultados, podemos estimar la probabilidad del resultado como x / n.
¿Qué pasa si x = 0?
¿Cuáles son los valores de la probabilidad del resultado que hacen compatible observar 0 resultados en 10 individuos?
BIOESTADÍSTICA -10
Obtenemos que una probabilidad de efectos secundarios del 15% es compatible con que no encontramos efectos secundarios en
un grupo de 10 pacientes tratados. De hecho, cualquier valor de probabilidad entre 0 y 12:30 puede explicar (es compatible) con
este resultado.
CREO QUE ESTA DIAPO SE LA HA DEJADO POR EXPLICAR
Conclusiones:
Podemos utilizar la distribución binomial para calcular la probabilidad de observar un cierto número de resultados de un tipo
determinado cuando hacemos Vaires observaciones.
La probabilidad se puede interpretar como el porcentaje de veces que esperamos observar este resultado en
una muestra (conjunto de observaciones).
El concepto de distribución es muy importante para comprender la variabilidad de resultados que están asociados a cada caso.
El concepto de cuantiles se refiere al valor que acumula una determinada probabilidad por debajo.
Podemos estimar el valor de la probabilidad a partir de las observaciones.

Apunts Bioestadística

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Apunts Bioestadística

Uploaded by

Copyright:

Available Formats

BIOESTADÍSTICA -1

Per què necessitem l’estadística?

* FACTORS QUE PODEN INFLUENCIAR EN EL PES:

* QUANT PESA UNA POMA?

LA ESTADÍSTICA EN EL MÈTODE CIENTÍFIC.

T1.2- DESCRIPTIVA DE DADES.

* HISTOGRAMA: distribució dels valors d’una variable quantitativa/valors

* GRÀFICA DE DISPERSIÓ: representa la variació conjunta de valors de dos variables quantitatives

* MEAN: Mitjana aritmètica

Dificultats i limitacions dels estudis experimentals en ciències de la salut:

DISSENY AMB DADES INDEPENDENTS.

 Hipótesis: Las medias poblacionales son iguales (su diferencia es 0).

DISEÑO CON DATOS APAREADOS.

Comparación del estado inicial en los dos grupos experimentales:

 La media de dif. En el grupo control estima el efecto placebo.

T.4: ESTUDIOS OBSERVACIONALES.

ESTUDIOS DE CASOS Y CONTROLES

 ¿Cómo se han obtenido los datos? ¿Qué diseño se ha utilizado?

Puntualizaciones sobre el concepto de riesgo:

𝑷𝒙 ≥ 𝟔𝟎= P(x=60) + P(x=61)+P(x=62)…

Hipótesis (probabilidad cara) Resultados Pvalor ¿Significativo?

 En las últimas dos no se descarta la Hipótesis nula ¿Por qué?

𝐍·(𝟏−𝐍) 0,51·(1−0,51) 0,51·0,49

Por otro lado; cuanto más se tire la moneda, la proporción de tiradas se

- Curvas: representa los valores según va evolucionando en el eje de

Distribución binomial: N= casos que se estudian.

𝑥=probabilidad del suceso

En el power: El evento de interés es la mejora del estado de salud del paciente.

1- n<- 10 3- dbinom (x,n,p) 2)) *Round significa que redondee a

Suponga que se administra a 10 pacientes y que sólo es efectivo en 5 casos. ¿Esto

¿Cuál es la probabilidad de que se observen 4 o menos mejoras?

You might also like