Professional Documents
Culture Documents
T1.1: INTRODUCCIÓ.
Els diferents factors discutits no afectaran al pes, ni totes les pomes pesaran el mateix. En general, això no es cert (ni per
pomes, ratolins ni humans).
Finalitat: la finalitat bàsica dels mètodes estadístics és avaluar si les dades es comporten de manera consistent respecte a un
determinat model (hipòtesi), tenint en compte els efectes associats a diferents factors.
Com avaluar les dades? (exemple).
Disposem de 4 dietes diferents. Es representa el pes dels pollastres als 21 dies.
Volem determinar quina dieta proporciona un pes Quina dieta és millor?.
final més elevat.
CONCLUSIONS.
Necessitem mètodes objectius per guiar la obtenció de dades que ens permetin avaluar hipòtesis de treball.
La variabilitat pròpia de cada experiment (error de mesura, factors externs, etc.) requereix mètodes estadístiques d’anàlisis.
Hem de reduir la probabilitat d’equivocar-nos en la avaluació del resultat.
ESTUDI FRAMINGHAM.
Estudi multicèntric: difícil extrapolació de dades. Població d’interès: 30-74 anys sense malalties
Estudi de malalties cardiovasculars. cardiovasculars.
Seguiment: 12 anys. Variables: edat, diabetis, fumar, tractament (o no)
pressió arterial, colesterol total, HDL.
MESURES.
Mitjana: valor mig.
Variància: quan més allunyats estan els valors de la mitjana, més gran es la variància.
És una mesura de dispersió; la distància existent que hi ha de la mitjana.
Interpretació:
BIOESTADÍSTICA -2
Mediana: valor mig té 50% amunt i avall. Quan coincideix amb la mitjana
és quan hi ha simetria de dades.
Desviació estàndard.
SEM.
Exemple: 25 47 48 59 60 63 70.
Mitjana: 53.14
Mediana: 59.
2 2 2
Variància: [(25-53.14) +(47-53.14) [...] + (70-53.14) ]/7-1
* MANERES DE MESURAR:
o Nominal: % nombre d’homes/dones, si/no, malalt/sa, etc.
No es poden fer mitjanes.
No son ordenables: no es poden ordenar les categories.
o Quantitatives: variables estadístiques que mesuren de manera numèrica i quantificable el conjunt d’observacions de la
mostra o població. Ex: altura d’homes adults, número de pupitres en una classe, etc.
Discretes: no existeixen valors entremitjos entre dos valors consecutius de la variable.
Ex: nº de fills d’una parella, d’accidents, notes acadèmiques, etc.
Els números d’una escala de dolor no són dades quantitatives discretes.
Quan es valora el grau de satisfacció (0: gens, 1: una mica, 2: bastant, 3: molt) són dades quantitatives
discretes.
Contínues: existeixen valors entremig de dos valors consecutius de la variable.
Ex: pes, concentració, temps, etc.
* VALORS NORMALS DE REFERÈNCIA: s’estudien grups
de persones (mostra) per tal de determinar el
comportament de diferents variables i la seva
associació amb patologies. Com a referència ràpida,
els valors que es fan servir pel colesterol són els
següents (mg/dl).
* BOXPLOT: distribució d’una variable quantitativa (en aquest cas chol) en diferents grups definits per
una variable qualitativa (en aquest cas gender). Les línies vermelles indiquen els nivells de colesterol
que defineixen grups de risc, segons la classificació que hem discutit abans.
* TRANSFORMACIÓ DE VARIABLES: Afegim una nova variable (nivells) que indica si el colesterol està per sota de 200, entre
200 i 240, o per sobre de 240. Aquesta nova variable és un factor.
* DISTRIBUCIÓ DE VALORS DE COLESTEROL EN ELS GRUPS DE RISC: La nova variable nivells permet avaluar quina distribució
de valors té el colesterol en cada un dels grups de risc.
BIOESTADÍSTICA -3
CONCLUSIONS.
En general, una variable tindrà una distribució més o El valors d’una variable es poden associar a probabilitats
menys dispersa de valors. de patir una patologia mitjançant models estadístics.
Podem determinar valors de referència calculant En general, haurem de considerar diferents variables
percentils. per tal de fer bones prediccions.
S.2.1. ELEMENTS DEL DISSENY D’EXPERIMENTS
ESTUDIS EXPERIMENTALS.
L'objectiu d'aquests estudis és comparar dos o més tractaments o bé intervencions terapèutiques, preventives o pal·liatives.
Els estudis experimentals de tractaments que es fan amb persones s'anomenen assaigs clínics.
Els assaigs clínics són els dissenys bàsics de la investigació en salut.
Es caracteritzen pel control del factor d'estudi o exposició (generalment un tractament) per part dels investigadors.
Els participants es distribueixen aleatòriament en els grups d'estudi per tal de garantir la comparabilitat dels subjectes en
totes les característiques relacionades amb les hipòtesis a comprovar.
Els subjectes del grup intervenció reben el tractament o la intervenció que es desitja valorar, mentre que els subjectes del
grup control no són tractats o poden rebre un placebo o un tractament estàndard.
Quan es troba una relació entre la variable d'exposició i efecte es pot establir amb força garanties una interpretació causal.
Permet controlar les fonts de variabilitat.
Primer de tot s’han de definir els grups el més equivalents possible la variabilitat intrínseca es pot assegurar: grups repartits
a l’atzar.
Aspectes clau: Població objecte
Població objectiu. A quina població volem generalitzar les conclusions?
Intervenció o exposició d'interès. o Humans.
Comparació de les intervencions. o Homes de més de 50 anys amb risc cardiovascular.
Resultats clau (com els mesurem operativament). o Mortalitat als hospitals públics.
Temporalitat dels resultats i de la seva avaluació. o Eficàcia d’un fàrmac.
Saber si l’efecte es més gran que X valor llavors serà
quan existeix rellevància clínica.
Exemple: Àcid fòlic i defectes del tub neural: Estudi PREDIMED: Prevenció amb dieta mediterrània:
Experimental, aleatoritzat, controlat, doble cec. Experimental, aleatoritzat, controlat.
Internacional (7 països), multicèntric (33 centres). Nacional (Espanya), multicèntric (11 centres).
1817 dones amb risc elevat de DTN. 7447 adults amb risc cardiovascular (diabetis tipus 2 o al
4 grups de tractament: menys 3 factors de risc).
o A: àcid fòlic. 3 grups: 2 intervenció i 1 control:
o B: àcid fòlic + combinació de vitamines. • A: DM + oli oliva extra verge.
o C: grup control. • B: DM + fruits secs.
o D: combinació de vitamines. • C: grup control (dieta baixa en greixos).
Variable de resultat: proporció de fetus amb DTN. Variable de resultat: infart de miocardi o embòlia o mort per
malaltia cardiovascular.
Comparabilitat del subjectes d’estudi:
Imprescindible per a demostrar l'efecte
d'una intervenció.
Tècniques per a aconseguir-ho:
o Construcció aleatòria dels grups.
o Manteniment de la comparabilitat
durant l'experiment.
o Avaluació dels resultats a cegues (simple
cec, doble cec).
BIOESTADÍSTICA -4
Doble cec:
En un doble cec, placebo-controlled clinical tiral ni pacients/investigadors saben qui rep placebo i qui tractament.
Per què?
o Pacients: no saben que estan rebent, i la seva creença de que pot passar, no influeix en els resultats.
o Investigadors: no poden donar pistes als pacients del que reben. Les seves expectatives de com haurien de ser els
resultats no influeix en els mateixos.
Efecte placebo: Millora observada com a resultat d’un tractament que no inclou un principi actiu específic. S’atribueix a la
resposta individual pel sols fet de sentir-se tractat.
Emmascarament: El fet de conèixer el tractament pot afectar l'avaluació del seu efecte:
Si ho sap el pacient, pot afectar a la resposta al tractament
Si ho sap l'investigador, pot afectar a la mesura de la resposta
Si és possible, cal evitar que el pacient i el professional que l'ha de valorar coneguin quin tractament pren el pacient:
Simple cec: el pacient no sap què està prenent.
Doble cec: ni el pacient ni l'investigador saben què està prenent el pacient.
Triple cec: ni el pacient ni l'investigador ni qui analitza les dades saben què està prenent el pacient.
Ejemplo:
Ahora, obtenemos un p-valor de 2.4x10-11 (prácticamente 0) que nos indica que los resultados no son admissibles bajo la
hipótesis de igualdad de medias poblacionales (el tratamiento no modifica la respuesta).
El IC establece que el aumento (efecto) de la media debido a la acción del tratamiento se situa entre 3.45 y 5.65.
En un examen se pasan dos versiones (A y B). Se quiere verificar si la media de notas depende de la versión.
Los datos no permiten concluir que existan diferencias en los resultados.
En la base de datos birthwt (libreria MASS) se recoge el peso de recien nacidos y los datos de las madres. Queremos
verificar si el peso depende de si la madre es fumadora o no.
Ejemplo:
Análisis:
La media de las diferencias es positiva y mayor de cero.
Podemos concluir que se produce una disminución despues del tratamiento.
BIOESTADÍSTICA -5
En un ensayo clínico se han definido dos grupos (1: Control, 2: Tratamiento). Se han distribuido al azar a los individuos del
estudio, recogiéndose la concentración de un metabolito de interés al inicio y al final del ensayo. El grupo control fue tratado con
un placebo.
Verificar si los grupos son equivalentes al inicio del estudio.
Estimar el efecto del placebo.
Estimar el efecto del tratamiento.
ESTUDIOS EXPERIMENTALES.
El experimentador diseña un estudio con el objetivo de controlar al máximo las fuentes de variabilidad.
Las condiciones del experimento están especificadas por el experimentador.
Establecer el efecto de un tratamiento de nueva síntesis.
o Se escogen individuos de entre los que padecen una cierta enfermedad. La selección se realiza en base a unos
criterios de inclusión en el estudio.
o Se dividen al azar los sujetos en distintos grupos de estudio, en función de las condiciones que se quieran evaluar. Por
ejemplo, un grupo control y un grupo de tratamiento.
o Las condiciones de cada grupo se definen por el experimentador: Grupo control con placebo, Grupo experimental
tratado con el nuevo fármaco.
ESTUDIOS OBSERVACIONALES.
En general, la información se obtiene en condiciones donde es muy difícil controlar las fuentes de variabilidad.
Cierto tipo de pacientes muestran una mortalidad elevada por efecto del virus de la gripe A.
o ¿Qué factores pueden ser responsables de esta situación? ¿Pueden establecerse diferencias debidas a factores
genéticos?
En esta situación, analizamos retrospectivamente a un conjunto de pacientes para establecer la posible relación
entre el problema y las causas.
Debemos establecer un grupo de comparación. Por ejemplo, las personas infectadas de gripe A que cursan con
una afectación benigna.
En este caso se trataría de un estudio de casos y controles.
Realizamos una encuesta para determinar el grado de satisfacción de un determinado colectivo profesional respecto de sus
condiciones laborales.
Comparamos la incidencia de una determinada enfermedad entre distintas comunidades.
BIOESTADÍSTICA -6
¿Existe relación entre el genotipo y la predisposición a la obesidad?
DISEÑO DE ENCUESTAS.
1. Elección de la muestra:
a. Cuestionario.
i. ¿Cómo preguntar?
ii. ¿Preguntas abiertas?
iii. Codificación.
iv. Considerar el procesamiento posterioir de la encuesta
b. Verificación:
i. Diseño de la base de datos.
ii. Excel.
iii. Bases de datos relacionales.
iv. R (data.frame).
2. En general se tratará de un estudio transversal.
ESTUDIOS DE COHORTES.
Seleccionamos la muestra en función a una característica (género, hábito, exposición, etc.).
Realizamos un estudio prospectivo.
o Seguimiento de la aparición de una enfermedad
Validamos la diferencia (p.e. porcentaje de enfermos en cada grupo)
Un estudio de cohortes es similar a un diseño experimental (aunque en general no se controlan las condiciones)
Se considera la causa y se observa la aparición del problema
Riesgo relativo:
El riesgo relativo no es más que un cociente de probabilidades
Este método sólo se puede aplicar en el caso de estudios de cohortes.
En los estudios de casos y controles, el riesgo relativo debe estimarse mediante el odds ratio.
Método:
El concepto de odds:
Si un suceso tiene una probabilidad p, se
conoce como odds el cociente p/(1-p).
Por lo tanto, se refiere a la razón entre la
probabilidad de que suceda respecto a la
probabilidad de que no suceda.
Por ejemplo, si un 10% de los expuestos
a un material peligroso acaban
desarrollando problemas de piel, la odds
BIOESTADÍSTICA -7
será de 0.1/0.9, es decir de 1/9.
Odds Ratio:
o El odds ratio mide la fuerza de la asociación entre casos y controles y la posible causa.
o El odds ratio es una buena aproximación al riesgo relativo cuando la enfermedad afecta a una proporción baja de
individuos.
T5: PROBABILIDAD.
Si se va a realizar un estudio sobre la probabilidad de que salga cara o cruz en una moneda se podrá realizar de la siguiente
manera:
1. Tirar esta 100 veces y valorar el % de veces que sale cara o que sale cruz.
2. Lo común cuando una moneda es buena es que el % sea 50-50%, pero la probabilidad de que en 100 tiradas salgan justo 50
cara y 50 cruces es muy baja, ya que se baraja con muchas más combinaciones (Ej: 49-51;43-57...), dentro de la
probabilidad, que salgan 50 caras y 50 cruces es mayor que te salgan 30 caras y 20 cruces, pero aun así no saldrán siempre
50 caras y 50 cruces
Para entender mejor este hecho se puede comparar con su homólogo en una menor escala
1. Si el experimento se hace con tiradas de diez veces, la mayor probabilidad es que salgan 5 caras y 5 cruces en cada tirada,
pero esta cifra compite con cuatro más, por lo tanto, no saldrá este resultado siempre, pero al competir con menos
conjugaciones que si la tiras 100 veces es más fácil que el 50% se cumpla.
Pvalor:
Volviendo al primer ejemplo; si por ejemplo salen 60 caras, se debería calcular la probabilidad de que 𝑃𝑥 ≥ 60:
Si la P tiene un valor muy pequeño (P<0,05) es que el valor que nos ha dado el experimento se aleja de manera SIGNIFICATIVA
de lo que esperabas (hipótesis nula), descartando la hipótesis teórica.
Ejemplos:
Tanto las líneas rectas como las líneas curvas creadas por puntitos
representan el intervalo de predicción (no es lo mismo que el de confianza, el
de predicción no se realiza en torno al experimento, sino que representa los
datos teóricos, pero ambos tienen una confianza del 95%). La diferencia entre
las líneas azules y las curvas:
Modelo binomial:
Supongamos que disponemos de un tratamiento que se ha probado clínicamente y que es efectivo en el 75% de los casos.
- De acuerdo con esta especificación, ¿cuáles son los resultados esperados cuando se administre a un conjunto de 10
pacientes?
- Suponga que se administra a 10 pacientes y que sólo es efectivo en 5 casos. ¿Contradice eso las especificaciones anteriores?
- ¿Cuál es el número mínimo de mejoras que se esperan?
- ¿Si aplicamos este tratamiento en un programa de salud a 1000 personas, qué porcentaje de mejoras esperamos observar?
- Supongamos que en los 10 casos no se han producido efectos secundarios. ¿Quiere decir esto que el medicamento no
produce efectos secundarios?
Esperamos, por tanto, que en el 95% de los grupos observen más de 5 mejoras
Esto corresponde al concepto de cuantiles:
El cuantil es el valor que corresponde a una probabilidad de encontrar resultados iguales o inferiores a este valor.
???qbinom??
Si aplicamos este tratamiento en un programa de salud a 1000 personas, qué porcentaje de mejoras esperamos observar?
El intervalo de normalidad (con probabilidad 0.95) del porcentaje que encontraremos en
una muestra se puede calcular como
Por lo tanto, podría ser que sólo un 69% mejorara. También podría ser que encontráramos que mejora un 80%. El intervalo
esperado compatible con un 75% teórico de mejoras se encuentra entre un 68% y un 82% con probabilidad 0.95.
Este cálculo realizado es la predicción teórica de la frecuencia relativa; es lo que se espera que pase a nivel teórico, por su
paret, el intervalo de confianza es propio de las muestras experimentales y puede variar, el intervalo de predicción no varía; de
hecho, la fórmula utilizada en este caso es la misma que la usada para el intervalo de confianza.
Supongamos que en los 10 casos no se han producido efectos secundarios. Quiere decir esto que el medicamento no produce
efectos secundarios?
En principio, si en una muestra de tamaño n observamos x resultados, podemos estimar la probabilidad del resultado como x / n.
¿Qué pasa si x = 0?
¿Cuáles son los valores de la probabilidad del resultado que hacen compatible observar 0 resultados en 10 individuos?
BIOESTADÍSTICA -10
Obtenemos que una probabilidad de efectos secundarios del 15% es compatible con que no encontramos efectos secundarios en
un grupo de 10 pacientes tratados. De hecho, cualquier valor de probabilidad entre 0 y 12:30 puede explicar (es compatible) con
este resultado.
CREO QUE ESTA DIAPO SE LA HA DEJADO POR EXPLICAR
Conclusiones:
Podemos utilizar la distribución binomial para calcular la probabilidad de observar un cierto número de resultados de un tipo
determinado cuando hacemos Vaires observaciones.
La probabilidad se puede interpretar como el porcentaje de veces que esperamos observar este resultado en
una muestra (conjunto de observaciones).
El concepto de distribución es muy importante para comprender la variabilidad de resultados que están asociados a cada caso.
El concepto de cuantiles se refiere al valor que acumula una determinada probabilidad por debajo.
Podemos estimar el valor de la probabilidad a partir de las observaciones.