Bioestadística

Manual Lee miele) EIR 2014 - 2015 TEMA 3 BIOESTADISTICA1 ESTADISTICA La estadistica es un método de razonamiento que permite interpretar aquellos datos cuya caracterfstica fundamental es la vatiabilidad, para obtener unas conclusiones, con una seguridad conocida. Por lo tanto odriamos definir la estadistica como el conjunto de ‘métodos necesarios para recoger,clasificar, representar y resumir datos, y asia partirde ellos extraer consecuencias cientificas. La finalidad es estudiar detalladamente las caracteristicas de una muestra de datos. Encontramos dos tipos de estadistica: D> Estadistica descriptiva: es la parte de la estadistica encargada de ordenar, presenta, sintetizar y organizar los datos. > Estadistica inferencial 0 analitica: es la parte de la estadistica que se ocupa de establecer conclusions sobre una poblacion (total del conjunto estudiado) a partir de los datos estudiados de una muestra (grupo de ‘elementos que va a representar al total del conjunto estudiado), 2 CONCEPTOS BASICOS DE ESTADISTICA > ‘elementos que cumplen ciertas propiedades, entre las cuales se incluye un determinado fenémeno que ‘queremos estudiar. Elconcepto poblacién, en estadistica, ‘es sindnimo de universo. los indices que resumen una ddeterminada Informacion sobre la poblacién, se le ‘denominan pardmetros y se suelen presentar en letras ‘griegas (por ejemplo: media poblacional = i. Podemos ‘lasificar la poblacién atendiendo al nimero de elementos que la componen: + Poblacién finita: si se conace el numero exacto de todos os elementos que la componen. + Poblacién infinita: cuando no se conoce el total de los elementos que la componen, > Muestra: se define como un grupo que forma parte de la poblacién a estudiar. La muestra se usa de forma habitual, ya que las poblaciones tienden a ser muy ‘extensas y es practicamente imposible estudiarlas de forma completa. Una forma de clasificar la mu seria en: + Muestra representativa: cuando cada uno de los. elementos que la forman han sido elegidos aleatoriamente (al azar), es decit, cuando los telementos que componen una muestray los que no la componen han tenido las mismas probabilidades de ser elegidos.. + Muestra no representativa: cuando los elementos ‘que la componen han sido elegidos siguiendo algtin ctiterio,es decirno han sido elegidos aleatoriamente. tra forma de clasiicar la muestra seria dependiendo del tamaiio de la muestra. Debemos tener en cuenta que trabajar con una muastra de tamafo adecuado permite ‘optimizar el estudic, tanto a la hora de reduc costes como a la de mejorar la calidad de los datos obtenidos. La podemos clasificar en: + Muestra pequeta: si el numero de individuos que ‘componen la muestra es inferior a 30. + Muestra grande: si el numero de individuos que ‘componen la muestra es superior a 30. Alos indices que resumen una determinada informacién sobre la muestra, edenominan estadistico y se suelen presentar en letras latinas (por ejemplo: desviacintipica muestra = 5) ‘Muestreo: se denomina al procedimiento osistematica de extraer una muestra. Tipos de muestreos: + Muestreo probabilistico 0 aleatorio. Lo que debemos hacer 2s extraer de la poblacién un grupo. de individuos, muestra, y a partir de las observaciones realizadas en ella, generalizar 0 extrapolar nuestros resultados a colectivos mas amplios (al resto de la poblacién). Al tamafio de la ‘muestra se le lama tamaiio muestral, Como el Lltimo objetivo del experimento es llegar a conclusiones vilidas para toda la poblacién en estudio, la muestra debe reunir una serie de caracteristicas: Aleatorieded: todos los individuos tienen la misma protabilidad (oportunidad) de formar parte de le muestra. La obtencion de una ‘muestra aleatoria requiere “en primer lugar” la Identificacién completa de la poblacion a estudiar. - Homogeneidad: la muestra ha de mantener las ‘mismas proporciones que la poblacién, en todas, aquellas variables que tengan influencla, La dificultad estriba en que no siempre se conocen, de antemano las variables que pueden influ en los resultados. = Independencia: a selecci6n de un individuo no Influye en laseleccién, ono, de otto individuo, Entre los diferentes tipos de muestreos aleatorios © probabilisticos tenemos: = Muestreo aleatorio simple: es una técnica asada en que cualquier elemento de la ppoblacintiane la misma probabilidad de formar parte de la muestra. Requiere confeccionar ppreviamente una lista con todos los elementos de la poblacién, asignandoles un orden correlativocesde el 1 hasta el"N' £1 més utilizado ‘esel dela tebla de numeros aleatorios. ~ Muestreo sistematico: el proceso de seleccién de la muestra se realiza mediante una regia sistematica simple, elegir uno de cada “a” Individuos. Para ello se ha de calcularla constante © fraccion de muestreo dividiendo el total dela ppoblacion entre el tamafio muestra previamente determinadb. MANUAL IFSES EIR 2014/2015 TEMA3> + Muestreo aleatorio estratificado: aseguramos ue Ia muestra tenga la misma proporcion de tuna o mas variables que la poblacién de la cual procede. Consiste en dividir la poblacion en subgrupos de acuerdo con certas caracteristcas, como el sexo 0 la raza, y luego extraer una ‘muestra al azar a partir de cada uno de dichos "estratos’ + Muestreo por grupos 0 conglomerados: muestra al azar a partir de agrupaciones naturales de individuos (conglomerados) dentro de la poblacién. Es til cuando la poblacién esta muy dispersa y resulta poco préctico o muy costoso confeccionar una lista de todos sus ‘elementos. Podemos encontratlo en dos etapas {ietdpico) 0 en varias etapas (polietapico. ‘Muestreo no probabilistico ono aleatorio: = Muestreo por conveniencia: se caracteriza porque, en general, la unidad de muestreo se autoselecciona o se ha seleccionade debido a su facil disponibilidad, = Muestreo por cuotas: también denominado en ‘ocasiones “accidental”. Seasienta generalmente sobre la base de un buen conocimiento de los estratos de la poblacion y/o de los individuos mds tepresentativos' oadecuados" para los fines de la. investigacién. Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el mismo cardcter de aleatoriedad. = Muestreo por criterioo juicio:en él se emplean los conocimientos del investigador acerca de la poblacién y sus elementos para elegir los casos ‘que se incluyen en la muestra, jiduo: entendemos como individuo de una poblacién ode una muestra a cada uno de los elementos {que la componen y de los cuales obtenemos cierta informacion del fendmeno que deseamos estudiar. Variable o caréeter: lo definimos como la propiedad 0 ualidad que presentan los elementos de la poblacién {que se desea estudiar, es decir todo lo que es susceptible de ser medido, de los elementos que forman parte de tuna poblacién. L variables se pueden clasificar segiin diferentes criterios pero la clasificacién mas utilizada es: Variables categéricas/ cualitativas 0 atributos:son aquellas variables que reflejan una cualidad,y por lo tanto no pueden cuantificarse. No pueden expresarse numéricamente, sino por medio de palabras excluyentes entre s,s decir por categorias. Las variables que tienen dos categorias se denominas dicotémicas © binarias, como por ejemplo el sexo (varén-mujen) y las variables que adoptan mas de dos categorias son llamadas policotémicas, como por ejemplo estado civil (Soltero-casado-viudo). Las podemos clasificar er = Cualitativas nominales: son aquellas variables en las que las distintas categorias de la variable se enumeran sin establecer un orden. Ejemplo: ‘grupo sanguineo (A/ AB/ B/C). = Cualitativas ordinales: son aquellas variables cualitativas en las que las categorias se ordenan de ‘un modo creciente 0 decreciente a la variable estudiada. Ejemplor dolor leve/ maderado/ fuerte). Variables cuantitativas: son aquellas que pueden ‘medirse numéricamente, es decir, son aquellas que pueden cuantificarse. Se clasifican a su vez en: Discontinuas o diseretas: son aquellas que sélo pueden expresarse mediante niimeros naturales enteros, es deci, aquellas en las que entre dos valores ‘consecutivos no podemos encontrar ‘inguin otro valot.Por ejemplo: el nimero de hijos. = Continuas:son aquellas que se pueden expresar mediante cualquier valor numérico que esté localizado en la escala de medida, es decir que ‘estélocalizado dentro de un intervalo. Pueden _adoptar cualquier valor intermedi. Por ejemplo: la medicién de la temperatura. La exactitud de estas variables viene determinada por el instrumento de medida Las variables se representan con letras latinas (x, y-y sus valores se indican mediante un subindice (xy, x Xj Aq) En este intervalo x representaria al valor dela variable (x) del individuo () que estudiamos. ESCALAS DE MEDIDA Son sistemas para clasificar los datos dependiendo de su naturaleza y de las relaciones que pueden establecerse entre las modalidades. Las escalas de medida se clasifican en: D> Escalas cualitativ Escala nominal: la clasificacion de los individuos se realiza segin particularidades de naturaleza cualitativa,siendo excluyentes entre si. Por ejemplo ‘cuando en un estudio estadistico nos referimos al sexo de la poblacién, tendremos a hombres y 2 mujeres; una de las variables excluiria ala otra, Escala ordinal: la clasficacién de los individuos se haria mediante la ordenacién de los individuos, es decir, se establece entre los individuos estudiados tuna elacién de:“mayor, igual o menor que" (es decir tun orden). Esta ordenaci6n puede ser creciente 0 decreciente. > Escalas cuantitativas Escala de Intervalo: cuando existe un orden ‘numérico y se comprueba la igualdad o desigualdad de las distancias entre los valores que toman los Individuos estudiados.En esta escala as variables no se iniciardn en un cero absoluto. Por ejemplo, la medicion de la temperatura corporal (la Consideramos en limites normales a parte de 36°C). Escala de proporcién © razén: cuando establecemos proporciones o razones entre valores de la variable, lo que supone un mayor grado de cuantificacion, A diferencia dela escala de intervalo, ln ésta si existe un cero absoluto. Por ejemplo, el ndmero de cigartillos que consume una persona al dia. En este caso el origen de la escala indicara la ‘ausencia de consumo de tabaco (ningun cigar). (Otros ejemplos serian:el peso la talla, TEMA3 MANUAL IFSES EIR 2014/20153 ESTADISTICA DESCRIPTIVA La estadistica descriptiva usa diferentes técnicas y ‘métodos para la organizaci6n y la exposicién de los datos obtenidos, Entendemos por tabulacién el resumen de manera fordenada de un conjunto de datos numéricos en una tabla; y tentendemos por tabla de frecuencias, a aquella tabla en aque se expresan de manera ordenada un conjunto de observaciones rel nimero de veces que éstas se repiten, > Variables cualitativas: cuando queremos describ los resultados que obtenemos a partir de variables cualitativas utilizamos medidas de distribucion de frecuencias de todas las categorias que medimos. La distribucion de frecuencias se expresa mediante: + Frecuencia absoluta (a): es el nimero de veces que se presenta cada una de las categorias dela variable {que estudiamos. Si sumamos todas las frecuencias absolutas obtendremos el niimero total de casos que ‘estamos observando (n = Zfa. re ‘+ Frecuencia relativa (fr): muestra la proporcion de las frecuenciasabsolutas con respecto al total de individuos ‘estudiados. Nos muestra la relacién de las frecuencias respecto a la unidad, es decir la suma de todas las recuenciasrelatvas seria uno (fr=faln). + Porcentaje ss): representala relacién delas frecuencias. relativas por cada cle individuos. La suma de todos los porcentajes es cen (96 = fr x 100). Ladistribucién de frecuencias es una sere de clases ue predeterminamos con el numero de sujetos que se incluyen en cada clase, Tabla SEXO a © % HOMBRES | 40 om 40 MUJERES | 60 06 60 TOTAL 700 7,00 | 100 Graficos + Diagrama de barras:para su construccion son necesarios unos ejes de coordenadas. En el eje de abscisas representaremos las categorias y en el de ordenadas representaremos las _frecuencias (absolutas o relativas) de cada categoria. Las barras estén slempre separadas entre si, ya que la variable ‘no es continua, Suelen ser de la misma anchura y su altura tiene que ser proporcional a la frecuencia (absoluta 0 relativa) de cada categoria + Diagrama de sectores 0 de pastel: para su ‘construccion se representa cada valor de la variable estudiada con ura porcin de circulo (sector, en el que el angulo centra de cada sector es proporcional alas. frecuencias (bier absolutaso relatvas). + Pictograma: sen representaciones graficas en las que se utilizan dibujos 0 pinturas con areas ‘proporcionales ala frecuencia de cada categoria Gao Variables cuantitativas: + Variables cuantitativas discretas: como en esta serie nos encortramos valores numéricos enteros la representacién grafica sera la misma que en las. ‘variables cualiativas. Para describ estas variables se usan medides de distribuci6n de frecuencias, es decir, frecuenchas absolutas, frecuencias relativas y porcentajes. Su representacion se hace mediante diagramas de barra. + Variables cuantitativas continuas:a estas variables, al poder tener valores intermedios entre dos rnumeros, para poder representarlas graficamente necesitamos agrupar los datos previamente. Para ello, dvidimos la variable en intervalos iguales y ‘contamos a fos individuos que presentan valores ‘comprendidos en cada uno de ellos. A estos Intervalos los denominamos clases, a los valores extremos de cada intervalo los denominamos limites inferior y superior, a la distancia entre ambos limites e denominamos intervalo de clase y al valor central de cada intervalo lo denominamos marca de clase, Si un dato coincide con el limite del intervalo lo incluimos siempre en el siguiente, es decir ena clase siguiente. Se recomienda que el nimero de intervalos ‘clases no debe superar los 20 ni ser inferior a5, de esta forma evitamos que la informacion esté muy dispersa_o muy concentrada. Se recomienda aproximadamente 10 intervalos o clases Las representaciones graficas utlizadas para la variable cuantiativa continua son: el histograma, poligono de frecuencias y diagrama de caja. Tabla tad [| ] * | % FF Fa =o] s [or |i | s | on 0-40 [10 [02 | 20 | 15 | 03 40 30, 40-60 | 25 | 05 | 50 08 360 1 10 50 MANUAL IFSES EIR 2014/2015 TEMA 3Gréficos + Histograma:para su construccién se usan barras adyacentes. En el eje de abscisas se reflelan los Intervalos en los que se agrupa la variable (base de la barra) y en el eje de ordenadas las frecuencias (absolutas o relativas - altura de la barra) de cada Interval. s ° ° 020 ae we og Edad (afos) + Diagrama de caja: la caja central indica elrango en. el que se concentra el 50% central de los datos. Sus lextremos son, por lo tanto, el 1° y 3* cuatil dela distribucién La linea central en la cajaes la mediana Deeste modo, sla variable es simeétrica,dicha linea se encontrard en el centro de ia caja. Los extremos de los "bigotes™ que salen dela caja son los valores que delimitan el 959 central de los datos, aunque en ‘casiones coinciden con los valores extremos dela distribucion. Se suelen también representar aquellas bservaciones que caen fuera de este rango (outliers valores extremos), ‘+ Poligono de frecuencias: es unaliinea quebrada que Une os puntos medios de las barras superiores de los rectangulos del histograma, Este grafico se construye sobre el histograma. Es de uso frecuente cuando ‘queremos presentar en un mismo grafico dos o mas histogramas comparables. INDICES QUE DEFINEN UNA DISTRIBUCION DE qos (MEDIDAS DE TENDENCIA CENTRAL Son indices numéricos que orientan sobre los valores de la variable en los que se agrupan los datos dea distribucion. > Media aritmética: se define como la suma de cada uno de los valores observados respecto al niimero de ‘observaciones. Las unidades son las mismas que las de la variable ala que se refiere. La media aritmeética es la ‘medida de tendencia central mas importante. Es de cil ‘manejo matemético, Se aracteriza por ser un valor Unico y puede serafectada por los valores extremos dela serie estudiada (en este caso es preferible la mediana).En una distribucion normal coincide con la moda y la mediana. La media aritmética para variables discretas se obtendria mediante la siguiente férmula x5 an En el que x} representa al valor de la variable y fa ala frecuencia absoluta, La media aritmética para variables continuas se obtendria mediante la siguiente férmula: En el que fa representa la frecuencia absoluta de cada clase, m; la marca de case y nes el de fa Un ejemplo de célculo de media aritmética seria: {iCudl es la media aritmética de edad de ingreso en un Colegio Mayor de un grupo de 4 amigos que tienen 18, 20, 20 22 afios respectivamente? ‘Sumaremos todas las edades y lo dividiremos entre el ‘numero de amigos. (18 + 20 + 20+22)/4=80/ 4=20, La media de edad seria de 20 afos. > Mediana: sedefinela mediana como aquel valor que, una ‘vez ordenados todos los datos de menara mayor, divide la serie dejando el mismo nimero de individuos @ un lado y 2 otro, Esel valor central de a sere. Lamediana es un valor de dificil manejo matematico que ‘se caracteriza por ser un valor nico que no esté afectado por los valores extremos della serie estudiada, por lo que fen series que sean muy dispersas se prefiere ala media, ‘Sitenemos una serie con un ndmeroimpar de valores, a ‘mediana coincide con un valor existente en la serie de datos. Cuando el numero de datos es parla mediana se calcula como la media de los dos valores centrales dela muestra, Tendremos en cuenta que si la mediana es un valor ‘semejante a la media la distribucién de los datos sera, homogénea, siendo preferible utilizar la media como medida de centralizacion y la desviacién tipica como medida de dispersién. Sin embargo, sila mediana y la ‘media difieren mucho los datos son muy heterogéneos, y es preferible utilizar la mediana como medida de Centralizacion y el rango intercuartlico 0 el rango como medida de dispersion, TEMA3 MANUAL IFSES EIR 2014/2015Un ejemplo de célculo dela mediana seria: :Cudlesla. ‘mediana de un grupo de amigos que van a ingresar en tun Colegio Mayor que tienen 18, 19, 20, 22 24 anos respectivamente? ‘Como la serie tiene un numero impar de valores (5), la mediana sera 20 afios, ya que es el valor central que pertenecea la sere (20 anos). Otro ejemplo de céleulo dea mediana seria: :Cuai es Ja mediana de un grupo de amigos que van a ingresar ‘en un Colegio Mayor que tienen 18, 19, 20, 2, 24y 25 ‘thos respectivamente? ‘Como la serie tiene un numero par de valores (6), la ‘mediana serd 21 afi, ya que en este casola mediana se calcula como la media de los dos nimeros centrales (20 y 22 afos) > > Moda: se define como el valor mas frecuente dela serie valor dominante, Se caractetiza por coincidir siempre con un valor de la serie. A diferencia de la media y ‘mediana, en una distribucion puede exist mas de una ‘moda (distribuciones bimodales,trimodales..). Un ejemplo de célculo de la moda seria: :Cusil es la ‘moda de un grupo de amigos que van a ingresar enun Colegio Mayor que tienen 18, 19, 20, 20, 21, 22y 24 ‘ios respectivamente? La moda seria 20 afos porque el valor més frecuente de la serie es 20. MEDIDAS DE DISPERSION, Estas medidas nos indican si los valores de una distribucion de datos estan agrupados ono en torno a un valor central. > Rango, amplitud o reco \4ximo - minimo Para valorar de forma elemental la dispersion de una serie de datos calcularemos la extension delintervalo en el que ‘estan contenidos todos los valores, Para calcular esta ‘extensi6n se utlizaria el rango,y éstesehallarestandoe! py dato més alto del mas bajo de la sere. El rango tiene un Interés relativo, ya que para clculario solo utilizamos dos valores (ademas son los menos representatives por ser los. valores mas extremos de la serie). > Desviacién tipica o estan« (06): Ladesviacién tipca se calcula sumando las diferencias al cuadrado de cada uno de los valores respecto a su media, dividiendo dicho resultado entre el total de individuos de la muestra y extrayendo al final la raiz cuadrada. La desviacion tipica tiene como unidad la misma que los. datos. La desviacién tipica no es otra cosa que la raiz cuadrada de la varianza. Como para calcular esta desviacién estin afectados los valores extremos solo seria valida para describir distribuciones simétricas. La Varianza (02 652): La varianza se obliene sumando las diferencias al cuadrado de cada uno de los datos respecto a su media y dividiendo al final el resultado entre el nimero de individuos de la sere. Junto con la desviacién tipica 0 ‘esténda es la medida de dispersion mds usada, CCuanto menor sea el valor de la vaianza mas homogénea va a ser la sere y, por lo tanto, menos dispersa sera la ‘muestra. La varianzatiene como unidad la misma de los datos pero elevada a cuadrado. oye Coeficiente de variacién de Pearson (CV): El coeficiente de variacion de Pearson es una medida de dispersion adimensional, que permite comparar, desde ‘un punto de vista descriptive, la dispersion (en forma de desviacién tipica) de dos o més variables con diferente ‘unidad de medida o la dispersién de una variable en distintos grupos. Pera ello no deben tomarse en valor absoluto,sino que ser preciso tomarlas en relacion a la media de donde proceden. Este valor indica el porcentaje que la desviacién tipica representa sobre la ‘media atitmética Se ees edna de 170 deavetn pen de oem meinot el peso de los 20 nifios, obteniendo una media ‘aritmética de 50 kz, y una desviacién tipica de 5 kg. {Dénde encontramos mayor variabilidad en la talla 0 ‘en el peso de os nitos? €V = 10/ 170 x (100) = 5,889 en la talla y CV = 5/50 (100) = 102%en el peso; por lo que interpretamos que los nifios tienen un peso con mayor variabilidad que talla, Rango intercuartiico: Rj 13 Oy El rango intercuartilico mide la extension entre los ‘uartles 3 y 1. Se halla restando el valor del cuartil 3 menos el cuartil1.Con este valor se determinardn los valores entre los que estan comprendida el 50% central dela serie. ‘ango Intercuartilico — ae desviacion tipica no puede dar valores negatives. si Desviaciéniintercuartil todos los valores de una variable son iguales, la a desviacintipica es igual a0, al no haber variabilidad. eae alguna, Laddesviacin intercuartilar mide a mitad de la distancia ala que estan el 50% de los valores centrale de a sere. Es la medida de dispersion que se usa cuando los datos, son asimétricos. MANUALIFSES EIR 2014/ 2015 TEMA3 7MEDIDAS DE POSICION > Cuartiles: llamamos cuartiles a los tres valores que dividen la distribucién ordenada de datos en cuatro partes iguales.€l primer cuartidejaréa.un lado la cuarta parte del colectivo, y al otro las tres cuartas partes restantes (Qy deja a su izquierda el 25% de los datos}; el segundo coincidiré con Ia mediana (Q2 deja 3 su Iquierda el $0%% de los datos) y el tercero dejaré tres. partes un lado yla cuarta parte restante al otro (03 deja, a su izquierda el 75% de los datos) > Deciles: llamamos deciles a los nueve valores que dlividen la distribucién ordenada de datos en diez partes. iguales. En este caso Dy dejaria a su izquierda el 10% de los datos y Ds deja a su izquierda el 50% de los datos y coincide con la mediana, > Percenties:lamamos percentiles alosnoventay nueve valores que dividen la distribucion ordenada de datos en cien partes iguales. 1 P deja a suiquierda e 1% de los datos y el Pp dejaraaSuizquierdael 50% de los datos. 1 percent 0 coincide con la median, Ejemplo: El percent 75 de tallaen un nif, se entiende como que el 74% tiene una talla menor que él yet 25% ‘una talla mayor. Otra forma de interpretarla, seria que el 75% tiene una tala menor oigual que él ye 25% mayor. El percent 50 coincide con el Q2 y con el deci, y todos estos valores son la mediana ya que dejan a su derecha izquierda e 50% dela distribucion. (MEDIDAS DE FORMA DE DISTRIBUCION DE DATOS > Segiin la moda: unimodales, bimodales... ee eigeek. vumMooaL ‘BIMODAL > Segiin a simetria: ‘+ Simétrica: en una distribucién simétrica las dos mitades pueden superponerse y su pico o punto maximo se situa en el centro, Una distribucion sera simétrica cuando coinciden la media, la moda y la ‘mediana en el mismo punto. + Asimetria:el pico esté fuera del centro y una cola es més larga que la otra. Hablamos de asimetriao sesgo ‘cuando no tenemos una distibucién simétrica. La simetria de una distribucién se mide mediante el ‘oeficiente de asimetria (S), en una distribucion simétrica, = Oy en una distibuckin asimétrica,S 0. Las distribuciones asimétricas pueden ser de dos tipos: ~ Cuando hay un sesgo positivo, $ > 0, la cola es mas larga y la caida es mas lenta a la derecha (asimetria ala derecha). + Cuando hay un sesgo negative, $ <0, lacola es mas larga ala izquierda (asimetia ala izquierda). > Segiin el“apuntamiento” o Kurtosis: el apuntamiento © kurtosis determina el grado de apuntamiento 0 picudez de una curva respecto a la distribucion o curva normal. Con este método observaremos la distribucién delos valores segin a forma dela curva, La distrib puede ser: + Isoctirtica © mesocirtica: presenta el mismo ‘apuntamiento que la curva normal uirios's = 0).Un ejemplo sera la distribucion normal o de Gauss. + Platicirtica: la dispersion de los valores es grande, resultando una distribucion mas aplanada que la ormal (kurtosis <0) + Leptocirtica: presenta mayor apuntamiento que la curva normal, existiendo mayor concentracién de os datos alrededor de la media, es decir menos dispersion (kurtos\s > 0), El‘apuntamiento o kurtosis‘de una dstribucién se mide mediante el coeficiente de kurtosis 0 coeficiente de apuntamiento (K) Leptocuirticn Mesociirtica Platicirtica 5 DISTRIBUCIONES DE DATOS Nos proponemos encontrar leyes tedricas 0 leyes ‘matematicas que sean seguidas por distibuciones biol6gicas de datos y se ajusten a elias, ya que si fuéramos capaces de encontrarlas, podtiamos sustituir todos los datos de nuestro estudio por una formula teérica que siguiese la misma distribucion que aquellos, es decir, sintetizaremos todos los datos en una formula Vamos a describir tres leyes tedricas que tienen la particularidad de ser seguidas por la inmensa mayoria de los fenémenos biol6gicos habituales: > Distribucién normal o de Gauss. Es la distribucién que siguen la mayoria de las variables biolbgicas. Cualquier variable cuantitativa puede ser estudiada en principio, de ‘acuerdo com la ley de Gauss. Las caracteristicas de esta distribucién, son TEMA3 MANUAL IFSES EIR 2014/2015+ Tiene forma de campana + Esasintotica respect aleje de abcisas:vade wa +=, + Essimétricarespecto ala media artétia + Esunimodal + Lamedia coincide con fa moda con fa medlana, + Es la distribuci6n de las variables cuantitativas continuas + Sedefine porla media y por la desviacién tipica, + Presenta dos puntos de inflexién (puntos en los quela curva cambia de concavidad) que coinciden con Ia desviacintipica + Sus coeficientes de asimetria y kurtosis son iguales a 0. + Elérea total encerrada por a curva de Gauss es igual 1 (10086), ‘Cuando una variable se distribuye normalmente: {160% de os vores extn comprondos entre 0 £195% de los valores estén comprendidos entre 1,960 1.99% de los valores estén comprendidos entre 22570 £1 99,75% de los valores estén comprendidos entrext3.0 Los valores del 95% y 99% describen los intervalos de confianza 0 seguridad; y por tanto la probabilidad de error esp<005yp<00, Ejemplos de distribucién normal o de Gauss: En un grupo de 100 pacientes se mide a frecuencia del pulso, obteniendo como media el valor de 80 pulsaciones con una desviacién tipica de 10. {Qué porcentaje de estos pacientes tendré entre 70 y 90 ulsaciones por minuto?: Segin la teoria de probabilidad de Gauss la distribucién {de datos queda definida por su media y por su desviacion tipiea, por lo que el 68% de los valores estan ‘comprendidos entre Xo, lo que es igual 80+ 10= 70 {90 pulsaciones por minuto. {Qué porcentaje de estos pacientes tendrd entre 60 y 100 pulsaciones por minuto’ ‘Seguin la teoria de probabilidad de Gauss, el 95% de los valores estén comprendidos entre + 2o, lo que es igual £80. 2(10) = 60 100 pulsaciones por minuto. {Qué porcentaje de estos pacientes tendrd entre 50 y 110 pulsaciones por minuto?: ‘Seguin la teoria de probabilidad de Gauss, e! 99,75% de los valores estan comprendidos entre X + 30, lo que es igual 803 (10) = 50 y 110 pulsaciones por minuto. > Distribucién Binomial: 8 (, p)Ladistribucién binomial fe una ley tebrica que aplicaremos siempre que conozcamos [a probabiidad (p) de aparicién de un feniémeno biolégico. El resultado va a ser dicotémico, pudiendo ser‘éxito’o"fracaso* siendola variable de interés ‘el nlumero de éxits alcanzados en “n” pruebas. Es una distibucién de variables discretas, por lo que constitulré siempre un diagrama de barras discontinuo. > Distribucién de Poisson. La distribucion de Poisson constituye un caso particular de la ley binomial para aquellas situaciones en las que la probabilidad (p) de ‘aparicion de un ferémeno sea muy pequefia Es Ia ley ‘adecuada para los sucesos raros’ ‘Se utiliza para variaales discretas que s6lo toman valores enteros, no negativos, con probabilidad no nula, pero si equefia. Esté defnida exclusivamente por la media Poblacional, La media y Ia varianza poblacional coinciden, Esta distribucin es asimétrica, pero a medida que va aumentando la media, tiende a la normalidad. Cuanto _menor sea la probabilidad de aparcién de un suceso("p” tienda a 0), y mayer sea el numero de individuos al que hemos de aplicara tienda a infinito), mas exacta sera sustitucin de la ley binomial por la de Poisson. La distribucion de Poisson esta ligada a un experimento {que tiene como finalidad cuantificar el numero de Individuos por unidad de tiempo, volumen y superficie, {que presentan un determinado carécter. Se utiliza para contajes. 6 ESTADISTICA INFERENCIAL © ANALITICA Estudia _muestras procedentes de poblaciones inaccesibles para inferir propiedades sobre la poblacién general. Dentro de la estadistica inferencial tenemos dos grandes apartados: estinacion de parametros y contraste de hipétesis. Estimacion de parémetros La estimacion de pardmetros se puede realizar de dos formas: estimacion puntual y estimacién por intervalos. Es més util la estimacién de un parémetro por intervalos, ya que se indican los limites de valores dentro de los cuales el parémetro poblacional tiene una probabilidad determinada de estar, abarcando de esta manera un rango mas amplio de valores, Lo intervalos de estimacién se denominan intervalos de confianzay los limites inferior y superior de dicho intervalo,reciben el nombre de limites de confianza, Al estimar una media queremos calcular un parémetro ppoblacional a parti-de un pardmetro muestral.Calcular MANUAL IFSES EIR 2014/2015 TEMA3Un intervalo de confianza alrededor de la media de una muestra, establece los dos limites de valores (superior & Inferior) entre los que se encontrara el verdadero pardmetro poblacional y también la probabilldad de que asisea. Lamedia poblacionalyy su desviaciontipica se denomina error tipico 0 error estandar de la media (Spy 6 eer); y esa dispersion de las medias muestrales respecto 31a, ‘media poblacional. No hay que confundirio por tanto con a desviacién tipi de la media poblacional. El eror estandar dela media se calcula a partir de resultados de la muestra. or vn DT =Desviacién tipica de la muestra ‘n= tamafo dela muestra Para ealcular los intervalos de confianza debemos ‘tener en cuenta o siguiente: + Siconstruimos un intervalo de confianza del 95%, concluiremos que en el 95% de las ocasiones la ‘media poblacional estaré ent 51,96 (eem) Mientras que en el 5% de las ocasiones nos equivocaremos. + Siestablecemos el nivel de confianza en el 99%, la media poblacional se situaré en un 99% de las ‘ocasiones entre: 522,57 (em) + Enel caso que a muestra sea n < 30 (‘menor de 30"), las intervalos de confanza se calculan siguiendo la siguiente formula: t= valor de Student obtenido de la tabla para el grado de seguridad deseado. Sm =Elerror estindar de la media. Ladistribucién t de Student se usa: Para estimar medias poblacionales a partir de ‘muestras pequerias (n < 30), ara comparar dos medias a partir de muestras independientes. Contraste de hipétesis Es un método de razonamiento que nos permite decir si una hipétesis es certa 0 no y con cuanto margen de error, es decir,con qué probabilidad de equivocacién. Cuando queremos comprobar si nuestra hhipétesis (relacién del tabaco con el cancer de pulmén, por ‘ejemplo),es cierta 0 se debe al azar, sometemos nuestros datos a un andlisis estadistico y utilizamos un test de ‘contraste de hipdtesis que se adeciie alas variables y caracteristicas de la muestra, dandonos este test un resultado "p’ Este resultado nos dice la hipétests que debemos aceptarlahipétesis nula, que nos dice queno hay diferencias estadisticas entre variable tabaco y cancer de pulmén, ola hipétesis alternativa, que nos dice que si hay diferencias estadisticas entre las variables. tabaco y cancer de pulmén, + Plantea le no diferencia entre lo que estamos comparando. La pequeta diferencia que existe pda ser explicable por el azar Hipétesis alternativa (Hy). + La hipétesis altemativa es la que queremos _demostrar (con una probabilidad de error) + Generalmente se plantea antes quel hipétesis nua. + Plantea la existencia de diferencia entre lo que estemos comparando, Siempre que se rechace la hip6tesis nula, nuestro resultado vendra acompafiado de una probabilidad de error y la forma de expresar este concepto, es acompanar ‘nuestro resultado de"p 6. <005' La probabilidad de“p {slo mismo que la probabilidad deo". "improbable que se deban alazat). + p> 005 —> Acepto (citerencias probablemente debidas a azar “p" 6 "a'= e5 el nivel de significacién, que fija el Investigador antes de realizar el contraste de hipdtesis. En a practica se utlizan niveles de significacion de 0,05 (5%) 6 de 0,01 (196). Un nivel de significacion del 5% implica trabajar con un nivel de confianza del 959%. Enel contraste de hip6tesis, se pueden cometer errores: rechaza la hipétesis ula siendo cierta.La probabilidad de cometer“a" Ejemplo: es el error que se comete cuando se concluye que hay diferencias en el test de hipdtesis (ambos tratamientos son diferentes), sin embargo en la realidad ambos tratamiento son iguales. La probabilidad de ese terror se ja de antemano por el investigador. Error tipo Il:no se rechaza la hipétesisnulasiendo fas, La probabilidad de cometer"B Ejemplo: es el error que se comete cuando se concluye {que no hay diferencias en el test (ambos tratamientos son iguales), sin embargo en la realidad ambos tratamientos son diferentes. Potencia del test: capacidad para detectar_una diferencia entre la hipétesisnulay la alternativa cuando realmente existe. La probabilidad de (1-8), TEMA3 MANUAL IFSES EIR 2014/2015REALIDAD NO EXISTEN Feteneias| DIFERENCIAS DIFERENCIAS| Mofala [SNE HAY DIFERENCIAS IFICATIVAS Rechazo Hg NOHAY DIFERENCIAS | Error tipo to SIGNIFICATIVAS | error ‘Acepto Ho Sees ee Testde contraste de Hipstesis Son pruebas estadisticas cuyo objetivo es rechazar la hipetesis nula,calculando qué probabilidad tienen los. resultados obtenidos de ser debidos al azar. Tipos de pruebas o test estadisticos: + Pruebas o test paramétricas: las variables analizadas en la poblacién de origen siguen una distribucion normal. + Pruebas o test no paramétricas: las variables no siguen una distribucién normal. Las pruebas no pparamétricas no dependen de la distribucion de la variable, por ello también reciben el nombre de test de dis 3 libre, No se manejan en ellas los. valores cuantitativos sino los rangos Son pruebas de ‘menor precisién que las paramétrica, se utilizan también cuando los tamafios muestrales son Pequerios (menor de 30 individuos). TEST PARAMETRICOS. PCO ey CHE-CUADRADO | CUALTATIA | CUALTATIVA COATT T-bEsTUDENT une | cUNITATIVR cyatrava UALTATIVA ANOVA\anss | “isd dow | UANTITAT A caer REGRESIONT REGMESONT | cuawrarvn | cunntaa Cada test paramétrico tiene un test no paramétrico para utilizar en caso de que no se cumplan las condiciones resefiadas anteriormente. a eCard ‘TEDE STUDENT UDE MANN-WHITNEY "ANOVA (ANALIS DEVA- ren KRUSKAL-WALLIS TREGRESION/CORRELA. | CORRELACION RHO DE ION ‘SPEARMAN) TEST DE FISHER/CORRI Secunonee LACION DE YATES, Ejemplos sobre contraste de hipétesis: Qué test estadistico utlizarias para analizar los datos de tensién arterial diastélica en 40 mujeres ‘embarazadas y 40no embarazadas?: La hipotesisrelaciona dos variables la variable tension arterial diastélica (es una variable cuantitativa), y la variable embarazada/no embarazada (es una variable cualitativa de dos categorias). El test que tendré que seleccionares la prueba deT de Student. 2Qué test estadistico utilizarias para analizar la ‘relacién entre la aplicacién de un protocolo de asepsia ¥ aparicién de infecciones nosocomiales?: La hipotesis reladona la variable “aplicacién de un protocolo (sino, que es de carécter variable “infeccién nosocomial (si/no)’ tuna variable cualitativa. El testa ‘Se analiza la posible relacion entre variables cualitaivas. E test estadisico que nos permite estudiar la existencia ‘ono de asociacién entre dos variables cualitativas es el test ola distribucién Chi-cuadrado. Permite realizar: + Pruebas de homogeneidad consiste en comprobar si varias muestras de un cardcter cualitativo, proceden de la misma poblacién. + Pruebas de independencia:consiste en comprobar {que dos variables cualitaivas, cuando se observa en. |a_misma serie de individuos u objetos, son independientes. ‘Test para dos variables cuantitativas Cuando la asociccién tiene un sentido (variable Independiente y variable dependiente) la manera de buscar la relaciér estadistica es el anélisis de la regresi6n, Cuandoel objetivo es simplemente valorar la asociacién entre dos variables cuantitativas, sin que haya sentido en la asociacién, se debe buscar la correlacién mediante el coeficiente de Pearson. + Correlacién linealila prueba estadistica que describe la elacion que existe entre dos variables cuantitativas se denomina correlacién; si variaciones de una de ellas implica variaciones en la otra. Esta prueba constituye el primer paso parallegar después, a poder determinar la formula matemética que traduzca tal relacién. La determinacin de esta férmula, cuando la correlacion ha sdo probada, se denomina regresién. La representacién gréficarecibe el nombre de nube de puntos o diagrama de dispersién. Enel diagtama de dispersion vemos que una variable aumenta al aunentar la otra, porque la nube crece Comparacion de me Las formulas anteriores permiten predeterminar el tamafio muestral necesario para estimar una media (variables cuantitativas) © una proporcién (variables cualitativas) Enlos testde contrast de hipétesis, el tamafio muestral dependeré de: + Lavarabiidad de a variable. + Erortipo!. + Error tipo. + Poder estaistico. ‘+ La proporcién de pacientes perdidos durante et estudio (). 8 ANEXO DE PROBABILIDAD. Hay muchas situaciones en la que los fenémenos resultantes se dan de forma aleatoria, es decir que si una situacién se repite siempre en las mismas condiciones, los resultados pueden ser diferentes. Definimos espacio muestral como el conjunto de todos los resultados posibles de un experimento. Cada elemento del espacio muestral se denomina suceso elemental y cada suceso formado por mas de un elemento se denomina suceso compuesto, Clasicamente se ha definido la probabilidad como el cociente entre los casos favorables y los casos posibles 0 totales.Por ello podemos decir que la probabilidad (Pr de un _acontecimiento x" es igual: rnimero de veces que ocurre X Sucesos no mutuamente excluyentes Ejemplot hipertenso/ diabético OO ‘Sucesos mutuamente excluyentes Ejemplo: mujer/ hombre SUCESOS MUTUAMENTE EXCLUYENTES. > SiAy B no pueden ocurtrsimulténeamente, se dice que se excluyen mutuamente y Pr (ANB) = 0. En los sucesos ‘mutuamente excluyentes no hay unin, por lo tanto la interseccion es igual a0. Ejempla: sla probabilidad de ser hombre es 0,50 y la de ser mujer es 0,50. :Cudl es la probabilidad de ser hombre y mujer’: La probabilidad de ser hombre y mujer es 0, ya que es imposible tener los dos sexos, al ser sucesos mutuamente excluyentes. Suma Pr(A6B)=Pr (AUB) = probabilidad de que ocurra Ao de que ocurra 8. SiAy Brno pueden ocurrirsimulténeamente, la regla de la suma a utilizar Pr (AUB) = Pr (A) + Pr (8) Ejemplo: sila protabilidad de ser hombre es 0,50 y la de ser mujer es 0,50. ;Cudl es la probabilidad de ser hombre o mujer?: La probabilidad de ser hombre o mujeres 05 +05 SUCESOS NO MUTUAMENTE EXCLUYENTES. Prix) erecta a > Interseccién o multiplicacién La probabilidad la podemos expresar como fraccién, Pr (A y B) = Pr (AnB) = probabilidad de que Ay B decimal (entre 0y 1) o come porcentaje. ‘ocurran simulténeamente, Ejemplo: En un examen de Enfermeria Fundamental en una clase de 150 personas, suspendieron 49 personas. La probabilidad de que una persona, seleccionada al azar, A B suspendiese la asignatura es: Pr (suspender) = 49/50=0,32 632%. Ante un problema de probabilidad lo primero que ' deters hace es dlerencay oes un sexes renter ‘Aqui hay que diferencia sel suceso es independlente, excluyente o no mutuamente excluyente, ya que las reglas jase ata) Paste joel eucenaie no) eal de célculo de probabilidad son diferentes. eoniere a pot season MANUAL IFSES EIR 2014/2015 TEMA3 13Ejemplo: son sucesos independientes el color del peloy ‘el color de los ojos, para tener el pelo rubio no tengo que tener previamente los os verdes, Si estos sucesos son Independientes se utiliza la siguiente formula: Pr (AnB) = Pr (A) xr (B) En cambio si los sucesos son dependientes, para que aparezca el suceso B ha debido de aparecer antes el suceso A, en esta situacién se utiliza la probabilidad ‘condicionada. Enel eercicio de probabilidad del examen de Enfermeria Fundamental, la probabilidad de que un alumno suspenda era de! 32%, Sin embargo, la probabilidad de suspender se modificaria siconaciésemos alos alumnos. aque estudlaron. Segun lo descrito, podemos hablar del concepto de probabilidad condicionada, dicho de otra ‘manera, la probabilidad de que ocurra A, una vez que ya bra ocurtido 8. Pr(Ay 8) _Pr(A) Pr(B/A) (A = ori) PriB) La probabilidad de A condicionada a B, 0 dicho de otro ‘moda, la probabilidad de que sabiendo que ha ocurrido. Bsuceda A. Una aplicacién importante de las probabilidades condicionadas, de interés en la investigacion medica, en especial en la teoria probabilistica del diagnostico, es lo que se conoce con el nombre de Teorema de Bayes. Con este teorema podemos conocer, mediante probablidades condicionadas, la probabilidad de que se presente una enfermedad después de contrastar la presencia de un sintoma o una prueba diagnéstica positva. Con este teorema encontraremos los valores. predictivos, una vez conocido el resultado de la prueba diagnéstica que sele ha hecho al paciente y conaciendo ‘ademas la prevalencia de la enfermedad en una poblacion. ‘Suma Pr (A 6B) = Pr (AUB) = probabilidad de que ocurra A, de que ocurra B, o de que ocurran ambos. A B Esto quiere decir que Pr (AUB) expresalaprobabilidad de {que ocurra por lo menos uno de los sucesos, es deci la adicién de los dos sucesos debe tener en cuenta que la interseccién no es nula, Pr (A.6B)=Pr(A) + Pr(B)-Pr (ANB) ‘Sisumamos ambos conjuntos lainterseccién es sumada dos veces, es por eso por lo que se le resta una ver la inerseccién, Hay problemas de probabilidad en los que se pide la probabildad de A 6 8, pero no de ambos. En ‘este caso $e restardlainterseccién dos veces. Ejemplo: el 4% de las personas de una ciudad son dlabéticas, el 18% son hipertensas y el 0,5% tienen ambas patologias. :Cual es la probabilidad de ser dlabético o hpertenso, pero no ambos ala vez?: Este es el caso en el que se pide la probabilidad de ser dlabéticoo hipertenso, perono la coincidencia de amas patologias. La formula es la siguiente: Pr (A 6B)=Pr (A) + Pr(B)-Pr 2(AnB) 0,18 + 0,05-2(0,009) = 0,212 4 TEMA 3 MANUAL IFSES EIR 2014/2015=tIFSES OPOSICIONES ENFERMERIA RU tea Sea eee eae eee Preenc aed ee er oC Rea Reservados todos los derechos. EI contenido de esta obra esta protegido por la Ley. No esté permitida la reproduccién total o parcial de su contenido, su tratamiento informatico, la transmision de ninguna otra forma o por cualquier medio, ya se electrénico, mecénico, por fotocopia, por registro u otros métodos, sin el permiso previo y por escrito de los titulares del copyright. Cee ene felt rem eC Oe ny PALE}

Bioestadística

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Bioestadística

Uploaded by

Copyright:

Available Formats

You might also like