You are on page 1of 45

APUNTE CLASES PROFESOR

UNIDAD I – ESTADISTICA DESPCRIPTIVA
ESTADISTICA CIENCIAS DE LA SALUD
UNIVERSIDAD SANTO TOMAS
LOS ANGELES

APUNTE DE CLASES PARA CARRERAS DE ENFERMERIA-KINESIOLOGIA Y
NUTRICIÓN Y DIETETICA

Profesor: Sr. Miguel Contreras N.

QUE DEBO APRENDER EN ESTA UNIDAD

1.- Identificar y reconocer los principales conceptos utilizados en estadísticas
aplicadas a la salud
2.- Identificar y distinguir las principales tipos de variables y sus principales
características.
3.- Escoger y aplicar los principales métodos para sistematizar la información
estadística.
4.- Reconocer, describir y calcular estimadores de posición y dispersión de
conjuntos numéricos de datos interpretando los resultados en términos de los
estadígrafos obtenidos

UNIDAD 1 ESTADÍSTICA DESCRIPTIVA

1.1 – PRESENTACIÓN DEL CURSO

Desde que la especie humana comenzó a crear cultura, es decir, a modificar y
reconstruir el ambiente que la rodeaba para sobrevivir y desarrollarse, fue necesario
también que comprendiera la naturaleza y las mutaciones de los objetos que constituían
su entorno.

El conocimiento de esas épocas no se circunscribió exclusivamente al conocimiento
instrumental, aplicable al mejoramiento de las condiciones materiales.

Apareció simultáneamente la inquietud por conocer el sentido general del cosmos y de
la vida y la toma de conciencia del hombre de su propia muerte originaron los primeros
intentos de elaborar explicaciones globales de toda la naturaleza.

Así aparecen la magia, posteriormente las explicaciones religiosas y más tarde los
sistemas filosóficos.

Todas estas construcciones del intelecto pueden verse como parte de un amplio proceso
de adquisición de conocimientos que muestra lo dificultosa que resulta la aproximación
a la verdad: en la historia del pensamiento nunca ha sucedido que de pronto alguien
haya alcanzado la verdad pura y completa sin antes pasar por el error, es decir el
conocimiento lo adquirimos dentro de un proceso y no como un acto espontaneo a pesar
que existen aquellos que piensan que hasta la inspiración súbita es en sí un proceso.

Def (La Autoridad). Al utilizar el método de la Autoridad, lo que se reconoce como
verdadero lo que guarda relación con la tradición o debido a que alguna persona
influyente en nuestras vidas lo ha dicho.

Def (Racionalismo). Este método supone que si las premisas son validas y el
razonamiento se ejecuta de forma acertada, de acuerdo a la lógica, en consecuencia las
conclusiones que se llegaron son verdaderas.

Consideremos el siguiente Silogismo:

pr1: Todos los alumnos de la asignatura son personas motivadas

pr2: José es alumno de esta asignatura
———————————————-
cc: José es una persona motivada.

Def (Intuición). Este método trabaja con la inspiración súbita, la idea que nos aclara
una situación y entra en nuestra conciencia como un todo. Esta surge regularmente con
posterioridad a que el método del razonamiento falla y cuando nosotros hemos dejado el
problema de lado por un tiempo.

Def (Método Científico). Es la Clasificación Meticulosa y Laboriosa de los Hechos, en
la comparación de sus relaciones y encadenamientos, y finalmente en el descubrimiento,
con la ayuda de una mente disciplinada, de una expresión concisa o fórmula, que
resuma en unas cuantas palabras una amplia variedad de hechos. Esta fórmula recibe el
nombre de ley Científica

Obs. Este método utiliza el razonamiento y la intuición para trabajar en la búsqueda
de la verdad. Esta se fundamenta en la evaluación objetiva de los hechos o
fenómenos, lo cual la distinguen de los anteriores. Se fundamenta en la observación
de fenómenos o hechos medibles y que se puedan trabajar mediante variables.

En una Investigación Estadística se distinguen cuatro etapas; Elaboración de un plan o
diseño de la investigación, compilación de los datos (listado y selección de una muestra,
enumeración...), Sistematización de los datos (Cuadros, Gráficos, Esquemas) y por
último el análisis estadístico.

ALGUNAS DEFINICIONES

Def: La BIOESTADISTICA es la Estadística aplicada a las ciencias biológicas

Def: Diremos que la ESTADÍSTICA es una ciencia relacionada con el MÉTODO
CIENTÍFICO en la colección y análisis de datos, muchas veces con el objeto de deducir
o inferir conclusiones y a partir de ellas poder tomar decisiones ante condiciones de
incertidumbre.

DESCRIPTIVA

ESTADÍSTICA

INFERENCIAL

b) La naturaleza cada vez más cuantitativa de las Ciencias de la Salud requiere del Método Estadístico para analizar y poner orden en los datos. a partir de los datos de la muestra obtener información sobre una población. es decir. REFLEXION FINAL a) La variabilidad biológica de los individuos objeto de estudio en las Ciencias de la Salud origina que sus datos sean impredecibles y que el modo de controlarlos sea a través del Método Estadístico. e) La naturaleza del trabajo clínico es en esencia de tipo probabilístico o estadístico. tomados al azar. Por ejemplo la edad promedio de todos los alumnos de la UST. POBLACIÓN es el conjunto de todos los datos de una característica medida en cada individuo del universo. Por ejemplo la edad promedio de una muestra de 250 alumnos de la UST. d) El volumen de la información que recibe el profesional de la Salud requiere de conocimientos estadísticos que le permitan leer crítica y comprensivamente los resultados científicos ajenos. recopilación de datos y análisis de los resultados.Estadística Descriptiva: Se ocupa de la organización y presentación de los datos en forma convenientemente útil y de fácil comunicación. ESTADÍGRAFO O ESTADÍSTICO es un valor característico obtenido a partir de una muestra. MUESTRA es un subconjunto seleccionado de la población de interés. Disciplinas que dan rigor y objetividad a los clásicos procesos subjetivos de diagnóstico. . pronóstico y tratamiento. El elegir una muestra representativa es un problema importante en las investigaciones estadísticas. además de hacer mediciones con esta información. Obs. Términos estadísticos básicos. PARÁMETRO es cualquier valor característico de una población. UNIVERSO es el conjunto completo de individuos o elementos de interés para nuestro estudio. Inferencia Estadística: Se orienta a lograr generalizaciones. este valor es siempre fijo pero desconocido. c) La investigación en el campo de las Ciencias de la Salud requiere de la Estadística en sus etapas de diseño. f) La perspectiva comunitaria de las Ciencias de la Salud requiere del uso de la Estadística para poder extrapolar las conclusiones.

Hay un conjunto de posibles resultados. binomial. siempre ocurren de la misma forma. que se puede resumir por una fórmula matemática. Son las llamadas distribuciones fundamentales de probabilidad (Distribución normal. de forma que el resultado ocurre de forma aparentemente casual. complejos. un animal. como el sexo o la talla de las personas. predecibles con un margen de variación mediante fórmulas matemáticas. Los datos son valores o categorías específicas de las variables inherentes al problema. Los datos que deben manejarse en una investigación científica para describir los objetos de interés son. EJ. Las variables presentan una gama de variaciones (al menos dos) en los diversos individuos.). No tienen un resultado fijo. tiene sus modelos de comportamiento. En Estadística sólo interesan las características variables. Las constantes no varían. ¡EL AZAR ES LA SUPREMA LEY DE LOS FENÓMENOS BIOLÓGICOS!. Los factores que influyen en que se produzca ese resultado u otro son múltiples. basadas en el cálculo de probabilidades. que una vez conocido nos permite calcular las probabilidades de que ocurra tal o cual resultado. Siguen el modelo indeterminista (= probabilístico. que habitualmente son denominadas variables. Tienen un resultado fijo. .1. conocidos de antemano. de los que sólo se producirá uno. un objeto o una acción. El azar no es ciego. Los fenómenos biológicos siguen uno u otro modelo. al azar.2 – LA VARIABLE Y TIPOS DE VARIABLES Los datos numéricos son números que expresan medidas (datos métricos) o recuentos de modalidades (datos categóricos). La consideración de esta diferenciación es esencial para decidir el método de análisis estadístico adecuado. en general de naturaleza diversa. etc. hipergeométrica. como las constantes físicas o la certeza de la muerte en los seres vivos. Al lanzar una bola es posible saber con exactitud la velocidad y la aceleración que va a tener en un determinado momento. de Poisson. El individuo es la unidad estadística y puede ser una persona. Por característica se entiende una propiedad o condición claramente reconocible en diversos individuos. Las características pueden ser constantes o variables. incontrolables y en parte desconocidos. casual o estocástico). Siguen el llamado modelo determinista de los fenómenos naturales. una planta. sin más aditamentos.

. estado civil.. pero además existe una relación de orden en el recorrido de la variable..Variable Nominal: Esta es una variable cualitativa y sólo permite distinguir entre clases. Grado en la Fuerzas Armadas y de Orden. c. TIENE SENTIDO Y ES POSIBLE efectuar operaciones aritméticas con el recorrido de estas variables. número de artefactos eléctricos que existen en el hogar. Ejemplo: Número de hijos.Variable Cuantitativa: Esta es una variable propiamente cuantitativa. etc. precio de las calculadoras.Según nivel de Medición: a. Ejemplo: nacionalidad. altura de los árboles. Ejemplo: nivel socioeconómico. temperatura corporal.Se presentarán tres criterios diferentes (no excluyentes y complementarios) para clasificar variables. etc. contextura. b. etc. marca calculadoras.Variable Ordinal: Esta es también una variable cualitativa.. . 1.

estado civil. La clasificación de las variables según los criterios de nivel de medición y tamaño de recorrido se pueden resumir de la siguiente forma:  Variable Nominal  Variable Ordinal Según nivel de Medición  Variable Cuantitativa Clasificación de Variables  Variable Discreta Según Tamaño de Recorrido  Variable Continua . nivel socioeconómico. número de artefactos eléctricos que existen en el hogar. altura de los árboles.Variable Discreta: La variable tiene recorrido finito o a lo más numerable. sexo.... b.Según Tamaño de Recorrido: a. etc.2.. Ejemplo: Número de hijos. precio de las calculadoras. etc. Si una variable es continua.Variable Continua: La variable tiene un recorrido infinito no numerable. Ejemplo: Temperatura corporal. edad. entre dos valores potencialmente observables siempre existe otro valor potencialmente observable. Esta clasificación depende de los objetivos del estudio y no de la estructura matemática misma de las variables. peso. 3.Según Orientación Descriptiva: Cada variable puede clasificarse considerando si esta es dependiente o independiente.

1 casa. Ciencias Sociales y del Comportamiento ha puesto énfasis en la necesidad de organizar esta información para comunicar un significado o respaldar resultados en proyectos de Investigación.5 cm. debe tratar de ordenar. Cuantitativo-discreto (Ej. Soltero.46 cc.). 3. Tabla datos no agrupados pacientes hospital local DIAGNOSTICO PACIENTE CANTIDAD DE PACIENTES ( Variable x)  fi  Bronquitis 10 Esguince 22 Tumor Cancerigeno 35 Quemadura diferentes grados 12 Infección estomacal 6 . La sistematización se puede ejecutar a variables del tipo Cualitativo (Ej.) o Cuantitativo.. Esto se logra si se trabaja bajo normas o reglas que permitan realizar su tabulación de variables bien definidas. suficientemente numerosos como para justificar la búsqueda de estructuras de presentación ordenada y resumida.. podemos llegar a desesperarnos y abrumarnos en nuestro proyecto... 3 mesas.. 10. 12. debido a la abundancia de información numérica. sin embargo. En el caso de los datos no agrupados se realizan dos columnas una con el valor de la variable  X  considerada en el estudio y su frecuencia  f  . Cuantitativo-continuo (Ej. en general. categorizarlas y por último como mostrar estos resultados en un gráfico. Ejemplo.9999 m3. y es aquí donde el investigador. clasificar. La sistematización de la información es el tercer paso de una investigación estadística. cuando la información esta organizada y se presenta gráficamente. organizarlas. para datos no agrupados o para datos que se deseen agrupar( Tabla de Frecuencia Relativa). organizar y mostrar la información del tipo cuantitativa de una manera sencilla y de fácil comprensión. El uso cada vez más creciente de la tabulación de información del tipo cuantitativo en áreas como Biología.3 – TABLAS DE FRECUENCIA Los datos que deben manejarse para ser sometidos a un análisis estadístico son. Si un gran número de información cuantitativa no están resumidos y simplificados. comprensión.1.). Grande. la comunicación.. Pequeño. Casado. interpretación e inferencia se facilita.

Frecuencia Relativa:La frecuencia relativa se expresa en términos de porcentaje y se representa por hi. En general. Se representa por fi. TIPOS DE FRECUENCIAS En estadística se trabaja con cuatro tipos de frecuencias.. DONDE fueron recolectados los datos. si hay N datos en total.Frecuencia Absoluta Acumulada: Se representa por Fi .Las tablas estadísticas deben tener un título que indique QUE información se presenta. Donde: F1  f1 F2  f1  f 2 F3  f1  f 2  f 3  Fk  f1  f 2  f 3    f k  N d. Así.. las cuales se definirán a continuación: a. Cuando el título sea muy extenso se puede acompañar con un llamado a pie de página.. es más claro e informativo indicar que proporción del total de los datos representa cada frecuencia hi.Frecuencia o Frecuencia Absoluta:Es el número de veces que se presenta un valor o una categoría de la variable. b. CUANDO se obtuvo la información.. una frecuencia fi representa un porcentaje hi del total.Frecuencia Relativa Acumulada: Fi Se representa por H i y corresponde a: H i   100% N . fi Donde: hi   100% N c.

36 TOTAL 110 100 INTERPRETACIÓN: f4 =29 29 perros atendidos en esta clínica veterinaria.00 MESTIZO 29 26.k es el número de categorías de la variable si esta es discreta. y corresponde al número de intervalos si la variable es cuantitativa continua ó discreta tabulada en intervalos. ii..Observación: i.18 PEKINES 28 25.45% de los perros atendidos en esta clínica veterinaria son de raza pekinés. durante una semana: RAZA fi hi (%) PASTOR ALEMÁN 31 28. h2=25.45 POODLE 22 20. .45% El 25. durante una semana son mestizos. Ejemplo tabla de frecuencia para variables nominales.Tiene sentido calcular las frecuencias acumuladas si la variable es a lo menos ordinal.. La siguiente información corresponde a la raza de los perros atendidos en una Clínica Veterinaria.

53 4 1 1. Número de fi hi (%) Fi Hi (%) Accidentes 0 45 66.12 3 3 4. en un año.65 57 83.29 64 94.83 2 7 10.90 87 100.00 TOTAL 87 100 Ejemplo tabla de frecuencia variables cuantitativas discretas. H4= 98.Ejemplo tabla de frecuencia para variables ordinales. durante un año. .68 38 43. La siguiente información corresponde a la edad de los perros atendidos en una Clínica Veterinaria.68 JOVEN 26 29.54 81 93. A continuación se presenta el número de accidentes en terreno que sufrieron los trabajadores de una empresa forestal.18 1 12 17.53% El 98.18 45 66. durante una semana: EDAD fi hi (%) Fi Hi (%) CACHORRO 38 43.00 TOTAL 68 100 INTERPRETACIÓN: F3 = 64 64 trabajadores de esta empresa forestal tuvieron a lo más dos accidentes en terreno durante un año.53% de los trabajadores de esta empresa forestal tuvieron a lo más tres accidentes en terreno.41 67 98.47 68 100.10 SENIL 6 6.56 ADULTO 17 19.89 64 73.

la amplitud de cada intervalo está dado por: ci  Li  Li 1 y para tabular la información con k intervalos de igual amplitud. .Estructura tabla de frecuencia variables cuantitativas continuas. Li es el límite superior del intervalo i. Lk-1 < X < Lk XK fk hk Fk Hk TOTAL N 100 donde : Li-1 es el límite inferior del intervalo i. Amplitud de un Intervalo: (ci) En general. VARIABLE Xi fi hi (%) Fi Hi (%) L0 < X < L1 X1 f1 h1 F1 H1 L1 < X < L2 X2 f2 h2 F2 H2 L2 < X < L3 X3 f3 h3 F3 H3 L3 < X < L4 X4 f4 h4 F4 H4 . . . . . y se determina por: X i  . . . . . . . la amplitud se determina de la siguiente forma: X máx  X min ci  k Marca de Clase: Li  Li 1 Se denota por Xi . 2 . . . . . . .

5 6 24 6 24 25 .Ejemplo tabla de frecuencia variables cuantitativas continuas. Se estudió el prendimiento en porcentaje en 25 plantaciones de Quillay. obteniéndose lo siguiente: PRENDIMIENTO Xi fi hi (%) Fi Hi (%) (%) 0 – 25 12.5 13 52 19 76 50 – 75 62.50 37.5 2 8 25 100 TOTAL 25 100 .5 4 16 23 92 75 – 100 87.

2 2. Para entender cómo construir una tabla de frecuencia a continuación se expone un ejemplo. puede desarrollar paso a paso.4 1.3 3.3 Suma 43 N° de Unidades 20 CÁLCULO CLASE MÉTODO DE STURGER Clase 5.2 3.4) en pacientes que trabajan dentro de sus casas. que Ud. Se le encarga a UD Desarrollar un estudio para determinar nivel de trauma físico (1-3.1 2.7508 Rango 2.5 2.366666667 0.1 3. 1.8 NO AGRUPADOS Desviación estándar 0.3 3. ya sean dueñas de casas. prestadores de servicios informáticos y reparador técnico de electrodoméstico.2 2.4 2.2 2.1 2.6 1. Se toman 20 muestras de pacientes sin importar la actividad que desarrolla.2 Valor Mínimo 1.3 1.293398986 6 Amplitud 0.2 1.1 Valor Máximo 3.TABLA FRECUENCIA CONTINUA Ejemplo.3 2. mecánicos.4 1.2 1.3 2.4 .

4 3.000 TOTAL 20 1.350 1. .6 2. Al igual que las tablas estadísticas.45 5 0.45 1. según los objetivos y tamaño de recorrido de las variables.800 3. CONSTRUCCIÓN DE TABLA DE FRECUENCIA (DATOS AGRUPADOS) CALIFICACIÓN LR_INF LR_SUP Xi fi hi FI HI 1.45 3.1 1.REPRESENTACIONES GRÁFICAS El gráfico es la representación en el plano.85 1 0. con el fin de obtener una impresión visual global del material presentado.Elección adecuada del tipo de gráfico.150 10 0.000 1.65 3. .Sencillez y auto explicación.85 1. .050 7 0.500 2.4 1.3 2. que facilite su rápida comprensión. DÓNDE y CUÁNDO se obtuvo la información.05 2. Algunos requisitos recomendables al construir un gráfico son: .300 6 0.25 2. Los gráficos son una alternativa a las tablas para representar las distribuciones de frecuencias.2 1.Evitar distorsiones por escalas exageradas.05 3 0.05 3.5 1.25 6 0.65 2.1 3.250 15 0.05 1.25 4 0.25 2.7 3.85 2.65 1 0.750 2.45 1.0 2. de la información estadística.200 20 1.300 1. los gráficos estadísticos deben tener un título y una explicación de QUÉ.9 2.4.8 1.050 16 0.

Todas las barras deben ser de igual ancho y estar igualmente espaciadas. Cada categoría de la variable se representa por una barra. se pueden utilizar indistintamente estos dos tipos de gráficos. GRUPO SANGUINEO DE PACIENTES ATENDIDOS EN UNA CONSULTA MÉDICA 14% 26% A B 39% 21% . si la variable es discreta. es decir. cuyo largo indica la frecuencia de observaciones en dicha categoría. GRUPO SANGUINEO PACIENTES ATENDIDOS EN UNA CONSULTA MÉDICA NÚMERO DE PACIENTES 40 30 20 10 0 A B AB O GRUPO DE SANGRE 2) Gráfico Circular o Sectorial: Son una alternativa a los gráficos de barras separadas. En el eje X se representa el recorrido de la variable y en el eje Y la frecuencia absoluta o la frecuencia relativa.TIPOS DE GRÁFICOS ESTADÍSTICOS 1) Gráfico de Barras Simples: Se utilizan para representar la distribución de frecuencias de variables discretas. El gráfico sectorial siempre se debe construir con las frecuencias relativas.

PORCENTAJE DE GERMINACIÓN DE DISTINTAS SEMILLAS SEGÚN CONCENTRACIÓN (%) DE DDT APLICADO PORCENTAJE DE GERMINACIÓN 50 45 TRIGO 40 35 MAIZ 30 25 20 ALFALFA 15 10 5 POROTOS 0 0.2 0.8 CONCENTRACIÓN DE DDT 4) Gráfico de barras divididas Son una alternativa a los gráficos de barras agrupadas. TRATAMIENTO PEOR IGUAL MEJOR TOTAL A 40 0 60 100 B 15 67 18 100 C 8 24 68 100 D 0 45 55 100 . Ej: En una consulta psiquiátrica. se realiza un estudio de cuatro nuevos medicamentos para la depresión y se controla la mejoría de los pacientes. tienen frecuencia cero ó 100%. 3) Gráfico de barras agrupadas Se utilizan para analizar la existencia de asociación entre dos variables discretas. Son más adecuados que el gráfico de barras agrupadas cuando algunas de las categorías de la variable dentro de un grupo.5 0.

5 1 2 3 4 5 6 7 8 9 tiempo (horas) 6) Pictogramas: Son una forma de representar la información mediante dibujos de los objetos que son motivo de estudio.5 36.5) Gráficos lineales: Son gráficos adecuados para analizar la existencia de asociación entre dos variables cuantitativas.5 38.0 36. .0 Temperatura (°C) 39. de la distribución de frecuencias.5 40. con un formato tal que de una idea rápida y visual.5 37. Son especialmente útiles para fines publicitarios por ser atractivos y de fácil comprensión.5 39.0 38.0 35.0 37. Son particularmente útiles cuando se desea mostrar los cambios de una o más variables a través del tiempo. Seguimiento de la temperatura de un paciente 40.

Ejemplo: a continuación se presenta el peso atómico y el radio atómico de distintos elementos químicos. La información se representa en pares ordenados (x. Radio atómico (nm) peso molecular (uma) 4 600 10 3500 35 8000 55 10000 70 15000 85 18500 120 23000 160 28000 200 31000 235 33600 275 35800 RELACIÓN ENTRE PESO MOLECULAR Y RADIO ATÓMICO 40000 35000 30000 Peso molecular (uma) 25000 20000 15000 10000 5000 0 0 50 100 150 200 250 300 Radio atómico en nm .7) Gráficos de correlación o diagramas de correlación Son apropiados para analizar la existencia de asociación entre dos variables cuantitativas.y).

y en el eje Y la frecuencia absoluta o relativa. también se utilizan para representar la distribución de frecuencia de variables cuantitativas continuas o discretas tabuladas en intervalos.25 4.25 2. mediante la marca de clase del intervalo.75 3.25 3. discretas o continuas tabuladas en intervalos.75 4.75 5. En el eje X se representa el recorrido de la variable y en el eje Y la frecuencia absoluta o relativa.25 5. VOLUMEN EXPIRATORIO FORZADO PACIENTES TRANSPLANTADOS 16 14 12 FRCUENCIA ABSOLUTA 10 8 6 4 2 0 2. es decir.75 VOLUMEN EXPIRATORIO FORZADO (LITROS) . Histograma 80 Frecuencia absoluta 60 40 20 0 1 2 3 Pes o al nacer (k) 4 5 9) Polígono de Frecuencias: Se puede utilizar este tipo de gráfico como una alternativa al Histograma.8) Histograma: Este tipo de gráfico se utiliza para representar la distribución de variables cuantitativas. En el eje X se representa el recorrido de la variable.

El polígono de frecuencias es particularmente útil cuando se tienen dos variables: una variable cuantitativa tabulada en intervalos y otra variable discreta. como en el siguiente ejemplo: CONCENTRACION DE FUOROCARBONADOS EN TRES MARCAS DE INSECTICIDA PORCENTAJE DE INSECTICIDAS 45 40 35 30 A 25 20 B 15 C 10 5 0 150 250 350 450 550 650 CONCENTRACION DE FUOROCARBONADOS en ppm .

Cuando se recolectan datos a partir del desarrollo de un experimento. el conocimiento y práctica de algún concepto de estadística comienza con la media aritmética. en estadísticas de encuestas públicas. en el salario promedio. utilizado desde el colegio hasta en nuestros estudios superiores. Si en cada muestra se calcula un estadístico determinado. etc. en un estado de cuenta promedio. podemos considerar las medidas de posición. Medidas de Posición: Tienen por objeto. el conjunto de todos esos índices constituye lo que se denomina “Distribución muestral del estadístico”. Moda y Mediana. más bien conocido como el promedio. como se resume en el siguiente diagrama. Desviación estándar Dispersión  Coeficiente de Variación Medidas de  Asimetría (Sesgo) Forma  Apuntamiento (Kurtosis) En nuestra vida.1. entre las cuales distinguimos la Media.5 – MEDIDAS DE POSICION Y TENDENCIA CENTRAL Entre las medidas que permiten resumir información proveniente de una población. La mayoría de ellas trata de ubicar el centro de la distribución. estas son: Media. Continuamente vemos su utilización. energía y dinero. Al considerar todas las muestras de tamaño ―n‖ que se puede extraer de una población.  Media  Moda Medidas de  Mediana Tendencia Central Medidas de  Percentiles  Cuartiles Posición  Quintiles  Deciles  Rango Medidas Medidas de  Recorrido Intercuartílico Resumen  Varianza. medidas de dispersión y medidas de forma. Moda y Mediana. Como el menor de los factores. obtener un valor que resuma en sí todas las mediciones. no puede el experimentador darse el lujo de presentar información vaga. razón por la cual. Su utilización y aclaración en el lenguaje técnico correcto para utilizar es lo que vamos a revisar como medidas de tendencia central. . necesitan una medida definida de tendencia central. Def. se llaman MEDIDAS DE TENDENCIA CENTRAL. no se puede gastar tiempo.

x2  18. x5  12.5 años. x7  7. x4  32. x8  7 8 x i 10  18  25  32  12  5  7  7 X  i 1   14. se define la media aritmética de X como: N x i x1  x 2    x N X  i 1  N N Ej: promedio para datos no tabulados: Consideremos la edad en años de ocho personas que sufren un extraño mal.5 años 8 8 Esto significa que la edad promedio de las personas que sufren este extraño mal es de 14. Media para datos no tabulados: Sea X una variable cuantitativa y x1  x2    x N los N datos de una población. . x6  5.MEDIDAS DE TENDENCIA CENTRAL a) Media Aritmética. Media o Promedio: Es una de las medidas de tendencia central de mayor uso. x1  10. La media muestral se simboliza por X y la media poblacional de denota por  (mu). x3  25.

Número de fi x i fi Accidentes 0 45 0 1 12 12 2 7 14 3 3 9 4 1 4 TOTAL 68 39 5 x i fi 39 X  i 1   0. datos tabulados.57 accidentes por año 68 68 Esto significa que los trabajadores de una empresa forestal han tenido en promedio 0. aproximadamente 1 accidente por año. y resulta ser la marca de clase si la variable esta tabulada en intervalos.57 accidentes en un año.Media para datos tabulados: Si los datos están tabulados en una tabla de distribución de frecuencias. Ejemplo: promedio para variable cuantitativa discreta. A continuación se presenta el número de accidentes en terreno que sufrieron los trabajadores de una empresa forestal. es decir. entonces la media se debe calcular como: k x i fi X  i 1 N siendo xi el valor de la variable en el intervalo i-ésimo si esta es cuantitativa discreta. . durante un año.

0 75 . Se estudió el prendimiento en porcentaje en 25 plantaciones de Quillay.5 % 25 25 El prendimiento promedio de las plantaciones de Quillay fue de 39. obteniéndose lo siguiente: PRENDIMIENTO (%) xi fi x i fi 0 .25 12.0 TOTAL 25 987.5%. X min   X  X máx N iv.   ( x  a) i 1 i 2 es mínima cuando a   . entonces: N i.0 25 . entonces Y  a X  b iii.5 X  i 1   39.100 87..5 2 175.5 4 250.75 62..Si Y  a  X  b .50 37.5 13 487. Propiedades de la Media Se puede demostrar utilizando propiedades de las sumatorias que si a y b son constantes y X e Y variables.5 4 x i fi 987..  x     0 i 1 i ii.5 6 75.5 50 .Ejemplo: promedio para variable cuantitativa tabulada en intervalos.

x2   7.. x8  32 Como N = 8. x8  7 Se ordenan los datos. x6  5. x7  7.Mediana (Me): Sea X una variable ordinal. x2  18. x7   25.b. en este caso los ordenaremos de menor a mayor: x1  5. utilizamos la expresión: X8  X8    2  1  2  X  4   X 5  10  12 Me( X )     11 años 2 2 2 . x4  32. x4   10. cuando estas han sido ordenadas según magnitud (de menor a mayor). x3  7. Mediana para datos no tabulados  X  N 1  . se define como Mediana "Me" un valor tal que supera a no más del 50% de las observaciones y es superado por no más del 50% de las observaciones. x1  10. x6   18. cuantitativa discreta o continua y sean x1  x2    x N las N observaciones de la variable. x3  25. que es un número par. si N es par  2 Ejemplo: mediana datos no tabulados: Si consideremos el ejemplo de la edad en años de las ocho personas que sufren un extraño mal. si N es impar    2    Me( X )   X N  X N       2   1   2   . x5  12. x5  12.

75 4 23 75 .5 .5 % 13 Esto significa que en el 50% de las plantaciones el prendimiento es de a lo más un 37. aplicando la fórmula de la mediana: Me( X )  25  12. Se estudió el prendimiento en porcentaje en 25 plantaciones de Quillay. obteniéndose lo siguiente: PRENDIMIENTO (%) fi Fi 0 . .Esto significa que el 50% de las personas que sufren este extraño mal tienen entre 5 y 11 años y el 50% restante tiene entre 11 y 32 años. es 2 2 decir. i=2.50 13 19 50 .5  6  25  37.25 6 6 25 . Mediana para datos tabulados en intervalos ([ Li 1  Li )) En este caso la Mediana se calcula como: N    Fi 1  Me( X )  Li 1   c 2 i fi Ejemplo: mediana para variable cuantitativa tabuladas en intervalos.100 2 25 TOTAL 25 N 25   12.5% y en el 50% de las plantaciones restantes el prendimiento es de a lo menos un 37.5%. éste valor está inmediatamente contenido en el segundo intervalo.

fueron pastor alemán. La siguiente información corresponde a la raza de los animales atendidos en una Clínica Veterinaria. la moda es la única Medida de Posición que se puede calcular. Esto significa que la mayoría de los perros atendidos en la clínica veterinaria durante una semana.Moda o Modo (Mo) Como su nombre lo indica es aquel valor de la variable que tiene una mayor frecuencia. Sueldos fi 120 – 160 20 160 – 200 30 200 – 240 50 240 – 280 30 280 – 320 20 .La siguiente tabla muestra la distribución de frecuencia de los sueldos (en miles de pesos) que reciben los 150 paramédicos que trabajan en un centro asistencial. Observaciones sobre la Media. Si una variable es nominal.. Ej. Mediana y Moda Si la distribución de frecuencias de una variable es simétrica estas tres medidas coinciden. Ejemplo: moda para variable nominal. durante una semana: X: RAZA fi PASTOR ALEMÁN 31 PEKINES 28 POODLE 22 MESTIZO 29 TOTAL 110 Mo(X)= PASTOR ALEMÁN.c.

9 64 ADULTO 17 19. para que vea que la forma de esta distribución es simétrica. cuando es posible. La mediana es adecuada cuando se trabaja con una variable ordinal. durante una semana: EDAD fi hi (%) Fi CACHORRO 38 43. Ejemplo mediana para variable ordinal: La siguiente información corresponde a la edad de los perros atendidos en una Clínica Veterinaria. obtendrá $220. Construya un histograma con esta información.7 38 JOVEN 26 29.9 87 TOTAL 87 100 Me(EDAD)= joven. la mediana y la moda de los sueldos de estos paramédicos. ya habíamos comentado que es la única medida de tendencia central posible de calcular cuando la variable con la cual se está trabajando es nominal. . En general cuando se realiza un estudio estadístico no se calculan las tres medidas de tendencia central.5 81 SENIL 6 6. Además. Si una variable es cuantitativa con una distribución aceptablemente simétrica es recomendable usar el promedio como medida de tendencia central. es recomendable utilizar la mediana como medida de tendencia central más adecuada cuando la variable es cuantitativa con una distribución demasiado asimétrica.000 para las tres medidas de tendencia central.Si calcula el promedio. El 50% de los perros atendidos en la clínica veterinaria son entre cachorros y jóvenes y el 50% restante son entre jóvenes y seniles. existen algunos criterios que mencionaremos a continuación: La moda es adecuada cuando una variable es nominal.

x3.. cuando estas son ordenadas de menor a mayor..... dentro de las Medidas de Resumen. xn una muestra de tamaño n. x2. Sea X una variable por lo menos ordinal y x1.MEDIDAS DE POSICIÓN Percentiles (Pk) Los percentiles corresponden. . Percentiles para datos tabulados en intervalos ( Li-1 – Li) ) kN    Fi 1  Pk  Li 1    c 100 i fi Cuartiles (Ci) Los cuartiles también son una medida de posición y separan la distribución de la muestra en cuatro partes. a las Medidas de Posición pero no de Tendencia Central (con excepción de la Mediana). de tal manera que: C1=P25 Me = C2= P50 C3 = P75 . se define "percentil k" como un valor tal que supera a no más del k% de las observaciones y es superado a lo más por el (100-k)% de las observaciones.

x3  25. x4  32.. razón por la cual no es una buena medida de dispersión (no es robusta). a. Rango( X )  X máx  X min Ejemplo: rango datos no tabulados Si consideremos el ejemplo de la edad en años de las ocho personas que sufren un extraño mal. ya que ellas no consideran la variabilidad de estas.6 – MEDIDAS DE DISPERSION Las medidas de posición por si solas. . no son suficientes para describir las distribuciones. x7  7. Lk : es el límite superior del último intervalo. x1  10.1. x5  12. Al comparar dos o más distribuciones puede suceder que estas tengan el mismo promedio. x2  18. de los valores observados. El rango es una medida demasiado influenciable por los valores extremos. Rango o Amplitud para datos tabulados en intervalos Si la variable está tabulada en intervalos el RANGO O AMPLITUD se define de la siguiente forma: Rango( X )  Lk  L0 donde: Lo : es el límite inferior del primer intervalo.Rango o Amplitud para datos no tabulados (R=Rango) Si la variable no está tabulada en intervalos el RANGO O AMPLITUD se define como la diferencia entre el valor máximo y el valor mínimo. pero que la dispersión de los valores observados no sea la misma. x6  5. x8  7 Rango(X) = 32 – 5 = 27 La máxima diferencia de la edad de estas personas es de 27 años.

Varianza para datos no tabulados N  x  X  2 i  X2  i 1 N Para hacer cálculos. obteniéndose lo siguiente: PRENDIMIENTO fi Fi (%) 0 . Sea X una variable cuantitativa y sea x1.75 4 23 75 . es más práctico usar la siguiente fórmula. b.100 2 25 TOTAL 25 Rango(PRENDIMIENTO (%) = 100 – 0 = 100 La máxima diferencia que existe en el porcentaje de prendimiento en las plantaciones de Quillay es de 100%.Varianza (V(X)) La varianza de la población se denota como 2 (sigma) y la varianza de la muestra se denota como S2... que es equivalente a la anterior: N x 2 i  X2  i 1   X  2 N .Ejemplo: rango para una variable cuantitativa tabulada en intervalos Se estudió el prendimiento en porcentaje en 25 plantaciones de Quillay.. . xN las N observaciones de la variable. x2.25 6 6 25 .50 13 19 50 ..

x4  32. x7  7.Ejemplo: varianza datos no tabulados Si consideremos el ejemplo de la edad en años de las ocho personas que sufren un extraño mal.25 años2.5 años N x 2 i   X    14. x1  10.5  82. x8  7 8 x i 1 2 i  10 2  18 2  25 2  32 2  12 2  5 2  7 2  7 2  2340 Y recordemos que  X  14. x2  18. x5  12.25 2340  X2  i 1 2 2 N 8 Por lo tanto la varianza de la edad de estas personas que sufren un extraño mal es de 82. x6  5. x3  25. .

25 12.5 50156.50 25 .5 X  i 1   39.5  446 50156.25 4 x i  fi 987.50 37.75 62.5 4 250 15625. la varianza se define como sigue: k  f  x  X  2 i i  X2  i 1 N y para cálculo se utiliza la expresión: k f i  xi2  X2  i 1   X  2 N Ej varianza para variable cuantitativa tabuladas en intervalos.50 TOTAL 25 987. obteniéndose lo siguiente: PRENDIMIENTO xi fi xi*fi xi2 *fi (%) 0 .Varianza para datos tabulados(DATOS AGRUPADOS) Si los datos están tabulados en una tabla de frecuencias.100 87.5 18281.25  X2  i 1 2 2 25 25 .00 75 .5 13 487.5 25 25 4 f i  xi2   X    39.5 6 75 937.25 50 .5 2 175 15312. Se estudió el prendimiento en porcentaje en 25 plantaciones de Quillay.

 Si Y  a X   Y2  a 2 X2 Ej Los trabajadores de cierta empresa tienen un sueldo promedio de $383. Determine el sueldo promedio y la varianza luego del aumento.658.571  35.290  10.  x  $383. 2  y2  a 2   x2   y2  (1.  Si Y  X  b   Y2   X2 ii. Propiedades de V(X) Si a y b son constantes.453.La varianza del porcentaje de prendimiento en las plantaciones de Quillay es de 446 (%)2.290  x2  30.500  424. 08)2  30.453. 08 b  $10. se cumplen las siguientes propiedades: i. Si a cada trabajador se le aumenta el sueldo en 8% más un bono de $10. .571 ($) 2 a  1. respectivamente el sueldo promedio y la varianza de los sueldos después del aumento.290. Desarrollo: Llamemos: X: sueldos antes del aumento.0144 ($)2 son. 08  383.500  y  a x  b   y  1.571 ($)2.658.2 y 35.500. Y: sueldos después del aumento. con una varianza de 30. 0144 Por lo tanto $424.

  2 En el ejemplo anterior la desviación estándar de los sueldos después del aumento es de $183..( X )  100% X Aplicaciones del Coeficiente de Variación 1°.. se utiliza como medida de dispersión la raíz positiva de la varianza..V . Sx) Como la unidad de medida de la varianza es el cuadrado de la unidad de medida de la variable. d. .Coeficiente de Variación (CV(X)) Se define como: X C. Ej Comparar la variabilidad de los pesos de los estadounidenses en libras y la variabilidad de los pesos de los chilenos en Kilogramos.c. la cual recibe el nombre de desviación típica o desviación estándar.Comparar la variabilidad de dos distribuciones de una misma variable con unidades distintas.Desviación Típica o Desviación Estándar (.833.

Comparar la variabilidad de distribuciones de variables distintas.V(Y) Nuestra conclusión la podemos expresar de cualquiera de estas formas: -La distribución de la estatura de estos niños tiene menor variabilidad.). obteniéndose la siguiente información: Estatura (X) Peso (Y)  x  135  y  24. -La distribución del peso de estos niños tiene mayor variabilidad.3 CV (Y )  100%  33. Ejemplo: En un curso de 20 alumnos se midió la estatura (en cm. -La distribución del peso de estos niños tiene mayor dispersión.V(X) < C.8 C. -La distribución de la estatura de estos niños es más homogénea.3 Al comparar la variabilidad de estas distribuciones. -La distribución del peso de estos niños es más heterogénea.8 σx=30 σy=8. obtenemos que: 30 CV ( X )  100%  22. -La distribución de la estatura de estos niños tiene menor dispersión.. .) y el peso (en kg. 47% 24. 22% 135 8. 2°.

3°. Edad (años) Hombres Mujeres 21 – 25 2 3 25 – 35 53 60 35 – 45 60 37 45 – 60 25 18 ¿Qué distribución tiene menor variabilidad? o ¿Qué distribución es más homogénea? En este ejemplo la edad promedio de hombres y mujeres es distinta.. Ejemplo: La siguiente tabla muestra la distribución de las edades según sexo. por lo tanto estamos obligados a calcular el coeficiente de variación si queremos comparar variabilidad. de los trabajadores de una agroindustria.Comparar la variabilidad cuando los promedios son distintos. .

El volumen de sangre en el cuerpo. . a. e... d. b. d.El cálculo del promedio de pacientes muestreados de un hospital.Identifique a qué escala de Medición pertenecen estos enunciados a) La ambulancia serie: 000120 b) 300 cm3/ seg. 4. e) En el turno noche se atendió a 5 pacientes/hr 3. Método Científico.75 m de altura y pesa 85 Kg. Muestra.Su peso. GUIA DE EJERCICIOS 1.-Indique cuáles de las siguientes afirmaciones representan una variable y cuáles una constante.El número de letras del alfabeto. c. a.Indique cuáles de las siguientes situaciones implican a la estadística descriptiva y cuáles a la estadística inferencial.El uso de una muestra para estimar la duración de un tipo medicamento. Población.. Investigación Estadística.La inducción de comportamiento hecho en una terapia grupal post traumática.. c) Producción Nº 1000805412008 d) El enfermero de medicina mide 1. Medición..El número de centímetros en un metro. además indique si es variable que tipo de escala utiliza... Medir.Un profesor de historia que indica a su grupo el número de estudiantes que obtuvieron la máxima calificación en un examen c. Estadística Inferencial y Estadística descriptiva. b.El número de estudiantes especialistas en Terapia Ocupacional....Defina los siguientes términos. 2.. Variable independiente y Variable dependiente. Estadística..

102kg.79 Varianza 54.44 92 5. asignando 20 a cada tratamiento. donde los puntajes mayores indican un mayor grado de la enfermedad. un grupo que se aliviará sólo con espera.6. 16. 12. Respuesta Ejercicio N°1 Ejercicio Letra a b c Media 13. cambios de hábitos alimenticios y el ejercicio físico. Desviación estándar.Para los ejercicios siguientes especifique. 14. Los tratamientos se administran durante 12 meses.5843 19.246 0. 95kg. c) NOTAS: 5. 5. 86kg. 6.. 5.1582 . 15. 5.. Error estándar y CV.5921 Error St 0. (1) La variable Dependiente (2) La variable Independiente (3)La muestra (4) La población (5) Los Datos Resumidos. a.6.2. b) 80kg. después de lo cual cada paciente se somete a un examen de sangre que mida su nivel de anemia. 92kg.2. 16. El examen tiene una escala de 0 a 100..1. Se incluye una cuarta condición de tratamiento.069 0.6. 13.625 40 0. a) EDADES: 11. 6. 5. Varianza. 13.9. Las medidas de dispersión revisadas.Un Enfermero del Centro de Diagnostico y Tratamiento CDT está interesado en evaluar tres métodos para tratar anemia: la medicación.6.7.2. 15. Se recluta a ochenta pacientes de la 5° y 8° Región de clase media y baja.6. 19.6. 5. Luego se calculan los valores promedio de cada tratamiento y se realiza la comparación para poder determinar la eficacia relativa de cada tratamiento.5. 13.3505 Desvest 23. 90kg. 89kg. 95kg. 11. 95kg.De los siguientes datos calcule. 6. 14. 11. 5. 5.5. 5. 6. para tener un grupo de control.100kg. 11.6. 5. 11.372 63. Rango. 88kg. 6.

Q2.00 4.60 1. D9 ..33 1.14 1.18 1.Q3 .15 1.40 0.18 0.16 1.80 1. P33.90 1.20 0.43 .15 1. P81 de los datos no agrupados y agrupados en tabla de frecuencia que corresponda utilizando la regla de Sturger.40 0.46 1.16 0.15 0.5 0.7.50 0.20 4.14 1.20 4.00 1.19 0.Determine Q1 .50 0.50 0. D6 .22 0. a) 119 135 138 144 146 150 156 111 135 220 125 135 140 144 147 150 157 111 185 221 126 135 140 145 147 152 158 115 184 321 128 136 142 145 148 153 161 111 175 355 132 138 142 146 149 154 163 135 112 135 b) 19 15 18 14 46 15 15 11 15 15 10 14 47 15 15 11 16 15 10 45 14 12 15 15 18 16 12 45 14 13 11 11 c) 0.15 1.47 1.

80 85 92 95 98 82 86 93 96 98 83 88 95 96 99 a) Obtenga el cuartil 3 y compárelo con percentil 74..8. . b) Entre que valores se encuentra el 40% central de la muestra.Se le encarga a UD Desarrollar un estudio para determinar rendimientos en 30 Nutricionistas de la provincia que trabajan junto a Ud. en un hospital local.

5 166.5 142.Obtenga Todos los estadígrafos vistos MTC y de dispersión..5 134.5 158. COMO VOY 1.. . NUMERO DE PACIENTES POR DIAMETRO DE CRANEO EN [mm] CESFAM CANTIDADPACIENTES 22 21 LOCAL 20 19 18 17 [fi] 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 126.5 174.5 182.5 DC[m] Titulo tabla________________________________________________________________ CRANEO[mm] Lrinf Lrsup Xi fi hi(%) Fi Hi total 2.Construya una tabla de frecuencia de acuerdo al gráfico de abajo.5 150.

-Aplique lo leído en clases con intervenciones coherentes y que aportaran al entendimiento de la unidad 9. 11. 6.No llego tarde o falto a mis clases.-Lo aprendido en la lectura del apunte me ha permitido mejorar el uso de las herramientas aprendidas.-Los saberes desarrollados en los trabajos de la unidad los he incorporado como parte de mis aprendizajes.-Realizo lectura previa a cada clase utilizando como apoyo este apunte.. 8. 5. AUTOEVALUACIÓN CRITERIOS NOTA 1-7 1. 2.. 7.-Le asigno tiempo y dedicación a la realización de las tareas que se me encomiendan o comprometo.-Los aspectos que me correspondió desarrollar en estudio y/o guías están de acuerdo a lo solicitado en clases.Escucho con atención y respeto los aportes de mi profesor y mis compañeros(as) 10. estoy completando lo estudiado con lectura personal e investigación. 3.-Participé en todas las etapas del desarrollo de los trabajos y/o guías de ejercicios.-Luego de realizados las guías. .