You are on page 1of 26

Definición De Estadística Es una ciencia formal que estudia la recolección, análisis e interpretación de datos de una muestra representativa, ya sea

para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algún fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. También Se puede decir, que la estadística es la herramienta fundamental que permite llevar a cabo el proceso relacionado con la investigación científica. La estadística es comúnmente considerada como una colección de hechos numéricos expresados en términos de una relación sumisa, y que han sido recopilados a partir de otros datos numéricos. A continuación algunas definiciones de estadísticas: Kendall y Buckland definen la estadística como un valor resumido,

calculado, como base en una muestra de observaciones que generalmente, aunque no por necesidad, se considera como una estimación de parámetro de determinada población; es decir, una función de valores de muestra. "La estadística es una técnica especial apta para el estudio cuantitativo de los fenómenos de masa o colectivo, cuya mediación requiere una masa de observaciones de otros fenómenos más simples llamados individuales o particulares". (Gini, 1953). Murria R. Spiegel, (1991) dice: "La estadística estudia los métodos científicos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas en tal análisis.

"La estadística es la ciencia que trata de la recolección, clasificación y presentación de los hechos sujetos a una apreciación numérica como base a la explicación, descripción y comparación de los fenómenos". (Yale y Kendal, 1954). Cualquiera sea el punto de vista, lo fundamental es la importancia científica que tiene la estadística, debido al gran campo de aplicación que posee.

Muestra "Se llama muestra a una parte de la población a estudiar que sirve para representarla". Murria R. Spiegel (1991). "Una muestra es una colección de algunos elementos de la población, pero no de todos". Levin & Rubin (1996). "Una muestra debe ser definida en base de la población determinada, y las conclusiones que se obtengan de dicha muestra solo podrán referirse a la población en referencia", Cadenas (1974). Ejemplo; El estudio realizado a 50 miembros de la comunidad de san Rafael. El estudio de muestras es más sencillo que el estudio de la población completa; cuesta menos y lleva menos tiempo. Por último se aprobado que el examen de una población entera todavía permite la aceptación de elementos defectuosos, por tanto, en algunos casos, el muestreo puede elevar el nivel de calidad.

Una población es un todo y una muestra es una fracción o segmento de ese todo. Este se realiza una vez que se ha establecido un marco muestral representativo de la población. el muestreo es una técnica que sirve para obtener una o más muestras de población. Los expertos en estadística recogen datos de una muestra. En consecuencia muestra y población son conceptos relativos. se procede a la selección de los elementos de la muestra aunque hay muchos diseños de la muestra.Una muestra representativa contiene las características relevantes de la población en las mismas proporciones que están incluidas en tal población. y lo más probable es que variaran de una muestra a otra. Al tomar varias muestras de una población. Ejemplo: Consideremos como una población a los estudiantes de educación del IUT. . Utilizan esta información para hacer referencias sobre la población que está representada por la muestra. las estadísticas que calculamos para cada muestra no necesariamente serían iguales. Muestreo Esto no es más que el procedimiento empleado para obtener una o más muestras de una población. determinando por lo menos dos caracteres a ser estudiados en dicha población.

Murray R. Hx. Como por ejemplo. tal como X. Y. Una muestra seleccionada por muestreo de juicio se basa en la experiencia de alguien con la población. Algunas veces una muestra de juicio se usa como guía o muestra tentativa para decidir cómo tomar una muestra aleatoria más adelante. el muestreo no aleatorio o de juicio y el muestreo aleatorio o de probabilidad. que puede tomar un valor cualquiera de un conjunto determinado de ellos. etc. Spiegel. Si la variable puede tomar solamente un valor. la edad. son aquellos que pueden ser expresados mediante números. (1992) "una variable es un símbolo. Variables y Atributos Las variables. Religión  Sexo. se llama constante. la estatura. Son caracteres susceptibles de medición." . el salario. Según. de los estudiantes Tipos De Muestreo Existen dos métodos para seleccionar muestras de poblaciones. Las muestras de juicio evitan el análisis estadístico necesario para hacer muestras de probabilidad. el peso. En este último todos los elementos de la población tienen la oportunidad de ser escogidos en la muestra. llamado dominio de la variable. también suelen ser llamados caracteres cuantitativos.

estado civil. es obvio que las variables toman distintos valores. aquellas características que pueden presentarse en individuos que constituyen un conjunto. es decir que no se pueden expresar mediante un número. profesión.Todos los elementos de la población poseen los mismos tipos de caracteres. Estas distintas formas en que se presentan los atributos reciben el nombre de "modalidades". Puede notar que los atributos no se presentan en la misma forma en todos los elementos. pero como estos en general no suelen representarse con la misma intensidad. Formas de Observar la Población: Se clasifican en directa o indirecta. son aquellos que no son susceptibles de medición. por ejemplo. La forma de expresar los atributos es mediante palabras. y los resultados obtenidos se consideran datos estadísticos originales. IUTIN (1997). Todos ellos juntos constituyen una variable. Los atributos también llamados caracteres cualitativos. nacionalidad.  Observación directa: es aquella donde se tienen un contacto directo con los elementos o caracteres en los cuales se presenta el fenómeno que se pretende investigar. etc. "Reciben el nombre de variables cualitativas o atributos. es aquella en que el investigador observa directamente los casos o individuos en los cuales se produce . Por lo tanto estos distintos números o medidas que toman los caracteres son los "valores de la variable". sexo. Para Ernesto Rivas González (1997) "Investigación directa.

es aquélla que se lleva a cabo a través de períodos de tiempo constantes. la observación de todos sus elementos se ve imposibilitada. Con el fin de deducir otros hechos o fenómenos.  Una observación periódica. Atendiendo a la cobertura. pueden ser exhaustiva.  Observación Parcial. años. parcial o mixta  Observación Exhaustiva.  Observación Indirecta: es aquella donde la persona que investiga hace uso de datos estadísticos ya conocidos en una investigación anterior. La solución para superar este inconveniente es observar una parte de esta población. por esto se llama también a esta investigación primaria". . entrando en contacto con ellos.  Una observación continua. Cuando la observación es efectuada sobre la totalidad de los elementos de la población se habla de una observación exhaustiva. o de datos observados por un tercero (persona o entidad). periódica o circunstancial. semestres. Estos períodos de tiempos pueden ser semanas. Atendiendo a la periodicidad.el fenómeno. como su nombre lo indica es aquella que se lleva acabo de un modo permanente. es aquella que se efectúa en forma ocasional o esporádica. Dados que las poblaciones en general son grandes. esta observación hecha más por una necesidad momentánea. sus resultados se consideran datos estadísticos originales. puede ser continua. que de carácter regular o permanente.  La observación circunstancial. trimestres. etc.

parte de ella se observa parcialmente. Utilizamos el muestre cuando no es posible contar o medir todos los elementos de la población. Observación Mixta. Encuesta Se entiende por encuesta las observaciones realizadas por muestreo. Para Levin & Rubin (1996) "Algunas veces es posible y práctico examinar a cada persona o elemento de la población que deseamos describir. En este tipo de observación se combinan adecuadamente la observación exhaustiva con la observación parcial. o bien cuando la población es muy grande. . Censo Se entiende por censo aquella numeración que se efectúa a todos y cada uno de los caracteres componentes de una población. A esto lo llamamos una numeración completa o censo. este tipo de observaciones se lleva a cabo de tal manera que los caracteres que se consideran básicos se observan exhaustivamente y los otros mediante una muestra. los censos se utilizan rara vez porque a menudo su compilación es bastante difícil. consume mucho tiempo por lo que resulta demasiado costoso. es decir son observaciones parciales. Por lo general. Si es posible listar (o enumerar) y observar cada elemento de la población.

(Cadenas. No obstante puede no solo referirse a la observación de todos los elementos de una población (observación exhaustiva) sino también a la descripción de los elementos de una muestra (observación parcial). la estadística descriptiva nos provee de todos sus medidas. Ernesto Rivas Gonzáles dice. En relación a la estadística descriptiva. en el oscilará dentro de cierto límite de confianza. que casi siempre es de un 95 a 99% de los casos. Se efectúa a través de cuestionarios verbales o escritos que son aplicados a un gran número de personas". lo mejor. . medidas que cuando quieran ser aplicadas al universo total. a fin de compararlas. no tendrán la misma exactitud que tienen para la muestra. "Para el estudio de estas muestras. obteniéndose de esa manera conclusiones sobre las características de dicho conjunto y sobre las relaciones existentes con otras poblaciones. esto significa que el valor de la medida calculada para la muestra. Según Antonio Napolitano "La encuesta. Estadística Descriptiva Tienen por objeto fundamental describir y analizar las características de un conjunto de datos. más directo y simple es preguntárselo directamente a ellas. es decir al estimarse para el universo vendrá dada con cierto margen de error.El diseño de encuestas es exclusivo de las ciencias sociales y parte de la premisa de que si queremos conocer algo sobre el comportamiento de las personas. es un método mediante el cual se quiere averiguar. 1974).

Estadística Inductiva Está fundamentada en los resultados obtenidos del análisis de una muestra de población. seleccionando un grupo menor de ellos (muestra). Estadística Inferencial son procedimientos estadísticos que sirven para deducir o inferir algo acerca de un conjunto de datos numéricos (población). Definición De Parámetro Estadístico Un parámetro estadístico es un número que se obtiene a partir de los datos de una distribución estadística. Según Berenson y Levine. con el fin de inducir o inferir el comportamiento o característica de la población. de donde procede. Los parámetros estadísticos sirven para sintetizar la información dada por una tabla o por una gráfica. Principales Parámetros Habitualmente se agrupan los parámetros en las siguientes categorías: . por lo que recibe también el nombre de Inferencia estadística. Los parámetros estadísticos son una consecuencia inevitable del propósito esencial de la estadística: crear un modelo de la realidad.

Su valor informa sobre el aspecto que tiene la gráfica de la distribución. desviación típica y media. varianza. Se incluyen entre estas el coeficiente de variación. Medidas de forma. Resumen la heterogeneidad de los datos. lo separados que estos están entre sí. que informan de la dispersión en términos relativos. moda y mediana. . los recorridos relativos y el índice de desviación respecto de la mediana. Hay dos tipos. Se trata de valores de la variable estadística que se caracterizan por la posición que ocupan dentro del rango de valores posibles de esta. el coeficiente de apertura.Medidas de posición. Entre ellas están los coeficientes de asimetría y los de curtosis. que vienen dadas en las mismas unidades en las que se mide la variable: recorridos. básicamente:  Medidas de dispersión absolutas.  Medidas de dispersión relativa. Entre ellos se distinguen:  Las  Las medidas de tendencia central: medias. Medidas de dispersión. deciles y percentiles). como un porcentaje. medidas de posición no central: cuantiles (cuartiles. desviaciones medias.

respecto a una característica. El diagrama permite mostrar gráficamente el principio de Pareto (pocos vitales. o panorama. . también llamado curva cerrada o Distribución AB-C. Permite. es decir. donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. Se suelen representar con histogramas y diagramas de Pareto. muchos triviales). pues. de la misma y que es de interés para el observador (como la longitud o la masa).Frecuencia Estadística Se llama frecuencia a la cantidad de veces que se repite un determinado valor de la variable. Mediante la gráfica colocamos los "pocos que son vitales" a la izquierda y los "muchos triviales" a la derecha. de la distribución de la población. de izquierda a derecha y separados por barras. Sirven para obtener una "primera vista" general. cuantitativa y continua. que hay muchos problemas sin importancia frente a unos pocos muy importantes. El diagrama de Pareto. Un histograma es una representación gráfica de una variable en forma de barras. o la muestra. asignar un orden de prioridades. es una gráfica para organizar datos de forma que estos queden en orden descendente. ya sea en forma diferencial o acumulada.

Tipos de frecuencia En estadística se pueden distinguir hasta cuatro tipos de frecuencias:  Frecuencia absoluta: Es el promedia de una sumo predeterminada y además consiste en saber cuál es el número o símbolo de mayor equivalencia. es el cociente entre la frecuencia absoluta y el tamaño de la muestra (N). es el cociente entre la frecuencia absoluta acumulada . es decir. (ni) de una variable estadística Xi. Siendo el fi para todo el conjunto i. la suma total de todas las frecuencias absolutas debe dar el total de la muestra estudiada (N). es el número de veces ni en la muestra N. Se presenta en una tabla o nube de puntos en una distribución de frecuencias.  Frecuencia relativa (fi).  Frecuencia relativa acumulada (Fi). Si multiplicamos la frecuencia relativa por 100 obtendremos el porcentaje o tanto por ciento (pi)  Frecuencia absoluta acumulada (Ni). Es decir. es el número de veces que este valor aparece en el estudio. A mayor tamaño de la muestra aumentará el tamaño de la frecuencia absoluta.

14. Los tipos de frecuencia pueden ser: . 08. frecuencia relativa de 11 es 0. 10.. La suma de las frecuencias relativas es siempre 1 . porque corresponde a la división 3/18 Distribución de frecuencias para datos agrupados Las distribuciones de frecuencias son tablas que resumen los datos originales en frecuencias. pues 11 aparece 3 veces.Indica la proporción con que se repite un valor. 18.17. 12. Entonces:  La  La frecuencia absoluta de 11 es 3. 20.Frecuencia Relativa (fr). 11. 05. 13. 15.Frecuencia Absoluta (f). La suma de frecuencias absolutas es siempre al total de datos observados.Es el número de veces que se repite el valor de cada variable.Ejemplo: Supongamos que las calificaciones de un alumno de secundaria fueran las siguientes: 18. 11. 12. Es el cociente entre la frecuencia absoluta y el número total de datos. 10. 15. . 11.. 13. 14.

Indica el número de valores que son menores o iguales que el valor dado. En estas distribuciones cada dato mantiene su propia identidad después que la distribución de frecuencia se ha elaborado. Se obtiene multiplicando la frecuencia relativa por 100. siguiendo un orden lógico con sus respectivas frecuencias. Se calcula así: ..Frecuencia Acumulada (fa). este valor con la tercera.. . En estas distribuciones los valores de cada variable han sido solamente reagrupados.Indica el número de valores que son menores o iguales que el valor dado. Se obtiene multiplicando la frecuencia relativa acumulada por 100. Se calcula así: Distribución de frecuencia para datos no Agrupados (n<20) Es aquella distribución que indica las frecuencias con que aparecen los datos estadísticos. y así sucesivamente.. y así sucesivamente. . este valor con la tercera...Frecuencia Porcentual (f%).Llamada también frecuencia relativa porcentual.Frecuencia Relativa Acumulada (fra). desde el menor de ellos hasta el mayor de ese conjunto sin que se haya hecho ninguna modificación al tamaño de las unidades originales. Es la suma de la frecuencia absoluta primera con la segunda.Frecuencia Relativa Acumulada Porcentual (fra%).Es la suma de la frecuencia relativa primera con la segunda. La suma de las frecuencias porcentuales es siempre 100%. .

también llamada universo o colectivo. percentiles. se sugiere que cuando el número total de datos (N) es igual o superior 20. se utilizará la distribución de frecuencia para datos agrupados. La razón fundamental para utilizar la distribución de frecuencia de clases es proporcionar mejor comunicación acerca del patrón establecido en los datos y facilitar la manipulación de los mismos. moda y mediana) y las Medidas de dispersión (desviación estándar. también se utilizará este tipo de distribución cuando se requiera elaborar gráficos lineales como el histograma. sin embargo.Distribución De Frecuencia De Clase O De Datos Agrupados (N>20) Es aquella distribución en la que la disposición tabular de los datos estadísticos se encuentra ordenada en clases y con la frecuencia de cada clase. Las medidas de tendencia central (media. es decir. el polígono de frecuencia o la ojiva. Población Población estadística. es el conjunto de elementos de referencia sobre el que se realizan unas de las observaciones. en estadística. cuartiles. los datos originales de varios valores adyacentes del conjunto se combinan para formar un intervalo de clase. Los datos se agrupan en clases con el fin de sintetizar. No existen normas establecidas para determinar cuándo es apropiado utilizar datos agrupados o datos no agrupados. condensar o hacer que la información obtenida de una investigación sea manejable con mayor facilidad. entre otros se calculan diferente cuando se trata de datos agrupados y de datos no agrupados. Población es el conjunto sobre el que estamos . resumir. varianza.

68. Es el símbolo de la media aritmética. 87 y 78 kg. 91. Definición De Media Aritmética La media aritmética es el valor obtenido al sumar todos los datos y dividir el resultado entre el número total de datos. Ejemplo: Los pesos de seis amigos son: 84. Normalmente es demasiado grande para poder abarcarlo. . 72.interesados en obtener conclusiones (hacer inferencia). Hallar el peso medio.

.6 = = 0.6 + 4. La suma de los cuadrados de las desviaciones de los valores de la variable con respecto a un número cualquiera se hace mínima cuando dicho número coincide con la media aritmética. La suma de las desviaciones de los números 8. 3. La suma de las desviaciones de todas las puntuaciones de una distribución respecto a la media de la misma igual a cero. 4 + 2.Media Aritmética Para Datos Agrupados Si los datos vienen agrupados en una tabla de frecuencias. 4 − 4. 12. 10 de su media aritmética 7.6 + 3 − 7. 4 = 0 2.6 es igual a 0: 8 − 7.6 + 5 − 7. 5.6 + 10 − 7.6 + 12 − 7. la expresión de la media es: Propiedades De La Media Aritmética 1.6 − 2.

que es una medida de centralización poco representativa de la distribución. La media no se puede calcular si hay un intervalo con una amplitud indeterminada . 72 kg. 69kg. La media es igual a 74 kg. La media es muy sensible a las puntuaciones extremas. Si tenemos una distribución con los siguientes pesos: 65 kg. 4. 66 kg. La media es independiente de las amplitudes de los intervalos. 2. 110 kg. 3. la media aritmética queda aumentada en dicho número. Observaciones Sobre La Media Aritmética 1. 4.3. 75 kg. 70 kg. La media se puede hallar sólo para variables cuantitativas. Si todos los valores de la variable se multiplican por un mismo número la media aritmética queda multiplicada por dicho número. 65 kg. Si a todos los valores de la variable se les suma un mismo número.

que ordenados son: . ) y otros dos por encima de él ( . si tenemos 5 datos. agrupados. que es la mediana de ese conjunto de datos. Datos no agrupados Sean los datos de una muestra ordenada en orden . porque éste es el valor central. deja dos datos por debajo ( . distinguimos dos casos: creciente y designando la mediana como a) Si n es impar. => El valor central . . Es decir: . . Utilizando los datos agrupados en intervalos de clase. . ). 2. la mediana es el valor que ocupa la posición una vez que los datos han sido ordenados (en orden creciente o decreciente). es el . tercero: Por ejemplo. Considerando los datos en forma individual. Este valor.Mediana La mediana representa el valor de la variable de posición central en un conjunto de datos ordenados Cálculo de la mediana Existen dos métodos para el cálculo de la mediana: 1. no A continuación veamos cada una de ellas.

del intervalo es la abscisa a calcular. si coincide con el valor de una frecuencia acumulada. si tenemos 6 datos. Si no coincide con el valor de ninguna abscisa. Por tanto. la mediana de este grupo de datos es la media aritmética de estos dos datos: Datos agrupados . los dos datos que están en el centro de la muestra ocupan y . se calcula a través de semejanza de triángulos en el histograma o polígono de frecuencias acumuladas.b) Si n es par. la mediana es la media aritmética de los dos valores centrales. utilizando la siguiente equivalencia: Donde y . . => Hay dos valores que están por debajo y otros dos que quedan por encima del siguiente dato . del . Al tratar con datos agrupados. . interior y exterior. son las frecuencias absolutas acumuladas tales que y son los extremos. . Cuando es par. que ordenados son: . las posiciones Por ejemplo. Es decir: . el valor de la mediana coincidirá con la abscisa correspondiente. la donde se alcanza la mediana y .

es la amplitud de los intervalos Varianza La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística. Varianza para datos agrupados . La varianza se representa por . Se observa que seleccionados para el diagrama.mediana.

Ejemplo Calcular la varianza de la distribución: 9. 9. 8. 9. 8.Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores. 3. 18 . 8.

Es decir. 4 Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede calcular la varianza total. la raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación. 3 Si todos los valores de la variable se multiplican por un número la varianza queda multiplicada por el cuadrado de dicho número.Propiedades De La Varianza 1 La varianza será siempre un valor positivo o cero. Si todas las muestras tienen el mismo tamaño: Si las muestras tienen distinto tamaño: Desviación Típica La desviación típica es la raíz cuadrada de la varianza. . en el caso de que las puntuaciones sean iguales. 2 Si a todos los valores de la variable se les suma un número la varianza no varía.

Desviación Típica Para Datos Agrupados Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.La desviación típica se representa por σ. .

8. 3 Si todos los valores de la variable se multiplican por un número la desviación típica queda multiplicada por dicho número. 8. 18 Propiedades De La Desviación Típica 1 La desviación típica será siempre un valor positivo o cero. 2 Si a todos los valores de la variable se les suma un número la desviación típica no varía. 3. 8. 9. . 9.Ejercicio 1: Calcular la desviación típica de la distribución: 9. en el caso de que las puntuaciones sean iguales.

es un índice muy sensible a las puntuaciones extremas. 3 Cuanta más pequeña sea la desviación típica mayor será la concentración de datos alrededor de la media. al igual que la media y la varianza. Si todas las muestras tienen el mismo tamaño: Si las muestras tienen distinto tamaño: Observaciones Sobre La Desviación Típica 1 La desviación típica.4 Si tenemos varias distribuciones con la misma media y conocemos sus respectivas desviaciones típicas se puede calcular la desviación típica total. 2 En los casos que no se pueda hallar la media tampoco será posible hallar la desviación típica. .