You are on page 1of 11

INSTITUTO TECNOLOGICO DE REYNOSA

MATERIA: PROBABILIDAD Y ESTADISTICA PROFESOR: HERNAN WENCESLAO ARAUJO TORRES RESUMEN ESTADISTICA DESCRIPTIVA INTEGRANTES: CISNEROS VEGA LORENA CORONA COBARRUBIAS CORAL GARCIA GARCIA ALDO ENRIQUE ROJAS OLVERA JORGE ANTONIO SAENZ TORRES OSCAR SALAS RODRIGUEZ CARLOS SALAZAR TORRES ELIAS

GRADO Y GRUPO: 2-B

CARRERA: INGENIERIA INDUSTRIAL

Introduccin notacin sumatoria


Para denotar la suma de una gran cantidad de indicadores estadsticos se emplea la letra griega , que es llamada Sigma. Esta letra indica la suma total. Si la variable x toma los valores (x1 + x2 + x3 + . . . . . + xn) entonces su notacin sumatoria es:

Esta expresin se lee como sumatoria de x, desde i= 1 hasta n . Aqu i=1 debajo de la notacin indica el elemento que va a sumarse (i) y el primer elemento de la suma (1) .La n indica el termino final de la suma. sta se puede representar como la suma de los primeros trminos con la notacin de

sumatoria o notacin sigma. El nombre de esta notacin se denomina de la letra griega (sigma mayscula, que corresponde a nuestra S de "suma" ). La notacin sigma es

de la siguiente manera:

La ecuacin anterior se lee la "suma de despus de sigma, por los enteros

desde

hasta

." La tetra k es

el ndice de la suma o variable de la sumatoria y se reemplaza k en la ecuacin , y se suman las expresiones que resulten, con lo que resulte del lado derecho de la ecuacin. Ejemplos Calcule la siguiente Serie:

Ejemplo 1

Solucin:

Ejemplo 2

Solucin:

DATOS NO AGRUPADOS:
Los datos no agrupados es un conjunto de informacin sin ningn orden que no nos establece relacin clara con lo que se pretende desarrollar a lo largo de un problema, esto se soluciona mediante una tabulacin que nos conduce a una tabla de frecuencias.

Ejemplo: Edades de un grupo de personas: 20, 50, 15, 13, 16, 13, 13, 20, 8, 16 , 40, 13, 20, 35, 28, 32. Calificaciones de la materia de espaol de un grupo de estudiantes: 10, 5, 6, 8, 6, 9, 7, 5, 8, 7. Distribucin de frecuencia para datos no Agrupados (n<20): Es aquella distribucin que indica las frecuencias con que aparecen los datos estadsticos, desde el menor de ellos hasta el mayor de ese conjunto sin que se haya hecho ninguna modificacin al tamao de las unidades originales. En estas distribuciones cada dato mantiene su propia identidad despus que la distribucin de frecuencia se ha elaborado. En estas distribuciones los valores de cada variable han sido solamente reagrupados, siguiendo un orden lgico con sus respectivas frecuencias. TRATAMIENTO PARA DATOS NO AGRUPADOS. A qu se refiere esto? Cuando la muestra que se ha tomado de la poblacin o proceso que se desea analizar, es decir, tenemos menos de 20 elementos en la muestra, entonces estos datos son analizados sin necesidad de formar clases con ellos y a esto es a lo que se le llama tratamiento de datos no agrupados. Por otro lado se les llama medidas de tendencia central a la media aritmtica, la mediana, la media geomtrica, la moda, etc. debido a que al observar la distribucin de los datos, estas tienden a estar localizadas generalmente en su parte central.

MEDIDAS DE TENDENCIA CENTRAL


La informacin resumida en una tabla de clases y frecuencias puede resumirse an ms, de manera que se pueda realizar un anlisis ms completo. La informacin resumida en una tabla puede expresarse en un solo valor. Para esto necesitamos lo que se conoce como medidas de tendencia central. Estas medidas reciben tal nombre porque alrededor de ellas tienden a girar los dems valores de una serie. Las medidas de tendencia central son tiles para tener una mejor descripcin de todos los valores que toma una variable determinada.

Media aritmtica
Consiste prcticamente en el clculo de un promedio tradicional, por lo que tambin es conocida como promedio o simplemente como media. Cuando la muestra tenga datos agrupados su clculo se realizara por medio de la siguiente frmula:
X

fx
n

Cuando la muestra tenga pocos datos la consideraremos como muestra con datos no agrupados y su clculo se realizara por medio de la siguiente frmula:
X

x
n

En donde: = media o promedio.

x = suma correspondiente de los datos nominales. f x = suma de las frecuencias por su correspondiente dato nominal n = nmero de elementos de la muestra Media geomtrica En ocasiones trabajamos con cantidades que cambian un cierto periodo, necesitamos conocer una tasa promedio de cambio, como la tasa de crecimiento promedio en un periodo de varios aos en tales casos la media aritmtica simple resulta inapropiada, pues no da resultados inapropiados o equivocados lo que necesitamos encontrar es la media geomtrica X g .

n: nmero de valores

X g n X1 X 2 X 3 ...X n

X n : producto de todos los valores de x

Mediana Dato que est en el centro de todos los datos ordenados de la muestra. Este valor puede pertenecer o no a la muestra original. Es un solo valor calculado a partir del conjunto de datos que mide la observacin, es la ms central o la que est ms en medio en el conjunto de nmeros.

Si el nmero de datos es impar, la mediana ser un valor observable y si el nmero de datos es par, la mediana ser el punto medio de los dos valores centrales.

nn 2
Mediana a partir de datos agrupados Si la muestra tiene un total de par de datos, la mediana ser la media de los dos datos centrales, y este valor no forma parte de la muestra.

~ X X n 1
2

Moda La moda es una medida de tendencia central diferente a la media, pero un tanto parecida a la mediana, pues en realidad no se calcula mediante algn proceso aritmtico, sino que simplemente es aquel valor que ms se repite en el conjunto de datos. Moda para datos agrupados

Mo LMo (

d1 )w d1 d 2

Medidas de posicin
Las medidas de posicin dividen un conjunto de datos en grupos con el mismo nmero de individuos. Para calcular las medidas de posicin es necesario que los datos estn ordenados de menor a mayor. Las medidas de posicin son: Cuartiles Los cuartiles dividen a los datos en cuatro Partes, contiene el 25% de los elementos de la Distribucin. Los smbolos Q1, Q2, Q3 y Q4 denotan los cuatro cuartiles. La forma para calcular los cuartiles va a Depender del tipo de datos, eso es si los datos estn agrupados o no. 1.-Primero hay que ordenar los datos de menor a mayor. 2.- El nmero de observaciones se divide entre 4 y este resultado indica el nmero del elemento que ocupa el primer cuartil. 3.-El segundo cuartil se calcula multiplicando por dos el nmero anterior y as sucesivamente para el resto de los valores hasta el ltimo elemento.

Clculo de los cuartiles para datos agrupados

En primer lugar buscamos la clase donde se encuentra, en la tabla de las frecuencias acumuladas.

Deciles

Los deciles son los nueve valores que dividen la serie de datos en 10 partes iguales. En primer lugar buscamos la clase donde se encuentra, en la tabla de las frecuencias acumuladas.

Percentiles Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.

Clculo de los percentiles En primer lugar buscamos la clase donde se encuentra, en la tabla de las frecuencias acumuladas. La forma de calcular los percentiles va depender del tipo de datos, es decir si stos estn agrupados o no No hay frmula para datos no agrupados.

MEDIDAS DE DISPERSION
Las medidas de dispersin, tambin llamadas medidas de variabilidad, muestran la variabilidad de una distribucin, indicando por medio de un nmero, si las diferentes puntuaciones de una variable estn muy alejadas de la mediana media Para calcular la variabilidad que una distribucin tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmtica. Pero la suma de las desviaciones es siempre cero, as que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviacin media) y otra es tomando las desviaciones al cuadrado (Varianza). La varianza es la media aritmtica del cuadrado de las desviaciones respecto a la media de una distribucin estadstica. Se representa por S . VARIANZA La varianza est basada en las desviaciones con respecto a la media. VARIANZA: Es el promedio de los cuadrados de las desviaciones de cada observacin con respecto de la media. Esta varianza es cero si todas las observaciones son iguales. Existen dos tipos de varianza. Varianza poblacional. Varianza muestral. Varianza de toda la poblacin. Es el valor medio de las desviaciones con respecto a la media, elevadas al cuadrado El proceso para calcular la varianza poblacional es el siguiente: Calcular la media aritmtica. Comprobar (X-u) = 0, por cada nmero se resta la media poblacional y se realiza la sumatoria. Calcular (X-u) 2 Obtener varianza. Varianza de una muestra de la poblacin. La varianza muestral es el valor medio de las desviaciones con respecto a la media, elevadas al cuadrado. El proceso para calcularla es el siguiente: Calcular X 2 Calcular X y X 2 DESVIACIN Es la medida de dispersin ms utilizada, tambin se la conoce como desviacin tpica, y es la raz cuadrada de la varianza. Esta medida pretende conseguir que la medida de dispersin se exprese en las mismas unidades que los datos u observaciones, al igual que la varianza existen dos tipos: Desviacin estndar poblacional Desviacin estndar muestral.

DESVIACIN ESTNDAR POBLACIONAL: Para toda la poblacin o datos, es la raz cuadrada de la varianza poblacional. DESVIACIN ESTNDAR MUESTRAL: Es un estimado de la desviacin estndar poblacional. Es la raz cuadrada de varianza muestral, su frmula es: En estadstica, cuando se desea hacer referencia a la relacin entre el tamao de la media y la variabilidad de la variable, se utiliza el coeficiente de variacin. Su frmula expresa la desviacin estndar como porcentaje de la media aritmtica, mostrando una mejor interpretacin porcentual del grado de variabilidad que la desviacin tpica o estndar. Por otro lado presenta problemas ya que a diferencia de la desviacin tpica este coeficiente es variable ante cambios de origen. Por ello es importante que todos los valores sean positivos y su media d, por tanto, un valor positivo. A mayor valor del coeficiente de variacin mayor heterogeneidad de los valores de la variable; y a menor C.V., mayor homogeneidad en los valores de la variable. Suele representarse por medio de las siglas C.V.

MEDIDAS DE FORMA
Las medidas de forma permiten comprobar si una distribucin de frecuencia tiene caractersticas especiales como simetra, asimetra, nivel de concentracin de datos y nivel de apuntamiento que la clasifiquen en un tipo particular de distribucin. Las medidas de forma son necesarias para determinar el comportamiento de los datos y as, poder adaptar herramientas para el anlisis probabilstico. : Son indicadores estadsticos que permiten identificar si una distribucin de frecuencia presenta uniformidad. Dos medidas de forma: Coeficiente de asimetra Mide el grado de asimetra de la distribucin con respecto a la media. Un valor positivo de este indicador significa que la distribucin se encuentra sesgada hacia la izquierda (orientacin positiva). Un resultado negativo significa que la distribucin se sesga a la derecha

Curtosis: Indica que tan apuntada o achatada se encuentra una distribucin respecto a un comportamiento normal (distribucin normal). Si los datos estn muy concentrados hacia la media, la distribucin es leptocrtica (curtosis mayor a 0). Si los datos estn muy dispersos, la distribucin es platicrtica (curtosis menor a 0). El comportamiento normal exige que la curtosis sea igual a 0 (distribucin esocrtica). TIPOS DE CURTOSIS La curtosis determina el grado de concentracin que presentan los valores en la regin central de la distribucin. As puede ser: Leptocrtica.- Existe una gran concentracin. Mesocrtica.- Existe una concentracin normal. Platicrtica.- Existe una baja concentracin.