You are on page 1of 11

La Estadística

Es una ciencia formal que estudia la recolección, análisis e interpretación de datos de una muestra representativa, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algún fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo, la estadística es más que eso, es decir, es el vehículo que permite llevar a cabo el proceso relacionado con la investigación científica. Distribución normal.- Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad. Se usa para la toma de decisiones en áreas de negocios o instituciones gubernamentales. La estadística se divide en dos grandes áreas: La estadística descriptiva, se dedica a la descripción, visualización y resumen de datos originados a partir de los fenómenos de estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de parámetros estadísticos son: la media y la desviación estándar. Algunos ejemplos gráficos son: histograma, pirámide poblacional, gráfico circular, entre otros. La estadística inferencial, se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de hipótesis), estimaciones de unas características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modelamiento de relaciones entre variables (análisis de regresión). Otras técnicas de modelamiento incluyen anova, series de tiempo y minería de datos. En su origen, por tanto, la Estadística estuvo asociada a los Estados o ciudades libres, para ser utilizados por el gobierno y cuerpos administrativos (a menudo centralizados). La colección de datos acerca de estados y localidades continúa ampliamente a través de los servicios de estadística nacional e internacional. En particular, los censos comenzaron a suministrar información regular acerca de la población de cada país. Así pues, los datos estadísticos se referían originalmente a los datos demográficos de una ciudad o estado determinados. Y es por ello por lo que en la clasificación decimal de Chester Dewey empleada en las bibliotecas, todas las obras sobre estadística se encuentran ubicadas al lado de las obras de o sobre la demografía. Ya se utilizaban representaciones gráficas y otras medidas en pieles, rocas, palos de madera y paredes de cuevas para controlar el número de personas, animales o ciertas mercancías. Hacia el año 3000 a. C. los babilonios usaban ya pequeños envases moldeados de arcilla para recopilar datos sobre la producción agrícola y de los géneros vendidos o cambiados. Los egipcios analizaban los datos de la población y la renta del país mucho antes de construir las pirámides en el siglo XI a. C. Los libros bíblicos de Números y Crónicas incluyen en algunas partes trabajos de estadística. El primero cona está ubicado al lado de las demográficas. La estadística tiene dos censos de la población de la Tierra de Israel y el segundo describe el bienestar material de las diversas tribus judías. En China existían registros numéricos similares con anterioridad al año 2000 a. C. Los antiguos griegos realizaban censos cuya información se utilizaba hacia el 594 a. C. para cobrar impuestos. Orígenes en probabilidad Los métodos estadístico-matemáticos emergieron desde la teoría de probabilidad, la cual data desde la correspondencia entre Pascal y Pierre de Fermat (1654). Christian Huygens (1657) da el primer tratamiento científico que se conoce a la materia. El Ars coniectandi (póstumo, 1713) de Jakob Bernoulli y la Doctrina de posibilidades (1718) de Abraham de Moivre estudiaron la materia como una rama de las matemáticas.1 En la era moderna, el trabajo de Kolmogórov ha sido un pilar en la formulación del modelo fundamental de la Teoría de Probabilidades, el cual es usado a través de la estadística. El siglo XIX incluye autores como Laplace, Silvestre Lacroix (1816), Littrow (1833), Richard Dedekind (1860), Helmert (1872), Hermann Laurent (1873), Liagre, Didion y Karl Pearson. Augustus De Morgan y George Boole mejoraron la presentación de la teoría. Adolphe Quetelet (1796-1874), fue otro importante fundador de la estadística y quien introdujo la noción del «hombre promedio» (l’homme moyen) como un medio de entender los fenómenos sociales complejos tales como tasas de criminalidad, tasas de matrimonio o tasas de suicidios.

Profesión que te gusta. 6. 2. 5. El color de los ojos de tus compañeros de clase. El número de estrellas de los hoteles de una ciudad viene dado por la siguiente serie: 3. El diámetro de las ruedas de varios coches. 18. 20. 1. 2. 3. 14. 4. 3. 3. 4. 2. La nacionalidad de una persona. 16. 3 Número de libros en un estante de librería. 3. Número de goles marcados por tu equipo favorito en la última temporada. 2. 18. 3. Construir la tabla de distribución de frecuencias y dibuja el polígono de frecuencias. 3. 2. 4. Indica que variables son cualitativas y cuales cuantitativas: 1. Coeficiente intelectual de tus compañeros de clase. 4. 4. 13. 3. 20. 13. 3. 15. 1. 22. 15. 2. 18. 1. De las siguientes variables indica cuáles son discretas y cuales continuas: 1. 2. 3. 6. Número de alumnos de tu Instituto. 15. 2. La profesión de una persona. 16. 3. Número de acciones vendidas cada día en la Bolsa. Número de hijos de 50 familias. 3. 4. Período de duración de un automóvil. Suma de puntos tenidos en el lanzamiento de un par de dados. 2. Comida Favorita. . Clasificar las siguientes variables en cualitativas y cuantitativas discretas o continuas. 2. 5. 2. 2. 16. 3. 2 Número de litros de agua contenidos en un depósito. 1. 15. 2. 2. 2. 5. 1. 1. El área de las distintas baldosas de un edificio. 19. 3.EJEMPLOS: 1. 3. 3. 4. 4. 3. 2. 3. 16. 3. 3. 1. 6. Censo anual de los españoles. Las puntuaciones obtenidas por un grupo en una prueba han sido: 15. 13. Construir la tabla de distribución de frecuencias y dibuja el diagrama de barras. 5. Temperaturas registradas cada hora en un observatorio.

CUADROS COMPARATIVOS El cuadro comparativo es un organizador que se emplea para sistematizar la información y permite contrastar elementos de un tema. EJEMPLOS: . Escribir las características de cada objeto o evento. Construir afirmaciones donde se mencionen las semejanzas y diferencias más relevantes de los elementos comparados. Marcar los parámetros a comparar. Está formado por un número variable de columnas en las que se lee la información en forma vertical y se establece la comparación entre los elementos de las columnas. CARACTERÍSTICAS: a) b) c) d) Identificar los elementos que se desea comparar.

Pictograma: con imágenes que sirven para representar el comportamiento o la distribución de los datos cuantitativos de una población. Gráfico circular: permite ver la distribución interna de los datos que representan un hecho. que se pueden clasificar en: Gráfico lineal: se representan los valores en dos ejes cartesianos ortogonales entre sí. el tamaño de las cuales es proporcional a la cantidad de datos.GRÁFICOS Gráfico o gráfica son las denominaciones de la representación de datos. Las gráficas de barras son una manera de representar frecuencias. Gráfico de barras: se usa cuando se pretende resaltar la representación de porcentajes de datos que componen un total. vectores. La altura de cada rectángulo es proporcional a la frecuencia del intervalo respectivo. cuyos vértices de la base coinciden con los límites de los intervalos y el centro de cada intervalo es la marca de clase que representamos en el eje de las abscisas. en forma de porcentajes sobre un total. generalmente usando una hoja de cálculo. a la descripción e interpretación de datos e inferencias sobre éstos. según lo que se desee destacar. sino mediante la interpolación (lectura entre puntos) y la extrapolación (valores fuera del intervalo experimental). También puede ser un conjunto de puntos. de líneas o de área que utiliza un campo numérico o un campo de fecha/hora como campo “A cambio de”. utilizando símbolos de tamaño proporcional al dato representado. y sirven para analizar el comportamiento de un proceso. mediante recursos gráficos (líneas. Forma parte de los programas estadísticos usados con los ordenadores. superficies o símbolos). Existen diferentes tipos de gráficas. El objetivo es poner una barra de largo (alto si es horizontal) igual a la frecuencia. creándose de este modo un eje X numérico verdadero o un ejemplo X de fecha/hora verdadero. generalmente numéricos. Gráfico de burbujas: Este tipo de gráfico presenta los datos como una serie de burbujas. La gráfica de barras sirve para comparar y tener una representación gráfica de la diferencia de frecuencias o de intensidad de la característica numérica de interés. Un gráfico de este tipo resulta muy efectivo para mostrar el número de productos vendidos en cierta región. para que se manifieste visualmente la relación matemática o correlación estadística que guardan entre sí. Se suele separar el sector correspondiente al mayor o menor valor. Está formado por rectángulos unidos a otros. La representación gráfica permite establecer valores que no han sido obtenidos experimentalmente. Eje numérico: Un gráfico de eje numérico es un diagrama de barras. Histograma: se emplea para ilustrar muestras agrupadas en intervalos. Una posibilidad es que el gráfico sea analógico por ejemplo. Las gráficas lineales se recomiendan para representar series en el tiempo. Una gráfica de barras se presenta de dos maneras: horizontal o vertical. Tufte han desarrollado nuevas soluciones de análisis gráficos. Los gráficos de eje numérico proporcionan un medio para aplicar una escala a los valores del eje X. también se utilizan para varias muestras en un diagrama. que se plasman en coordenadas cartesianas. Ejemplos: . Una gráfica de barras contiene barras verticales que representan valores numéricos. La estadística gráfica es una parte importante y diferenciada de una aplicación de técnicas gráficas. la representación de los resultados de las elecciones con colores sobre un hemiciclo. o un conjunto de elementos o signos que permiten la interpretación de un fenómeno. y es donde se muestran valores máximos y mínimos. Autores como Edward R. las frecuencias están asociadas con categorías.

.

5 no es un valor posible al rodar el dado.Esperanza Matemática En estadística la esperanza matemática (también llamada esperanza. Por ejemplo. media poblacional o media) de una variable aleatoria. un juego donde el beneficio esperado es cero (no ganamos ni perdemos) se llama un "juego justo". valor esperado. considerando los 38 posibles resultados. la esperanza matemática del beneficio para apostar a un solo número es: Que es -0. es el número que formaliza la idea de valor medio de un fenómeno aleatorio. En el mundo de las apuestas. Por lo tanto uno esperaría. Nota: El primer paréntesis es la "esperanza" de perder tu apuesta de 1€. en el que todos los sucesos son de igual probabilidad. la esperanza es igual a la media aritmética. representa la cantidad media que se "espera" como resultado de un experimento aleatorio cuando la probabilidad de cada suceso se mantiene constante y el experimento se repite un elevado número de veces.5. en media. y el valor esperado para apostar 1 euro son 0. Por lo tanto. La esperanza matemática del beneficio es el v alor esperado a ganar menos el valor esperado a perder. el valor esperado cuando tiramos un dado equilibrado de 6 caras es 3. Podemos hacer el cálculo: y cabe destacar que 3. Por ejemplo. En este caso.el valor de la esperanza puede ser improbable o incluso imposible.0526 aproximadamente. La ganancia para acertar una apuesta a un solo número paga de 35 a 1 (es decir. Para una variable aleatoria discreta con valores posibles y sus probabilidades representadas por la función de probabilidad la esperanza se calcula como: Para una variable aleatoria absolutamente continua. El segundo paréntesis es la esperanza matemática de ganar los 35€. cobramos 35 veces lo que hemos apostado y recuperamos la apuesta. así que recibimos 36 veces lo que hemos apostado). la ruleta americana tiene 38 casillas equiprobables. la esperanza se calcula mediante la integral de todos los valores y la función de densidad: .9474 euros. Cabe decir que el valor que toma la esperanza matemática en algunos casos puede no ser "esperado" en el sentido más general de la palabra . Una aplicación común de la esperanza matemática es en las apuestas o los juegos de azar. Por tanto. por eso es negativo el valor. la esperanza es igual a la suma de la probabilidad de cada posible suceso aleatorio multiplicado por el valor de dicho suceso. perder unos 5 céntimos por cada euro que apuesta. Cuando la variable aleatoria es discreta.

5) 3-Sabiendo que p(X ≤ 2) = 0.001 y 0. La función de distribución y su representación. pierde tantos cientos de euros como marca el dado. 2-Sea X una variable aleatoria discreta cuya función de probabilidad es: x 0 1 2 3 4 5 1. Hallar: La esperanza matemática. gana tantos cientos de euros como marca el dado.003. Si sale número primo.1 0.2 0. pi 0.000 € ó un segundo premio de 2000 € con probabilidades de: 0. en la que puede ganar de 5. La esperanza matemática. ¿Cuál sería el precio justo a pagar por la papeleta? . Calcular las siguientes probabilidades: p (X < 4.75.1 Calcular. 6-Un jugador lanza un dado corriente.1 0. Determinar la función de probabilidad y la esperanza matemática del juego. la varianza y la desviación típica. Se define la variable aleatoria X como la suma de las puntuaciones obtenidas.4 0. pero si no sale número primo. representar gráficamente la función de distribución. Gana 1 ó 2 € si aparecen una o dos caras. Por otra parte pierde 5 € si no aparece cara. Hallar la función de probabilidad. 5-Se lanza un par de dados. calcular: 1. Determinar la esperanza matemática del juego y si éste es favorable.1 0.5) p (X ≥ 3) p (3 ≤ X < 4. 2.EJERCICIOS: 1-Dada la experiencia aleatora de anotar las puntuaciones obtenidas al lanzar un dado. 4-Un jugador lanza dos monedas. la varianza y la desviación típica. 2. 3.7 y p(X ≥ 2) = 0. 7-Si una persona compra una papeleta en una rifa. la esperanza matemática y la varianza. La función de probabilidad y su representación.

15)10(0. esta última con un alto grado de aceptación si se toma en cuenta que disminuye considerablemente las posibilidades hasta un nivel mínimo ya que somete a todas las antiguas reglas a una simple ley de relatividad. Para aplicar la regla de Laplace es necesario que los experimentos den lugar a sucesos equiprobables.. Siendo: P(A) = probabilidad de ocurrencia del evento A. como la teoría Dempster-Shafer y la teoría de la relatividad numérica.[cita requerida] La probabilidad de un evento se denota con la letra p y se expresa en términos de una fracción y no en porcentajes. Existen diversas formas como método abstracto.+ P(x = n) .+ P(x = m) P(x ≥ m) = P(x = m) + P(x = m+1) + P(x = m+2) +. es decir.... es decir.15. Ejemplo.85)5 = 7. Por otra parte. la matemática. En tal caso debemos tomar en cuenta que: P(x < m) = P(x = 0) + P(x = 1) + P(x = 2) + P(x = 3) +. que todos tengan o posean la misma probabilidad. La teoría de la probabilidad se usa extensamente en áreas como la estadística.PROBABILIDADES La probabilidad es la medida cuantitativa por medio de la cual se obtiene la frecuencia de un suceso determinado mediante la realización de un experimento aleatorio.. Regla de la adición La regla de la adición o regla de la suma establece que la probabilidad de ocurrencia de cualquier evento en particular es igual a la suma de las probabilidades individuales. bajo condiciones suficientemente estables.. del que se conocen todos los resultados posibles.+ P(x = m − 1) P(x > m) = P(x = m+ 1) + P(x = m+ 2) + P(x = m+3) +. P(A o B) = P(A) U P(B) = P(A) + P(B) si A y B son mutuamente excluyente.. P(A) = 1. que dos no pueden ocurrir al mismo tiempo. P(A o B) = P(A) + P(B) − P(A y B) si A y B son no ex cluyentes..68 * 10−6 Generalmente existe un interés en la probabilidad acumulada de "m o más " éxitos o "m o menos" éxitos en n ensayos.. Si en un semestre intensivo se inscriben 15 alumnos ¿Cuál es la probabilidad de que aprueben 10 de ellos? P(x = 10) = 15C10 (0. La probabilidad de que un alumno apruebe la asignatura Cálculo de Probabilidades es de 0.. es decir. La probabilidad de ocurrencia de un suceso seguro es 1. P(A y B) = probabilidad de ocurrencia simultanea de los eventos A y B.15)10(0. Regla de la multiplicación La regla de la multiplicación establece que la probabilidad de ocurrencia de dos o más eventos estadísticamente independientes es igual al producto de sus probabilidades individuales. la física. la regla de la multiplicación y la distribución binomial.. si es que los eventos son mutuamente excluyentes. P(A y B) = P(A B) = P(A)P(B|A) si A y B son dependientes Regla de Laplace La regla de Laplace establece que: La probabilidad de ocurrencia de un suceso imposible es 0. las ciencias y la filosofía para sacar conclusiones sobre la probabilidad discreta de sucesos potenciales y la mecánica subyacente discreta de sistemas complejos. La probabilidad constituye un importante parámetro en la determinación de las diversas casualidades obtenidas tras una serie de eventos esperados dentro de un rango estadístico. P(B) = probabilidad de ocurrencia del evento B.85)5 = 10!/(10!(15−10)!)(0..+ P(x = n) P(x ≤ m) = P(x = 0) + P(x = 1) + P(x = 2) + P(x = 3) +. la probabilidad de que un evento "no ocurra" equivale a 1 menos el valor de p y se denota con la letra q: Los tres métodos para calcular las probabilidades son la regla de la adición. por lo que el valor de p cae entre 0 y 1. P(A y B) = P(A B) = P(A)P(B) si A y B son independientes.

con un águila en una cara y un sol en la otra. Hay dos casos posibles (n) de ocurrencia (o cae águila o cae sol) y sólo un caso favorable (f) de que pueda caer águila (pues sólo hay un águila en la moneda).Por lo tanto: b) b) Probabilidad de que al lanzar un dado salga un número par: en este caso los casos favorables (f) son tres (que salga el dos. frente a los 100. el número que jugamos.EJEMPLOS: a) Probabilidad de que al lanzar un dado salga el número 2: el caso favorable (f) es tan sólo uno (que salga el dos). Por lo tanto: e) Probabilidad al lanzar una moneda.000 números nos: tan sólo un caso favorable (f). mientras que los casos posibles (n) son seis (puede salir cualquier número del uno al seis).000 casos posibles (n). mientras que los casos posibles (n) siguen siendo seis. Por lo tanto: c) c) Probabilidad de que al lanzar un dado salga un número menor que 5: en este caso tenemos cuatro casos favorables (f) (que salga el uno. el tres o el cuatro). Por lo tanto: . Por lo tanto: d) Probabilidad de ganarse el premio mayor de una lotería en la que juegan 100. el dos. frente a los seis casos posibles. el cuatro o el seis).

14). entonces consideramos que las medidas contradicen la teoría. . De hecho.La desviación estándar (DS/DE). Interpretación y aplicación: La desviación estándar es una medida del grado de dispersión de los datos con respecto al valor promedio. 8) cada una tiene una media de 7. Aunque esta fórmula es correcta. en la práctica interesa realizar inferencias poblacionales. Sus desviaciones estándar muestrales son 7. 8. las tres muestras (0. con objeto de tener una visión de los mismos más acorde con la realidad al momento de describirlos e interpretarlos para la toma de decisiones. 0. de gran utilidad en la estadística descriptiva. Para conocer con detalle un conjunto de datos. 6. Junto con este valor. la desviación estándar es simplemente el "promedio" o variación esperada con respecto a la media aritmética. La tercera muestra tiene una desviación mucho menor que las otras dos porque sus valores están más cerca de 7. Desglose. 8. es una medida de dispersión usada en estadística que nos dice cuánto tienden a alejarse los valores concretos del promedio en una distribución. muestra la agrupación de los datos alrededor de un valor central (la media o promedio). Dicho de otra manera. 6.. La desviación estándar es uno de tres parámetros de ubicación central. la desviación típica es una medida (cuadrática) que informa de la media de distancias que tienen los datos respecto de su media aritmética. También hay otra función más sencilla de realizar y con menos riesgo de tener equivocaciones: . específicamente.Es posible calcular la desviación estándar de una variable aleatoria continua como la raíz cuadrada de la integral Donde: La DS es la raíz cuadrada de la varianza de la distribución de probabilidad discreta Así la varianza es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética de la distribución. Se suele representar por una S o con la letra sigma. Cuando los casos tomados son iguales al total de la población se aplica la fórmula de desviación estándar poblacional. la desviación estándar de esas medidas es de vital importancia: si la media de las medidas está demasiado alejada de la predicción (con la distancia medida en desviaciones estándar). La desviación estándar puede ser interpretada como una medida de incertidumbre. por lo que en el denominador en vez de n. 14) y (6. la desviación estándar es "el promedio del cuadrado de la distancia de cada punto respecto del promedio". sino que necesitamos conocer también la desviación que presentan los datos en su distribución respecto de la media aritmética de dicha distribución. expresada en las mismas unidades que la variable. Esta medida es más estable que el recorrido y toma en consideración el valor de cada dato. (0.. 14. Distribución de probabilidad. Puesto que la media de la muestra es una combinación lineal de los datos.DESVIACIÓN ESTÁNDAR La desviación estándar o desviación típica (denotada con el símbolo σ o s. en lugar de la media de la población.en este caso una. también llamada desviación típica. ya que las mediciones caen fuera del rango de valores en el cual sería razonable esperar que ocurrieran si el modelo teórico fuera correcto. no basta con conocer las medidas de tendencia central. Esto es coherente. La desviación estándar de un grupo repetido de medidas nos da la precisión de éstas. Por ejemplo. el residual a la muestra media se extiende más allá del número de grados de libertad por el número de ecuaciones de restricción . Se define como la raíz cuadrada de la varianza. 5 y 1 respectivamente. Cuando se va a determinar si un grupo de medidas está de acuerdo con el modelo teórico. La desviación estándar de un conjunto de datos es una medida de cuánto se desvían los datos de su media. Dado esto a la muestra así obtenida de una muestra sin el total de la población se le aplica esta corrección con la fórmula desviación estándar muestral. dependiendo de la procedencia del conjunto de datos) es una medida de centralización o dispersión para variables de razón (ratio o cociente) y de intervalo. se usa n-1 (Corrección de Bessel) Esta ocurre cuando la media de muestra se utiliza para centrar los datos.

33 Éste es el valor de la desviación estándar.1) Sustituyendo por 6.( 6 . Calcular la desviación estándar : Sustituyendo N . . N = 6 porque hay seis datos: 2. En este caso. Calcular el promedio o media aritmética .1 por 5.EJEMPLO: 1.