You are on page 1of 86

Curso de Estadística Básica

Ingeniería Industrial
11/07/2011 Instituto Tecnológico Superior de Tierra Blanca I.I VIRIDIANA SÁNCHEZ VÁZQUEZ

Curso de Estadística Básica ESTRUCTURA DEL CURSO

• Conceptos basicos • Distribución de frecuencias

• Pruebas de hipótesis • Regresión Lineal

Día 1

Día 2

• ANOVA • Diseño de Experimentos

D ía 3
Instituto Tecnológico Superior de Tierra Blanca Página 2

Tema 1: Introducción a la Estadística Una meta común e importante de la materia de estadística es la siguiente: aprender acerca de un grupo grande examinando los datos de algunos de sus miembros. En dicho contexto los términos muestra y población adquieren importancia. Las definiciones formales de estos y otros términos básicos se muestran a continuación Datos: son las observaciones recolectadas (como mediciones, géneros, respuestas de encuestas). Estadística: es un conjunto de todo el plan de estudios experimentos, obtener datos y luego organizado, resumió, presentar, analizar, interpretar y llegar a conclusiones basadas en datos. Población: es el conjunto completo de todos los elementos (puntuaciones, personas, medidas, etc.) Que se va a estudiar. El conjunto es completo porque incluye a todos los objetos que se estuvieran. Censo: es el conjunto de datos de cada uno de los miembros de la población. Muestra: es un conjunto de miembros seleccionados de una población. • • Los datos muestran les deben reunirse de una forma adecuada, como a través de un proceso de selección aleatoria. Si los datos muestran les no se reúnan de la forma apropiada, resultaron tan inútiles que ninguna cantidad de estadística podrá salvarnos.

Estadística Descriptiva. Es la parte de la Estadística dedicada a colectar, organizar, resumir, presentar y analizar datos. Estadística Inferencial. Es la parte de la Estadística dedicada a generar conclusiones válidas acerca de las características de “la fuente” de donde fueron obtenidos los datos. Muestra Aleatoria. Es una muestra obtenida de la población de tal manera que todas las posibles Muestras de igual número de observaciones tienen la misma probabilidad de ser seleccionada. En otras palabras, en una muestra aleatoria solo el azar es “quien decide” que elementos están en la muestra, se debe evitar cualquier procedimiento que involucre la participación del investigador ya que inconscientemente se podría sesgar el muestreo y se no representativo de la población. Se dice que una muestra aleatoria es representativa de la población cuando tiene las mismas características de la población, y el muestreo aleatorio es la manera con mayores posibilidades de obtener una muestra representativa.

TIPOS DE DATOS Concepto clave en la materia de estadística se trata totalmente de utilizar datos muestrales para ser inferencias se (o generalizaciones) sobre una población completa. Debemos saber y entender las definiciones de población, muestra, parámetro y estadístico, ya que son básicas y fundamentales. También necesitamos reconocer la diferencia entre datos cuantitativos y datos cualitativos. Tenemos que entender que algunos números, como los códigos postales, no son cantidades en el sentido de que realmente mide no cuenten algo. Los códigos postales son. En realidad, ubicaciones geográficas, por lo que no tiene sentido hacer cálculos con ellos, como calcular su promedio. En esta sección se describen distintos aspectos de la naturaleza de los datos muestran les, los cuales pueden afectar de manera importante los métodos estadísticos que se utilicen con ellos. Definiciones Parámetro es una medición numérica que escribe algunas características de una población. Estadístico es una medición numérica que describe algunas características de una muestra. Los datos cuantitativos consisten en números que representan conteos con mediciones. Los datos cualitativos (o categóricos poder atributo) se dividen en diferentes categorías que se distinguen por algunas características no numéricas. Los datos discretos resultan cuando el número de valores posibles en un número finito un número que “puede contarse” (es decir, el número de valores posibles es 0,1, 2, etcétera). Uno los datos continuos (numéricos) resultan de un infinito de posibles valores que corresponden a alguna escala continua que cubre un rango de valores sin huecos, interrupciones o asaltos. Niveles de medición El nivel de medición nominal se caracteriza por datos que consiste en exclusiva mente en nombres, etiquetas o categorías. Los datos no se pueden acomodar en un esquema de orden (como demás bajo al más alto). Ejemplos veamos algunos ejemplos de datos muestrales a nivel de medición nominal. 1. Sí/no/indeciso: respuesta es decir, no e indeciso en una encuesta. 2. Colores: los colores de los automóviles conducidos por estudiantes universitarios (rojo, negro, azul, blanco, magenta, púrpura, etcétera)

B. los datos en este nivel no tienen punto de partida cero natural inherente (donde nada de la cantidad está presente). Utilizando los rangos de la revista. una revista ordena las ciudades de acuerdo a su “ habitabilidad”. Por ejemplo. aunque no es posible determinar diferencias entre tales calificaciones. Ejemplos veamos algunos ejemplos de datos muéstrales a nivel de medición ordinal. etcétera) determinan un orden. no existe un punto de inicio natural.4°F. 1.2 °F y 98. pero con la propiedad adicional de que la diferencia entre los valores de datos cualesquiera tiene un significado. Tales calificaciones se pueden ordenar. D. sería incorrecto decir que 50°F es dos veces más caliente que 25°F. Los datos están en el nivel de medición ordinal cuando pueden acomodarse en algún orden. Sin embargo. Rangos: con base en varios criterios. pero estos números no tienen un significado computacional real y cualquier promedio que se calcule carece de sentido. Por lo General. no se deben utilizar para hacer cálculos. Por ejemplo. aunque no es posible determinar diferencias entre los valores de los datos con tales diferencias carecen de significado. En ocasiones se asigna números a las distintas categorías (especialmente cuando los datos e codifican para utilizarse en computadoras). las diferencias entre los rangos no tiene ningún significado. sabemos que A es mayor que B (por lo que hay un orden). Pareciera que el Valor de 0 °F no es un punto de partida cero natural. Sin embargo. Dichos valores están ordenados. no podemos restar B de A (por lo que no se puede calcular las diferencias) 2. pero esta diferencia de 1 no tiene significado porque no es una cantidad exacta que sea comparable con otras diferencias de este tipo. Los datos ordinales proporcionen información sobre comparaciones relativas pero no las magnitudes de las diferencias. y podemos determinar su diferencia de 0. los datos son ordinales no deben utilizarse para hacer cálculos como promedios. Ejemplos los siguientes ejemplos ilustran el nivel de medición de intervalo. C. la diferencia entre la ciudad de nueva York y Boston no se puede comparar de forma cuantitativa con la diferencia entre San Luis y Filadelfia. Dicho rangos (primero. Las calificaciones de un curso: un Profesor universitario asigna calificaciones de A. La diferencia entre la primera y la segunda ciudades no es la misma que la diferencia entre la segunda y la tercera ciudades. Sin embargo.Puesto que los datos nominales carecen de orden y no tienen un significado numérico. El nivel de medición de intervalo se parece al nivel ordinal. 1. . aunque en ocasiones esta norma se infringe (como sucede cuando utilizamos calificaciones con letras para calcular una calificación promedio). Temperaturas: las temperaturas corporales de 98. D o F. segundo. tercero.6° F son ejemplos de datos a nivel de medición intervalo. la diferencia “del segundo menos el primero” sugeriría 2-1 = 1.

1776 y 1492. 2008. tanto las diferencias como las proporciones tienen significado. Precios: los precios de libros de texto universitarios ($0 realmente representa ningún costo y un libro de $90 es tres veces más caro que un libro de $30). Para valores a este nivel. participantes: 1 Córdoba 1 Orizaba 1 Puebla Las categorías están ordenadas pero no hay diferencias o carecen de significado. por lo que el año cero es arbitrario y no constituye un punto de partida cero natural que represente “la ausencia de tiempo”). Este nivel de medición se denomina de razón porque el punto de partida cero hace que las razones poco sientes tengan significado. Nivel Nominal Resumen Ejemplo de Solo categorías. Ejemplos los siguientes ejemplos de datos al nivel de medición de razón. 1. Esos: los presos (en quilates) de anillos de compromiso de diamante (el cero realmente representa la ausencia de 4 quilates que es dos veces el peso de 2 quilates). mientras que las temperaturas faringe y están en el nivel de intervalo. Sugerencia: para simplificar esta diferencia. los presos están en el nivel de razón. Entre los cuatro niveles de medición. Observé la presencia de un Valor ser natural. los datos no pueden acomodarse Origen en un esquema de orden. pero con la propiedad adicional de que sí tiene un punto de partida cero natural (donde el cero indica que nada de la cantidad está presente). Ordinal De intervalo Automóviles de los participantes: 3 medianos 2 compactos Las diferencias tienen un significado pero no hay Temperaturas de Tierra punto de partida cero natural y los cocientes no Blanca: tienen significado 20 ºC 40 ºC 50 ºC . En nivel de medición de razón es similar a nivel de intervalo. (El tiempo no inician en el año cero. estudie la siguiente tabla que señala las diferencias entre los cuatro niveles de medición. así como el uso de proporciones que significan “dos veces” y “tres veces”. Para una comparación y un repaso concisos. la principal dificultad surge del distinguir entre los niveles de intervalo y de razón.2. 2. Puesto que un preso de 200 libras estos meses más pesado que un peso de sien libras pero 50°F no es dos veces más caliente que 25°F. Daños: los años 1000. utilice una sencilla “prueba razón”: considere dos cantidades en las cuales un número es dos veces en otro y pregunté seis y “dos veces” sirve para describir correctamente las cantidades.

Variable Tipo X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 Escriba la respuesta que considere correcta Si un experimento produce datos que son de naturaleza continua. determine cuales son variables cualitativas y cuales son cuantitativas.. 3. 2.58 (según los datos de la oficina censal mexicana) R= . 5 Km 10 Km 220 Km EJERCICIOS: Consulte el conjunto de datos de la OECD que da información sobre censos.De razón Hay un punto de partida cero natural y los cocientes tienen significado. datos económicos y comerciales de 29 países. R= . Distancia de traslado de los participantes. de acuerdo a las variables presentadas en la tabla. R= .. Determine si el valor dado es un estadístico o un parámetro 1. se encontró que 706 sobrevivieron cuando se hundió.Se selecciona una muestra de hogares y la media de personas por familia es de 2..En un estudio de los 2223 pasajeros del Titanic. .En la actualidad el 42% de los gobernadores de las 50 entidades de Estados Unidos son demócratas. ¿los datos también pueden ser cuantitativos o pueden ser cualitativos? .

Calificaciones de los participantes al curso de estadística. porque continúa siendo más barato que comprar los CD.Los números de seguridad social R= . R= Pensamiento Crítico Esta sección está diseñada para ilustrar la forma en que se utiliza el sentido común cuando pensamos críticamente acerca de datos y estadísticos.La distancia que recorren los estudiantes para llegar a la escuela R= 5. Número de estudiantes matriculados en el ITSTB. por lo que . en cada momento. . que se sentirían más cómodos utilizándolo por una cuota. a los lectores se les planteó la siguiente pregunta: “¿continuará utilizando Napster si tuviera que pagar una cuota?” los lectores podían registrar sus respuestas en el sitio web Newsweek. Otro 5% dijo que sí..Velocidad de un coche (km/h) R= . como cuando se utiliza una muestra de respuestas voluntarias (que se define más adelante en esta sección). 1. . hay que enfocarse en el pensamiento y el uso del sentido común al analizar datos. . Es importante saber que cuando los datos muéstrales se reúnen de manera inapropiada.Los números en las camisetas de los corredores de maratones R= 2. R= . Cuando Newsweek o alguien más hace una encuesta por internet.Las calificaciones que da la revista del consumidor recomendado. R= Determine cuál de los cuatro niveles de medición es el más apropiado. Cantidad de horas de estudio por semana de los estudiantes. 2. La siguiente definición se refiere a uno de los usos incorrectos de la estadística más comunes y graves. De las 1873 respuestas recibidas. R= 6.. MSNDC. de “la mejor compra.. COM. que estuvo permitiendo el libre acceso a la copia de CD musicales. . Por ejemplo. R= 3. el 19% dijo que sí. . la revista Newsweek hizo una encuesta sobre el controvertido sitio web Napster. no recomendado”. . 4. Una muestra de respuesta voluntaria (o muestra auto seleccionada) es aquella en que los propios sujetos deciden ser incluidos.Número de billetes de $20 en circulación en México. 3... ningún método estadístico es capaz de producir resultados válidos.. En esta sección. en vez de memorizar métodos o procedimientos específicos. los propios individuos deciden participar.Determine si los valores dados provienen de un conjunto de datos discretos o continuos 1.

el 67% fueron suspendidos al menos 3 veces. un como las de barras y las de pastel (circulares). Las dos gráficas de la figura que se muestra abajo. Encuestas telefónicas. para no engañarnos por su forma General. se muestra se décadas como éstas: • • • Encuestas por internet. tienen graves errores y no deberíamos obtener conclusiones sobre una población.constituye una muestra de respuesta voluntaria. . Desde un punto de vista estadístico. donde se reporto que. donde los sujetos deciden si responden o no. por su naturaleza. aunque una práctica común consiste en afirmar o sacar conclusiones incorrectas sobre una población más grande. Sin embargo. ¡Pero esta cifra está basada en una muestra de tan sólo tres estudiantes! Los informes en los medios de comunicación no mencionaron que el tamaño de la muestra era muy pequeño. S. de radio o de periódicos le piden que llame voluntariamente a un número especial para registrar su opinión. su estado vecino. por lo que su respuesta no son representativas de toda la población. el Children´s Defence Fund público Children Out of School in America. BUREAU OF ECONOMIC ANALYSIS. las personas con opiniones extremas son más proclives a participar. Con este tipo de muestras de respuesta voluntaria sólo se logran conclusiones válidas sobre el grupo de gente específico que decidió participar. (En el capítulo dos analizaremos diferentes tipos de gráficas). A continuación se presentan algunos ejemplos de muestras de respuesta voluntaria que. se pueden utilizar para exagerar O subestimar a la verdadera naturaleza de los datos. una muestra de este tipo es defectuosa y no debe usarse para hacer afirmaciones generales sobre una población más grande. donde anuncios televisivos. Como ejemplo. de los estudiantes de secundaria suspendidos en una region. Encuestas por correo. provocando que los lectores crean de manera incorrecta que la diferencia es mucho mayor de lo que realmente es. la gráfica del inciso B) tiende a producir una impresión subjetiva engañosa. Muestras pequeñas Las conclusiones no se deben basar en muestras demasiado pequeñas. Gráficas Las gráficas. La figura enseña una lección importante: para interpretar de manera correcta una gráfica. Como el eje vertical no inicia en cero. describe los mismos datos obtenidos de u. tenemos que analizar la información numérica que va presentar. aunque en el inciso B) está diseñado para exagerar la diferencia entre el ingreso personal per cápita en California y nevada. donde los sujetos decía si responden o no.

en los que cada dimensión está dibujado en proporción a las cantidades reales vea como la figura B) exagera mucho la diferencia al crear la falsa impresión de que el consumo de petróleo en estados unidos es aproximadamente 50 veces mayor que en el de Japón. sino que aumenta en un factor de ocho. Sin embargo.Pictogramas los dibujos de objetos. Si usted duplica cada lado de un cuadrado. el área no tan sólo se duplica. Al dibujar este tipo de objetos artistas podrían crear falsas impresiones que distorsionan las diferencias. como las bolsas de dinero. también suelen ser confusos. Si usted duplica cada lado de un cubo. el volumen no solamente se duplica. Algunos objetos que se utilizan comúnmente para describir datos son los objetos tridimensionales. el inciso b) de la figura se dibujó con barriles. sino comenta en un factor de cuatro. Vea la figura donde el inciso a) está dibujado para describir correctamente la relación entre el consumo diario de petróleo en estados unidos y Japón. En la figura a) parece que estados unidos consume aproximadamente cuatro veces un más petróleo que Japón. Instituto Tecnológico Superior de Tierra Blanca Página 10 . barriles (para la producción de petróleo) y casas (para la construcción de viviendas). sacó de monedas y tanques del ejército (para gastos militares). llamados pictogramas.

el 24 % culpo al tránsito y el 57% culpó a la industria. como los individuos con bajos ingresos que son menos proclives a reportar cuánto dinero gana. Observe las tasas reales de la respuesta “sea” para las diferentes formas de redacción de una pregunta: 97% sí: “¿debería el Presidente utilizar su poder de veto para eliminar los desperdicios?” 57 % sí: “ ¿debería el Presidente utilizar su poder de veto uno?” Orden de las preguntas En ocasiones las preguntas de una encuesta se sesgan de manera no intencional debido a factores como el orden de los reactivos que se someten a consideración. la está tomando toda. continental Airlines publicó anuncios que afirmaban que se trataba de una haría que “mejoraron un 100% durante los últimos seis meses”. Al referirse la pérdida de equipaje. algunos datos faltan debido a factores especiales. en parte debido a que muchos televendedores persistentes tratan de vender bienes o servicios. En un editorial el que criticaba de estadística. Cuando se plantean preguntas de crecido en los últimos años. A veces faltan datos muéstrales por el azar. Instituto Tecnológico Superior de Tierra Blanca Página 11 . y el 27% a la industria. el 45% culpo a este factor. cuando la industria se presentó primero. Falta de respuesta Existe una falta de respuesta cuando alguien se rehúsa a responder una pregunta de encuesta o cuando la persona no está disponible. Si usted toma el 100% de alguna cantidad. Preguntas predispuestas hay muchos aspectos que afectan las preguntas de encuestas. iniciando con un argumento de venta similar a un encuesta de opinión.Porcentajes En ocasiones utilizan porcentajes confusos o poco claros. (No se requiere del 110 % de esfuerzo para entender esta afirmación). lo cual implica que la posibilidad de que falte un dato no tiene ninguna relación con sus valores u otros valores. el new York times interpretado correctamente que la cifra de mejora de un 100% significa que ya no se pierde el equipaje: un logro que todavía no disfruta continental Airlines. Estas pueden estar “cargadas” o redactadas intencionalmente para obtenerlas respuesta deseada. Datos faltantes En ocasiones los resultados se ven muy afectados por datos faltantes. Observé estas preguntas de una encuesta aplicada en Alemania: • • ¿Cree usted que el tránsito vehicular contribuye a la contaminación del aire más o menos que la industria? ¿Cree usted que leyendo se contribuye la contaminación del aire más o menos que el tránsito vehicular? Cuando se presentó primero el tránsito. Sin embargo.

vendidos en este país en los últimos diez años. Imágenes parciales (el 90 % de todos nuestros automóviles. ni que la riqueza de una persona afecta directamente su puntuación de CI. La afirmación era técnicamente correcta. Si encontramos una correlación entre la riqueza y el CI. En este caso. Cuando Hertz solicitó información detallada sobre la encuesta. aunque muy engañosa pues no presentaba los resultados completos. En los medios de comunicación masiva son muy comunes los reportes de una correlación recién encontrada con una redacción que indicado implica directamente que una de las variables de causa de la otra. como no Journal of the American Medical Association. no podemos concluir que el coeficiente intelectual de una persona afecta directamente su riqueza. continúa circulando”. un Cynthia Crossen cita un ejemplo de la revista corporate travel que publicó resultados que mostraban que. no podemos de concluir que una de las variables ser causa de (o lo que afecta directamente a) la otra variable. Por ejemplo. Debemos ser muy cautos con encuestas como éstas.Correlación y casualidad correlación no implica causalidad. encargó un estudio que dio como resultado la siguiente aseveración impresa en algunos periódicos: “ de acuerdo con la encuesta nacional de 250 empleadores profesionales. entre las compañías de renta de automóviles. Instituto Tecnológico Superior de Tierra Blanca Página 12 . Estudios para el propio beneficio En ocasiones los estudios reciben el patrocinio de grupos con intereses específicos que buscan promover. un fabricante de los lustrador para calzado. Distorsiones deliberadas en el libro Tainted Truth. Harris fue la ganadora en una encuesta realizada a las personas que utilizan dicho servicio. mucha gente considera erróneamente que también es exacta. Puesto que estas cifras muy precisa. Números precisos “en la actualidad hay 103. 027 hogares en estados unidos”. el número de subestimado y sería mejor decir que el número de hogares es aproximadamente de 103 millones. Millones de consumidores escucharon ese mensaje comercial y no se dieron cuenta de que el 90 % de los automóviles que el anunciante vendió en este país se vendieron durante los últimos tres años por lo que la mayoría de esos automóviles que circulaban estaban casi nuevos. donde el patrocinador puede obtener ganancias monetarias con base en los resultados. En los últimos años ha aumentado la preocupación por la práctica de las empresas farmacéuticas financiera médicos que realizan experimentos clínicos y reportan sus resultados en revistas de prestigio. la razón más común por la que un solicitante de empleo no logró dar una buena impresión fue por llevar los zapatos desaseados”. la respuesta originales desaparecieron y el coordinador de encuesta de la revista anuncio. Esto significa que cuando encontramos una asociación estadística entre dos variables.215. kiwi brands.

¿Qué es incorrecto en este estudio? Instituto Tecnológico Superior de Tierra Blanca Página 13 . . la empresa de dulces. un investigador concluye que el estudio provoca que la gente viva más tiempo. Varios estudios. reportados en el Journal Nutrition revelaron que. el chocolate ocupa el lugar que merece en la pirámide alimenticia. antioxidantes asociados con la disminución del riesgo de enfermedades cardiacas y embolias. Un estudio reveló que en la ciudad de Tierra Blanca se expiden mas multas por exceso de velocidad a los individuos de nivel económico más bajo que a las personas que cuentan con alguna empresa o microempresa. las frutas. y la chocolate manufactures Association financiaron gran parte de la investigación”. . los sujetos a prueba incrementaron los niveles de antioxidantes en su sangre. después de comer chocolates. junto a sus vecinos de clase alta: el vino tinto. Con base en un estudio que revela que las personas que se gradúan de la universidad viven más tiempo que quienes no lo hacen. Utilice el pensamiento crítico para indicar lo que se pide El New York Times publico un articulo que incluía la siguiente afirmación: “porfin. Inc. Por lo tanto se cree que los individuos de recursos bajos exceden la velocidad límite más que las personas con un nivel económico de alto.. .EJERCICIOS En los siguientes ejercicios utilice el pensamiento crítico para elaborar una alternativa Considere un informe de los medios de comunicación masiva de que los automóviles BMW causan que las personas estén saludables. los vegetales y el té verde. Mars. ya que se ha descubierto que los individuos que conducen automóviles BMW están más saludables que quienes no lo hacen. El chocolate contiene flavonoides.

El senado de la republica entró en audiencia para considerar una ley que obligaba a los motociclistas a usar cascos. 4. Centro: Valor promedio o representativos que indica la localización de la mitad el conjunto de los datos. “Cuidado con los Virus que Destruyen el Valioso Trabajo” Instituto Tecnológico Superior de Tierra Blanca Página 14 . Característica importante de los datos 1. 3. exploran y comparan conjuntos de datos.. cuando se describen. uniforme o sesgada). en el sentido de que puedan aplicarse a la población general de todas las mujeres? ¿Por qué? . Algunos motociclistas testificaron que habían participado en choques donde los cascos resultaron inútiles. las siguientes características suelen ser sumamente importantes. ESTADÍSTICA DESCRIPTIVA Cuando se describen. ¿Qué grupo importante no fue capaz de testificar? . basó sus conclusiones en las 4500 respuestas que recibió después de enviar por correo 100 000 cuestionarios a diversos grupos de mujeres. Distribución: la naturaleza o forma de la distribución de los datos (como en forma de campana. Variación: medida de la cantidad en que los valores de los datos varían entre sí. Tiempo: características cambiantes de los datos a través del tiempo. 2. Valores extremos: valores muéstrales que están muy alejados de la vasta mayoría de los demás valores de la muestra. Cuando la autora Shere Hite escribió la Mujer y el amor: Una revolución cultural en progreso. exploran y comparan conjunto de datos. 5. ¿Es probable que sus conclusiones sean validas.

19. Frecuencia acumulada relativa de una clase. 21. se recomiendan de 5 a 20 clases. 20. Número de clases. Ejercicio 1. 22. Es su frecuencia acumulada absoluta dividida entre n. 25. 23. 22. 20. Sea n el tamaño o número de observaciones en la muestra. Los datos se agrupan en clases o intervalos de clase. 18. 17. 21. Tenemos que √50= 7. 22. Longitud de los intervalos de clase. Es el número de observaciones contenidas en dicha clase. que básicamente es un agrupamiento de datos en grupos pequeños llamados intervalos de clase o clases. Se hará una tabla de frecuencias. 21. 18. 20. 23. 21. 20. 20. ahora de deben organizar de una manera conveniente para que el investigador pueda percibir rápidamente el comportamiento de la distribución de los datos. 18. Tablas de Frecuencias. 21. 21. Hay otros criterios pero usaremos este que es muy sencillo. 20.071 que redondeando a entero nos da 7. luego usaremos 7 clases. 20. Frecuencia acumulada absoluta de una clase. La tabla de frecuencias se hace con datos que son números reales correspondientes a una variable continua. Frecuencia relativa absoluta de una clase. Frecuencia absoluta de una clase. También se recomiendan un mínimo de 5 clases y un máximo de 20 clases y evitar si son posibles las clases vacías. Luego el número de clases se puede determinar como √ . 21. 21. 19. Para esto se debe hacer una tabla de frecuencias. Ahora para obtener la longitud de clase. 16. 19. 22. 22. 15. 21. 19.2 Lo siguiente son horas por semana dedicadas a ver TV de una muestra de 50 estudiantes. 15. 22. primero debemos definir el número de clases. 21. Es su frecuencia absoluta dividida entre n. 18. El número de observaciones menores al límite superior de la clase. 24. 23. 18.Distribución de frecuencias Cuando ya se tienen los datos de la muestra. 15. Sea MAX la mayor observación de la muestra y sea MIN la menor observación de la muestra. 18. Luego. luego se cuenta el número de observaciones que “caen” en cada clase. 20. 22. 20. 23. 19. 15. 22. tenemos que MAX = 25 y MIN = 15 de donde Instituto Tecnológico Superior de Tierra Blanca Página 15 . la longitud de clases es: − ú Lo anterior es considerando que todas las clases tienen la misma longitud.

43 = 16. Otro valor importante es el valor central de cada clase que se llama marca de clase. tal que los límites de la segunda clase son: 16. luego la primera clase tiene una frecuencia absoluta de 5. Observe que la suma de las frecuencias absolutas debe ser igual a n.43.43 y 16. Para la segunda clase solo se tiene al 17 lo cual da una frecuencia absoluta de 1. y así sucesivamente. es decir la cantidad de valores de la muestra ubicados en cada clase. 15.longitud de clase = (25 – 15)/7 = 1. es recomendable redondear la longitud de clase hacia arriba para asegurar que el valor máximo de la muestra se incluya en la última clase. Luego. la primera clase es el intervalo que inicia en el valor mínimo de la muestra que es 15 hasta el valor 15 + 1. Ahora obtenemos la frecuencia absoluta de cada clase.2 muestra los intervalos de clase y sus marcas de clase en las primeras tres columnas. éste se obtiene promediando los límites del intervalo de clase.86.43.43 + 1. Es recomendable que en la tabla de frecuencias se agregue la columna “conteo” en donde se coloca la frecuencia absoluta de clase con la correspondiente cantidad de líneas verticales como se muestra en la tabla 1.3.86)/2= 17. Para la primera clase se tiene que la marca de clase es (15 + 16.43. la razón de esto es que no da una visión anticipada del aspecto del histograma. Para la primera clase se tienen los valores: 15.43 + 17. 15. el límite superior de la primera clase es el límite inferior de la segunda.715. Instituto Tecnológico Superior de Tierra Blanca Página 16 .16.3. es decir el límite inferior de la primera clase es 15 y el límite superior es 16. 15. La tabla 1. Entonces.43 = 17. para la segunda clase se tiene que la marca de clase es (16. etc.145.43)/2 = 15. etc. El resto de las frecuencias absolutas se muestran en la tabla 1.

5 A continuación se presenta la cantidad de minutos que toma viajar desde el hogar al trabajo. EJERCICIOS 1. para un grupo de maestros con automóvil. La longitud de la base es la longitud del intervalo de clase y la altura es la frecuencia de clase. colocando una barra rectangular sobre cada intervalo de clase. Es una gráfica de la tabla de frecuencias. 28 31 25 26 48 21 37 32 41 25 19 31 32 43 26 35 16 42 23 38 23 33 29 28 36 a) ¿Cuántas clases serian recomendables? b) ¿Qué intervalo de clase sugiere? Instituto Tecnológico Superior de Tierra Blanca Página 17 .3 Determinar las frecuencias faltantes en la tabla.Ejercicio 1. Organice los datos en una representación de tallo y hoja. Ejercicio 1.4 La tabla siguiente muestra la cantidad de anuncios en 30 segundos que se transmitieron por radio y fueron adquiridos por cada uno de los 45 miembros de una asociación de agentes de ventas de automóviles. ¿Alrededor de que valores tienden a agruparse el número de anuncios de publicidad? ¿Cuál es el menor número de anuncios adquiridos por un agente de ventas? ¿Cuál es el mayor número de anuncios? (realizarlo mediante el software Minitab) 96 142 132 143 93 94 111 120 88 107 125 103 117 125 104 113 127 155 106 124 95 155 139 138 113 103 134 96 112 119 108 127 97 94 117 89 148 120 118 156 112 136 139 135 125 Representación gráfica de una distribución de frecuencias Histograma.

Es el valor cuya frecuencia acumulada relativa es el 50% (el 2º. Luego. cuartil). Tratan de medir el alejamiento o distanciamiento de los datos. Mientras este valor sea más grande significa que los datos están muy alejados. La media aritmética. Conceptos básicos de las medidas de tendencia central Una medida de tendencia central es un valor que se encuentra en el centro o a la mitad de un conjunto de datos. La otra medida importante de dispersión es la varianza. significa que los datos están muy juntos o compactos. El Rango. Es la suma de los datos dividida entre n. la varianza poblacional y la varianza muestral. Para calcular la mediana. La primera se aplica cuando lo que se tiene es la población (cosa en es poco usual). La Moda.c) ¿Qué valor sugiere como límite inferior de la primera clase? d) Organice los datos en una distribución de frecuencias LI MC LS CONTEO F FR FAA FAR e) Realice el histograma y de una conclusión acerca de la distribución de los datos. Si n es par. primero se ordenan los datos en forma creciente (de menor a mayor). ~ La mediana X . si n es un número impar la mediana es el valor ubicado en el “centro” de los datos. dato mayor – dato menor. Es la diferencia. La varianza muestral se aplica cuando se tiene una muestra aleatoria de la población y con ella se desea estimar la varianza poblacional Instituto Tecnológico Superior de Tierra Blanca Página 18 . La moda es el valor con mayor frecuencia Conceptos básicos de las medidas de dispersión Medidas de dispersión. y mientras esta medida sea menor. pero hay dos tipos de varianza. la mediana se obtiene promediando los dos valores centrales.

Un suceso simple es un resultado o un suceso que ya no puede desglosarse en componentes más simples. tales valores P solo son valores de probabilidad. Concéntrese en desarrollar una intuición para interpretar valores de probabilidad. Se presentarán tres métodos diferentes para calcular valores de probabilidad. contestar una pregunta de opción múltiple en un examen. Es decir. supongan que usted ha creado un procedimiento de selección del genero y afirma que este incrementa en gran medida la probabilidad de que un bebe sea niña. en especial los que son relativamente pequeños. el espacio muestral está formado por todos los resultados que ya no pueden desglosarse más. inclusive. en el sentido de que ocurra en pocas ocasiones. En capítulos posteriores hablaremos de valores específicos llamados “valores P” y veremos que estos tienen un papel suma mente importante en diversos métodos de estadística inferencial. bajo un supuesto dado. Fundamentos Concepto clave: en esta sección se presenta el concepto básico de la probabilidad de un suceso. tal probabilidad es tan bajo que se rechazaría como una explicación razonable. En cambio. Regla el suceso infrecuente para estadística inferencial Si. Aun que existe la probabilidad de que nazcan 98 niñas en 100 nacimientos sin ningún tratamiento especial. Veremos que los valores de probabilidad se expresan en números entre 0 y 1. Esta es precisamente la forma de pensar de los especialistas en estadística: rechazan las explicaciones basadas en probabilidades muy bajas y utilizan la regla del suceso infrecuente para la estadística inferencial. concluimos que el supuesto probablemente es incorrecto. tratamos con procedimiento (como tirar un dado. debemos comprender que una pequeña probabilidad. Sin embargo. Sin embargo. como se describe en esta sección. Instituto Tecnológico Superior de Tierra Blanca Página 19 .Probabilidad La probabilidad conforma los cimientos sobre los cuales se construyen los métodos importantes de la estadística inferencial. El espacio muestral de un procedimiento se compone de todos los sucesos simples posibles. Al considerar la probabilidad. Por ejemplo. Suponga que los resultados de pruebas independientes con 100 parejas demuestran que su procedimiento dio por resultado 98 niñas y solos 2 niños. el objetivo más importante de esta sección consiste en aprender a interpretar valores de probabilidad. como 0. o ser sometió a una prueba de consumo de drogas) que producen resultados. corresponde a un suceso que es infrecuente. se reconocería de manera general que los resultados indican fuertes evidencias para afirmar que la técnica de selección del género es efectiva. la probabilidad de un suceso particular observado es extremadamente pequeña. Como un sencillo ejemplo. Un suceso es cualquier conjunto de resultados o consecuencias de un procedimiento.001.

Solución. Pues que el espacio muestral consiste en suceso que no tienen la misma probabilidad. puede encontrarse en el campo general de la probabilidad real. Instituto Tecnológico Superior de Tierra Blanca Página 20 . El espacio muestral consiste en dos sucesos simples: Miller anota el tiro libre o no lo hace. En cierto momento de su carrera. por lo que no podemos usar el método clásico de la regla 2. empleamos el método clásico (regla 2) para obtener. ¿Qué probabilidad tiene de elegir el genotipo Aa? Solución puesto que el espacio muestral (AA. Reggie Miller. Aa. En este caso todos sabemos que la probabilidad en cuestión es muy.Aa. anote cada genotipo individual en una ficha. no podemos usar el método de frecuencias relativas de la regla 1. basado en nuestro conocimiento general. Calcule la probabilidad que tiene el jugador de basquetbol de la NBA. P(Miller anota un tiro libre) = 5915 = 0.Ejemplo: anotación de un tiro libre. Este estimado subjetivo. aA y aa. de anotar un tiro libre después de recibir una falta. 0.000000000001 (equivalente a una en un billón). P (Aa)=1/4 Ejemplo: choques de meteoritos ¿Cuál es la probabilidad de que su automóvil sea impactado por un meteorito este año? Solución: en ausencia de datos históricos de meteoritos que chocan con automóviles. no podemos utilizar el método clásico (regla 2). si no el método de las frecuencias relativas (regla 1) con sus resultados anteriores. ¿Cuántos intentos son necesarios para obtener un resultado que parezca ser razonablemente preciso? Regla formal de la suma P(A o B)= P(A) + P(B) -P(A y B) Donde P(A y B) denota la probabilidad de que A y B ocurran al mismo tiempo. y obtenemos lo siguiente. anoto 5915 tiros libres entre 6679 tiros (de acuerdo con datos de la NBA). por medio de la cual hacemos un estimado subjetivo. es mejor comprender el espíritu de la regla y utilizar esa compresión de la siguiente forma. La regla formal de la suma se presenta como una formula. como resultado en su ensayo de un procedimiento. pero no son igualmente probables. En general. una tachuela quede con la punta hacia arriba. pero no se recomienda el uso irreflexivo de las formulas.Aa. luego mezcle las cuatro fichas y elija uno al azar. Hay dos posibles resultados (chocar o no chocar). Estimemos que sea.886 6679 Ejemplo: Genotipo como parte de un estudio sobre los genotipos AA. Actividad: Estimar la probabilidad de que cuando se dejen caer. Esto nos deja con la regla 3. digamos.aa) en este caso incluye resultados igualmente posibles. muy pequeña.

calcule la suma del numero de formas en que puede ocurrir el suceso A y el numero de formas en que puede ocurrir el suceso B. Los sucesos A y A debe ser disjuntos. Calcule P(niña). utilice los datos de la siguiente tabla que resume los resultados de 985 muertes de peatones causadas por accidentes. Sucesos complementarios Dijimos que A consiste en todos los resultados en lo que el suceso A no ocurre. cuando nace un bebe. la probabilidad de no tener un niño. existe un término especial para describirlo: Definición Los sucesos A y B son disjuntos (o mutuamente excluyentes) cuando ambos no pueden ocurrir al mismo tiempo. ¿El conductor estaba intoxicado? Si No ¿El peatón estaba intoxicado? Si No 59 79 266 581 Instituto Tecnológico Superior de Tierra Blanca Página 21 . tenemos P (niña) = 1 – P (niño) = 1 – 0. es que puede EJERCICIOS En los ejercicios del 1 al 4. sumando de tal manera que cada resultado se cuente solo una vez. P(A o B) es igual a esa suma. porque es imposible que un suceso y un complemento ocurren al mismo tiempo Regla de los sucesos complementarios P(A) + P(A) = 1 P(A) = 1 – P(A) P(A) = 1 – P(A) Ejemplo: En realidad.488.512 = 0. los sucesos disjuntos no se traslapan).512. es de 0. que es la misma que la de tener una niña.488 Es decir. P(niño) = 0. La principal ventaja de la regla de los sucesos complementarios simplificar mucho ciertos problemas. (Es decir. dividida entre número total de resultados en el espacio muestral.Regla intuitiva de la suma Para obtener P(A o B). Puesto que el traslape de sucesos es un aspecto esencial en la regla de las sumas. Solución: usando la regla de los sucesos complementarios.

la cara representa al as niñas y la cruz a los varones. calcule la probabilidad de que el el peatón no estuviera intoxicado o que el conductor no estuviera intoxicado.…. ¿Por qué? Instituto Tecnológico Superior de Tierra Blanca Página 22 . En el cuadro de dialogo. describa una simulación que de cómo resultado los géneros de 100 bebes recién nacidos.si se elige al azar una de las muertes de peatones. Otra opción es usar una calculadora o computadora para generar aleatoriamente 0 y 1(el 0 representa 1 niño y el 1 representa 1 niña).si se elige al azar una de las muertes de peatones. Ejemplo selección del genero cuando los investigadores médicos prueban técnicas de selección del genero.. El número medio de defectos en los lotes debe ser 10.5. Sin embargo algunos lotes tendrán menos o más de 10 defectos. ¿cree usted que esta estimación es hasta cierto punto exacta?. Introduzca 25 para el numero de renglones guarde los resultados en la columna C1 e ingrese un mínimo de 1 y un máximo de 365. 2. 4. Consideremos el siguiente ejemplo para comprender mejor el uso de la simulación. representan teléfonos celulares sin defectos. Ejercicio: Suponga que un lote consiste en 500 teléfonos celulares y que la tasa general de aparatos defectuosos es del 2%. Realice una simulación generando 500 números. 3.. después seleccione Random Data y después seleccione integer.100.4. la probabilidad al menos 60 niñas entre 100 niños. cada uno de ellos entre 1 y 100. Suponiendo que el nacimiento de un varón o de una niña es igualmente probable.. Los números deben generarse de forma que sean igualmente probables. a) Utilice Minitab o Excel para simular la fabricación de teléfonos celulares y registre el número de defectos en este lote simulado. calcule la probabilidad de que el peatón estuviera intoxicado o que el conductor no estuviera intoxicado.si se elige al azar una de las muertes de peatones. Solución una opción es simplemente lanzar una moneda al aire 100 veces. b) Repita el inciso a para tener un total de 20 lotes simulados c) Utilice los resultados del inciso b) para estimar la probabilidad de que el numero de defectos en un lote sea exactamente 10. necesitan conocer valores de probabilidad de diferentes resultados. Cualquier resultado de 1 y 2 representa un teléfono celular defectuoso en tanto que los resultados de 3. • Minitab: seleccione calc en la barra del menú principal. por ejemplo. Simulación La simulación es un proceso que se comporta de la misma forma que el procedimiento sometido a consideración.. calcule la probabilidad de que el peatón estuviera intoxicado o que el conductor estuviera intoxicado.si se elige al azar una de las muertes de peatones.1. de manera que produce resultados semejantes. calcule la probabilidad de que el conductor estuviera intoxicado o que el peatón no estuviera intoxicado.

.De entre tres hijos todos son niñas. √2 Calcule la probabilidad de cada suceso cuando una pareja tiene tres hijos 1..... 5/3. -1.0123. Al hablar acerca de la probabilidad de que llueva en Tierra Blanca el 28 de julio del próximo año. ya que lloverá o no lloverá.“El pronóstico de mañana indica un 10% de probabilidad de lluvia” 3. b. 358..De entre tres hijos hay exactamente una niña 2.De entre tres hijos hay exactamente hay exactamente dos niñas 3.“Usted tiene la probabilidad de una bola de nieve en el infierno de casarse con mi hija” ¿Cuál de los siguientes valores no puede ser una probabilidad? 0..De los 100 dulces M&M listados estime la probabilidad de obtener un dulce azul al elegir al azar un dulce M&M sencillo.520? ¿Un triunfo como este es infrecuente? . ¿La estimación del inciso a) coincide aproximadamente con esta afirmación o al parecer existe una gran diferencia? Instituto Tecnológico Superior de Tierra Blanca Página 23 .. 0.EJERCICIOS: ¿Qué significan cuando decimos que la probabilidad de ganar el premio mayor de la lotería nacional es 1/20.“como estudio a conciencia y comprendió los conceptos. 2. ¿Este razonamiento es correcto? ¿Por qué? . el reportero de la crónica afirma que la probabilidad es de ½ . a. seguramente aprobara el examen de estadística” 2. 1.The Mars Company afirma que el 24ª % de sus dulces M&M sencillos son azules. 3/5. Exprese el grado indicado de probabilidad como un valor de probabilidad entre 0 y 1 1.

914 0.897 0.908 0.921 0.924 0.978 0.876 0.988 0.92 0.902 0.94 0.871 0.989 0.LISTA DE LOS PESOS DE 100 M&M OLDM&M: Data Set 14 in this book includes recent weights from a sample of M&M plain candies.886 0.96 0.939 1.86 0.897 0.002 0.9 0.976 0.952 0.872 0. RED ORANGE YELLOW BROWN 0.968 0.908 1.861 0.949 0.942 0.888 0.919 0.911 0.914 0.891 0.858 0.92 0.886 0.909 BLUE GREEN 0.898 0.879 0.033 0.912 0.902 0.875 1.89 0.926 0.892 0.856 0.913 0.936 0.898 0.902 0.932 0.897 0.911 0.889 0.933 0.955 0.867 0.906 0.971 0.917 0.936 0.949 0.93 0.908 0.9 0. but this data set includes weights from a sample collected in 1993.898 0.87 0.902 Instituto Tecnológico Superior de Tierra Blanca Página 24 .924 0.87 0.921 0.838 0.904 0.93 0.877 0.924 0.941 0.923 0.911 0.866 0.876 0.92 0.009 0.874 0.879 0.893 0.91 0.909 0.882 0.928 0.983 0.965 0.875 0.934 0.956 0.968 0.93 0.868 0.903 0.

Distribuciones de Probabilidad Discretas Una variable aleatoria es aquella (casi siempre representada por x) que tiene un solo valor numérico determinado por el azar, para cada resultado de un procedimiento. Una distribución de probabilidad es una distribución que indica la probabilidad de cada valor de la variable aleatoria. A menudo se expresa como grafica, tabla o formula. Las distribuciones de probabilidad binomial nos permite enfrentar circunstancias en las que los resultados pertenecen a dos categorías relevantes, tales como aceptable/defectuoso o sobrevivió/murió. En la siguiente definición se plantean otros requisitos. Definición Una distribución de probabilidad binomial resulta de un procedimiento que cumple con todos los siguientes requisitos: 1. El procedimiento tiene un número fijo de ensayos. 2. Los ensayos deben ser independientes. (el resultado de cualquier ensayo individual no afecta las probabilidades de los demás ensayos). 3. Todos los resultados de cada ensayo deben ser clasificados en dos categorías (generalmente llamadas éxito y fracasos). 4. La probabilidad de un éxito permanece igual en todos los ensayos. Ejemplo selección de jueces. En el caso de Castañeda contra partida se señalo que, aunque el 80% de población de un condado en Texas es México – estadounidenses, solo el 39% de quienes fueron llamados para integrar el jurado pertenecían a este grupo, supongamos que necesitamos seleccionar a 12 jueces de una población integrada en un 80% de por México- estadounidenses, y que deseamos calcular la probabilidad de que, de 12 jueces elegidos al azar, exactamente 7 sean México – estadounidenses. a. ¿este proceso dará por resultado una distribución binomial? b. Si este proceso da como resultado una distribución nominal, identifique los valores de n, x, p y q. Solución. a. Este procedimiento satisface los requisitos de una distribución binomial, como se indica a continuación. 1. El número de ensayos (12) es fijo. 2. Los 12 ensayos son independientes. (técnicamente los, 12 ensayos implican una selección sin reemplazo y no son independientes, pero podemos suponer independencia porque estamos seleccionando al azar solo a 12 miembros de una población muy grande. 3. Cada uno de los 12 ensayos tienen dos categorías de resultado posible: el miembro de jurado elegido es México – estadounidenses o no lo es.

Instituto Tecnológico Superior de Tierra Blanca

Página 25

4. Para cada miembro del jurado elegido, la probabilidad de que sea Méxicoestadounidenses es de 0.8 (porque el 80% de la población es Méxicoestadounidense). Esa probabilidad es de 0.8 es la misma para cada uno de los miembros del jurado. b. Una vez concluimos que el procedimiento dado así da por resultado una distribución binomial, ahora procedemos a identificar los valores de n, x. p y q. 1. Con 12 jueces elegidos, tenemos que n=12 2. Buscamos la probabilidad de exactamente 7 México- estadounidenses, entonces x=7. 3. La probabilidad de éxito (elegir a un México- estadounidense) es una selección es 0.8 por lo tanto, p= 0.8. 4. La probabilidad de fracaso (no elegir a un México – estadounidense) se 0.2 por lo tanto, q=0.2. Una vez más, es muy importante asegurarse de que tanto x como p se refieran al mismo concepto de “éxito”. En este ejemplo usamos x para contar el número de México- estadounidense, de manera que p debe ser la probabilidad de un México – estadounidense. Por siguiente por siguiente, x y p si usan aquí el mismo concepto de éxito (México – estadounidense) Distribución de probabilidad de poisson Es una distribución de probabilidad discreta importante, ya que a menudo se utiliza para describir comportamientos que ocurren en raras ocasiones (con probabilidad pequeñas). Debemos conocer los requisitos para el uso de la distribución de poisson y también debemos saber cómo calcular las probabilidades. Definición La distribución de poisson es una distribución de probabilidad discreta que se aplica a las ocurrencias de algún suceso durante un intervalo específico. La variable aleatoria x es el número de veces que ocurre un suceso en un intervalo el intervalo puede ser tiempo, distancia, área, volumen o alguna unidad similar. Requisitos de la distribución de Poisson • • • • La variable aleatoria x es el número de veces que ocurre un suceso durante un intervalo. Las ocurrencias deben ser aleatorias Las ocurrencias deben ser independientes entre si Las ocurrencias deben estar unifórmenle distribuidas dentro del intervalo empleado.

Instituto Tecnológico Superior de Tierra Blanca

Página 26

Distribución normal estándar

1.- presenta forma de campana 2.- posee una media igual a 0 3.- tiene una deviación estándar a 1 Así como existen muchas distribuciones uniformes diferentes (con distintos rangos de valores), también existen muchas distribuciones normales diferentes, las cuales dependen de dos parámetros: la medida poblacional µ y la desviación estándar poblacional σ. Cálculo de probabilidades con puntuaciones z dadas. Si utilizará la tabla A-2, es esencial que comprenda los siguientes puntos: 1.- la tabla A-2 está diseñada únicamente para la distribución normal estándar, que tiene una medida de 0 y una desviación estándar de 1. 2.- la tabla A-2 abarca dos páginas, una para las puntuaciones Z negativas y la otra para las puntuaciones z positivas. 3.- cada valor en la tabla es una área acumulativa desde la izquierda hasta un límite vertical por arriba de la puntuación z especifica. 4.- cuando construya una grafica, evite la confusión entre puntuaciones z y las áreas. Puntuación z: distancia a lo largo de la escala horizontal de la distribución normal estándar, remítase a la columna de la extrema izquierda y el renglón superior de la tabla A-2. Áreas: región bajo la curva, remítase a los valores de la tabla A-2.

Instituto Tecnológico Superior de Tierra Blanca

Página 27

Ejemplo termómetros científicos. La precisión Scientific Instrument Company fabrica termómetros que se suponen deben de dar lecturas 0°C al punto de congelación del agua. Las pruebas de una muestra grande de estos instrumentos revelaron que el punto de congelación del agua, algunos termómetros daban lecturas por debajo de 0° (denotadas con números negativos ), y otras daban lecturas por encima de 0° ( denotados con números positivos). Supóngase que la lectura media es 0°C y que la desviación estándar de las lecturas es 1.00°C. También supóngase que las lecturas se distribuyen de manera normal. Si se elige al azar un termómetro, calcule la probabilidad de que, al punto de congelación del agua, la lectura sea menor que 1.58°. Solución: La distribución de probabilidad de las lecturas es una distribución normal estándar, ya que las lecturas se distribuyen de forma normal, con µ=0 y σ= 1. Necesitamos encontrar el área que está debajo de z= 1.58, continua:

Ejemplo termómetros científicos: utilice los termómetros del ejemplo anterior y calcule la probabilidad de seleccionar al azar un termómetro con una lectura ( en el punto de congelación del agua) por arriba de -123°. Solución: nuevamente, calculemos la probabilidad deseada encontrando el área correspondiente. Buscamos el área de la región sombreada en la figura pero la tabla A-2 está diseñada para aplicarse únicamente en áreas acumulativas desde la izquierda. Si nos remitimos a la tabla A-2, en la pagina con puntuaciones negativas, encontramos que área acumulativa de la izquierda ha de ser z = -123es 0.1093, tal como se observa. Sabiendo que el área total bajo la curva es 1, podemos calcular el área sombreada si restamos 0.1093 de 1. El resultado es 0.8907. Aun cuando la tabla A-2 está diseñada únicamente para áreas acumulativas a partir de la izquierda, podemos utilizarla para calcular áreas acumulativas desde la derecha, tal como se muestra en la figura.

Instituto Tecnológico Superior de Tierra Blanca

Página 28

0228. El ejemplo anterior puede generalizarse como una regla que establece que el área correspondiente a la región localizada entre dos puntuaciones z especificas puede obtenerse al calcular la diferencia entre las dos áreas localizadas en la tabla A-2. Formula 1.00 corresponde al área de 0. empleando la fórmula 1.Ejemplo termómetros científicos: Una vez más. simplemente estandarice los valores para poder continuar utilizando los mismos procedimientos de la sección anterior Si convertimos valores en puntuaciones estándares. Instituto Tecnológico Superior de Tierra Blanca Página 29 . haga una selección aleatoria de al mismas muestra de termómetros y calcule la probabilidad de el termómetro elegido tenga lecturas ( en el punto de congelación del agua entre -2. y que z= 1. como se observa en la figura. El área de forma directa.. después sombree la región que representa la probabilidad deseada.50°).50 corresponde al área de 0.00° y 1. utilice este 1. entonces los procedimientos para trabajar con todas las distribuciones normales son los mismos que los de la distribución normal estándar.1. indique la media y los valores específicos de x.9332. pero podemos emplearla para encontrar que z= -2. Cuando calcule procedimiento: áreas en una distribución normal no estándar.dibuje una curva normal.1 z= x -µ/σ (redondear las puntuaciones z hasta dos decimales). Aplicaciones de las distribuciones normales Para trabajar con una distribución normal que no es estándar.

07 es un área de 0.para cada valor relevante de x que sea un límite de la región sombreada. Solución: Paso 1: Observe la figura . con una media de 172 libras y una desviación estándar de 29 libras. encontramos que el área acumulativa a la izquierda de z= 0. Si seleccionamos al azar a un hombre. Supongamos “el peor de los casos”. Paso 2: para usar al tabla A-2 primero debemos de aplicar al formula 1.. que incluye la siguiente información: los hombres tienen pesos que se distribuyen normalmente. utilice la formula 1.1 para transformar la distribución normal no estándar a una distribución normal estándar. con una media de 172 lb y una desviación estándar de 29 lb. (Esto podría ocurrir fácilmente en una ciudad donde se realizan convecciones en las personas del mismo género suelen viajar en grupos).1 para convertir el valor a la puntuación z equivalente.. en el que todos los pasajeros son hombres adultos. El peso de 174 libras se convierte a una puntuación z de la siguiente manera: Z= x-µ/σ = 174-172/29 = 0. área de la región sombreada que Ejemplo pesos de pasajeros de taxis acuáticos. calcule la probabilidad de que pese menos de 174 lb ( el valor sugerido por National Transportation and Safety Board). Instituto Tecnológico Superior de Tierra Blanca Página 30 . suponga que los pesos de hombres se distribuyen normalmente.07 Pasó 3: si nos remitimos a la tabla A-2 y utilicemos z = 0. En concordancia con los datos de la National Health and Nutrition Examination Survey.07.2. La carga segura para un taxi acuático se calculó en 3500 libras.5279. El peso medio de un pasajero es de 140 libras. 3. y la región sombreada representa a los hombres con pesos menores de 174 libras.Remítase a la tabla A-2 para encontrar el constituye la probabilidad deseada.

registre la media y la desviación estándar.25 d) Mayor que -1. después haga clic en el botón de constante de entrada e ingrese el valor Para encontrar un valor correspondiente a un área conocida.52 h) Mayor que 0 En los ejercicios 1 y 2 use la información que se le proporciona.8 pulgadas.En una organización para personas altas.00 g) Mayor que 3. se requiere que las mujeres midan al menos 70 pulgadas ¿qué porcentaje de la mujeres cumple con este requisito? R= Instituto Tecnológico Superior de Tierra Blanca Página 31 .Para encontrar el área acumulativa que está a la izquierda de una puntuación Z (como en la tabla A-2). con una media de 69 pulgadas y una desviación estándar de 2. • La estatura de los hombres se distribuyen normalmente. EJERCICIOS: En los siguientes ejercicios suponga que las lecturas de los termómetros se distribuyen normalmente. probabilidad acumulada.5 pulgadas.. 1.45 y -2. seleccione calc. normal. distribuciones de probabilidad. con una media de 0 y una desviación estándar de 1ºC. seleccione calc.75 e) Entre 1 y 2 f) Entre -2. Se selecciona aleatoriamente un termómetro y se prueba.6 pulgadas y una desviación estándar de 2. • La estatura de las mujeres se distribuye normalmente con una media de 63. normal. después seleccione probabilidad acumulada inversa e indique la media y la desviación estándar. dibuje un bosquejo y calcule la probabilidad de cada lectura. distribuciones de probabilidad. a) Menor que -1 b) Menor que 1 c) Mayor que 1. Después haga clic en el botón de constante de entrada y registre el área total que se encuentra a la izquierda del valor dado. En cada caso.

Anote los valores en una columna 2. 3.2. Seleccione basic statistics 4. Seleccione stat 3. construya una Grafica cuantilar normal.. con excepción del 5% de los más altos. 5.. Si un especialista en estadística diseña una casa de tal manera que la entrada de la puerta tenga una altura suficiente para todos los hombres. • Todas las muestras aleatorias del mismo tamaño n se seleccionan de la población (todas deben de tener la misma probabilidad de ser seleccionadas). Para la construcción de una grafica cuantilar normal en MINITAB utilice los siguientes pasos: 1. Seleccione normality test. Haga click en ok Instituto Tecnológico Superior de Tierra Blanca Página 32 .Histograma: construya un histograma. Rechace la normalidad si el histograma difiere mucho de la forma de campana.. ¿Cuál sería la altura de la entrada? 3.Grafica cuantilar normal: si el histograma es básicamente simétrico y existe a lo sumo un valor extremo. ¿Qué peso se utilizaría para establecer un punto de corte que separe al 2% de los bebes menos pesados de los demás? El teorema del límite central • La variable aleatoria x tiene una distribución (que puede o no ser normal) con media µ y desviación estándar σ.valores extremos: rechace la normalidad si existe más de un valor extremo.En estados unidos los pesos al nacer se distribuyen normalmente. 2.. Introduzca la columna en la que introdujo los datos 6.la altura estándar de la entrada de una puerta es de 80n pulgadas. Determinación de la normalidad 1. con una media de 3420g y una desviación estándar de 495 g. si un hospital desea establecer condiciones especiales de observación para el 2% de los bebes menos pesados..

La proporción muestral es mejor estimado puntual es el mejor estimado puntual en la proporción poblaciones . las proporciones muéstrales no tienden sistemáticamente a subestimar ni a sobreestimar p. Las condiciones para la distribución binomial se satisfacen. Además existen procedimientos para tratar situaciones para que la distribución normal no es una aproximación adecuada).Estimaciones y tamaños de muestra Las dos aplicaciones principales de la estadística inferencial implican el uso de datos de muestra para 1. hay dos categorías de resultados y las probabilidades permaneces constantes para cada ensayo. = = proporción muestral de = 1= proporción muestrl de en una muestra e tamaño en una muestra de tamaño Definición Un estimado puntual es un valor individual (o punto) que se usa para aproximar un parámetro de población. Instituto Tecnológico Superior de Tierra Blanca Página 33 . NOTACIÓN PARA PROPORCIONES. Requisitos: 1. 2. La proporción muestral es el timador más consistente en el sentido de que la desviación estándar de las proporciones muéstrales tienden a ser menor a la desviación estándar de cualquier otro estimador estándar sin sesgo. hay un número fijo de ensayo los ensayos son independientes. 3. de manera que este ≥5 y ≥ 5 se cumplan para que la requisito es una forma de verificar distribución normal sea una aproximación adecuada para la distribución binomial. Estimación de la proporción de una población. No está sesgado en el sentido de que la distribución de las proporciones muéstrales tiende a concentrarte al valor . Estimar el valor de un parámetro de población 2. La muestra es aleatoria simple. Esto es. Probar alguna aseveración (o hipótesis) acerca de una población. esto es. Usamos como el estimado puntual ya que no está sesgado y es el más consistente de los estimadores que podrían usarse. = proporción muestral de x éxitos en una muestra de tamaño . Existen al menos 5 éxitos y al menos 5 fracasos (cuando y se desconocen estimamos sus valores utilizando la proporción muestral.

El intervalo de confianza suele abreviarse como IC.(con ∝= 0. Para un nivel de de 0. los especialistas en estadística han diseñado ingeniosamente otro tipo de estimado: el intervalo de confianza o estimado del intervalo. A continuación se presenta un ejemplo de un intervalo de confianza basando en los datos muestrales de 280 ensayos de terapeutas de contacto. pero no tenemos indicación precisa de que tan bueno es nuestro mejor estimado.497.5.99 (99%). Interpretación de un intervalo de confianza. Debemos ser cuidadosos para interpretar los intervalos de confianza correctamente.4 es el mejor estimado puntual de la proporción poblacional . Para un nivel de confianza El de valor 0. y 95%. Definición El nivel de confianza es la probabilidad 1−∝ (a menudo expresado por el valor equivalente). Instituto Tecnológico Superior de Tierra Blanca Página 34 . que es la proporción de veces que el intervalo de confianza realmente contiene el parámetro de población. Las opciones más comunes para el nivel de confianza son 90% (con ∝= 0. La opción del 95% es la más común puesto que provee un equilibrio entre presión (reflejada en el ancho del intervalo de confianza) y confiabilidad (expresada por el nivel de confianza). que consiste en un rango (o un intervalo) de valores en vez de un solo valor.381< p<0.50). y 99%(con ∝= 0. de ∝ ∝es el complemento del confianza nivel de confianza .95 (95%) =0.9 (95%). ∝ =0.10) . donde en el 44% de los ensayos se identifica correctamente la mano elegida: El intervalo de confianza estimado de 0. El nivel de confianza también se llama grado de confianza o coeficiente de confianza. como 0.01. Definición Un intervalo de confianza(o estimado del intervalos) es un rango (o un intervalo) de valores que se usan para estimar el valor real de un parámetro de población. Un intervalo de confianza se asocia con un nivel de confianza.¿Por qué necesitamos intervalos de confianza? En el ejemplo anterior vimos que 0. El nivel de confianza suele expresarse como la probabilidad o área 1−∝ (alfa griega minúscula). Como el estimado puntual tiene el gran defecto de no revelar nada de qué tan bueno es.95(o 95%) de la proporción poblacional p es 0.01). suponiendo que el proceso de estimación se repite un grado numérico de veces.el nivel de confianza nos da la tasa de éxitos del procedimiento que se utiliza para construir el intervalo de confianza.

Instituto Tecnológico Superior de Tierra Blanca Página 35 .381<p<0.497.Existe una interpretación correcta y muchas diferentes y creativas interpretaciones erróneas del intervalo de confianza 0.

Notación para el valor critico. el bebe es o no una niña.5. de manera que los limites del intervalo de confianza contienen o no a p. (El valor de – z∝⁄2 está en la frontera vertical para el área de ∝ 2 en la cola izquierda).381 y 0. Un nivel de confianza el 95% nos dice que el proceso que estamos usando. Errónea: “Existe un 95% de probabilidad de que el valor real de p este entre 0. a la larga. utilizada para estimar la proporción. el intervalo de confianza obtenido de los datos muéstrales no incluiría la proporción poblacional. si un bebe acaba de nacer y el médico esta por anunciar su género.497 realmente contiene el valor verdadero de p”. dará por resultado límites del intervalo de confianza que contienen la proporción real de la población el 95% del tiempo.497. Suponga que la proporción real de todas las identificaciones correctas de la mano por partes de los terapeutas de contacto es p=0. Esto significa que si seleccionamos muchas muestras diferentes de tamaño 280 y construimos los intervalos de confianza correspondientes. propiedad de que una 7-2) área de derecha de la distribución normal (Véase lasepara figura 2 en 2 ∝ 2 en la Instituto Tecnológico Superior de Tierra Blanca Página 36 . Definición Un valor crítico es el número en línea limítrofe que separa estadísticos muestrales que tienen mayor probabilidad de ocurrir de aquellos que no tienen probabilidad de ocurrir.381 a 0. Entonces.” Para cualquier punto especifico en el tiempo.5 de que sea niña.5 no se encuentran entre 0. Con un 95% de confianza. ya que la proporción poblacional real de 0.497. El subíndice ∝ 2 es simplemente un recordatorio de que la puntuación z separa un área de cola derecha de la distribución normal estándar. (note que en esta interpretación correcta. De manera similar. un intervalo de confianza construido a partir de una muestra que incluye o no a p. El valor critico z∝⁄2 es el valor z positivo que está en la frontera vertical que separa una área de ∝ 2 en la cola derecha de la distribución normal estándar. es incorrecto decir que existe una probabilidad de 0. esperamos que 19 de las 20 muestras den por resultado intervalos de confianza que contienen el valor real de p. ∝ El número 2∝ es la uncola valor crítico. y no hay una probabilidad implicada. el 95% de ellos incluirían realmente el valor de la proporción poblacional p.381 y 0.497. una puntuación z con laestándar. una población tiene un valor fijo y constante de p. el nivel del 95% se refiere a la tasa de éxitos del proceso.381 y 0. y no a la proporción de la población en sí). por eso es incorrecto decir que existe un 95% de probabilidad de que p se localice entre el los valores tales como 0. Una proporción poblacional p es como el bebe que acaba de nacer: el valor de p es fijo.Correcta: “Tenemos una confianza del 95% de que el intervalo de 0. Valores críticos.

Redondee los límites del intervalo de confianza para p a tres dígitos significativos. Con base en los resultados anteriores. existe una probabilidad de que una proporción muestral sea errónea por más de E. podemos resumir el procedimiento para construir un estimado del intervalo de confianza de una proporción poblacional como sigue. denotado por E. es la diferencia máxima probable (con probabilidad 1. + Regla de redondeo para estimados de intervalos de confianza de p. La diferencia entre la proporción muestral y la proporción de la población se considera un error.Margen de error. Ahora definiremos el margen de error E como sigue.2 Formula 1. El margen de error E también se conoce llama error máximo del estimado y se calcula multiplicando el valor critico por la desviación estándar de las proporciones muestrales. el margen de error. podemos calcular la proporción muestral y esta proporción muestral suele ser diferente de la población poblacional p.2 E = z∝ 2 margen de error para proporciones Dada la formula en que se define el margen de error E. Cuando reunimos un conjunto de datos muéstrales. Intervalo de confianza (o estimado de intervalo) para la proporción poblacional p. Definición Cuando se utilizan los datos de muestra aleatoria simple para estimar una proporción p. como se indica en la fórmula 1. − < < + Donde E = z∝ 2 El intervalo de confianza suele expresar en los siguientes formatos equivalentes ± – .∝) entre la proporción muestral de observada y el valor real de la proporción poblacional p. . como los datos sobre la terapia de contacto de Emily Rosa en el problema del capítulo (donde el 44% de los 280 ensayos correspondieron a identificaciones correctas).

(Por ejemplo. los límites del intervalo de confianza resultantes a tres dígitos Uso del Minitab para determinar intervalos de confianza Seleccione estadísticas. n=1200. Verifique que los supuestos requeridos se cumplan (la muestra es aleatoria simple. 3. haga clic en opciones y luego en el cuadro de la frase “use la prueba y el intervalo basado en una distribución normal”. También haga clic en el botón de opciones. 2. 98% de confianza . x=800. x=267. luego 1 proporción. ingrese el nivel de confianza deseado. 1. el valor critico es z∝ 2 =1. En el cuadro de dialogo haga clic en el botón datos resumidos. Ejercicios: Un estudiante encuesta a 100 compañeros de clase y les pregunta si tienen deudas pendientes. 99% de confianza 3. En vez de utilizar una aproximación normal. 95% de confianza 2. Después de calcular la proporción muestral de esta muestra de n=100 sujetos. las condiciones para la distribución binomial se satisfacen y existen al menos 5 éxitos y al menos 5 fracasos). el procedimiento determinado de Minitab consiste en determinar los límites de intervalo de confianza por medio de un método exacto. Construya el intervalo de confianza 1. n=500. Utilizando el valor del margen de error E calculado y el valor de la proporción muestral . Evalué el margen de error E = z∝ 2 4. Redondee significativos. + Sustituya esos valores en el formato general para el intervalo de confianza: − − <± < + . n=1068.96). Para usar el método de aproximación normal analizado. ¿su puede utilizar el método analizado anteriormente para estimar la proporción de todos los adultos que tienen deudas pendientes? ¿Por qué? . calcule los valores – . Remítase a la tabla A-2 y encuentre el valor crítico z∝ 2 que corresponde al nivel de confianza deseado.Procedimiento para construir un intervalo de confianza para p. estadística básica. + 5. si el nivel de confianza es del 95%. x=200.

. SOLUCIÓN. Si distribución exactamente normal. por las siguientes dos Por lo general la media de la muestra razones: 1. Pulso cardiaco de mujeres.Estimación de una media de población: conocida. (todas las muestras del mismo tamaño tienen la misma probabilidad de ser seleccionadas). Como la media muestral es el mejor estimado puntual de la media poblacional .] sino que tienden a coincidir con este valor. Por razones similares. Los requisitos incluyen la propiedad de que la población se ≥ 30. las medidas muestrales no tienden sistemáticamente a sobreestimar el valor de . sino aproximadamente normal. ¿Dónde estaríamos? El conjunto de datos del archivo FHEALTH incluye pulsos cardiacos (en latidos por minutos) de mujeres seleccionadas al azar. la población no necesita tener una distribuya normalmente o que n>30. [es decir. 3. concluimos que el mejor estimado puntual de los pulsos cardiacos de todas las mujeres es 76. La medida muestral es el mejor estimado puntual de la media de la población. Sin él. Podemos considerar que el requisito de normalidad se satisface si no hay valor extremo y si un histograma de los datos muestrales no se aleja mucho de la forma de campana.3. los estadísticos son los siguientes: n=40. Requisitos: 1. la media muestral es el mejor estimado puntual de la media poblacional . La muestra es aleatoria simple. ni tienden sistemáticamente a subestimar el valor de . se ven muy afectados si los datos se alejan de la normalidad. EJEMPLO.5. 2. la distribución de las medias muestrales tiende hacer más consistente (con menos variación) que la distribución de otros estadísticos muestrales. El valor de la desviación estándar poblacional es conocido. Para los datos muestrales. brinda el mejor estimado. Para todas las poblaciones. la media muestral es un estimador sin sesgo de la media poblacional . es decir. (Se dice que los métodos de esta sección son robustos.3 y s= 12. El pulso cardiaco de las personas es sumamente importante. lo que significa que la distribución de medias muestrales tiende a concentrarse alrededor del valor de la media poblacional .3. Utilice esta muestra para calcular el mejor estimado puntual de la media poblacional de los pulsos cardiacos de todas las mujeres. Para muchas poblaciones. Requisitos de normalidad. Cualquier o ambas de estas condiciones se satisfacen: la población esta normalmente distribuida o n>30. =76. =76. En la sección anterior vimos que la proporción muestral es el mejor estimado puntual de la proporción poblacional p. siempre y cuando no se alejen demasiado).

un intervalo de confianza nos ofrece información que nos permite comprender mejor la exactitud del estimado. El intervalo de confianza se asocia con un nivel de confianza. =0. En la sección anterior vimos que la desviación √ esE ∝ estándarpoblacional de la las medidas muestrales. Estimación del intervalo de la medida poblacional -E< O < +E donde ±E o E = ∝ 2∙ √ (con conocida). podemos calcular la medida muestral y esa medida muestral por lo regular es diferente de la medida poblacional . Para un nivel de∝confianza de 0. Utilizando el margen de error E ahora podemos identificar el intervalo de confianza para la medida poblacional (si se satisfacen los requisitos de esta sección). ( . . Margen de error.99 (o99%).Intervalo de confianza. Cuando reunimos un conjunto de datos muestrales. Aunque él un estimado puntual es el mejor valor individual para estimar un parámetro poblacional. no nos da ninguna indicación precisa de que tan bueno es este mejor estimado. Utilizando y la notación que se presento en sección anterior ahora podemos usar/el de / error que √ margen 2 expresa como sigue: Formula 1. Sin embargo. como 0. Como se describió en la sección anterior. 0.95 (o 95%). Si la población no está distribuida normalmente las muestras grandes producen medidas muestrales con una distribución que se aproxima a la normal. Los tres formatos que suelen usarse para expresar el intervalo de confianza se presentan en el siguiente cuadro.3 E = ∝ 2 ∙ √ margen de error para la medida (con base en σ).3 refleja el hecho de que la distribución del muestreo de la medida muestral es exactamente una distribución normal con medida y desviación estándar /√ . La fórmula 1. +E) Definición Los dos valores -E y +E se llaman limites del intervalo de confianza. siempre y cuando la población tenga una distribución normal con medida y desviación estándar . Para un confianza de 0. como los datos de los 40 pulsos de mujeres que se incluyen en el conjunto de datos 1 del apéndice B.01.E. ∝ es ∝ el = complemento del nivel nivel de confianza.95 (o 95%).05. La diferencia entre la medida muestral y la medida es un error.el nivel de confianza nos da la tasa de éxito de procedimiento que se utiliza para construir el intervalo de confianza.

Utilizando el valor calculado del margen de error E y el valor de la medida muestral . el valor critico es de z∝⁄2 =1.E. Cuando utilice el conjunto de datos original para construir un intervalo de confianza a un decimal más del que se usa para el conjunto de datos original. Cuando el conjunto de datos original se desconoce y solo se utiliza el resumen de estadísticos (n. Redondee los valores resultantes usando la siguiente regla de redondeo. Evalué el margen de error E= z∝⁄2 ∙ /√ . 2. Remítase en la tabla A-2 y calcule el valor crítico z∝⁄2 correspondiente al nivel de confianza deseado. < Regla de redondeo para intervalos de confianza utilizados para estimar .96). (Tenemos una muestra aleatoria simple. y la población parece estar distribuida normalmente o n>30).Procedimiento para construir un intervalo de confianza para conocida) (con 1. el 95% de estos contendrían realmente el valor de . Esto significa que si seleccionamos muchas muestras diferentes del mismo tamaño y construimos los intervalos de confianza correspondiente a la larga. sustituya esos valores en el formato general para el intervalo de confianza: -E< +E O ±E O ( . ) redondee los limites del intervalo de confianza al mismo número de espacios decimales utilizados para la media muestral Interpretación de un intervalo de confianza. es conocida. (Esta interpretación correcta se refiere a la tasa de éxito del proceso que se usa para estimar la media poblacional). si el nivel de confianza es de 95%. Verifique que los supuestos requeridos se satisfagan. (por ejemplo. +E) 5. Instituto Tecnológico Superior de Tierra Blanca Página 40 . 1. 4. Correcta: “tenemos una confianza del 95% de que el intervalo de 72.4 a 85. 2. . 3.2 realmente tiene el valor verdadero de ”. calcule los valores .E and +E.

pero los requisitos anteriores se satisfacen. Requisitos: la media poblacional: 1. La muestra es aleatoria simple. La media muestral . y se sabe que σ es $18. pero esto introduce otra fuente de confiabilidad en especial o las muestras pequeñas para mantener un intervalo de confianza a un nivel deseado el 95% compensamos esta falta de confiabilidad adicional haciendo más ancho el intervalo de ∝ ∝ una confianza: utilizamos valores críticos distribución t de Student). utilizamos la distribución t de student (en vez de la distribución normal). 2. los cuales son más grandes que los valores críticos de2(de 2 de la distribución normal. Calcule el intervalo de confianza 1. estimamos con el valor de la desviación estándar muestral s..0.salarios de ex docentes del ITSTB que tomaron un curso de estadística: confianza del 95%. es el mejor estimado puntual de la medida poblacional He aquí aspecto clave de esta sección: si no se conoce. Gosset fue un empresario de la cervecería Guinness Brewery que necesitaba una distribución que pudiera utilizarse con muestreas pequeñas. y se sabe que σ es $68.5<µ<6. Estimación de desconocida. = $688. n=70. Instituto Tecnológico Superior de Tierra Blanca Página 41 . (Puesto que no conocemos el valor de . Escriba un enunciado que interprete el intervalo de confianza de manera correcta.277.calificaciones de crédito de solicitantes de tarjetas de crédito: confianza del 99%. que desarrollo William Gosset (1876-1937).200. entonces Gosset publico bajo el seudónimo de student. La muestra proviene de una población distribuida normalmente o n<30. n=41.Ejercicios: Con base en datos muestrales se obtiene el siguiente intervalo de confianza del 95%: 2. .. 2. La cervecería irlandesa donde trabajaba no permitía la publicación de resultados de investigaciones. = $67.

Por ejemplo.La distribución de t Student. se utiliza para calcular valores críticos denotados por t ∝ 2. un nivel de confianza de 95% corresponde a ∝ = 0. de manera que encontramos los valores listados en la columna para un área de 0. el numero de grados de libertad está dado por n-1 =22.074 Instituto Tecnológico Superior de Tierra Blanca Página 42 . El valor correspondiente el renglón para 22 grados de libertad y la ∝ columna para unencontrar área de 0. Puesto que esas 9 primeras puntuaciones pueden seleccionarse con libertad para adoptar cualquier valor. Puesto que n=23. Una muestra de tamaño n=23 es una muestra aleatoria simple seleccionada de una población distribuida normalmente.05 en dos colas. decimos que existen 9 grados de libertad disponibles.05. entonces la distribución de: = − √ Es una distribución t de Student para todas las muestras de tamaño n. Calcule el valor crítico ∝ 2 correspondiente a un nivel de confianza del 95%. si 10 estudiantes tienen puntuaciones de examen con una media de 80. Grados de libertad = n – 1.05 en dos colas es 2. Comencemos con el valor critico denotado por ∝ 2. pero antes presentamos los componentes necesarios para la construcción de intervalos de confianza. El numero de grados de libertad para un conjunto de datos muestrales recolectados es el numero de valores muestrales que pueden variar después de haber impuesto cierta restricciones a todos los valor de los datos. podemos asignar con libertad valores a las primeras 9 puntuaciones. localizamos el renglón 22 con respecto a la columna de la extrema izquierda. Un valor de ∝ 2 se puede encontrar en la tabla A-3 localizando el numero apropiado de grados de libertad en la columna izquierda y avanzando por el renglón correspondiente hasta encontrar el numero que aparece directamente a bajo del área adecuada en el parte superior. Utilizando la tabla A-3. Definición. conocida a menudo como distribución t. la distribución t student. Al igual que en la sección anterior. pero la decima puntuación se calcula la suma de las 10 puntuaciones debe ser 800 entonces la decima puntuación debe ser a 800 menos la suma de la primeras 9 puntuaciones. entonces ahora el que sabemosde margen cómo error E de ese intervalo valores de críticos confianza.074. Pronto analizaremos algunas de las propiedades importantes de la distribución t. Si una población tiene una distribución normal. Para las aplicaciones de esta sección el número de grados libertad es simplemente el tamaño muestral menos 1. denotados por ∝ 2 podemos describir 2 = 2.

redondee los límites del intervalo de confianza al mismo número de lugares decimales utilizados para la medida muestral. Si utiliza el conjunto original de datos. redondee a un decimal mas que se usa para el conjunto original de datos. Instituto Tecnológico Superior de Tierra Blanca Página 43 . Utiliza n -1 grados de libertad. remítase al “área en dos colas”). . 1. (con 1. Propiedades importantes de la distribución t de Student. tiene n -1 grados de libertad. Redondee los límites del intervalo de confianza resultantes.E. Verifique que los requisitos se satisfacen. 3. Si utiliza un resumen de estadísticos ( .El margen de error E para la estimación de Formula 1.(tenemos una muestra aleatoria simple y la población parece estar distribuida normalmente o n>30). Intervalos de confianza para la estimación de -E< +E Donde = ∝/ < √ Procedimiento para construir un intervalo de confianza para desconocidas). La tabla A-3 lista valores de (con desconocidas). La distribución t de Student es diferente para distintos tamaños de muestra. calcula los valores de -E y +E. (para el nivel de confianza. Evalué el margen de error = ∝/2 ∙ /√ 4. sustituya estos valores en el formato general para el intervalo de confianza: .E < < +E O ±E ( . +E) 5. Utilizando el valor del margen de error E calculando y el valor de la media muestral . ). ∝/ . remítase a la tabla A-3 y encuentre el valor crítico ∝/ que corresponde al nivel de confianza deseado. 2. Ahora listamos las propiedades importantes de la distribución t que utilizamos en esta sección.4 = ∝/ √ Donde ∝/ (con desconocidas).

=100. y la población tiene una distribución normal c) n=8. ibución normal est7á. se obtuvieron los siguientes datos de pesos al nacer: n= 190. s=645g.2.ndar. Dis6tr. s=15. 3. =100. La desviación estándar de la distribución t de student varia con el tamaño muestral. Distribución t de Student con n =12 0 Ejercicios: Suponiendo que usted planea construir un intervalo de confianza para la media poblacional µ. a) n=150. y la población tiene una distribución sesgada b) n=8. s=15. el diseño del estudio justifica el supuesto de que la muestra puede tratarse como una muestra aleatoria simple. s=15. pero refleja una mayor variabilidad (con distribuciones más amplias) de lo que se espera con muestras pequeñas. Conforme el tamaño muestral n se hace más grande. la distribución t de Student se acerca más a la distribución normal estándar. Utilice los datos muestrales para construir un estimado del intervalo de confianza del 95% de µ. 4. =2700g. utilice los datos para determinar si el margen de error debe calcularse utilizando un valor critico de la distribución normal (z) o un valor critico de (t) o de ninguno de estos. La distribución t de student tiene la misma forma de campana simétrica que la distribución normal estándar. pero es mayor que 1(a diferencia de la distribución normal estándar tiene =1) 5. =100. y la población tiene una distribución muy sesgada Ejemplo: en un estudio de los efectos sobre los bebes del consumo de cocaína durante el embarazo. La distribución t student tiene una media de t=0 (así como la distribución normal estándar tiene una medida de z=0). el peso medio al nacer de todos los bebes hijos de Instituto Tecnológico Superior de Tierra Blanca Página 44 .

madres que consumieron cocaína durante el embarazo. Instituto Tecnológico Superior de Tierra Blanca Página 45 .

el requisito de tener una distribución normal es mucho más estricto. Para los métodos de esta sección. En la tabla A-3 encontramos que el valor crítico corresponde a n-1= 189 grados de libertad y un área en dos colas de 0.972. 2.276226.2762 Con base en los datos muestrales. Como la tabla A-3 no incluye gl=189.276226 formula 1. . Cuando desarrollamos estimados de varianza o desviaciones estándar utilizamos otra distribución.97355 se calcula utilizando la = 1.7238 < µ < 2792. Requisitos: 1.276226 <µ< 2700 + 92. En consecuencia.972* 645/√ = 92.4: = ∝/ √ Ahora calcularemos el intervalo de confianza: indica a continuación: -E< < +E = 2700g y E= 92.276226 2607. conocida como la distribución chi cuadrada. y debemos revisar la distribución de los datos construyendo histogramas y graficas cuantilares normales. Cuando consideramos estimados de proporciones y medias. utilizamos el valor critico más cercano de 1. utilizamos las distribuciones normales y t de Student.05. pero este requisito es mucho más importante aquí. Examinaremos características importantes de esta distribución antes de proceder con el desarrollo de intervalos de confianza.92. tenemos una confianza del 95% de que los limites de de 2608 g y 2792 g realmente contienen el valor del peso medio al nacer. (Suponga que la población tiene una distribución normal) a) calcule el margen de error b) calcule el intervalo de confianza para la media poblacional Estimación de la varianza poblacional.El valor crítico es ∝/2= 1. s=4. Calcule el margen de error E: el margen de error E= 2. La muestra es aleatoria simple.9 kg. n=40.0 kg. =3.972. EJERCICIOS: El peso perdido por una dieta de slim fast: 95% de confianza. los alejamientos de una distribución normal pueden generar errores muy graves. La población debe tener valores distribuidos normalmente (aun si la muestra es grande) El supuesto de una población distribuida normalmente se menciono en secciones anteriores. como se 2700.

pero no puede ser negativos. La distribución chi cuadrada no es simétrica. Puesto que la distribución chi cuadrada es sesgada y no simétrica. remitida a la tabla A-4. La distribución chi cuadrada se determina por el número de grados de libertad y en este capítulo usamos n1 grados de libertad. el intervalo de ± confianza no se ajusta al formato de y debemos hacer cálculos se parados para los limites de confianza superior e inferior. por lo que no debemos hacer la generalización incorrecta de que el número de grados de libertad es siempre n. suponga que seleccionamos al azar muestras independientes de tamaño n y. En una población distribuida normalmente. a diferencia de las distribuciones normales y t de student. Distribución chi cuadrada. con varianza . La tabla A-2 para la distribución normal estándar proporciona área acumulativa de la = ( ) . Los valores de chi cuadrada pueden ser cero o positivos.1. y esa área representa la re un intervalo de región acumulativa localizada a la derecha del valor critico.5 Donde n= tamaño muestral = Varianza muestral = varianza poblacional Denotamos chi cuadrada por . 2. Si se utiliza la tabla A-4 para calcular valores críticos. Grados de libertad = n-1. Formulación 1.Distribución chi cuadrada. El estadístico muestral =(n-1) / tiene una distribución llamada distribución chi cuadrada. para cada muestra calculamos la varianza muestral (que es el cuadrado de la desviación estandar muestral s). Para calcular valores críticos de la distribución chi cuadrada. que se pronuncia “ji cuadrada”. observe su siguiente característica: En la tabla A-4 cada valor critico de corresponde a una área que se encuentra en el renglón superior de la tabla. Propiedades de la distribución del estadístico chi cuadrada 1. En capítulos posteriores encontramos situaciones en las que grados de libertad no son n-1.

izquierda pero la tabla A-4 para la distribución chi cuadrada provee áreas acumulativas de la derecha. .

la desviación estándar de los pesos de monedas de 1 centavo fabricadas con el equipo nuevo.0228 g contienen el valor real de σ.0165g.025 los valores críticos de son = 2. Utilizando n-1 grados de libertad.0086< <.0228 Con base en este resultado. Ejemplo: En la actualidad las monedas de 1 centavo de dólar se acuñan con una desviación estándar de . 5. construimos el intervalo de confianza al evaluar lo siguiente: ( ).700 y 19. 3. ¿parce que el equipo nuevo sirve para reducir la variación de los pesos? Solución: el tamaño muestral es n=10 de manera que hay 9 grados de libertad . y la muestra tiene una desviación entandar de 0. Con base en los resultados. calcule la raíz cuadrada de los límites del intervalo de confianza superior e inferior y cambie por .023. = . ( ) < <( ) 4. Redondee los límites del intervalo de confianza resultantes. Una grafica cuantilar normal y un histograma indican que los pesos provienen de una población distribuida normalmente.0125 g. la desviación estándar muestral de s=. utilice los resultados muestrales para construir un estimado de un intervalo de confianza del 95% de σ. Si se desea un estimado del intervalo de confianza de . redondee a un decimal más del que se usa para el conjunto original del dato. se prueba un nuevo equipo con la intención de mejorar la calidad al reducir la variación.0125 y el tamaño muestral de 10. tenemos una confianza del 95% de que los limites de . Verifique que los requisitos se satisfagan. . . Se tiene una muestra aleatoria simple de 10 monedas de 1 centavo acuñadas con el equipo nuevo. buscamos en la tabla A-4 el valor de los nueve grados de libertad y revisamos las columnas con áreas de . (la muestra es aleatoria simple y un histograma o grafico cuantiar normal sugiere que la población tiene una distribución que es muy cercana a la distribución normal). Evalúa los límites del intervalo de confianza e inferior utilizando el siguiente formato para el intervalo de confianza. Si se utiliza el conjunto original de datos. Si se utiliza la desviación estándar o varianza muestrales redondee los límites del intervalo de confianza al mismo número de espacios decimales.023 Usando los valores críticos de 2. remítase a la tabla A-4 y encuentre los valores críticos correspondiente al nivel de confianza deseado. 2. .700 y =19.0086g y . < < ( ) .Procedimientos para construir un intervalo de confianza para 1.975 y .

Hipótesis Y Prueba De Hipótesis Tenemos que empezar por definir que es una hipótesis y que es prueba de hipótesis. es decir. el cual es un rango de valores en el que se espera se encuentre el parámetro poblacional En nuestro caso se desarrolla un procedimiento para probar la validez de una aseveración acerca de un parámetro poblacional este método es denominado Prueba de hipótesis para una muestra. En este caso es necesario hacer una estimación puntual que es un valor que se usa para estimar un valor poblacional.Pruebas de Hipótesis para una muestra 1. después se hacen las pruebas para verificar la aseveración o para determinar que no es verdadera. En el análisis estadístico se hace una aseveración.introducción Dentro del estudio de la inferencia estadística. se emplea para determinar si la hipótesis es una afirmación razonable.. se plantea una hipótesis. la desviación estándar o la forma de la población. la prueba de hipótesis es un procedimiento basado en la evidencia muestral y la teoría de probabilidad. Pero es necesario tener conocimiento de ciertos datos de la población como la media. Pero una estimación puntual es un solo valor y se requiere un intervalo de valores a esto se denomina intervalo de confianza y se espera que dentro de este intervalo se encuentre el parámetro poblacional buscado.. se describe como se puede tomar una muestra aleatoria y a partir de esta muestra estimar el valor de un parámetro poblacional en la cual se puede emplear el método de muestreo y el teorema del valor central lo que permite explicar cómo a partir de una muestra se puede inferir algo acerca de una población. 2. Por tanto. lo cual nos lleva a definir y elaborar una distribución de muestreo de medias muestrales que nos permite explicar el teorema del límite central y utilizar este teorema para encontrar las probabilidades de obtener las distintas medias maestrales de una población. para verificar si la afirmación es razonable se usan datos. pero a veces no se dispone de esta información. Prueba de una hipótesis: se realiza mediante un procedimiento sistemático de cinco pasos: . También se utiliza una estimación mediante un intervalo. Hipótesis es una aseveración de una población elaborado con el propósito de poner a prueba.

Paso 2: Seleccionar el nivel de significancia. El planteamiento de la hipótesis nula siempre contiene un signo de igualdad con respecto al valor especificado del parámetro. . Cualquier investigación estadística implica la existencia de hipótesis o afirmaciones acerca de las poblaciones que se estudian. no a una estadística de muestra. Analizaremos cada paso en detalle Objetivo de la prueba de hipótesis. Esta prueba aporta una clase de prueba más allá de una duda razonable. Es una afirmación que se acepta si los datos muestrales proporcionan evidencia suficiente de que la hipótesis nula es falsa. pero debemos de tener cuidado con esta determinación ya que en la consideración de estadística no proporciona evidencia de que algo sea verdadero. La letra H significa hipótesis y el subíndice cero no hay diferencia. al llegar al paso cinco se puede o no rechazar la hipótesis. La hipótesis alternativa (H1) es cualquier hipótesis que difiera de la hipótesis nula.. Nivel de significancia: Probabilidad de rechazar la hipótesis nula cuando es verdadera. La hipótesis nula (Ho) se refiere siempre a un valor especificado del parámetro de población. también es denominada como nivel de riesgo. El propósito de la prueba de hipótesis no es cuestionar el valor calculado del estadístico (muestral). Se le denota mediante la letra griega α.Siguiendo este procedimiento sistemático. Se le conoce también como la hipótesis de investigación. 3.Procedimiento sistemático para una prueba de hipótesis de una muestra Paso 1: Plantear la hipótesis nula Ho y la hipótesis alternativa H1. Por lo general hay un "no" en la hipótesis nula que indica que "no hay cambio" Podemos rechazar o aceptar Ho. La hipótesis nula es una afirmación que no se rechaza a menos que los datos maestrales proporcionen evidencia convincente de que es falsa. sino hacer un juicio con respecto a la diferencia entre estadístico de muestra y un valor planteado del parámetro. El planteamiento de la hipótesis alternativa nunca contiene un signo de igualdad con respecto al valor especificado del parámetro.

Si la estadística de prueba cae dentro de la región de aceptación. entonces. es decir. En cualquiera de los dos casos se comete un error al tomar una decisión equivocada. Si suponemos que la hipótesis planteada es verdadera. cuando es verdadera en la población. En la siguiente tabla se muestran las decisiones que pueden tomar el investigador y las consecuencias posibles. puede incurrirse en error: Un error tipo I se presenta si la hipótesis nula Ho es rechazada cuando es verdadera y debía ser aceptada. se denota con la letra griega β se presenta si la hipótesis nula es aceptada cuando de hecho es falsa y debía ser rechazada. Instituto Tecnológico Superior de Tierra Blanca Página 50 .este término es más adecuado ya que se corre el riesgo de rechazar la hipótesis nula. estén fuera de área de aceptación. La probabilidad de cometer un error tipo I se denomina con la letra alfa α Un error tipo II. cuando en realidad es verdadera. Este nivel esta bajo el control de la persona que realiza la prueba. ya sea de aceptación de la Ho o de la Ha. Por otro lado. estos valores no son tan improbables de presentarse si la hipótesis nula es falsa. indica la probabilidad de aceptar la hipótesis planteada. El valor crítico separa la región de no rechazo de la de rechazo. una región de rechazo (conocida como región crítica) y una región de no rechazo (aceptación). Tipos de errores Cualquiera sea la decisión tomada a partir de una prueba de hipótesis. La distribución de muestreo de la estadística de prueba se divide en dos regiones. el nivel de significación indicará la probabilidad de no aceptarla. La región de rechazo puede considerarse como el conjunto de valores de la estadística de prueba que no tienen posibilidad de presentarse si la hipótesis nula es verdadera. El nivel de confianza (1-α). no se puede rechazar la hipótesis nula.

Como es más fácil encontrar diferencias grandes. se habrán apoyado exclusivamente en el análisis de una parte de ésta. En la práctica se establece el nivel α y para disminuir el Error β se incrementa el número de observaciones en la muestra. β disminuye. incrementar lo que se llama poder de la prueba (1. Instituto Tecnológico Superior de Tierra Blanca Página 51 . el tamaño de la muestra requerida. la probabilidad de cometer un error de tipo II. El estudio y las conclusiones que obtengamos para una población cualquiera. depende de la diferencia entre los valores supuesto y real del parámetro de la población. En otras palabras. Las contrastaciones se apoyan en que los datos de partida siguen una distribución normal Existe una relación inversa entre la magnitud de los errores α y β: conforme a aumenta. es deseable aumentar cuando ésta es verdadera. En la práctica un tipo de error puede tener más importancia que el otro. y así se tiene a conseguir poner una limitación al error de mayor importancia.β) La aceptación de la hipótesis planteada debe interpretarse como que la información aleatoria de la muestra disponible no permite detectar la falsedad de esta hipótesis. Lo ideal sería establecer α y β. lo cual puede ser o no ser posible. De la probabilidad con la que estemos dispuestos a asumir estos errores. pues así se acortan los limites de confianza respecto a la hipótesis planteada .La meta de las pruebas estadísticas es rechazar la hipótesis planteada. por ejemplo. si la diferencia entre la estadística de muestra y el correspondiente parámetro de población es grande. La única forma de reducir ambos tipos de errores es incrementar el tamaño de la muestra.Para que cualquier ensayo de hipótesis sea bueno. probablemente sea pequeña. o sea. Esto obliga a establecer con cuidado el valor de a para las pruebas estadísticas. La probabilidad de cometer un error de tipo II denotada con la letra griega beta β. debe diseñarse de forma que minimice los errores de decisión. dependerá.

La elección de uno de estos depende de la cantidad de muestras que se toman. existen muchos estadísticos de prueba para nuestro caso utilizaremos los estadísticos z y t. el valor estadístico de prueba es z y se determina a partir de: Instituto Tecnológico Superior de Tierra Blanca Página 52 . si las muestras son de la prueba son iguales a 30 o mas se utiliza el estadístico z.. o cuando el valor de la muestra es grande (30 o más). cuando se conoce la desviación estándar (σ) poblacional.Paso 3: Cálculo del valor estadístico de prueba Valor determinado a partir de la información muestral. Tipos de prueba a) Prueba bilateral o de dos extremos: la hipótesis planteada se formula con la igualdad Ejemplo H0 : µ = 200 H1 : µ ≠ 200 b) Pruebas unilateral o de un extremo: la hipótesis planteada se formula con ≥ o ≤ H0 : µ ≥ 200 H1 : µ < 200 H0 : µ ≤ 200 H1 : µ > 200 En las pruebas de hipótesis para la media (μ). en caso contrario se utiliza el estadístico t. que se utiliza para determinar si se rechaza la hipótesis nula.

que la probabilidad de que se presenten bajo la suposición de que la hipótesis nula es verdadera. para muestra grande y desviación estándar poblacional desconocida se determina por la ecuación: En la prueba para una media poblacional con muestra pequeña y desviación estándar poblacional desconocida se utiliza el valor estadístico t.El valor estadístico z. con prueba de una cola a la derecha Instituto Tecnológico Superior de Tierra Blanca Página 53 . La región de rechazo define la ubicación de todos los valores que son tan grandes o tan pequeños. Paso :4 Formular la regla de decisión SE establece las condiciones específicas en la que se rechaza la hipótesis nula y las condiciones en que no se rechaza la hipótesis nula. es muy remota Distribución muestral del valor estadístico z.

. se compara con el valor crítico y se toma la decisión de rechazar o no la hipótesis nula.Valor critico: Es el punto de división entre la región en la que se rechaza la hipótesis nula y la región en la que no se rechaza la hipótesis nula. En este último paso de la prueba de hipótesis.05 Datos: Día 1 2 3 4 5 6 7 8 9 10 Usuarios 356 427 387 510 288 290 320 350 403 329 Día 11 12 13 14 15 16 17 18 19 20 Usuarios Día 305 21 413 22 391 23 380 24 382 25 389 26 405 27 293 28 276 29 417 30 Usuario 429 376 328 411 397 365 405 369 429 364 Solución: Se trata de un problema con una media poblacional: muestra grande y desviación estándar poblacional desconocida. Para confirmar o no este supuesto se controla la cantidad de lectores que utilizaron la biblioteca durante 30 días. se calcula el estadístico de prueba. También existe la posibilidad de que la hipótesis nula se acepte cuando debería haberse rechazado (error de tipo II). Tenga presente que en una prueba de hipótesis solo se puede tomar una de dos decisiones: aceptar o rechazar la hipótesis nula. 4. Paso 5: Tomar una decisión. Debe subrayarse que siempre existe la posibilidad de rechazar la hipótesis nula cuando no debería haberse rechazado (error tipo I). Instituto Tecnológico Superior de Tierra Blanca Página 54 . Se considera el nivel de significancia de 0.Ejemplo en la cual se indica el procedimiento para la prueba de hipótesis Ejemplo El jefe de la Biblioteca Especializada de la Facultad de Ingeniería Eléctrica y Electrónica de la UNAC manifiesta que el número promedio de lectores por día es de 350.

4143965 Varianza de la muestra 2747.Paso 01: Seleccionamos la hipótesis nula y la hipótesis alternativa Ho: μ═350 Ha: μ≠ 350 Paso 02: Nivel de confianza o significancia 95% α═0. debido a que el numero de muestras es igual a 30. Columna1 Media Error típico Mediana Moda Desviación estándar 372.04706877 234 276 510 Instituto Tecnológico Superior de Tierra Blanca Página 55 .05 Paso 03: Calculamos o determinamos el valor estadístico de prueba De los datos determinamos: que el estadístico de prueba es t.8 9.56951578 381 405 52. en este caso determinamos la desviación estándar de la muestra y la utilizamos en la formula reemplazando a la desviación estándar de la población. Calculamos la desviación estándar muestral y la media de la muestra empleando Excel. pero la desviación estándar de la población es desconocida.36687081 0. conocemos la media de la población. lo cual se muestra en el cuadro que sigue.26897 Curtosis Coeficiente de asimetría Rango Mínimo Máximo 0.

0%) 11184 30 19.044.05. En caso contrario no se rechaza la hipótesis nula si Z queda entre -1.017 Instituto Tecnológico Superior de Tierra Blanca Página 56 .96. En este último paso comparamos el estadístico de prueba calculado mediante el Software Minitab que es igual a Z = 2.95. Por consiguiente la regla de decisión: es rechazar la hipótesis nula y aceptar la hipótesis alternativa.96.800 9. el área en la que no se rechaza Ho está entre las dos colas. se rechaza Ho.569 (354. Paso 05: Toma de decisión. One-Sample Z Test of mu = 350 vs not = 350 The assumed standard deviation = 52.38 0. Como el estadístico de prueba calculado cae a la derecha del valor critico de Z.38 y lo comparamos con el valor critico de Zc = 1. es por consiguiente 0. es decir 0. La regla de decisión la formulamos teniendo en cuenta que esta es una prueba de dos colas. está en cada cola. Por tanto no se confirma el supuesto del Jefe de la Biblioteca.05 da un valor de Zc = 1.414 N Mean SE Mean 95% CI Z P 30 372.96 y +1. 391.571868 Paso 04: Formulación de la regla de decisión.96.96.Suma Cuenta Nivel de confianza (95. El valor critico para 0. la mitad de 0. si el valor Z calculado no queda en la región comprendida entre -1.96 y +1.556) 2.025.

La prueba resultó ser significativa. Instituto Tecnológico Superior de Tierra Blanca Página 57 . se acepta la hipótesis alterna (H1) a un nivel de significancia de α = 0.Conclusiones: • Se rechaza la hipótesis nula (Ho). • La evidencia estadística no permite aceptar la aceptar la hipótesis nula.05.

Se satisfacen las condiciones para una distribución binomial 3.05. Se satisfacen las condiciones np≥5 y nq≥ 5. Las observaciones muestrales son una muestra aleatoria simple 2. el 61% obtuvo trabajo por medio de redes de contacto. para probar la aseveración de que la mayoría de los empleados (más del 50%) consiguen su trabajo por medio de redes de contacto.Prueba de una aseveración respecto de una proporción. Utilice los datos muestrales. Requisitos: 1. El estadístico de prueba para probar una aseveración sobre una proporción es: = − Ejemplo: De los resultados de una encuesta a 703 empleados elegidos al azar. Las aseveraciones sobre una proporción poblacional suelen probarse utilizando una distribución normal como aproximación de la distribución binomial. con un nivel de significancia de 0. Paso 0 : Analizar si se cumplen los requisitos: Paso 0 Paso 1 Paso 2 Paso 3 Paso 4 Paso 5 Paso 6 Paso 7 Paso 8 Instituto Tecnológico Superior de Tierra Blanca Página 58 .

1 proportion. Introduzca el tamaño de muestra y el numero de éxitos y después haga clic en Options y proceda a introducir los datos en el cuadro sde dialogo. Para utilizar el método de aproximación normal presentado en este tema. Para alternative seleccione el formarto usado para la hipótesis alternativa.05 con el método del valor P. haga clic en el botón de options y luego en el recuadro que dice “use tests and interval based on normal distribution”. luego haga clic en el botón de summarized data. Basic statics. Según la teoría de Mendel ¼ de los vástagos de chicharos de chicharos debían tener vainas amarillas. el procedimiento determinado por Minitab consiste en determinar el valor P empleando un método exacto. para probar la aseveración de que la proporción de vástagos de chicharos con vainas amarillas es igual a ¼. Para el valor de test proportion. Utilice un nivel de significancia de 0. Instituto Tecnológico Superior de Tierra Blanca Página 59 . Para el nivel de confianza introduzca el complemento del nivel de significancia. uno de ellos dio por resultados descendencia que consistía en 428 plantas de chicharos con vainas verdes y 152 plantas de chicharos con vainas amarillas.Cuando Gregor Mendel realizó sus famosos experimentos de hibridación con chicharos. En vez de usar una aproximación normal. Paso 0 Paso 1 Paso 2 Paso 3 Paso 4 Paso 5 Paso 6 Paso 7 Paso 8 Minitab : Seleccione stat. ingrese la proporción empleada en la hipótesis nula.

Calcule los valores críticos siguientes: 1.EJERCICIOS: En los siguientes ejercicios examine la afirmación dada.prueba de dos colas.. 3.10. y los estadísticos de muestra incluyen n=1018 sujetos. después exprese la hipótesis nula y la hipótesis alternativa de manera simbólica. 1. Instituto Tecnológico Superior de Tierra Blanca Página 60 ..El peso medio de mujeres que han ganado el título de nuestra belleza México es igual 54.02. 2. es p ≠ 0. de los cuales 516 afirman sentirse satisfechos con su trabajo.Más del 25% de los usuarios de internet pagan sus facturas en línea..17 es p < 0. que es la desviación estándar de la población general.Las puntuaciones del CI de los profesores universitarios tienen una desviación estándar menor que 15.α=0. (Asegúrese de emplear el símbolo correcto...α=0. α=0.25. de los cuales 224 dicen que fumaron un cigarrillo la semana pasada.01 3.prueba de cola derecha.. La aseveración es que más de 75% de los empleados están satisfechos con su trabajo.05 2. 4. y los estadísticos de muestra incluyen a 580 adultos empleados.. α=0.8846 kg.19 Calcule el valor del estadístico de prueba z La aseveración es que la proporción de adultos que fumaron un cigarrillo la semana pasada es menor que 0.

los valores críticos y el valor P se resumen de la siguiente manera: 1. Use el nivel de significancia de 0.94% de ellos presentaba flores verdes.01. ¿Sería válida la conclusión aun hoy? ¿Por qué? .05. El resto tenia flores blancas. Instituto Tecnológico Superior de Tierra Blanca Página 61 . Utilice los resultados de esta muestra para probar la aseveración de que más del 15% de los hogares estadunidenses emplean el correo electrónico. Considere una prueba de hipótesis que utiliza un nivel de significancia de 0. se obtuvieron 8023 vástagos de chicharos y el 24. Se satisface una o ambas de las siguientes condiciones: la población se distribuye normalmente y n>30 El estadístico de prueba que se utiliza es el siguiente: = − √ Ejemplo: un fabricante de equipo deportivo desarrolla un nuevo sedal sintetico que afirma tiene una resistencia media a la tensión de ocho kilogramos con una desviación estándar de 0. Se conoce el valor de la desviación estándar poblacional 3. Pruebe la hipótesis µ= 8 kilogramos contra la alternativa µ≠8 kilogramos si se prueba una muestra aleatoria de 50 sedales y se encuentra que tienen una resistencia media a la tensión de 7.05 para probar la aseveración de que la plantas de chicharos con flores verdes se presenta en una proporción del 25% a) b) c) d) e) ¿Cuál es el estadístico de prueba? ¿Cuál es el valor crítico? ¿Cuál es el valor P? ¿Cuál es la conclusión? Se podría utilizar una hipótesis para “probar” que el porcentaje de plantas de chicharos con flores verdes es del 25% como se aseveró? En 1997 una encuesta de 880 hogares estadunidenses revelo que 149 de ellos emplean el correo electrónico.8 kg. La muestra es aleatoria simple 2. el estadístico de prueba.En uno de los famosos experimentos de Mendel sobre la hibridación.5 kilogramos. Utilice un nivel de significancia de 0. Prueba de hipótesis respecto a una media con desviación estándar poblacional conocida Los requisitos.

.Difiere para tamaños de muestra distintos 2. su forma más ancha refleja una mayor variabilidad..Se desconoce el valor de la desviación estándar poblacional σ El estadístico de prueba usado para este caso es: = − √ Propiedades importantes de la distribución t de Student 1..Tiene una media de t=0 Instituto Tecnológico Superior de Tierra Blanca Página 62 .La muestra es aleatoria simple 2.Paso 0 Paso 1 Paso 2 Paso 3 Paso 4 Paso 5 Paso 6 Paso 7 Paso 8 Prueba de hipótesis respecto a una media con desviación estándar poblacional desconocida Requisitos. lo que se espera cuando se utiliza s para estimar σ.. 1.Tiene la misma forma de campana que la distribución normal estándar. 3..

A continuación se presentan los pesos en gramos.8635 y una desviación estándar de s= 0. para probar la aseveración que hizo un gerente de producción de que los m&m tienen en realidad una media mayor que 0.. Paso 0 Paso 1 Paso 2 Paso 3 Paso 4 Paso 5 Paso 6 Paso 7 Paso 8 Instituto Tecnológico Superior de Tierra Blanca Página 63 ..4. Ejemplo: Control de calidad de los dulces m&m.05.8535 g.La desviación estándar de la distribución varía de acuerdo con el tamaño muestral y es mayor que 1.8535g para dar la cantidad anunciada.9 g. 5. de manera que los m&m deben tener un peso medio de al menos 396. en el empaque se afirma que el peso neto del contenido es de 396. elegidos al azar de una bolsa que contiene 465 m&m. esta distribución (t) se acerca más a la distribución normal estándar.9/465 = 0. Utilice el método tradicional siguiendo el procedimiento descrito en el diagrama de flujo. Utilice los datos muestrales con un nivel de significancia de 0. de manera que los consumidores están recibiendo mas que la cantidad indicada en la etiqueta. el conjunto de datos sobre los dulces m&m que se mostro en secciones anteriores incluye los pesos de 13 dulces m&m rojos.Conforme aumenta el tamaño muestral n. los cuales tienen una media de = 0.0576 g.

) de rechazar una hipótesis nula falsa.Potencia de una prueba: La potencia de una prueba de hipótesis es la probabilidad (1. Es decir. Instituto Tecnológico Superior de Tierra Blanca Página 64 . la potencia de una prueba de hipótesis es la probabilidad de sustentar una hipótesis alternativa que es verdadera. se calcula utilizando un nivel de significancia α particular y un valor específico del parámetro de la población que representa una alternativa al valor considerado como verdadero en la hipótesis nula.

considere aumentareltamañodelamuestra..042165. 0.=0.0 Lapotenciaesunafuncióndeltamañodelamuestraydeladesviaciónestándar.62ºF.Parad etectarunadiferenciamenorque0. =132.0496 55 Paraniveldesignif.Sifuera0.049655 mayor.9 0. 2.05ytamañ odelamuestra=13: Silamediaverdaderafueramayor queelobjetivopor 0.7 Pote ncia ¿Cuáleslaprobabilidaddedete ctarunadiferencia? <40% 60 % 90 % 100 % ¿Quédiferenciapuededetectarco nun tamañodemuest rade13? Diferencia Potencia 0.036769 0.0 80.8 0.. Datos muestrales: n=21. el valor o valores críticos y establezca la conclusión final. s=12. Ejercicios.032162 0. 1.0 70.tendríauna probabilidadde90.049655 60.05. obtenga la hipótesis nula.Suponga que se seleccionó una muestra aleatoria simple de una población distribuida en forma normal.ustedtendríaunaprobabilid adde60%dedetectar ladiferencia.032162.el conjunto de datos 2 del apéndice B incluye 106 temperaturas corporales con una media de 98. el estadístico de prueba. Utilice un nivel de significancia . el valor P.032162 0. El nivel de significancia es α= 0. la alternativa.20 ºF y una desviación estándar de 0.042165 0.0 90.Pruebatde1muestraparal amediadeRed Informededia gnóstico Ordendelosdatosenlahojadetrabajo Investigar valoresatípicos(marcadosenrojo). 1. Aseveración: La puntuación media del coeficiente intelectual de profesores de industrial es mayor que 120.0 0.

con base en esos resultados.de 0.05 para probar la aseveración de que la temperatura media corporal es menor que 98.6 ºF que suele utilizarse es errónea? .6ºF. ¿Parece que la media de 98.

02 11. y una muestra aleatoria simple de 24 latas produce las cantidades en onzas que se listan a continuación. Se prueba una nueva máquina embotelladora. pero no puede ser negativos. con gl= n-1 para el numero de grados de libertad.93 11.La muestra es aleatoria simple 2.051 oz. Utilice un nivel de significancia de 0. Los ingenieros de control de calidad desean asegurarse que un producto tenga una media aceptable.98 12.93 11. Ejemplo: El mundo de la industria comparte esta meta en común: mejorar la calidad reduciendo la variación. pero también quieren producir artículos con una calidad consistente. eliminando los defectos. (Las 24 cantidades tienen una desviación estándar de s=0.00 12.051 onzas.05 Instituto Tecnológico Superior de Tierra Blanca Página 66 .96 11.02 11.98 11.Curso de Estadística Básica Prueba de hipótesis respecto a una desviación estándar Requisitos: 1.95 12. 2.039 oz).. Propiedades de la distribución 1.02 11.90 12. Crown ha fabricado latas de bebidas de cola con cantidades que tienen una desviación estándar de 0.99 11. a diferencia de las distribuciones normales y t de student.99 11.99 12. 11. Los valores de chi cuadrada pueden ser cero o positivos. La distribución chi cuadrada no es simétrica.95 Paso 0 Paso 1 11.05 para probar la aseveración de que las latas de bebidas de cola de la nueva máquina tienen cantidades con una desviación estándar menor que 0.96 11.07 11.98 12.02 12.98 12.99 12.La población tiene una distribución normal El estadístico que se utiliza para este tipo de pruebas es: =( − 1) Valores P y valores críticos: Utilice la tabla A-4..01 11.02 11.

Curso de Estadística Básica Paso 2 Instituto Tecnológico Superior de Tierra Blanca Página 67 .

¿parece que la cocaína consumida por las madres afecta la variación de los pesos de sus bebés? 2.01 para probar la aseveración de que los dulces M&M de cacahuate tienen pesos que varían mas que los pesos de los dulces M&M sencillos.Curso de Estadística Básica Paso 3 Paso 4 Paso 5 Paso 6 Paso 7 Paso 8 En los siguientes ejercicios pruebe la aseveración dada..8222 y XR= 228. = 2700 g.. mientras que aquí se requieren 189 grados. Suponga que se selecciona una muestra aleatoria simple de una población distribuida normalmente. (como la tabla A-4 tiene un máximo de 100 grados de libertad. y s=645.Se realizó un estudio de hijos de madres que consumieron cocaína durante el embarazo y se obtuvieron los siguientes datos muestrales de pesos al nacer: n= 190. ¿Por qué los dulces de cacahuate tendrán pesos que varían mas que los pesos de los dulces sencillos? Instituto Tecnológico Superior de Tierra Blanca Página 68 . La desviación estándar de los pesos de los dulces M&M sencillos es de 0. utilice los siguientes valores críticos obtenidos por medio de software XL = 152.utilice un nivel de significancia de 0. Utilice el método tradicional de prueba de hipótesis.05 para probar la aseveración de que la desviación estándar de los pesos al nacer de hijos de consumidoras de cocaína difiere de la desviación estándar de 696 g de los pesos al nacer de los hijos de las mujeres que no consumieron cocaína durante el embarazo. Utilice un nivel de significancia de 0.056 g.31g. 1.9638) Con base en el resultado. una muestra de 41 dulces M&M de cacahuate tienen pesos con una desviación estándar de 0.

Requisitos: 1.Curso de Estadística Básica Inferencias a partir de dos muestras Inferencias acerca de dos proporciones Cuando se prueba una hipótesis acerca de dos proporciones poblacionales o cuando se construye un intervalo de confianza de la diferencia entre dos proporciones poblacionales.. Instituto Tecnológico Superior de Tierra Blanca Página 69 . si no que estimamos su valor común con la proporción muestral agrupada que se describe a continuación. Ejemplo: La siguiente tabla incluye los resultados de una prueba clínica en la que se dio tratamiento a pacientes con síndrome del túnel carpiano.. Proporción muestral agrupada. Observe que cuando se prueba la hipótesis nula de p1=p2. no hay necesidad de estimar los parámetros individuales p1 y p2.Para ambas muestras. los requisitos y la notación son los siguientes. 2. con un nivel de significancia de 0. el número de éxitos es de al menos 5 y el número de fracasos es de al menos 5. = + + Estadístico de prueba para dos proporciones (con Ho: p1=p2) = ( − )−( − + ) Donde p1-p2=0 (supuesto en la hipótesis nula) = = y + + = =1− Utilice la tabla A-2.tenemos proporciones de dos muestras aleatorias simples que son independientes. Utilice los datos muestrales de la tabla.05 para probar la aseveración de que la tasa de éxito de la cirugía es mejor que la tasa de éxito del entablillado.

Haga clic en OK dos veces. Si realiza una prueba de hipótesis. seleccione el formato para la hipótesis alternativa y haga clic en el cuadro para utilizar el estimado agrupado de p para la prueba. Haga clic en el botón summarize Data e ingrese los valores muestrales. luego 2 proportions.Curso de Estadística Básica Tabla de datos: tratamiento del síndrome del túnel carpiano Cirugía 67 73 92% Tratamien to Éxito un año después del tratamiento Número total de sujetos tratados Porcentaje de éxito Paso 0 Entablillado 60 83 72% Paso 1 Paso 2 Paso 3 Paso 4 Paso 5 Paso 6 Paso 7 Paso 8 Minitab: seleccione stat de la barra del menú principal. ingrese el valor aseverado de p1-p2. luego seleccione basic statics. Instituto Tecnológico Superior de Tierra Blanca Página 70 . Haga clic en options e introduzca el nivel de confianza deseado.

Grupo de tratamiento n1= 500 =100 Grupo Placebo n2=400 =50 Instituto Tecnológico Superior de Tierra Blanca Página 70 .. c)los valores críticos de z y d) el valor P 1.05 para probar la aseveración de que p1=p2. Utilice los tamaños muestrales y los números de éxitos dados para calcular a) el estimado agrupado . Suponga que usted planea utilizar un nivel de significancia de α=0.Curso de Estadística Básica EJERCICIOS: Calcule el número de éxitos x sugeridos por la afirmación dada: 1. b) El estadístico de prueba z. el 7% consumió una bebida alcohólica cada día.De 976 sujetos encuestados.

si se sabe que se trata de un error. sin entretenerse demasiado con cálculos aritméticos tediosos. pero se deben satisfacer los siguientes requisitos cuando se prueban hipótesis o cuando se hacen inferencias acerca de r. necesitamos medidas más precisas y objetivas. Conceptos básicos de correlación Iniciamos con la definición básica de correlación. Requisitos Dado cualquier conjunto de datos muestrales apareados siempre se puede calcular el coeficiente de correlación lineal r. un término que se utiliza comúnmente en el contexto de una relación entre dos variables. Utilizando datos muéstrales apareados (que en ocasiones se llaman datos bivariados). que sirve para detectar patrones lineales. si se sabe que se trata de un error.Curso de Estadística Básica Correlación Concepto clave: en esta sección se explica el coeficiente de correlación lineal r que es una medida numérica de la fuerza de la relación entre dos variables que representan datos cuantitativos. Los efectos de cualquier otro valor extremo deben tomarse en cuenta calculando r con y sin el valor extremo incluido. 1. C oefi cien te de co rrel ación lin eal Puesto que el examen visual de los diagramas de dispersión es muy subjetivo. la muestra de datos apareados es una muestra aleatoria de datos cuantitativos. calculamos el valor de r (generalmente con recursos tecnológicos) y luego utilizamos este valor para concluir que existe (o no) una relación entre las dos variables. Puesto que los programas de cómputo o las calculadoras suelen emplearse para calcular el valor de r. (es importante que los datos muestrales no se hayan reunido por medio de algún método inapropiado. los puntos se aproximan al patrón de una línea recta. como una muestra de respuesta voluntaria). El examen visual del diagrama de dispersión debe con firmar que los puntos se acercan al patrón de una línea recta. lo que quiere decir que cuando se grafican. 3. Los efectos de cualquier valor extremo. es importante enfocase en los conceptos de esta sección. Empleamos el coeficiente de correlación lineal r. 2. Instituto Tecnológico Superior de Tierra Blanca Página 71 . Es necesario eliminar cualquier valor extremo. En esta sección solo consideramos las relaciones lineales. Defini ció n Una correlación existe entre dos variables cuando una de ellas está relacionada con la otra de alguna manera.

Interpretación de r por medio de un programa de cómputo: si el valor P calculado es menor o igual que el nivel de significancia. r ρ Formula 1. indica que cada valor de x debe elevarse al cuadrado y después deben sumarse esos cuadrados. De lo contrario. Después de obtener. Es sumamente importante evitar confundirse entre Σx² y (Σx)² indica que cada valor de x debe multiplicarse primero por su valor y correspondiente. a 1 o a -1 son vagas.Curso de Estadística Básica Notación para el coeficiente de correlación lineal n Σ² Σx Σx ² (Σx)² Σxy representa el numero de pares de datos presentes. todos estos productos. De lo contrario. no existe evidencia suficiente para sustentar la conclusión de una correlación lineal. el valor de r siempre debe estar entre -1 y +1. no existe evidencia para sustentar la conclusión de una correlación lineal. denota la suma de todos los valores de x. denota la suma de los elementos indicados.6 = (∑ (∑ ) (∑ ) ) (∑ )(∑ (∑ ) ) (∑ ) Interpretación de r por medio de la tabla A-6: si el valor absoluto del valor calculado de r excede el valor de la tabla de A-6. Dada la manera en que la formula 1.956 obtenido en el ejemplo anterior. Interpretaciones tales como “cercano a” 0. indica que los valores de x deben sumarse y el total elevarse al cuadrado.6 está construida. concluya que existe una correlación lineal significativa. la letra griega rho se usa para representar el coeficiente de correlación lineal de una población. por lo que utilizamos el siguiente criterio especifico de decisión: Instituto Tecnológico Superior de Tierra Blanca Página 72 . tal como el valor de -0. pero si r se acerca -1 o +1. Interpretación del coeficiente de correlación lineal Necesitamos interpretar un valor calculado de r. representa el coeficiente de correlación lineal de una muestra. concluya que existe una correlación lineal. concluimos que hay una correlación lineal entre x y y. inclusive. se calcula su suma. Si r se acerca a 0. concluimos que no existe una correlación lineal entre x y y.

se concluye que existe una correlación lineal. la tabla A-6 lista valores que son “críticos” en este sentido: separan valores comunes de r de aquellos que son poco comunes. De lo contrario. Uso de un programa de cómputo: si el valor P calculado es menor o igual que el nivel de significancia. se concluye que existe una correlación lineal. De lo contrario.Curso de Estadística Básica Uso de la tabla A-6: Si el valor absoluto del valor calculado de r excede el valor de la tabla A-6. no existe evidencia suficiente para sustentar la con conclusión de una correlación lineal. Cuando en realidad no existe una correlación lineal entre x y y. no existe evidencia suficiente para sustentar la conclusion de una correlación lineal. Instituto Tecnológico Superior de Tierra Blanca Página 73 .

Curso de Estadística Básica Instituto Tecnológico Superior de Tierra Blanca Página 74 .

Curso de Estadística Básica Instituto Tecnológico Superior de Tierra Blanca Página 75 .

Curso de Estadística Básica Instituto Tecnológico Superior de Tierra Blanca Página 76 .

Curso de Estadística Básica Instituto Tecnológico Superior de Tierra Blanca Página 77 .

Curso de Estadística Básica Instituto Tecnológico Superior de Tierra Blanca Página 78 .

Curso de Estadística Básica Instituto Tecnológico Superior de Tierra Blanca Página 79 .

Curso de Estadística Básica Instituto Tecnológico Superior de Tierra Blanca Página 80 .