Club GeoGebra Iberoamericano

Club GeoGebra Iberoamericano

10
PROBABILIDAD E INFERENCIA ESTADÍSTICA

Probabilidad e inferencia estadística

1

si ejecutamos el comando nPr[6. describimos los comandos que ofrece GeoGebra para obtener el número de variaciones. n] en la vista CAS obtendremos la expresión que nos permite obtener la variaciones sin repetición de m elementos tomados de n en n.Club GeoGebra Iberoamericano PROBABILIDAD E INFERENCIA ESTADÍSTICA INTRODUCCIÓN Este tema estará dedicado a exponer las opciones que GeoGebra ofrece para trabajar la probabilidad. permutaciones o combinaciones. por lo que bastará escribir m! Probabilidad e inferencia estadística 2 . Recordemos que para obtener el número de variaciones con repetición de me elementos tomados de n en n bastará con calcular el valor de . siempre que los argumentos que utilicen sean numéricos. El comando nPr se puede utilizar también en la línea de entrada. TÉCNICAS DE RECUENTO A continuación. sólo se podrá utilizar desde la vista CAS. Permutaciones sin repetición de m elementos se obtienen calculado el valor del factorial de m. En el caso que algún coeficiente sea simbólico. finalizando con algunas actividades sobre contraste de hipótesis. Por ejemplo.2] obtendremos 30 como número de variaciones de 6 elementos tomados de dos en dos. Variaciones sin repetición de m elementos tomados de n en n se calculan utilizando el comando nPr. Al escribir nPr[m. Comenzaremos con las distintas opciones de recuento para continuar con las distribuciones de probabilidad.

tomadas de n en n (en la vista CAS). Por ejemplo. al ejecutar NúmeroCombinatorio[6. n] devolverá la expresión de las combinaciones de m. NúmeroCombinatorio[m. Así. ¿Cuántos números de cinco cifras se pueden formar? ¿Cuántos de estos números comienzan por la cifra 3 y tienen como cifra final 1? c. responde a las siguientes cuestiones: a. al calcular 5! Obtendremos 120 como resultado. el tercero c veces. Este cálculo se puede realizar tanto en la vista algebraica como en la vista CAS. Para obtener las permutaciones de m elementos en los que el primer elemento se repite a veces. …. ¿Cuántos números de tres cifras se pueden formar de manera que la suma de sus cifras sea distinta? Probabilidad e inferencia estadística 3 . el segundo b veces. ¿Cuántos números de tres cifras distintas se pueden formar? b.2] obtendremos 15 como número de combinaciones de seis elementos tomados de dos en dos.Club GeoGebra Iberoamericano Por ejemplo. Actividades propuestas Actividad 1 Utilizando sólo las cifras impares. hay que aplicar la fórmula: Combinaciones de m elementos tomados de n en n se obtienen utilizando el comando NúmeroCombinatorio.

Actividad 3 Intenta determinar cuántas combinaciones son posibles en cada una de las apuestas siguientes: a. las matrículas de los autos tienen la forma siguiente: A-XYZT-BC. 2 como opción. tanto en la vista de hoja de cálculo como en la vista CAS. en las que: A es una letra que puede ser tanto una vocal como una consonante. c. con la que Al pulsar sobre esta herramienta aparecerá la siguiente ventana: Probabilidad e inferencia estadística 4 . determina cuántas matrículas distintas se pueden formar. la herramienta Calculadora de probabilidades podemos trabajar con distintas distribuciones. DISTRIBUCIONES DE PROBABILIDAD En las últimas versiones de GeoGebra encontramos. Una lotería en la que hay que marcar 6 números de 49 posibles.Club GeoGebra Iberoamericano Actividad 2 En un cierto país. Una lotería en la que el número premiado es de cinco cifras que se pueden repetir. Una quiniela de futbol con 14 resultados que admiten 1. XYZT son cifras que se pueden repetir y BC son letras que no pueden ser vocales. considerando que del abecedario se pueden utilizar los caracteres siguientes: ABCDEFGHIJKLMNOPQRSTUVWYZ. b. Con estas condiciones. X.

Si lo intenta cinco veces. En la parte derecha de la imagen aparecerá la tabla con las distintas probabilidades. calcula las siguientes probabilidades: a. establecemos que se trata de una distribución binomial e introducimos los valores 5 para n y 0. c. Por lo que una vez seleccionada la herramienta Cálculo de probabilidades. A partir de los valores anteriores.2048 Probabilidad e inferencia estadística 5 . podemos determinar la probabilidad correspondiente a los apartados a y c. Actividad 4 La probabilidad de que un jugador de golf haga hoyo en un lanzamiento a una cierta distancia es de 0.3277 P(dos aciertos)=P(X=2)=0.Club GeoGebra Iberoamericano Observamos que además de la gráfica en la que representa la probabilidad. Acierte alguna. No acierte ninguna vez.0. una para determinar el tipo de distribución y otro para establecer la probabilidad que deseamos obtener.2 para p.2. P(0 aciertos) = P(X=0)=0.2 . b. Acierte dos veces. disponemos de dos pestañas. Con los datos anteriores podemos determinar que se trata de una distribución binomial B5.

muestras de tamaño 4. tal y como aparece en la imagen siguiente: Probabilidad e inferencia estadística 6 . ¿cuál será la probabilidad de que el peso medio de una de esas muestras esté comprendido entre 65 y 72 Kg? ¿Cuál es la probabilidad de que el peso medio sea menor que 70 kg? Para una muestra de tamaño 4 la distribución de la media muestral seguirá una    N   .  n  . 8 4   en nuestro ejemplo serán .   N 70. Si elegimos al azar. Por tanto P(X≥1)=0. introduciendo 1 como valor para el extremo inferior del intervalo. indicando los valores correspondientes.6723. Ya solo queda establecer que deseamos obtener la probabilidad de un intervalo. distribución Normal cuyos parámetros serán Una vez seleccionada la herramienta Cálculo de probabilidades indicamos que la distribución sigue una Normal e introducimos los valores de la media y la desviación típica.Club GeoGebra Iberoamericano Para determinar la probabilidad de acertar alguna podemos calcular P(X>0)=1-P(X=0) o utilizar la opción que ofrece la ventana anterior. Actividad 5 El peso de los adultos de una determinada población sigue una distribución Normal de media 70 kg y desviación típica 16. estableciendo en probabilidad el valor por el lado derecho. que 16   N  70.

introduciendo al continuación el valor 70. Los resultados aparecen en la siguiente imagen: Actividades propuestas Actividad 6 En una empresa de 20 trabajadores se ha comprobado que cada uno falta al trabajo el 4% de los días. b) Falten al trabajo menos de tres trabajadores. P(65  X  72)  0.Club GeoGebra Iberoamericano Por tanto. Calcula la probabilidad de que en un determinado día: a) no se registre ninguna ausencia. c) Falte un único empleado. Probabilidad e inferencia estadística 7 .3327 Para obtener la probabilidad de que el peso medio sea menor que 70 Kg bastará con seleccionar Por lado izquierdo en la pestaña Probabilidad.

2 y desviación típica 1 punto. Es claro entonces que la probabilidad que queda en el intervalo será p = 1-α. Buscamos k tal que P[-k< x <k]=1-α Este valor se denomina valor crítico.1 entonces 1. es decir: P[-k < x <  +k] = p. Intervalo característico Sea X una variable aleatoria que se distribuye normalmente.α =0.9 y α /2=0.95 Buscamos en las tablas: k=1. hay que hallar k tal que P [ x <k] = 0. entonces se tiene que Si α =0.645 Probabilidad e inferencia estadística 8 . k). por tanto los intervalos característicos son de la forma (-k. Vamos a calcular los intervalos característicos para los valores más comunes que toma α. INTERVALOS DE CONFIANZA Recordemos algunos conceptos básicos. INFERENCIA ESTADÍSTICA. La probabilidad que dejamos fuera del intervalo característico la notaremos con α. Se seleccionó de manera aleatoria una muestra de tamaño 25. Si llamamos al valor de la variable que deja a su derecha una probabilidad α.1) la media es 0. Intervalo característico en la N(0. Un intervalo característico es un intervalo simétrico entorno a la media ( -k. la calificación de los alumnos sigue una distribución Normal de media 6. Determina la probabilidad de que la media de las calificaciones de los alumnos de una de esas muestras esté comprendida entre 6 y 6.6 puntos.1) Si tenemos la distribución N(0.05. corresponde a la probabilidad p = 1-α . es decir. .Club GeoGebra Iberoamericano Actividad 7 En una universidad.  +k) en el que la probabilidad de que un valor de la variable esté en ese intervalo es p.

es conocida.96 .100% es: siendo el valor comentado en el apartado de intervalos característicos.645 .96) Si α =0. Para ello se recurre a una muestra de tamaño n en la cual se obtiene una media muestral.575) Intervalo de confianza para la media Se desea estimar la media.1 es: (-1.645) Si α =0.025. Para ello seleccionamos la herramienta Cálculo de probabilidades.1) el intervalo característico cuyo valor crítico es 0. Probabilidad e inferencia estadística 9 .99 y α /2=0.005. 2.05 entonces 1. entonces el intervalo de confianza de µ con un nivel de confianza de (1 . GeoGebra calcula directamente el intervalo de confianza. µ. . Si la población de partida es normal. y en ella la pestaña Estadísticas.05 es: (-1. 1.1) el intervalo característico cuyo valor crítico es 0.995 Buscamos en las tablas: k= 2.96 En N(0.01 entonces 1. de una población cuya desviación típica.975 Buscamos en las tablas: k= 1. hay que hallar k tal que P[ x <k] = 0. o si el tamaño de la muestra es n > 30. σ.α =0.95 y α /2=0.575 En N(0.1) el intervalo característico cuyo valor crítico es 0. 1.Club GeoGebra Iberoamericano En N(0.α).575 .01 es: (-2.α =0. hay que hallar k tal que P [ x <k] = 0.

8 años. Introducimos los datos: Probabilidad e inferencia estadística 10 . para la edad. Se sabe que la edad en la población. para la edad media de la población. de la que procede esa muestra. en la vista anterior. al 94%.Club GeoGebra Iberoamericano Actividad 8 Elegimos. Obtenga un intervalo de confianza. una media de 17. la opción Z estimada de una Media. sigue una distribución Normal con una desviación típica de 0.5 años. En una muestra aleatoria de 100 individuos se ha obtenido.

Para un nivel de confianza del 94%. Determine un intervalo de confianza de la proporción de turismos que tienen motor diésel en esa ciudad. 17'6505). Introducimos los datos: Probabilidad e inferencia estadística 11 .100% es: Actividad 9 Elegimos. Para ello se recurre a una muestra de tamaño n. en la que se obtiene una proporción muestral p. Intervalo de confianza para la proporción Se desea estimar la proporción de individuos con una cierta característica que hay en una población.Club GeoGebra Iberoamericano Por tanto el intervalo de confianza es: (17 '3495. en la vista anterior. y se ha encontrado que 75 de ellos tienen motor diésel. El intervalo de confianza de la proporción con un nivel de confianza (1 – α). la opción Z estimada de una Proporción. En un estudio de mercado del automóvil en una ciudad se ha tomado una muestra aleatoria de 300 turismos. El error máximo cometido en la estimación es de 0’1505.

Club GeoGebra Iberoamericano Por tanto el intervalo de confianza es: (0’203. La media de la muestra ha sido de 37’1 ºC y la desviación típica de la población. CONTRASTE DE HIPÓTESIS Recordemos algunos conceptos básicos. El primer paso del contraste consiste en plantear estas hipótesis:   La hipótesis nula. se acepta o se rechaza con una probabilidad prefijada α. Calcula un intervalo de confianza para la media poblacional con un nivel de confianza del 99%. si la relación es una desigualdad. Hallar un intervalo de confianza para el porcentaje de votantes del partido A con un nivel de confianza del 90%. H0. relacionamos el parámetro con un valor. que es la afirmación que inicialmente se considera verdadera y que se quiere contrastar. Probabilidad e inferencia estadística 12 .0’297). que es la afirmación contraria a la planteada en la hipótesis nula. Actividades propuestas Actividad 10 En un hospital se ha tomado la temperatura a una muestra de 64 pacientes para estudiar la temperatura media de sus enfermos. H0. El error máximo cometido en esta estimación es de 0’047. El segundo paso del contraste consiste en calcular la zona de aceptación: La zona de aceptación está formada por los valores para los que se acepta la hipótesis nula H0. si la relación es una igualdad. La hipótesis alternativa. Un contraste de hipótesis es un procedimiento que nos permite decidir si una hipótesis realizada sobre un parámetro desconocido de la población. Actividad 11 En las últimas elecciones se ha tomado una muestra de 450 personas a la salida de los colegios electorales y 125 de ellas afirmaron haber votado al partido A. Cuando formulamos la hipótesis nula. de 1’04 ºC. INFERENCIA ESTADÍSTICA. Según la relación que establecemos entre ambos resultan:   Contrastes bilaterales. Contrastes unilaterales. H1. llamada nivel de significación.

Sin embargo. a continuación. fijado previamente en el contraste. El nivel de significación.1). Este tipo de problemas se suelen resolver hallando el intervalo de aceptación y valorando. Los estadísticos de contraste que vamos a utilizar son normal y para el caso de distribuciones normales o que se aproximen a la para el caso de proporciones. si se acepta la hipótesis nula o alternativa en función de que el valor que se compara esté en la zona de aceptación o en la de rechazo.Club GeoGebra Iberoamericano La zona crítica o de rechazo está formada por los valores para los que se rechaza la hipótesis nula H0. el valor crítico que se analiza es Z  mientras que en 2 un contraste unilateral el valor crítico es Z  . Primer método: Tipificar el valor muestral y compararlo con el intervalo de aceptación expresado en valores de la distribución Normal N(0.1). delimita las zonas de aceptación y de rechazo. Pueden darse estas situaciones: OBSERVACIÓN: En un contraste bilateral. son los valores de Z en los apartados señalados con flecha en las siguientes ventanas: Probabilidad e inferencia estadística 13 . GeoGebra los proporciona directamente. Sabemos que ambos siguen una distribución N (0. GeoGebra los resuelve de dos formas diferentes.

Club GeoGebra Iberoamericano Segundo método: Calcular el valor exacto del nivel de significación correspondiente al resultado muestral Z hallado anteriormente. GeoGebra los proporciona directamente. son los valores de P en los apartados señalados con flecha en las siguientes ventanas: Se aplica la siguiente regla: Probabilidad e inferencia estadística 14 .

Para comprobar lo que dice el fabricante respecto a la duración. 1’645). Nivel de significación: α = 0’1 H0: 0 = 500. mirando en las tablas de la N(0. H1: 0 ≠ 500. o bien que P=0’1615>0’1. se ha realizado una prueba con 49 bombillas y se ha obtenido una duración media de 492 horas. Activamos GeoGebra: Podemos observar que Z=-1’4 está en el intervalo de aceptación. ¿Podemos aceptar la afirmación del fabricante con un nivel de significación del 10%? Contraste: bilateral.1) obtenemos De = 1’645. el resultado no es significativo y por tanto se acepta H0. para un nivel de significación del 10% es (-1’645. Contraste de hipótesis bilateral para la media de la población Actividad 12 Un fabricante garantiza que la duración media de las bombillas que produce es de 500 horas con una desviación típica de 40. en la normal.Club GeoGebra Iberoamericano  Si P es mayor que el nivel de significación α fijado en el enunciado.  Si P es menor que el nivel de significación α fijado en el enunciado. el resultado es significativo y por tanto se rechaza H0. . En ambos casos se concluye que se acepta la hipótesis nula H0 Probabilidad e inferencia estadística 15 . Por tanto el intervalo de aceptación.

Para ello. Se desea contrastar si un nuevo proceso de fabricación no aumenta dicho peso medio. Activamos GeoGebra: Probabilidad e inferencia estadística 16 . De .Club GeoGebra Iberoamericano Contraste de hipótesis unilateral para la media de la población Actividad 13 El peso en vacío de los envases fabricados por una empresa. se eligen al azar 25 envases fabricados por la nueva técnica y se encuentra que la media de su peso en vacío es de 20. para un nivel de significación del 0’02 es . a un nivel de significación α = 0.5 gramos. es una variable aleatoria que sigue una ley normal con media 20 gramos y una desviación típica de 1 gramo.1) obtenemos = 2’10. ¿Se puede afirmar. Contraste: unilateral.02. según su método usual. mirando en las tablas de la N(0. en la normal. Por tanto el intervalo de aceptación. que el nuevo proceso ha aumentado el peso medio de los envases? Nivel de significación: α = 0’02 H0: 0 ≤ 20. H1: 0 > 20.

Por tanto el intervalo de aceptación. o bien que P=0’3291 > 0’01. Se desea contrastar la veracidad de esta afirmación y.1) obtenemos = 2’58. Nivel de significación: α = 0’01 De H0: p0 = 0’7. Activamos GeoGebra: Podemos observar que Z=-0’9759 está dentro del intervalo de aceptación. H1: p0 ≠ 0’7. en la normal. o bien que P=0’0062 < 0’02. Contraste: bilateral. 2’58). en la que se observa que 340 ven la televisión mientras cenan. se toma una muestra de 500 familias. mirando en las tablas de la N(0. para ello. En ambos casos se concluye que se acepta la hipótesis nula H0. si la afirmación es cierta con un nivel de significación de 0’01. mediante un contraste de hipótesis. En ambos casos se concluye que se rechaza la hipótesis nula H0 Contraste de hipótesis bilateral para la proporción de la población Actividad 14 Un estudio sociológico afirma que el 70% de las familias cena viendo la televisión. Probabilidad e inferencia estadística 17 . . Decida. para un nivel de significación del 1% es (-2’58.Club GeoGebra Iberoamericano Podemos observar que Z=2’5 está fuera del intervalo de aceptación.

con hipótesis nula Ho : po ≥ 0’26. informando que una encuesta propia indica que solo 240 de los 1000 usuarios encuestados afirman que habrían utilizado el coche particular. para verificar la afirmación del Ayuntamiento e indique la región crítica de dicho contraste para un nivel de significación del 5% y decida si podría aceptarse el informe del Ayuntamiento. Nivel de significación: α = 0’05 H0: p0 > 0’26. Establezca un contraste. un periódico local anuncia la falsedad del dato. o bien que P=0’0747 > 0’05. Actividades propuestas Probabilidad e inferencia estadística 18 . Contraste: unilateral. mirando en las tablas de la N(0. en la normal. Sin embargo.Club GeoGebra Iberoamericano Contraste de hipótesis unilateral para la proporción de la población Actividad 15 Un informe de un Ayuntamiento afirma que al menos el 26% de los usuarios del carril bici habrían utilizado el coche particular para sus desplazamientos de no haber existido dicho carril. En ambos casos se concluye que se acepta la hipótesis nula H0. De .1) obtenemos = 1’645. Por tanto el intervalo de aceptación. para un nivel de significación del 5% es . H1: p0 < 0’26. Activamos GeoGebra: Podemos observar que Z=-1’4419 está dentro del intervalo de aceptación.

Actividad 18 Una empresa dedicada a la fabricación de tornillos asegura que sólo 1% de su producción es defectuosa. la empresa asegura que el tiempo medio de espera para recibir atención no supera los 6 minutos. con un nivel de significación del 5%. ¿Podemos aceptar la hipótesis del fabricante con nivel de significación del 1%? Actividad 19 Los profesores de una academia de idiomas aseguran que el porcentaje de alumnos que estudian inglés en su Centro. Plantea un contraste de hipótesis. con una desviación típica de 2. ¿podemos aceptar la afirmación de los profesores con nivel de significación 0’01? Probabilidad e inferencia estadística 19 . la hipótesis de que la estatura media de esa población es de 160 cm? Actividad 17 En un servicio de atención al cliente. A partir de una muestra de 81 escolares de dicha población se ha calculado una estatura media de 159 cm y una desviación típica de 12’9 cm. Se selecciona una muestra de 150 tornillos y se observa que 3 de ellos son defectuosos.Club GeoGebra Iberoamericano Actividad 16 En una población escolar se ha comprobado que la estatura sigue un modelo Normal de Probabilidad. con nivel de significación del 5% para decidir si el tiempo medio de espera es superior al que indica la empresa. el tiempo medio de espera ha sido 8 minutos. del 58%. ¿Podríamos rechazar. 23 de ellos estudian inglés. En una muestra de 30 llamadas. es como mínimo. Si de una muestra de 40 alumnos.