You are on page 1of 180

CAPTULO I

Estadstica e Investigacin

Estadstica e Investigacin
1.

La Estadstica y la Investigacin Cientfica


1

Slo con el propsito de crear un marco adecuado para nuestra exposicin, daremos
algunas ideas bsicas sobre investigacin, sin explicar los conceptos, dado que esto
compete al curso de Metodologa de la Investigacin Cientfica.
De las muchas definiciones que se pueden encontrar en la bibliografa, la siguiente
es sencilla, clara y completa: Es el estudio sistemtico, controlado, emprico, reflexivo y
crtico de proposiciones hipotticas sobre las supuestas relaciones que existen entre
fenmenos naturales. Permite descubrir nuevos hechos o datos, relaciones o leyes, en
cualquier campo del conocimiento humano.... (Canales, Alvarado y Pineda, 1996, p. 53).
Segn Canavos (1992), explica los tipos caractersticas y fases de la investigacin:
1.1. Qu tipos de Investigacin existen?
Existen tantas tipificaciones de la investigacin como criterios se emplean. Es
frecuente encontrar en la literatura sobre metodologa de la investigacin una exposicin de
las clasificaciones segn diversos criterios que a juicio de sus autores son los "ms
importantes". Ante esta situacin es conveniente aclarar que no hay clasificaciones buenas
ni malas, ni verdaderas ni falsas, ni ms importantes ni menos importantes. Una tipificacin
s puede ser ms o menos adecuada, til en mayor o menor grado para identificar una
investigacin. Hay quienes pretenden tipificar una investigacin particular segn los
diferentes criterios conocidos, el resultado es, en la mayora de los casos, un embrollo
artificial e intil.
En este texto le presentamos slo una tipificacin, la que en base a nuestra experiencia,
resulta ser de mayor utilidad en muchas disciplinas, en particular para las investigaciones
en el campo de la educacin y administracin. (Canales, 1996)
1.1.1. La Investigacin Descriptiva (Diagnstica).
Cuando el objetivo de la investigacin es la descripcin o la caracterizacin de
un aspecto, fenmeno o un proceso educativo, estaremos en el caso de una investigacin
descriptiva.
*La investigacin descriptiva univariada.
Un ejemplo de este tipo sera una investigacin que se plantea el siguiente
objetivo:
"Identificar las caractersticas de los cliente puntuales en los crditos del Banco de Crditosucursal Balta, atendidos en el presente ao 2016".
La descripcin del fenmeno de la desercin consistir fundamentalmente en la medicin
de su incidencia segn gnero, grado de estudio, lugar de procedencia del cliente, tipo de
cliente, tipo de tarjeta que posee, movimientos mensuales que realiza a la tarjeta, actividad
2

a la que se dedica el cliente, etc.


Se trata de una investigacin cuyo propsito es el de caracterizar el comportamiento de una
sola variable, un solo fenmeno: clientes puntuales en los crditos. (Canales, 1996)

a)
b)

c)

d)

Caractersticas. En general, una investigacin descriptiva univariada es aquella en la que:


El objetivo del estudio se limita a la descripcin o caracterizacin de un fenmeno o
proceso a travs de una serie de indicadores pertinentes para dicho propsito.
No se formulan hiptesis de relacin entre variables. El anlisis puede implicar la
formulacin y contraste de hiptesis estadsticas de bondad de ajuste, que centra el inters
en evaluar la distribucin terica de la variable o indicador en cuestin.
Desde la visin de algunos metodlogos este tipo de trabajo no es considerado como una
investigacin; nosotros consideramos que es una tarea con valor cientfico, a un nivel
inicial en la formacin de investigadores.
Se lleva a cabo sobre la base a una muestra, y no tiene sentido hablar de variables
dependientes o independientes. (Canales, 1996)
CUIDADO. La expresin univariada, se debe entender como
el estudio de un solo fenmeno, ms adelante aclararemos
*La investigacin descriptiva correlacional.
Es aquella en la que el objetivo es el de buscar la relacin entre dos o ms
fenmenos o procesos. En el rea de la educacin consideremos que estamos interesados en
investigar no slo la desercin, sino que buscamos su relacin o vinculacin con otra(s)
variable(s), tales como las condiciones socioeconmicas, condiciones sociodemogrficas o
las caractersticas psicolgicas de los desertores. El objetivo de la investigacin podra ser
formulado en los siguientes trminos: (Canales, 1996)
Determinar la relacin del fenmeno de la desercin con las condiciones
sociodemogrficas y psicolgicas de los escolares del Centro Educativo 10104

Caractersticas. En este tipo de investigaciones:


a) Se consideran dos o ms variables, en el caso de nuestro ejemplo las variables son la
desercin, las condiciones sociodemogrficas y las condiciones psicolgicas.
b) Se formula hiptesis de relacin entre las variables. Esta relacin slo es de correlacin o
covariacin y no de causa-efecto. La estructura de las hiptesis es, en forma general:
c) Existe una relacin directa (o inversa) entre la variable X y la variable Y
d) En cuanto a la funcin de las variables en la estructura relacional, una(s) variable(s)
puede(n) considerarse Variable(s) dependiente(s) y otra(s) como variable(s)
independiente(s), sin embargo, en la mayora de los casos no es posible o no es correcto
3

atribuir a las variables la funcin de ser dependientes o independientes, lo correcto es


considerarlos como fenmenos concomitantes o variables que varan en forma conjunta, es
decir, hay una covariacin entre ellas.
e) Se realizan las mediciones de las variables a travs de un conjunto de indicadores y
mediante procedimientos estadsticos se detecta la existencia o no de una relacin y, en
caso de existir evidencia, se cuantifica el grado de relacin entre los indicadores.
f) Las relaciones que se detectan no son relaciones de causa - efecto. Luego, no es correcto
tampoco formular conclusiones cuya estructura es: " la variable A influye en la variable B"
o "el fenmeno o factor A es causa del fenmeno o variable B".
g) Este tipo de investigacin tambin se puede realizar sobre la base de una o ms muestras.
(Canavos, 1992)
1.1.2. La Investigacin experimental.
Supngase que un profesor est interesado en investigar los logros en el
aprendizaje de los estudiantes mediante el uso del Nuevo Enfoque Pedaggico (N.E.P.)
frente al enfoque tradicional; Postula la hiptesis de que el nuevo enfoque pedaggico
permite el logro de aprendizajes en mayor grado que el enfoque tradicional. Cuenta con 80
escolares que tienen los mismos antecedentes acadmicos y son similares en muchas
caractersticas tales como edad, nivel educativo, nivel socioeconmico, inteligencia, etc.
Para verificar su hiptesis nuestro docente investigador procede del modo siguiente:
(Canavos, 1992)
-

Forma dos grupos de 40 estudiantes cada uno, asignando al azar a cada elemento en uno de
los grupos. Uno de los grupos constituye el Grupo Control y el otro, el Grupo
Experimental.
Conduce el proceso de enseanza-aprendizaje de modo que emplea el Nuevo Enfoque
Pedaggico con el Grupo Experimental y el Enfoque Tradicional con el Grupo Control.
Finalizado el periodo de aplicacin de ambos enfoques, realiza la evaluacin del logro de
los objetivos en ambos grupos y
Procede a comparar ambos grupos mediante algn test (o prueba) estadstica.
Caractersticas
La experimentacin se utiliza para deducir relaciones causales. El significado cientfico de
la causalidad difiere del significado comn. El cuadro siguiente, reproducido de Malhotra,
aclara lo que debemos entender por causalidad en el campo de la ciencia. (Canavos, 1992)
Tabla 1
Significados comn y cientfico de causalidad
4

Significado comn
Significado cientfico
-X es la nica causa de Y
-X es slo una de las causas posibles de Y
-X siempre debe llevar a Y
-La presencia de X provoca que la presencia de Y
sea ms probable (X es una probable causa de
(X es una causa que determina Y)
Y)
-Es posible probar que X es la causa de Y.
- Es difcil probar que X sea la causa de Y. A lo
ms podemos inferir que X es una causa de Y.
Fuente: Malhotra, 2008
-Se formula la hiptesis de relacin causal entre las variables.
-Se puede hablar con propiedad de la variable dependiente (efecto) y de la variable
independiente (causa). En nuestro ejemplo la variable dependiente es el logro de objetivos
y la variable independiente es el enfoque aplicado, es una variable cualitativa con dos
modalidades de variacin: el N.E.P. y el Enfoque Tradicional.
-Se manipula de manera intencional la o las variables independientes.
-Se mide el efecto de la variable independiente sobre la variable dependiente.
-Se controla la validez interna de la situacin experimental, para evitar la influencia de
otras variables extraas. (Canavos, 1992)
Niveles de la Investigacin
Cientfica

INVESTIGACIN
EXPERIMENTAL

INVESTIGACIN
CORRELACIONAL
INVESTIGACIN
DESCRIPTIVA
UNIVARIANTE

Figura 1: La siguiente figura trata de expresar los niveles para cada uno de los

tipos de investigacin referidos.


Fuente: Malhotra, 2008
1.2 Cuntas y cules son las fases de la Investigacin?
En el proceso de investigacin se pueden identificar varias fases, siendo las dos
grandes fases las siguientes:

1.2.1. Fase de Planeacin


a. Seleccin del tema.
5

b. Planteamiento del problema


- Formulacin del Problema.
- Formulacin de objetivos
- Justificacin e Importancia.
c. Construccin del marco terico
- Teoras
- Antecedentes
- Datos
- Variables
- Hiptesis.
d. Diseo metodolgico
- Tipo de Investigacin
- Seleccin de diseo de la investigacin
- Diseo de la muestra
- Elaboracin de instrumentos de recoleccin de datos
- Diseo de formatos de tabulacin
- Previsin de los anlisis a realizar con los datos.
1.2.2. Fase de Ejecucin.
a. Seleccin de la muestra
b. Obtencin de datos
c. Edicin de datos
d. Codificacin de datos
e. Creacin de una base de datos
f. Anlisis de datos
g. Presentacin de los resultados del anlisis
h. Interpretacin de resultados
i. Formulacin de conclusiones
j. Redaccin y comunicacin del Informe de investigacin.
1.3. En qu fase del proceso de Investigacin interviene la Estadstica?
La Estadstica interviene en las dos fases del proceso de investigacin.
En la fase de Planeacin, la Estadstica interviene en el Diseo Metodolgico,
concretamente, en el diseo de la muestra, la elaboracin de los instrumentos de
recoleccin de datos, diseo de los formatos de los reportes o tablas y la previsin de los
mtodos especiales a emplear en el anlisis de los datos recolectados. (Canavos, 1992)
En la fase de Ejecucin, la Estadstica interviene casi en todas las actividades que se
sealan, salvo en la interpretacin de los resultados del anlisis, que es una tarea de

explicacin de los hallazgos de la investigacin a partir del marco terico respectivo.


(Devore, 1998)
1.4 En conclusin. Qu es la Estadstica?
Podemos decir que la Estadstica es una Ciencia que proporciona mtodos eficientes
para practicar la investigacin cientfica.
Es imprescindible establecer tres grandes niveles de anlisis de la estadstica para
aproximarnos a los datos de una investigacin

Estastica

Aproximacin univariada:
Ordenar, resumir, tabular, graficar, describir, estimar
parmetros, evaluar ajuste, contrastar hiptesis (media,
proporcin)
Aproximacin Bivariada:
Contrastar diferencia entre grupos, analizar relaciones
entre variables.

Aproximacin Multivariada:
Elaborar modelos y contrastarlos empricamente.
Realizar pronsticos, Identificar grupos homogneos,
Figura 2: La figura muestra los tres grandes niveles de la estadstica
fatores o dimensiones subyacentes.

aproximacin a la investigacin
Fuente: Elaboracin propia

La estadstica constituye una metodologa para realizar investigaciones con un


enfoque cuantitativo. Existe el enfoque cualitativo de la investigacin, que se basa en
metodologas tales como la hermenutica y la etnografa.
Los mtodos que proporciona la estadstica son tan diversos que generalmente se dividen
en dos grandes categoras: estadstica descriptiva y estadstica inferencial.
1.4.1 Estadstica descriptiva:
Es la rama que se encarga de describir, analizar una serie de datos y extraer
conclusiones sobre el comportamiento de estas. Los grficos, tablas, diagramas y clculos
descriptivos nos ayudan a mostrar los datos de manera ms clara y elocuente.
1.4.2 Estadstica inferencial:
7

Es la rama que implica generalizaciones y afirmaciones con respecto a la


probabilidad de su validez. (Canavos, 1992)
Hasta esta parte tenemos una primera visin de la relacin entre la Investigacin
Cientfica y la Estadstica.
1.5 Importancia de la Estadstica
No existe actividad humana en que se deje de usar la Estadstica, las decisiones ms
importantes en nuestra vida se toman con ayuda de esta ciencia. La importancia en el rea
cientfica es porque:
a) Realiza una descripcin ms exacta.
b) Permite resumir los resultados de manera significativa y cmoda.
c) Nos permite obtener conclusiones generales y especficas.
1.6 Nomenclatura usada en la Estadstica
1.6.1 Medicin:
La medicin es un proceso de asignacin de nmeros u otros signos a las
caractersticas de los objetos, de acuerdo con ciertas reglas especificadas con anticipacin.
1.6.2 Poblacin:
Se denomina poblacin al conjunto de todas las unidades de observacin o
anlisis (que consiste en personas, animales, objetos, etc.), cuyas caractersticas observables
se van a estudiar. Una poblacin debe definirse en trminos de su contenido, extensin y
tiempo.
Tarea: En el caso del ejemplo de investigacin descriptiva:
Cul es el objetivo?
Respuesta:.......................................................................................................
Cul es el fenmeno de inters a investigar?
Respuesta: El fenmeno de
Dnde tiene lugar el fenmeno?
Respuesta: .........................................
En quienes ocurre el fenmeno?.
Respuesta:.......................................................................................................
La poblacin bajo estudio se debe definir siempre:
Describiendo sus elementos o entidades que la conforman, de modo que se pueda saber con
precisin si un elemento dado pertenece o no a la poblacin.
Delimitndolo
en el espacio.
Dnde
fenmeno?
Si la poblacin
bajo estudio
no ocurre
es muyelgrande,
en el sentido de la cantidad de sus
Delimitndolo
en
el
tiempo.
Cundo
ocurre
el
fenmeno?
elementos, y si se cuenta con los medios econmicos y el tiempo suficientes, la
investigacin se realiza con todos los elementos de la poblacin.
8

1.6.3 Muestra:
Es una parte, un subgrupo de elementos de la poblacin que se selecciona para
participar en el estudio. Cuando la poblacin es muy grande, es decir tiene cientos o miles
de elementos o cuando los medios y el tiempo son limitados, la investigacin se conduce
slo por la muestra. (Canavos, 1992)
Representacin de poblacin y muestra

Figura 3. La figura nos representa la muestra como parte de una poblacin


de estudio.

Fuente: Lpez, 2014


1.6.4 Unidad de Anlisis:
Es cualquier elemento que tenga informacin sobre el fenmeno que se estudia.
As, si estudiamos la altura de los nios de una clase, cada alumno es una unidad de
anlisis; si estudiamos el precio de la vivienda, cada vivienda es una unidad de anlisis.
(Canavos, 1992)
1.6.5 Dato:
Es el valor o respuesta que adquiere la variable.
1.6.6 Constante:
Es un dato cuyo valor no puede cambiar durante la ejecucin de la investigacin.
Recibe un valor en el momento de la recoleccin y este permanece inalterado durante toda
la investigacin.
1.6.7 Estadgrafo:
Es una medida usada para describir el comportamiento de una variable en la
muestra. Sirven para estimar parmetros o como valores de distribuciones de probabilidad
que permiten hacer inferencia estadstica. (Canavos, 1992)
1.6.8 Parmetro:
9

Son todas aquellas medidas que describen numricamente la caracterstica de una


poblacin. Tambin se les denomina valor verdadero, ya que una caracterstica poblacional
tendr un solo parmetro (media, varianza, etc.). Sin embargo, una poblacin puede tener
varias caractersticas, y, por tanto, varios parmetros.
1.6.9 Variable:
Es una caracterstica que representa a aquello que vara o que est sujeto a algn
tipo de cambio. Se trata de algo que se caracteriza por ser inestable, inconstante y mudable.
1.6.10 Indicador:
Son medidas verificables de cambio o resultado diseadas para contar con un
estndar contra el cual evaluar, estimar o demostrar el progreso con respecto a metas
establecidas. (ONU, 2002)

1.7 Clasificacin de variables y escala de medicin


Trataremos la clasificacin de variables por su naturaleza, por su escala y por la
relacin de sus variables
1.7.1 Por su Naturaleza
Clasificacin de las Variables por su Naturaleza

Cualitativas
Por su
Naturaleza

Discretas
Cuantitativas
Continuas

Figura 4: Por su naturaleza, las variables se clasifican en cualitativas y


cuantitativas, y a su vez las cuantitativas en discretas y continuas

Fuente: Lpez, 2014


1.7.1.1 Variables cualitativas: Son las variables que expresan distintas
cualidades, caractersticas o modalidad. Cada modalidad que se presenta se denomina
atributo o categora. Las variables cualitativas pueden ser dicotmicas cuando slo pueden
tomar dos valores posibles como: s y no, hombre y mujer, etc. o son politmicas cuando
pueden adquirir tres o ms valores. (Lpez, 2014)

10

1.7.1.2 Variables cuantitativas: Son las variables que se expresan mediante


cantidades numricas. Las variables cuantitativas adems pueden ser:
Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de
valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores
entre los distintos valores especficos que la variable pueda asumir. Ejemplo: El nmero de
hijos (1, 2, 3, 4, 5).
Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo
especificado de valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg,...) o la altura (1,64 m,
1,65 m, 1,66 m,...), o el salario. Solamente se est limitado por la precisin del aparato
medidor, en teora permiten que exista un valor entre dos variables. (Lpez, 2014)
1.7.2 Por su Escala
Clasificacin de las Variables por su Escala

Nominal
Cualitativas
Ordinal

Por su
Escala

Intervalo
Cuantitativas
Razn

Figura 5: Por su escala, las variables cualitativas pueden ser nominales u


ordinales, y las cuantitativas en escala de intervalo y razn.

Fuente: Miller, 1992


1.7.2.1 Variable cualitativa de escala Nominal: Presenta modalidades no
numricas que no admiten un criterio de orden, por ejemplo: sexo, estado civil, profesin,
color de cabello, etc.
1.7.2.2 Variable cualitativa de escala Ordinal: Presenta modalidades no
numricas que admiten un criterio de orden, por ejemplo: nivel de instruccin, ciclo
acadmico, cargo administrativo, etc.
1.7.2.3 Variable cuantitativa de escala Intervalo: Son variables numricas
cuyos valores representan magnitudes y la distancia entre los nmeros de su escala es igual.
Con este tipo de variables podemos realizar comparaciones de igualdad/desigualdad,
establecer un orden dentro de sus valores y medir la distancia existente entre cada valor de
la escala. Las variables de intervalo carecen de un cero absoluto, por lo que operaciones
11

como la multiplicacin y la divisin no son realizables. Un ejemplo de este tipo de


variables es la temperatura, ya que podemos decir que la distancia entre 10 y 12 grados es
la misma que la existente entre 15 y 17 grados. Lo que no podemos establecer es que una
temperatura de 10 grados equivale a la mitad de una temperatura de 20 grados. (Lpez,
2014)
1.7.2.4 Variable cuantitativa de escala Razn: Las variables de razn poseen
las mismas caractersticas de las variables de intervalo, con la diferencia que cuentan con
un cero absoluto; es decir, el valor cero (0) representa la ausencia total de medida, por lo
que se puede realizar cualquier operacin Aritmtica (Suma, Resta, Multiplicacin y
Divisin) y Lgica (Comparacin y ordenamiento). Este tipo de variables permiten el nivel
ms alto de medicin. Las variables altura, peso, distancia o el salario, son algunos
ejemplos de este tipo de escala de medida. (Lpez, 2014)
1.7.3 Por la relacin de sus variables
Clasificacin de las Variables por la Investigacin.

Dependiente
Por su
Investigacin
Independiente
Figura 6: Las variables por su investigacin pueden clasificarse
en dependientes e independientes.

Fuente: Miller, 1992

1.7.3.1 Variables Dependientes: Es aquella que dentro de una hiptesis


representa la consecuencia, el efecto, el fenmeno que se estudia. Se simboliza con la letra
Y. Ejemplo: entre las variables rendimiento acadmico y aplicacin de mtodos, la variable
dependiente es rendimiento acadmico.
1.7.3.2 Variables Independientes: Es aquella que influye en la variable
dependiente y no depende de otra variable, dentro de una hiptesis. Se simboliza con la
letra X. Ejemplo: entre las variables hiperactividad y falta de autoestima, la variable
autoestima es independiente, ya que explica o influye en la hiperactividad del nio. (Miller,
1992).

12

PROBLEMAS PROPUESTOS
1. Para cada enunciado identificar a qu tipo de investigacin corresponde y que
tipo de estadstica (descriptiva o inferencial) se va a aplicar:
a) Determinar las preferencias de los habitantes de una ciudad por ciertos programas
de t.v.
b) Investigar los efectos de una clase de abonos en el crecimiento precoz de un tipo de
maz.
c) Evolucin del servicio de clientes en los bancos.
d) Evaluar los efectos de un programa para prevenir los comportamientos delictivos en
jvenes que han abandonado sus hogares.
e) Determinar la relacin entre el estado de nimo motivacional de los trabajadores y
el nivel de productividad de los mismos.
f) Determinar algunas caractersticas de las escuelas pblicas de un pas.
g) Determinar la relacin entre inteligencia (C.I.) que tiene los estudiantes y el estado
educativo de los padres de familia.
h) Determinar las necesidades de asistencia mdica en lnea.
i) Estudio de mercado y los perfiles de consumidor de cierto producto.
j) Efecto de la motivacin de logros en el rendimiento de los estudiantes.
2. Clasifique adecuadamente las diversas variables
VARIABLES
Nmero de artculos elctricos vendidos
Actitud de los pacientes durante su internado
El peso de la carga de los camiones
La longitud de 1000 tornillos con arandela y tuerca
El grado acadmico de un docente
Marca de computadoras utilizadas
Cantidad de dinero gastado en libros
Volumen de agua de un reservorio
Los tipos de fallas de una maquinaria
Nmero de inasistencias en un mes
Nivel socioeconmico de los habitantes de Chiclayo
Gravedad de un infarto
Nmero de ataques de asma semanales

TIPO

ESCALA

13

3. Para cada ejercicio, identificar: poblacin, unidad de anlisis, muestra, variable y


tipo de variable:
a. La empresa Telefnica, desea disear nuevos planes de una tarifa en el servicio de telefona
mvil en la ciudad de Lima. Se elige 50 usuarios de telefona mvil y se observa sus gastos
en trfico telefnico.
b. Se est haciendo un estudio de la calidad de la produccin de lingotes o barras de acero
producidos por la empresa Sider Per de Chimbote. Se evalan los pesos y dimetros de
una muestra de 50 lingotes de acero. Dicha muestra fue obtenida de la produccin diaria en
forma aleatoria y las unidades de medida estn dadas en kg. y cm.
c. La Oficina de Servicios Generales de la USS desea conocer los medios en los cuales con
mayor frecuencia se transportan los alumnos de la USS. Para ello realiza una encuesta a 50
alumnos de pregrado en el semestre 2012-II y encuentra que el 70% de los encuestados usa
el transporte pblico y el 20% usa el transporte de la universidad.
d. En una farmacia de Chiclayo, se est recogiendo informacin sobre el grado de satisfaccin
de los clientes respecto a su servicio nocturno, para ello se toma una muestra de 70 clientes
y concretamente se les pregunta en cuanto a la relacin calidad-precio de los medicamentos
en este servicio nocturno.
e. Un mdico de cabecera trabaja en un rea rural del distrito de Ferreafe que cuenta con
4500 habitantes, y est interesado en conocer cuando se producen un mayor nmero de
demanda de asistencia a domicilio, para reforzar el horario que ms lo necesita. Para ello
realiza una encuesta a 200 habitantes y ha recogido datos sobre las ltimas demandas que
ha tenido y las ha catalogado como visitas de maana, tarde, noche o festivo dependiendo
de la hora y en el da en que se han producido.

f. El Director del diario la Industria quiere saber cul es el diario que ms prefieren los
lectores de la ciudad de Chiclayo. Para llevar a cabo este estudio se seleccion una muestra
de 684 lectores de dicha ciudad.
g. La Facultad de Ciencias de la Comunicacin de una Universidad Pblica cuenta con 5000
estudiantes y est realizando un estudio sobre el impacto de las redes sociales y el internet
en la formacin de los jvenes de la especialidad de Comunicacin Social. Para ello se
encuesta a chicos y chicas de primer y segundo semestre de dicha especialidad, si se
aplicaron 200 encuestas lo que proveer resultados del por qu las nuevas tecnologas se
han vuelto tan necesarias en estos das?
14

CAPTULO II
Mtodo de recoleccin de datos

15

Mtodos de Recoleccin de Datos

2. Mtodos, organizacin y presentacin de datos


2.1 Mtodos de recoleccin de datos
Una vez que seleccionamos el diseo de investigacin apropiado y la muestra adecuada
(probabilstica o no probabilstica), de acuerdo con nuestro problema de estudio e hiptesis
(si es que se establecieron), la siguiente etapa consiste en recolectar los datos pertinentes
sobre los atributos, conceptos o variables de las unidades de anlisis o casos (participantes,
grupos, organizaciones, etctera). (Sols, 2013)
Recolectar datos implica elaborar un plan detallado de procedimientos que nos conduzcan
a reunir datos con un propsito especfico. Este plan incluye determinar:
a Cules son las fuentes de donde se obtendrn los datos? Es decir, los datos van a ser
proporcionados

por

personas, se producirn de observaciones o se encuentran en

documentos, archivos, bases de datos, etctera.


b. En dnde se localizan tales fuentes? Regularmente en la muestra seleccionada, pero es
indispensable definir con precisin.
c. A travs de qu medio o mtodo vamos a recolectar los datos? Esta fase implica elegir
uno o varios medios y definir los procedimientos que utilizaremos en la recoleccin de los
datos. El mtodo o mtodos deben ser confiables, vlidos y objetivos.
d. Una vez recolectados, de qu forma vamos a prepararlos para que puedan analizarse y
respondamos al planteamiento del problema? (Sols, 2013)
2.2. Tcnicas de Recoleccin de Datos:
Existen 5 tcnicas de recoleccin de datos y puedes utilizar una o ms de ellas en tu trabajo
de investigacin.
2.2.1. Documentacin
Constituye la tcnica de recoleccin de datos ms bsica y a la vez la ms inexacta;
corresponden a los estudios retrospectivos donde es la nica forma disponible de

16

recopilar la informacin. Habitualmente la informacin fue recolectada con fines


distintos al estudio en curso.
Los estudios basados en la documentacin no cuentan con instrumentos de
medicin, nicamente con una ficha de recoleccin de datos donde debemos copiar
o trasladar la informacin previamente registrada. (Sols, 2013)
2.2.2. Observacin
Es el examen detenido de los diferentes aspectos de un fenmeno, con la finalidad
de estudiar sus caractersticas, rasgos y comportamiento dentro del ambiente donde
se desarrolla el propio fenmeno.
La observacin es el registro, en forma sistemtica, de patrones conductuales de
personas, objetos y sucesos a fin de obtener informacin sobre el fenmeno de
inters.
La observacin es cientfica cuando es sistemtica, controlada y cuenta con
mecanismos destinados a evitar errores de subjetividad, confusiones, etc. La
observacin no participante es cuando no perturba la accin o situacin que se est
investigando.
La observacin participante implica conciencia en el evaluado; puede ser natural
cuando el observador pertenece al conjunto humano que investiga, y artificial
cuando la integracin del observador es a propsito de la investigacin. (Sols,
2013)
2.2.3. Entrevista
La evaluacin que se realiza al individuo evaluado no puede pasar inadvertido de su
participacin, por lo que se requiere del consentimiento informado para su
participacin. El instrumento es el evaluador la reaccin la provoca directamente el
evaluador.
La entrevista puede ser estructurada si cuenta con una gua de entrevista y no
estructurada cuando busca explorar caractersticas en el evaluado. Esta tcnica es
utilizada nicamente cuando la unidad de estudio es un individuo. (Sols, 2013)
2.2.4. Encuesta
17

Busca conocer la reaccin o la respuesta de un grupo de individuos que pueden


corresponder a una muestra o a una poblacin, por lo tanto es cuantitativa, requiere
de un instrumento que provoque las reacciones en el encuestado; es auto
administrado si el individuo completa los reactivos (asincrnico) y hetero
administrado cuando hay un encuestador (sincrnico).
El encuestador no necesariamente pertenece a la lnea de investigacin. Implica gran
economa de tiempo y personal. (Sols, 2013)
2.2.5. Psicometra
Desarrollada por los investigadores de las ciencias del comportamiento, pero
aplicable a diversas reas del conocimiento, no requiere de que el investigador
pertenezca a la lnea de investigacin que se est ejecutando; primero porque los
instrumentos son autoadministrables y luego porque incluso el evaluado se puede
autocalificar.
Utilizado para evaluar variables distintas a la lnea de investigacin. La evaluacin
es asincrnica, porque se puede realizar por distintos medios. (Sols, 2013)
2.3. Instrumentos de recoleccin de datos
Recurso que utiliza el investigador para registrar informacin o datos sobre las variables
que tiene en mente. Todo instrumento de recoleccin de datos debe reunir tres requisitos
esenciales: conabilidad, validez y objetividad.
2.3.1. Conabilidad
Grado en que un instrumento produce resultados consistentes y coherentes. Por
ejemplo, si una prueba de inteligencia (Intelligence Quotient, IQ) se aplica hoy a un
grupo de personas y da ciertos valores de inteligencia, se aplica un mes despus y
proporciona valores diferentes, al igual que en subsecuentes mediciones, tal prueba
no sera confiable.
Existen diversos procedimientos para calcular la confiabilidad de un instrumento
de medicin. Todos utilizan procedimientos y frmulas que producen coeficientes
de fiabilidad. La mayora de stos pueden oscilar entre cero y uno, donde un
18

coeficiente de cero significa nula confiabilidad y uno representa un mximo de


confiabilidad (confiabilidad total, perfecta). Cuanto ms se acerque el coeficiente a
cero (0), mayor error habr en la medicin. (Sols, 2013)
Procedimientos para determinar la confiabilidad
Medida de estabilidad: un mismo instrumento de medicin se aplica dos o ms
veces a un mismo grupo de personas, despus de cierto periodo de tiempo.
Mtodo de formas alternativas o paralelas: dos o ms instrumentos similares en
contenido se aplican a un mismo grupo de personas dentro de un periodo de tiempo
corto.
Mtodo de mitades partidas: el conjunto total de tems se divide en dos mitades y
los resultados de ambas se comparan.
Coeficiente alfa de Cronbach: permite estimar la fiabilidad de un instrumento de
medida a travs de un conjunto de tems.
Como criterio general, George y Mallery (2003) sugieren las recomendaciones
siguientes para evaluar los coeficientes de alfa de Cronbach:
- Coeficiente alfa > 0.9 es excelente
- Coeficiente alfa > 0.8 es bueno
- Coeficiente alfa > 0.7 es aceptable
- Coeficiente alfa = 0.6 es cuestionable
- Coeficiente alfa < 0.5 es inaceptable
2.3.2. La validez
La validez, en trminos generales, se refiere al grado en que un instrumento
realmente mide la variable que pretende medir. Por ejemplo, un instrumento vlido
para medir la inteligencia debe medir la inteligencia y no la memoria.
La validez es un concepto del cual pueden tenerse diferentes tipos de evidencia:
19

La validez de contenido: grado en que un instrumento refleja un dominio


especfico de contenido de lo que se mide. Es el grado en el que la medicin
representa al concepto o variable medida (Bohrnstedt, 1976). Por ejemplo,
una prueba de operaciones aritmticas no tendr validez de contenido si
incluyera slo problemas de resta y excluyera problemas de suma,
multiplicacin o divisin.
Validez de criterio: validez que se establece al correlacionar las
puntuaciones resultantes de aplicar el instrumento con las puntuaciones
obtenidas de otro criterio externo que pretende medir lo mismo.
Validez de constructo: debe explicar el modelo terico emprico que
subyace a la variable de inters
La validez de constructo incluye tres etapas (Carmines y Zeller, 1991):
- Se establece y especifica la relacin terica entre los conceptos (sobre la
base de la revisin de la literatura).
- Se correlacionan los conceptos y se analiza cuidadosamente la correlacin.
- Se interpreta la evidencia emprica de acuerdo con el nivel en el que
clarifica la validez de constructo de una medicin en particular.
Validez de expertos: se reere al grado en que aparentemente un instrumento
de medicin mide la variable en cuestin, de acuerdo con expertos en el
tema.
2.3.3. Objetividad:
Grado en que el instrumento es o no permeable a la influencia de los sesgos y
tendencias de los investigadores que lo administran, califican e interpretan (Mertens,
2010).
2.4. Cuestiones fundamentales para un instrumento de medicin

20

Existen tres cuestiones bsicas respecto a las variables que deben considerarse al momento
de construir un instrumento: Operacionalizacin, Codificacin y Nivel de medicin.
a) La operacionalizacin de variables: es el paso de una variable terica a
indicadores empricos verificables y medibles e tems o equivalentes (Sols,
2013). La Operacionalizacin se fundamenta en la definicin conceptual y
operacional de la variable.
Cuando se construye un instrumento, el proceso ms lgico para hacerlo es transitar
de la variable a sus dimensiones o componentes, luego a los indicadores y
finalmente a los tems o reactivos y sus categoras.
b). Codificacin
Codificar los datos significa asignarles un valor numrico o smbolo que los
represente, ya que es necesario para analizarlos cuantitativamente.
Ejemplos:
Si la variable es Gnero sabemos que tiene dos categoras:
Categora
Masculino
Femenino

Codificacin
1
2

Si la variable es horas de exposicin diaria a la televisin,


Categora

Codificacin

- No ve televisin
- Menos de una hora
- Una hora
- Ms de una hora, pero menos de dos
- Dos horas
- Ms de dos horas, pero menos de tres
- Tres horas
- Ms de tres horas, pero menos de cuatro
- Cuatro horas
- Ms de cuatro

0
1
2
3
4
5
6
7
8
9

c). Niveles de medicin


21

Nivel de medicin nominal: las categoras no tienen orden ni jerarqua


Nivel de medicin ordinal: las categoras tienen orden de mayor a menor

Ejemplo:
Si la variable es posicin jerrquica en la empresa
Presidente
Vicepresidente
Director general
Gerente de rea
Subgerente
Jefe
Empleado

7
6
5
4
3
2
1

2.5. Tipos de Instrumentos


En la investigacin disponemos de diversos tipos de instrumentos para medir las variables
de inters y en algunos casos llegan a combinarse varias tcnicas de recoleccin de los
datos. A continuacin las describimos brevemente. (Brace, 2013).
2.5.1. Cuestionarios
Un cuestionario es un instrumento diseado con un conjunto de preguntas respecto
de una o ms variables a medir (Chasteauneuf, 2009). Debe ser congruente con el
planteamiento del problema e hiptesis
Tipos de preguntas que se pueden elaborar en un cuestionario:
Preguntas Cerradas: son aquellas que contienen opciones de respuesta
previamente delimitadas
Ejemplos:
Estudia usted actualmente?

Durante la semana pasada vio la final


De la Liga de Campeones en Europa?

) S

) S

) No

) No
22

Cul es el puesto que ocupa usted en su empresa?


o Presidente
o Vicepresidente
o Gerente
o Coordinador
o Supervisor
o Obrero
Preguntas Abiertas: dan completa libertad al interrogado para que responda y
permiten la obtencin de una mayor informacin del asunto investigado.
Ejemplos:
Por qu asiste a psicoterapia?
------------------------------------------------------------------------------------------------------------Qu ms le gust del producto?
-------------------------------------------------------------------------------------------------------Mtodo de escalamiento Likert
Conjunto de tems que se presentan en forma de afirmaciones, para medir la
reaccin del sujeto en tres, cinco o siete categoras.
Cuando las afirmaciones son negativas significa que se califican desfavorablemente
al objeto de actitud de la siguiente manera
1. El personal de la Direccin General de Impuestos Nacionales es grosero al
atender al pblico.
1. Muy de acuerdo
2. De acuerdo
3. Ni de acuerdo ni en desacuerdo
4. En desacuerdo
5. Muy en desacuerdo
23

Cuando las afirmaciones son positivas se califican de la siguiente manera


2. Los servicios que presta la direccin general de Impuestos Nacionales
habitualmente son muy buenos.
5. Muy de acuerdo
4. De acuerdo
3. Ni de acuerdo ni en desacuerdo
2. En desacuerdo
1. Muy en desacuerdo
2.6. Organizacin y Presentacin de Datos
Una vez recopilados los datos, es necesario resumirlos y presentarlos en forma tal.
Que faciliten su comprensin y su posterior anlisis y utilizacin. Y esto se logra al
describir la distribucin de las puntuaciones o frecuencias de cada variable en tablas de
frecuencia.
2.6.1. Tablas de Frecuencias
Son cuadros estadsticos que contienen las categoras de la variable o los valores
observados x1. x2. x3, .,xk de la variable X (distribucin) con sus respectivas
frecuencias (distribucin de frecuencias).
Los datos de una investigacin se pueden agrupar de dos formas diferentes. En tabla
de distribucin de frecuencias para datos no agrupados y tabla de distribucin de
frecuencias para datos agrupados. (Sols, 2013)

A. Tablas para Variables Cualitativas


Frecuencia absoluta simple
Frecuencia relativa simple

24

Nomenclatura usada en la tabla:

Frecuencia absoluta simple (f i) Es el nmero de veces que se repiten los


valores

dentro de los diferentes

intervalos en que est dividida la

informacin.
Frecuencia relativa simple ( hi%) Es el valor que resulta al dividir cada una
de las frecuencias absolutas simples entre el nmero total de datos.
n
hi % i * 100
n

Ejemplo: Los datos corresponden a la nacionalidad de 15 ponentes que


asistieron a un Congreso Internacional realizado en una universidad del Per,
X1= Colombiano

X6= Peruano

X11= Peruano

X2= Boliviano

X7= Venezolano

X12= Colombiano

X3= Peruano

X8= Colombiano

X13= Ecuatoriano

X4= Ecuatoriano

X9= Boliviano

X14= Peruano

X5= Peruano

X10= Peruano

X15= Boliviano

Con esta informacin construir una tabla de distribucin de frecuencia para


la variable Nacionalidad (x).
Tabla 1:
Distribucin de ponentes que asistieron a un Congreso
Internacional realizado en una universidad del Per,
por nacionalidad. 2015.
Nacionalidad
Bolivarianos
Colombianos
Ecuatorianos
Peruanos
Venezolanos
Total

fi
3
3
2
6
1
15

hi%
20.0
20.0
13.3
40.0
6.7
100.0

25

Interpretacin:
f4 = 6 indica que 6 de los ponentes que asistieron al congreso son de
nacionalidad peruana.
h4% = 40% indica que de los ponentes que asistieron al congreso el 40%son
de nacionalidad peruana.
f3 = 2

indica que 2 de los ponentes que asistieron al congreso son de

nacionalidad Ecuatoriana.

B. Tablas de Variables Cuantitativas Discretas


Frecuencia absoluta simple
Frecuencia relativa simple

Frecuencia relativa acumulada


Frecuencia absoluta acumulada

Nomenclatura usada en la tabla:

26

Frecuencia absoluta acumulada (Fi) Se obtiene sumando y acumulando los


valores de las frecuencias absolutas simple intervalo por intervalo en orden
ascendente.
F 1 = f1
F 2 = f1 + f 2
F 3 = f1 + f 2 + f3
Fi = f1 + f2 + f3 + + fi

Frecuencia relativa acumulada (Hi%) Se obtiene sumando y acumulando


los valores relativos simples intervalo por intervalo en orden ascendente.
H1 = h1
H2 = h1 + h2
H3 = h1 + h2 + h3
Hi = h1 + h2 + h3 + + hi

Ejemplo: Se realiza un estudio para determinar el nmero de trabajadores que


emplea las pequeas empresas del departamento de Lambayeque, para lo cual
se toma una muestra de 20 pequeas empresas determinndose los siguientes
datos:

X1 = 6

X6 = 3

X11 = 4

X16 = 3

X2 = 5

X7 = 4

X12 = 5

X17 = 4

X3 =4

X8 =4

X13 =6

X18 = 6

X4 =4

X9 =5

X14 = 2

X19 =5

X10 = 5

X15 = 4

X20 =3

X5 =5

Clasificacin:

27

En este caso se identifican los distintos valores que tiene Xi, primero
ubicamos el mayor y el menor valor: X min = 2 y Xmx = 6. Los distintos
valores que toma la variable Xi los vamos a denotar por fi resultando:
X1 = 2; X2 = 3; X3 = 4; X4 = 5; X5 = 6

Tabulacin:
Tabla 2:
Nmero de trabajadores de 20 postas
Lambayeque. 2008
N de Trabajadores
fi
2
1
3
3
4
7
5
6
6
3
Total
20
Fuente: Sector Salud -Lambayeque.

mdicas del departamento de


Fi
1
4
11
17
20

hi%
5
15
35
30
15
100

Hi%
5
20
55
85
100

Interpretacin:
f3 = indica que hay 7 postas mdicas que tienen 4 trabajadores
F4 = indica que hay 17 postas mdicas que tienen como mximo 5
trabajadores
h3% = indica que el 35% de las postas mdicas tienen 4 trabajadores
H3% = indica que el 55% de las postas mdicas tienen como mximo 4
trabajadores.

C. Tablas para Variables Cuantitativa Continua


28

Frecuencia absoluta simple


Frecuencia absoluta acumulada

Frecuencia relativa simple


Marca de Clase

Frecuencia relativa acumulada

Nomenclatura usada en la tabla:


Marca de clase (xi) La marca de clase es el punto medio de un intervalo.
l l
xi i 1 i
2

Cuando la variable en estudio es continua, para elaborar una tabla de


distribucin de frecuencias deben seguir los siguientes pasos:
Elige el Rango (R)
Se define como la diferencia entre el valor mximo y el valor mnimo.
R = X mx - Xmn

Elige el nmero de Intervalos (I)


El nmero de intervalos puede fijarse arbitrariamente dependiendo del nmero
de datos que se tenga. Por lo general el nmero de intervalos a elegir, vara
entre 5 a 20.
Sin embargo existen algunas frmulas que permiten determinar el nmero de
intervalos.

I 2.5 * 4 n

K 1 3,322*log n

n 10
29

Donde: K = Nmero de Intervalos


n = Nmero de datos.

Elige la Amplitud (A)


Se define como el cociente que se tiene al dividir el Rango (R) entre el
nmero de intervalos (K).
A

R
K

Si la amplitud del intervalo resultara un valor no entero se procede a


redondear al entero inmediato superior si los datos son enteros. Si los datos
proporcionados estn en decimal, se redondea de acuerdo al nmero de
decimales de la informacin.

Ejemplo: Los siguientes datos muestran la duracin de la auditora de fin de


ao (en das) en las diferentes instituciones pblicas del departamento de
Lambayeque. 2014.
12

14

19

18

15

20

19

15

15

15

18

17

27

21

33

36

20

27

22

23

33

16

20

21

22

21

33

28

13

27

21

17

14

18

16

13

14

33

16

22

Construir una tabla de distribucin de frecuencias.


i. Hallar el Rango

R X max X min
R = 36 12 = 24

30

ii. Nmero de Intervalos


K = 1 + 3,322*log(n)
K = 1 + 3,32*Log(40)
K = 6,32
K=6

iii. Amplitud del Intervalo

R 24

K
6
A4
A

Tabla 3
Duracin de las auditoras de fin de ao (en das) en las diferentes
instituciones pblicas del departamento de Lambayeque. 2014
[Li-1 - Li>
Xi
fi
Fi
12 a 16
14
10
10
16 a 20
18
10
20
20 a 24
22
11
31
24 a 28
26
3
34
28 a 32
30
1
35
32 a 36
34
5
40
Total
40
Fuente: Boletn informativo de Contralora

hi%
25.0
25.0
27.5
7.5
2.5
12.5
100.0

Hi%
25.0
50.0
77.5
85.0
87.5
100.0

Interpretacin:
f5: Solo 1 auditora requiri entre 28 - 32 das
f3 : 11 auditoras requirieron de 20 24 das.
h4 % : el 7,5 % de las 40 auditoras, requirieron de 24 - 28 das.
H5 % : el 87,5 % de las 40 auditoras, requirieron ms de 12 das, pero menos
de 32 das.

31

2.4 Representaciones grficas


Los grficos ms usuales para representar variables de tipo cualitativa son los
siguientes:

2.4.1. Diagramas de barras:


Se representan en el eje de ordenadas las modalidades y en abscisas las frecuencias
absolutas o bien, las frecuencias relativas. Se utiliza para representar
variables cualitativas y cuantitativas discretas.

Tabla 4
Opinin de los pobladores acerca del trabajo que viene realizando el
actual alcalde del municipio de Jos Leonardo Ortiz. Chiclayo. 2015.
Aprobacin
frecuencia (fi)
Porcentaje %
Muy desfavorable
4
1.9
Desfavorable
30
14.4
Neutral
95
45.7
Favorable
40
19.2
Muy favorable
39
18.8
Total
208
100.0
Fuente: encuesta realizada a los pobladores de J.L.O.

32

Opinin de los pobladores acerca del trabajo que viene realizando el actual alcalde de J.L.O. Chicayo. 2015
50.0

45.7

45.0
40.0
35.0
30.0
25.0

Porcentaje

19.2

20.0

18.8

14.4

15.0
10.0
5.0

1.9

0.0

Fuente: encuesta realizada a los pobladores de J.L.O.

33

Nivel de Satisfaccin del Paciente segn grado de instruccin en la Dimensin Humana de Cuidado Enfermero en el Hospital General Jan. Mayo - junio 2014.
100

100
90
80
62.5
60.4
70
60 46.4
50
35.7
40
25
17.9 18.8 20.8
PORCENTAJE 30
12.5
20
10
0

60
40
Alto
Medio
Bajo
00

GRADO DE INSTRUCCIN

Fuente: encuesta realizada a los pacientes del hospital General Jan.

2.4.2 Grfico Circular


Nivel de Satisfaccin del paciente respecto al cuidado enfermero en el postoperatorio inmediato del Hospital General Jan. Mayo - junio 2013.

15.6; 16%

22.2; 22%

Bajo

Medio

Alto

62.2; 62%

Se
emplea especialmente para variables de tipo cualitativa, siempre que la variable de
estudio no tenga ms de 4 categoras.
34

Fuente: encuesta realizada a los pacientes del hospital General Jan.

Para variables de tipo cuantitativa discreta tenemos el siguiente grfico.


2.4.3 Diagrama de Bastones
Las barras deben ser estrechas para representar los valores que toma la
variable pues son discretos.
Ejemplo
Se lanzan tres monedas al aire en 8 ocasiones y se contabiliza el nmero de
caras, X, obtenindose los siguientes resultados:
Representar grficamente el resultado.
En primer lugar observamos que la variable X es cuantitativa discreta,
presentando las modalidades:
Ordenamos a continuacin los datos en una tabla estadstica:

Tabla 5
Nmero de veces que aparece una cara al lanzar una moneda
al aire
xi
fi
hi
0
1
12.5
1
3
37.5
2
3
37.5
3
1
12.5
Total
8
100
Nmero de veces que aparece una cara al lanzar tres monedas al
aire
Fuente: Elaboracin propia.

2.4.4. Histograma
Un histograma se construye a partir de la tabla estadstica, representando
Figura
4. La grfica
nos muestra
la distribucin
del como base. El
sobre
cada intervalo,
un rectngulo
que tiene
a este segmento
nmero de veces que aparece una cara en el
lanzamiento de tres monedas.

35

criterio para calcular la altura de cada rectngulo es el de mantener la


proporcionalidad entre las frecuencias absolutas (o relativas) de cada intervalo
y el rea de los mismos.

Edad de 50 pacientes atendidos por emergencia en el Hospital Docente las


14.972008
Mercedes
de Chiclayo abril
16
14
12
10
8
N DE PACIENTES
6
4
2
0

14

5.03

2
26 35 35 44 44 53 53 62

5.2

3.2

62 71 71 80 80 - 89

EDAD

Figura 5. Los resultados muestran que 6 pacientes tienen una edad


de 35 a 44 aos y 15 de ellos una edad de 53 a 62 aos.
Fuente: Registro Hospital Docente las Mercedes

2.4.5. Polgono de frecuencias

36

El polgono de frecuencias se
construye
tenemos

fcilmente

si

representado

previamente el histograma,
ya que consiste en unir
mediante lneas rectas los
puntos del histograma que
corresponden a las marcas de
clase. Para representar el polgono de frecuencias en el primer y ltimo
intervalo, suponemos que adyacentes a ellos existen otros intervalos de la
misma amplitud y frecuencia nula, y se unen por una lnea recta los puntos del
histograma que corresponden a sus marcas de clase. Obsrvese que de este
modo, el polgono de frecuencias tiene en comn con el histograma el que las
reas de la grfica sobre un intervalo son idnticas. (Meyer,2002)

37

PROBLEMAS PROPUESTOS
1. En una encuesta a 20 habitantes de Trujillo sobre cuntas veces a la semana compran en
pequeos comercios de la ciudad, las respuestas obtenidas son:
2, 0, 3, 1, 4, 5, 1, 1, 2, 3, 0, 0, 1, 3, 2, 5, 4, 3 , 3, 2
Construye una tabla de frecuencias y calcula qu tanto por ciento de los habitantes hace 3 o
menos compras a la semana.
2. El personal del consultorio de un mdico estudi el tiempo de espera de los pacientes que
llegaron al consultorio con una solicitud de servicio de urgencia. Se recabaron los datos
siguientes con los tiempos de espera en minutos durante un periodo de un mes.
2 5 10 12 4 4 5 17 11 8
9 8
12
21 6 8 7
13
18
3
Use las clases 0 4, 5 9, etc. Para realizar lo siguiente:
a) La distribucin de frecuencia
b) La distribucin de frecuencia relativa
c) La distribucin de frecuencia acumulada
d) La distribucin de frecuencia relativa acumulada
e) Qu porcentaje de pacientes que necesita un servicio de emergencia espera 9 minutos o
menos?
3. Un profesor decide registrar el mes de nacimiento de cada uno de los 40 estudiantes de
su clase.
Junio
julio
noviembre abril
enero
38

Julio
agosto
Mayo
abril
Agosto
noviembre
Agosto
junio
Noviembre setiembre
Febrero
setiembre
Octubre
setiembre

setiembre
febrero
enero
julio
junio
junio
diciembre

diciembre
agosto
junio
marzo
marzo
noviembre
marzo

julio
junio
abril
diciembre
noviembre
mayo
junio

Construya una tabla de frecuencias, y un grfico apropiado para dicha variable Intrprete
Cul es el mes que presenta la mayor y la menor frecuencia de nacimientos?.

4. En una clase se pregunt a los alumnos por las horas de estudio que dedican a la
semana. Estas han sido las respuestas:
16
15
10

11
20
8

17
3
10

12
2
6

10
5
16

5
12
16

1
7
10

8
6
3

10
3
4

14
9
12

Construye una tabla de frecuencia y representa grficamente la distribucin

5. Un investigador desea conocer los ingresos mensuales de los clientes del Banco Ripley
(en miles de nuevos soles) y toma una muestra de 45 clientes para conocer dichos ingresos,
y obtiene los siguientes datos:
3,00
6,82
5,50
3,90
2,93

1,99
5,30
6,60
5,84
6,60

2,90
5,80
3,85
3,50
4,60

4,70
5,70
6,70
4,40
6,60

3,00
4,70
3,50
3,70
2,90

5,80
6,60
8,80
4,50
4,69

4,50
6,60
10,00
5,63
3,99

7,09
5,74
10,10
4,60
6,70

4,40
4,23
13,40
5,79
2,58

a) Haciendo uso de la regla de Sturges construya una tabla de distribucin de frecuencias.


b) Interprete f2, h4%, F3, F5 F2 H4%
c) Construya un grfico apropiado para la variable Ingresos mensuales e interprete.
39

6. Si a un grupo de 30 personas le preguntamos el dinero que en ese momento llevan


encima (en soles), nos encontramos con los siguientes datos:
45 115 25 30 Ocupacin Costa
17 8 2 268 60
Sierra
Selva
78
159
230 Agricultore
500 120 10
15
16
7
5 18 20 67 s
50 37 150 20
5
9
4
98 18 12 31 Mineros
42 56 110
Tcnicos
13
8
2
16
11
4
a) Haciendo uso Obreros
de la regla de
Sturges construya una tabla de distribucin de frecuencias.
b) Construya un histograma de frecuencias para dicha distribucin.
Respuestas
7. Se ha realizado una Todos los das
qu regularidad se lee el Ua vez por semana
ciudad, y los resultados Una vez al mes
Alguna vez al ao
Nunca
No contesta

Porcentaje
37.3
29
10.5
12
..
0.4

encuesta para saber con


peridico
en
una
fueron estos:

a) Qu tanto por ciento de personas respondieron nunca?


b) Si las personas que no contestaron fueron 6, cuntas personas fueron encuestadas?
c) Las personas encuestadas, son muestra o poblacin?
8. Se ha clasificado un grupo de personas de acuerdo a su ocupacin y procedencia. La
distribucin result la siguiente:
a) Construya un grfico para representar la distribucin de las personas por su ocupacin.
b) Haga un grfico para comparar la regin de procedencia de las personas segn su
ocupacin.

9. Los datos representan a los sabores de helados ms vendidos en una bodega de una
ciudad. Construye un grfico circular e interpreta
40

Sabor
Vainilla
Chocolate
Fresa

Porcentaje
30
43
27

10. En marzo del 2012 la empresa de investigacin de mercados BITCORA, fue


contratada por el banco Continental para que realice un estudio sobre la aceptacin de los
crditos anuales que ofrecen a sus clientes en sus sucursales de Chiclayo y Jos Leonardo
Ortiz. La empresa despus de hacer un estudio de las caractersticas de los clientes activos
del banco, seleccion una muestra de 36 clientes de la sucursal de Chiclayo y recolect de
ellas informacin para un conjunto de variables seleccionadas para tal fin. Los resultados se
muestran a continuacin.
X1: Tipo de crdito:
(1) Inversin en negocio (2) Compra de inmuebles
(3) Compra de maquinarias (4) Inversin en bolsa de valores
(5) Compra de autos
X2: N de solicitudes:
(1) Soltero (2) casado (3) divorciado

N de clientes
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

Tipo de Crdito
N de solicitudes
Inversin en negocio
1
Compra de inmuebles
2
Compra de maquinaria
1
Inversin en negocio
2
Compra de inmuebles
1
Inversin en bolsa de valores
2
Compra de autos
1
Compra de maquinaria
1
Compra de autos
2
Inversin en bolsa de valores
1
Compra de maquinaria
3
Inversin en bolsa de valores
1
Compra de inmuebles
3
Compra de autos
3
Inversin en bolsa de valores
1
Compra de inmuebles
4
Compra de maquinaria
4
Inversin en bolsa de valores
1
Inversin en bolsa de valores
3
Compra de autos
7

Monto de crdito
(miles de soles)
30
35.3
48.4
50.1
55.3
57.2
58.1
60.4
65.3
66
68
69.1
70.2
72.5
73.1
75.3
77.2
79.1
82.7
84.3

Tipo de cliente
soltero
divorciado
soltero
soltero
divorciado
casado
soltero
divorciado
divorciado
casado
casado
casado
divorciado
casado
divorciado
divorciado
divorciado
divorciado
casado
divorciado
41

21
22
23
24
25

Compra de maquinaria
Inversin en bolsa de valores
Inversin en negocio
Compra de maquinaria
Inversin en bolsa de valores

1
5
6
1
2

86
90.3
95.2
100.1
101.2

soltero
soltero
casado
divorciado
divorciado

Realiza lo siguiente:
a) Una grfica adecuada para las variables cualitativas
b) Una tabla de frecuencia para la variable Monto de crdito anual (miles de soles).
Interprete f2, H3%, h4%, F5
c) Una tabla de frecuencia para la variable cuantitativa discreta
d) un cuadro que permita construir un grfico adecuado para representar la variable tipo de
crdito segn el tipo de cliente.
e) Considerando solamente los clientes casados, construya una tabla de frecuencias que las
distribuya de acuerdo al tipo de crdito.

CAPTULO III
42

Medidas de Tendencia Central


y
Posicin

Medidas de Tendencia Central y Posicin


1. Medidas de centralizacin
Las Medidas de Centralizacin o de Tendencia Central son parmetros o estadgrafos que
expresan en forma resumida un conjunto de datos. Estos parmetros a travs de sus
propiedades y sus definiciones hacen posible el anlisis de un conjunto de datos.
3.1. El Promedio o Media Aritmtica
El promedio es el centro de la distribucin de los datos cuando se trata de casos
normales. Entendemos aqu por casos normales aquellos conjuntos de datos que no
contienen valores muy extremos, valores muy alejados de los dems (Universidad Catlica
de Valparaso) .
El promedio tiene los siguientes smbolos
para promedio poblacional
x para promediomuestral

3.1.1 Promedio para datos originales: Se denomina datos originales a un


conjunto de datos de cualquier variable y copiados de cualquier manera. La frmula para su
clculo es:
43

xi
i 1

Donde xi: Observaciones o datos


n: N de datos

Ejem.1: Los siguientes datos corresponde al ingreso econmico de 8 padres de los alumnos
de ingeniera de sistemas: 1200, 900, 1250, 1350, 800, 750, 1200, 1300. Encontrar el
ingreso promedio

1200 900 1250 1350 800 750 1200 1300


8

x 1093,75

Soles

El ingreso econmico promedio de 8 padres de familia es 1093,75 soles.

3.1.2 Promedio para datos tabulados


a. Promedio para datos tabulados no agrupados en intervalos
n

x
Formula:

x f

i i

i 1

Ejem. 2:
Tabla 1
Nmero De trabajadores por empresa
Xi
46
47
48
49

fi
8
10
16
14
44

50 Econmico
12 Yi
Ingreso
51
9
454,5

587,5
52
6 521
587,5

720,5
Total
75 654
720,5 853,5
787
853,5 986,5
920
986,5 1119.5
1053
1119,5 1252,5
1186
1252,5 1385,5
1319
Total
Reemplazamos los valores en la frmula:

fi
5
5
10
13
16
8
5
62

Fi
5
10
20
33
48
56
62

46 x8 47 x10 48 x16 49 x14 50 x12 51x9 52 x6


75
x 48,84
x

El N promedio de trabajadores por empresa es aproximadamente 49

b. Promedio para datos tabulados agrupados en intervalos

x
FORMULA:

x f

i i

i 1

Yi : Marcas de clase del intervalo

Ejem.3:
Tabla 2
Ingreso econmico de 62 padres de familia

45

521x5 654 x5 787 x10 920 x13 1053 x16 1186 x8 1319 x5
62
x 945,74
x

El ingreso econmico promedio de los 62 padres de familia es de 945,74 soles.


3.2. La Moda (Mod)
La Moda en un conjunto de observaciones, viene a ser el valor de la variable que se
presenta con ms frecuencia en la distribucin de datos.
No tiene smbolo definido.
3.2.1. Moda para datos cuantitativos agrupados
Ejemplo N 1: Los siguientes datos corresponde al ingreso econmico de 10 padres de
familia. Encontrar la moda.
970, 930, 860, 1040, 1020, 1380, 1410, 900, 1040, 1240
Mod = 1040
Ejemplo N 2: Ingreso econmicos de 8 trabajadores. Encontrar la moda.
1200, 1050, 910, 1300, 1550, 1420, 960
Estos datos no tienen moda.
Ejemplo N 3: corresponde al peso de 10 alumnos:
65, 54, 72, 60, 58, 54, 66, 70, 58
Mod1 = 54
Mod2 = 58
Un conjunto de datos puede tener una moda y se dice que la distribucin de los datos es
unimodal, ms de una moda se dice que la distribucin de los datos es multimodal o
tambin no tener moda y se dice que la distribucin de los datos es amodal.
3.2.2. Moda para Datos Cuantitativos agrupados
a. Moda para datos tabulados no agrupados en intervalos

Mod x j
Formula:
46

Dnde:
xj es el
variable que
mxima
absoluta.
Ejem.4:
datos de la tabla 1

Ingreso
Econmico
454,5 587,5
587,5 720,5
720,5 853,5
853,5 986,5
986,5 1119.5
1119,5 1252,5
1252,5 1385,5
Total

fi

Fi
5
10
20
33
48
56
62

5
5
10
13
16
8
5
62

Xi
46
47
48
49
50
51
52
Total

valor
de
la
corresponde a la
frecuencia

Tomamos

los

fi
8
10
16
14
12
9
6
75

La Moda ser el valor de la variable que corresponde a la mxima frecuencia absoluta


(f4 =16), en este caso Mod = 48
El resultado significa que es ms frecuente encontrar empresas con 48 trabajadores
b. Moda para datos tabulados agrupados en intervalos

f i f i 1

( f i f i 1 ) ( f i f i 1 )

Md L j 1 A

Formula:

Donde:
fi = mxima frecuencia absoluta
fi-1 = frecuencia absoluta anterior a nj
fi+1 = frecuencia absoluta posterior a nj
Li-1 = lmite inferior del intervalo que se encuentra en la misma fila de nj
A = Amplitud del intervalo

Ejem.5: Vamos a tomar los datos de la tabla 2

47

De acuerdo a la teora:
1 fi = 16
4 A = 133
5

2 Li-1 = 986,5
fi+1 = 8

3 fi-1 = 13

Reemplazando lo valores en la frmula se tiene:

16 13

16 13 16 8

Mod 986,5 133


Mod 1022

Los sueldos o ingresos econmicos ms frecuente de 62 trabajadores encuentran alrededor


de 1022 soles.
3.2.3. Moda para datos cualitativos:
La moda estar dada por la categora de la variable que corresponde a la mxima frecuencia
absoluta.
Ejem.6:

Tabla 3
Nivel de Instruccin de 70 personas
Nivel de instruccin
Primaria
Secundaria
Sup. No Universitaria
Sup. Universitaria

fi
2
11
42
15

hi%
2,86
15,71
60,00
21,43

Total

70

100,00

48

La mxima frecuencia es 42, por lo tanto, la moda es la categora superior no


universitaria, es decir: Mod = Sup. No Universitaria
3.3. La Mediana
Es el valor que divide a la totalidad de datos, ordenados en forma creciente o
decreciente, en dos partes iguales, de tal manera que el 50% de los datos se encuentren a la
izquierda de la mediana y el otro 50% a la derecha de la mediana.(Tomeo, 2003)

Li

Me
50%

Ls
50%

La mediana se aplica en lugar del promedio, cuando la variabilidad de los datos es muy
marcada. La mediana tambin se aplica a datos cualitativos ordenados de acuerdo a rangos.
La mediana no tiene smbolo definido.
3.3.1. Mediana para datos cuantitativos no agrupados
Se presentan dos casos:
a Cuando el N de datos es Par
Se ordenan los datos en forma creciente o decreciente y se toma el promedio de los dos
valores del centro.
Ejemplo N1: Los siguientes datos corresponden a las edades de 10 ingenieros:
50, 22, 61, 30, 55, 42, 46, 35, 38,28
Ordenamos en forma creciente:
22, 28, 30, 35, 38, 42, 46, 50, 55, 61

38 42
2
Me 40
Me

El 50% de los ingenieros tienen una edad mxima de 40 aos

b Cuando el N de datos es Impar


Ejemplo N2: Los siguientes datos corresponden al n de trabajadores de 9 empresas
63, 56, 94, 32, 58, 41, 90, 45, 104
49

Ordenamos de forma creciente


32, 41, 45, 56, 58, 63, 90, 94, 104

Se toma el valor del centro: Me = 58

El 50% de empresas tienen un nmero mximo de 58 trabajadores.


3.3.2. Mediana para Datos Cuantitativos Tabulados
a

Mediana para datos no agrupados en intervalos

1 Cuando
Formula:

n
Fi 1
2

Me = Xi

Dnde:
xj: Es el valor de la variable que se encuentra en la misma fila de Fi

Fi: Frecuencia absoluta acumulada inmediatamente mayor que

n
2

Fi-1: Frecuencia absoluta acumulada anterior a Fi

Procedimiento:

Ejem.7: Tomamos los datos de la tabla 1


Xi
46
47
48
49
50
51
52
Total

fi
8
10
16
14
12
9
6
75

Fi
8
18
34
48
60
69
75

n 75

37,5
2 2

Fi 1 34

Fi 48

efectivamente

n
Fi 1
2
50

50% de las empresas tienen como mximo 49 trabajadores.

2 Cuando

Formula:

n
Fi 1
2

Li 1 Li
2

Ejem.8: Los siguientes datos corresponden al N de hijos de 54 familias

Nmer
o de
hijos
Li
1
2
3
4
5
6
Total

Procedimiento:
fi
5
10
12
15
8
4
54

Fi
5
15
27
42
50
54

54

27
Fi mximo
42
El 50% de las2familias
tienen como
2
1
2
aproximadamente
4 hijos.
n
b Mediana para datos agrupados en intervalos
Fi 1
Fi 1 27
2
3
efectivamente

1 Cuando

n
Fi 1
2

n 2 Fi 1

Fi Fi 1

Me Li 1 A *
FORMULA:

51

Dnde:
Li-1 = lmite inferior del intervalo que se encuentra en la misma fila de Fi
A = Amplitud del intervalo
n
2

Fi = frecuencia absoluta acumulada inmediatamente mayor que


Fi-1= frecuencia absoluta acumulada anterior a Fi
Ingreso
fi
Econmico
Fi
Ejem.9: Vamos a tomar los datos de la tabla 2
454,5 587,5
5
5
587,5 720,5
5
10
720,5 853,5
10
20
853,5 986,5
13
33
986,5 1119.5
16
48
1119,5 1252,5
8
56
1252,5 1385,5
5
62
Total
62

Procedimiento:

n 62

31
2
2

Li 1 853,5

2 Fi= 33

Fi 1 20

efectivamente

n
Fi 1
2

5 A = 133

Reemplazando valores se tiene:

52

31 20
Me 853,5 133

33 20
Me 966,04

El 50% de trabajadores tienen un ingreso mximo de 966,04 soles.

2 Cuando

Formula

n
Fi 1
2

Me Li 1

Ejem.10: Los siguientes datos corresponden al peso en kilos de 120 alumnos.


Peso
30 33
33 37
37 41
41 45
45 49
49 53
Total

fi
10
20
30
30
16
14
120

Fi
10
30
60
90
106
120

Procedimiento:

n 120

60
2
2

Li 1 41

Fi 90

Fi 1 60

efectivamente

n
Fi 1
2

A4

Reemplazando valores se tiene:

Me 41
53

El 50% de los alumnos tienen un peso mximo de 41 kilogramos.

3.3.2. Mediana para datos cualitativos:


Es factible obtener la mediana cuando se tiene datos cualitativos, susceptibles de ordenarse
de acuerdo a rangos o categoras.

Ejem.11: Tomaremos los datos de la tabla 3

Nivel de Instruccin
Primaria
Secundaria
Superior No Universitaria
Superior Universitaria
Total

fi
2
11
42
15
70

Fi
2
13
55
70

Procedimiento:

n
35
2

Fi 55

Fi 1 13

La mediana est dada por la categora que se encuentra en la misma fila de F i; por lo tanto,
la mediana est dada por la categora Superior no universitaria.
El 50% de los padres de familia de los estudiantes tienen un grado de instruccin mximo
de Superior no universitaria.
3.4. Cuartiles (Qi)
Son medidas de posicin que dividen a la distribucin de datos ordenados, en cuatro partes
iguales, de tal manera que:
Li

Q1

Q2

Q3

Ls

25%
50%
75%
54

3.4.1. Cuartiles para datos no agrupados

x(1) x ( 2) x ( 3) .... x ( n )
Una vez ordenados los datos tales que

. El cuartil i-simo (i = 1,
(

i
)( n 1 )
4

2 o 3), es el valor del dato que ocupa la posicin


en el ordenamiento.
Si la posicin resulta entera, se hace una interpolacin lineal entre los dos valores
correspondientes a las dos observaciones entre las cuales se encuentra la fraccin.
Ejem.12

Tomaremos los datos, ordenados previamente correspondientes al ingreso econmico


semanal de 7 padres de familia.
200, 225, 300, 420, 450, 460, 540
x1

x2

x3

x4 x5

x6

x7

Clculo del Primer Cuartil (Q1): i =1, n =7


(

i
1
)( n 1 ) ( )( 7 1 ) 2
4
4

, posicin entera, luego Q1 = x2 = 225.


El 25% de los padres de familia, tienen un ingreso mximo de 225 soles.
Clculo del Segundo Cuartil (Q2): i =2, n =7
(

i
2
)( n 1 ) ( )( 7 1 ) 4
4
4

, posicin entera, luego Q2 = x4 = 420


El 50% de los padres de familia, tienen un ingreso mximo de 420 soles.
Clculo del Tercer Cuartil (Q3): i =3, n =7
(

i
3
)( n 1 ) ( )( 7 1 ) 6
4
4

, posicin entera, luego Q3 = x6 = 460.


El 75% de los padres de familia, tienen un ingreso mximo de 460 soles.
Ejem.13
Tomaremos los datos ordenados previamente, correspondientes al ingreso econmico
semanal de 10 padres de familia
200, 225, 300, 420, 450, 460, 540, 550, 600, 650
x1
x2 x3 x4 x5
Clculo del Primer Cuartil (Q1): i =1, n =10

x6

x7

x8 x9 x10

55

i
1
)( n 1 ) ( )( 10 1 ) 2.75
4
4

, posicin no entera, luego Q1 estar entre las

observaciones X2 y X3.
Estableciendo proporciones se tiene:
Q1 x 2 0,75

Q1 x 2 ( x3 x 2 )(0,75)
x3 x 2
1
Q 225 (300 225)( 0,75)
Q 225 56,25
Q 281,25
El 25% de los padres de familia tienen un ingreso mximo de 281,25 soles.
Clculo del Segundo Cuartil (Q2): i =2, n =10
i
2
( )( n 1) ( )(10 1) 5,5
4
4

, posicin no entera, luego Q2 estar entre las observaciones X5

y X6.
Entonces:
Q2 x5 ( x6 x5 )(0,5)
450 (460 450)(0,5)
450 5
Q2 455
El 50% de los padres de familia tienen un ingreso mximo de 455 soles.

Clculo del Tercer Cuartil (Q3): i =3, n =10


i
3
( )( n 1) ( )(10 1) 8,25
4
4

, posicin no entera, luego Q3 estar entre las

Observaciones X8 y X9.

Entonces:

56

Q3 x8 ( x9 x8 )(0,25)
550 (600 550)( 0,25)
550 12,5
Q2 562,5
El 75% de los padres de familia tienen un ingreso mximo de 562,5 soles.
3.4.2. Cuartiles para datos agrupados

Formula:

Ingreso
Econmico

fi

Fi

454,5 587,5
587,5 720,5
720,5 853,5
853,5 986,5
986,5 1119.5
1119,5 1252,5
1252,5 1385,5
Total

5
5
10
13
16
8
5
62

5
10
20
33
48
56
62

n(i )

4 Fi 1
Qi Li 1 A *

Fi Fi 1

Donde i, tomar valores de 1 a 3, segn se trate de calcular el 1, 2 3 cuartil.


Ejem.14
Para el cuadro N 2, calcular el primer, segundo y tercer cuartil.

Procedimiento: Es parecido al clculo de la mediana

57

n(1)

4 Fi 1
Q1 Li 1 A *

Fi Fi 1

Clculo del primer cuartil (Q1): i = 1

Formula:

n i 621

15,5
4
4

2 Fi= 20

3 Fi-1 = 10
4 Li-1 = 720,5

5 A = 133

Reemplazando valores en la frmula:

15 10
20 10

Q1 720,5 133 *
Q1 787

El 25% de los trabajadores, tienen un ingreso mximo de 787 soles.

Clculo del segundo cuartil (Q2): i = 2

58

Formula:

n ( 2)

4 Fi 1
Q2 Li 1 A *

Fi Fi 1

Procedimiento:

n i 62 2

31
4
4

2 Fi = 33

4 Li-1 = 853,5

3 Fi-1 = 20

5 A = 133

Reemplazando valores en la frmula:


31 20
33 20

Q2 853,5 133
Q2 966,04

El 50% de los trabajadores, es decir 31, tienen un ingreso mximo de 966,04 soles.

Clculo del tercer cuartil (Q3): i = 3

Formula:

n(3)

4 Fi 1
Q3 Li 1 A *

Fi Fi 1

Procedimiento:

n i 62 3

46,5
4
4

4 Li-1 = 986,5

2 Fi = 48

3 Fi-1 = 33

5 A = 133

59

Reemplazando valores en la frmula:


46,5 33
Q3 986,5 133
48 33
Q3 1106,2

El 75% de los trabajadores, es decir 47 tienen un ingreso mximo de 1106,2 soles.

3.5. Deciles (Di)


Son medidas de posicin que dividen a la distribucin de datos, previamente ordenados, en
10 partes.
(

El decil isimo es el valor del dato que ocupa la posicin

i
)( n 1 )
10

en el ordenamiento.

Si la posicin no resulta entera, se hace una interpolacin lineal entre los dos valores
correspondientes a las dos observaciones entre las cuales se encuentre la posicin.
(Montgomery, 1997)
3.5.1. Deciles para datos originales
Ejemplo: Tomaremos los datos correspondiente al ingreso semanal, previamente ordenados
de 9 trabajadores de una empresa
320, 330, 345, 410, 460, 580, 900, 940, 940
x1

x2

x3

x4

x5

x6

x7

x8

x9

Calcular el Decil 2 y el Decil 6.


Decil 2 (D2): i = 2, n = 9

2
)( 9 1 ) 2
10

Posicin entera
Por tanto el decil 2 es el dato que ocupa la segunda posicin: D2 = 330.
El 20% de los trabajadores tienen un ingreso mximo de 330 soles.
60

Decil 6 (D6): i = 6, n = 9
(

6
)( 9 1 ) 6
10

Posicin entera
Por tanto el decil 6 es el dato que ocupa la sexta posicin: D6 = 580.
El 60% de los trabajadores tienen un ingreso mximo de 580 soles.

3.5.2. Deciles para datos tabulados


n(i )

10 Fi 1
Di Li 1 A *

Fi Fi 1

Formula:
Donde i, tomar valores de 1 a 9, segn se trate del primero, segundo, hasta el noveno decil.
Ejem.15
Para el cuadro N 2, calcular el 4 decil.
Procedimiento:

n i 62 4

24,8
10
10

4 Li-1 = 853,5

n ( 4)

10 Fi 1
D4 Li 1 A *

Fi Fi 1

2 Fi = 33

3 Fi-1 = 20

5 A= 133

Reemplazando valores en la frmula:

61

El

Ingreso
Econmico

fi

Fi

454,5 587,5
587,5 720,5
720,5 853,5
853,5 986,5
986,5 1119.5
1119,5 1252,5
1252,5 1385,5
Total

5
5
10
13
16
8
5
62

5
10
20
33
48
56
62

24,8 20
33 20

D4 853,5 133 *
D4 902,61

40% de los trabajadores, tienen un


ingreso mximo de 902,61 soles.
3.6. Percentiles

Para el clculo de los centiles o percentiles (P i) se procede de manera similar y las frmulas
correspondientes son: (Hoog, 1995)
(

Para datos originales:

i
)( n 1 )
100

Para datos tabulados:

Formula:

n(i )

100 Fi 1
Pi Li 1 A *

Fi Fi 1

Ejem.16: Para la tabla 2, calcular el 37 percentil.

62

Procedimiento:

n i 62 37

22,94
100
100

4 Li-1 = 853,5

2 Fi = 33

3 Fi-1 = 20

5 A= 133

n(37)

100 Fi 1
P37 Li 1 A *

Fi Fi 1

Reemplazando valores en la frmula:

22,94 20

33 20

P37 853,5 133 *


P37 883,57

El 37% de los trabajadores, tienen un ingreso mximo de 883,57 soles.

63

PROBLEMAS PROPUESTOS
1. El siguiente cuadro muestra la distribucin de la renta anual (en miles de soles) en que
incurren 50 viviendas:
Renta anual
4-6
6-8
8 - 10
10 - 12 12 - 14 14 - 16 16 - 18
N de Viviendas
3
2
7
7
11
11
9
- Halle la renta anual promedio
- Calcule la renta anual mximo que paga el 50% de las viviendas
- Cunto es la renta anual que paga la mayora de los hogares?
2. Un dentista observa el nmero de caries en cada uno de los 100 nios de cierto
colegio. La informacin obtenida aparece resumida en la siguiente tabla:
N cari es
fi
hi%
0
25
25
1
20
20
2
X
z
3
15
15
4
y
5
- Halle el nmero de caries promedio.
- El nmero de caries mximo que tienen el 50% de los nios.
3. El histograma de la distribucin correspondiente al peso de 100 alumnos de
Bachillerato es el siguiente

Halle el peso ms frecuente en los alumnos

4. Los siguientes datos pertenecen a la distribucin de la produccin de papas (en Tn.) en 40


zonas del pas
L1= 20
f2 - f5=2
X5= 100
f1=4
f3=20
Si se sabe que la distribucin es simtrica y presenta 5 intervalos de clase.
Reconstruya los intervalos de clase y obtenga las frecuencias absolutas
64

Calcule la media, la mediana y moda e interprtelos


5. Dada la siguiente distribucin de frecuencias, calcular el valor de n sabiendo que la moda
es 60 y pertenece al tercer intervalo.
Intervalos
f
16 32
6
32 48
n
48 64
8
64 80
3n
80 - 96
3
6. A los trabajadores de la empresa El Olivar, se les consult, sobre el nmero de hijos que
tienen a fin de regalarles un obsequio por navidad.
Nmero de
Trabajadores
hijos
0
15
1
20
2
23
3
14
4
10
5
5
- Cuantos hijos en promedio tiene cada trabajador
- Cuantos hijos tiene la mayora de los trabajadores
- Cuantos hijos tiene como mximo el 85% de los trabajadores
7. Las notas de los alumnos que llevaron el curso Matemtica bsica se presenta a
continuacin:
15.0
11.9
10
15
12.1
13.8
8
14.5
9.5
12.3
7.5
12.7
8.3
20
6.3
13.6
10.4
15.3
5.5
19.2
12.5
14.5
15
14.5
11.6
11.9
13
11.2
-

Cul es la nota promedio de los alumnos


Cuanto es la nota mxima del 45% de los alumnos
Cul es la nota mxima del 70% de los alumnos.

8. El tiempo en segundos que demoran las computadoras en transferir un mismo


archivo a un dispositivo externo esta dado en la siguiente tabla:
Tiempo en minutos
Nmero de
65

computadoras
170 175
1
175 180
3
180 185
4
185 190
8
190 195
5
195 200
2
Calcular la el tiempo mximo que demoran el 65% de las mquinas en transferir un
archivo.
Cunto tiempo tardan la mayora de computadoras en transferir un archivo?
Cul es el tiempo promedio.

9. Se recolect el nmero de papeletas por distintos motivos a un grupo personas que


se dedicaban hacer taxi, obtenindose la siguiente tabla:
Nmero de papeletas
Taxistas
26-34
2
34-42
1
42-50
10
50-58
4
58-66
16
66-74
8
74-82
9
Total
50
-Calcule el nmero de papeletas promedio por taxista
-Calcule el nmero de papeletas ms frecuente en los taxistas.
10. Las personas que asisten al gimnasio Ponte en Forma comentaron sobre el
nmero de hijos que tienen:
3
0
4
4
2
1
3
3
0
1
4
4
1
2
2
2
1
0
3
0
2
3
4
3
3
2
1
2
2
1
3
2
- Cuntos hijos tienen en promedio las personas
- Cuntos hijos como mximo tiene el 45% de las personas.
- Cuntos hijos como mximo tiene el 74% de las personas.

66

CAPTULO IV
Medidas de Dispersin
Y
Deformacin

Medidas de Dispersin y Deformacin


4.1. Medidas de Dispersin
67

Son medidas o parmetros estadsticos que sirven de complemento a las medidas de


centralizacin en el anlisis de los datos. La dispersin o variacin es una caracterstica
importante de un conjunto de datos porque intenta dar una idea de cun esparcidos se
encuentran stos. (Mendenhall, 2000)
4.1.1. Recorrido o Rango: (R)
Viene a ser la diferencia entre el valor mximo y el valor mnimo de los datos, es decir:
R = VMax VMin
Ejem.1: Si tenemos los siguientes datos referentes al ingreso quincenal de 10 trabajadores.
720 860 820 456 - 950 1000 1150 980 1384 998
VMax = 1384
VMin = 456
R = 1384 456 = 928 soles.
El recorrido a rango como estadgrafo de posicin es muy limitado, porque slo considera
los valores extremos de la distribucin de datos y no nos indican nada sobre el
comportamiento de los datos.
4.1.2. Varianza:
La Varianza muestral es la que se presenta en la tabla adjunta y la varianza poblacional se
define en el captulo de probabilidades.

CONDICIN
Datos Originales

Muestra
( x i x )2

S=
2

n1

( x i x )2f i

Datos Tabulados
sin intervalos

S 2=

Datos Tabulados
con intervalos

( y i x )2f i

S=

n1

n1

Ejem.2: Los siguientes datos corresponden a los ingresos econmicos por semana de 12
trabajadores de una empresa
68

Xi: 600, 650, 200, 710, 300, 550, 420, 460, 450, 540, 850, 225.
Para poder aplicar la frmula, primero debemos encontrar el promedio y luego aplicar la
frmula de la varianza.
1 Calculando el promedio:

x 496.25

2 Calculando la varianza muestral:

S 2=

( x i x )2
n1

(600 496.25) 2 (650 496.25) 2 (200 496.25) 2 ...... (225 496.25) 2


12 1
419156.22
S2
12 1
2
S 38105.11 Soles al cuadrado
S2

4.1.3. Desviacin Estndar: Es la raz cuadrada de la varianza.


Las frmulas son las siguientes:
CONDICIN
Datos Originales
Datos Tabulados
sin intervalos
Datos Tabulados
con intervalos

Muestra
S=
S=
S=

( x i x )2
n1
(x i x )2f i
n1
( y i x )2f i
n1

Ejem.3: A partir del ejemplo 2 se encontrar la desviacin estndar.


S S 2 38105.11
S 195.21 Soles

La dispersin promedio que existe entre los datos y la media aritmtica es de 195.21 soles.
4.1.4. Coeficiente de variacin:
Se utiliza para comparar la dispersin de dos conjuntos de datos que tienen unidades
diferentes, ya que representa una medida relativa de dispersin.
69

CV

s
(100)
X

Ejemplo: La resistencia al rompimiento de dos muestras de botellas es la siguiente:


Muestra 1:
Muestra 2:

230
190

250
228

245
305

258
240

265
265

240
260

Muestra 1:

Muestra 2

x 248

x 248

s = 12.56

s = 38.75

CV = 12.56/248*100= 5.06%

CV = 38.75/248*100 = 15.625

La muestra 1 presenta menor variabilidad.


4.2 Medidas de Asimetra
4.2.1. Coeficientes de asimetra (As)
Miden el grado de deformacin horizontal de la distribucin de frecuencias.
ndices de Asimetra de Pearson (As).
Se definen:
As

3( y Me)
S

As

y Md
S

El primero es el ms usual.
Interpretacin

y Me Md

1. Si la distribucin es Simtrica, entonces As = 0, en este caso coinciden


2. Si la distribucin es Asimtrica Positiva sesgada a la derecha si: As > 0.
3. Si la distribucin es Asimtrica Negativa sesgada a la izquierda si: As < 0.

70

Fuente: Escobar, 2010


4.2.2. Estadgrafos de Apuntamiento o Kurtuosis
La kurtosis viene a ser el grado de apuntamiento de una distribucin.
a. Si una distribucin tiene una elevada punta o apuntamiento, se llama Leptokrtica.
b. Si la distribucin se asemeja a una distribucin normal se llama Mesocrtica
c. Si la distribucin es aplanada se denomina Platikrtica. (Meyer, 2002)
El estadgrafo para analizar el apuntamiento es:

Coeficiente de Kurtuosis: a =

m4
S4

Donde S4 = ( S2 )2

x
m4 =

x ni
4

Si a = 3 : La distribucin es Mesokrtica ( Normal).


Si a > 3 : La distribucin es Leptokrtica ( apuntada)
Si a < 3 : La distribucin es Platikrtica ( aplanada )

Fuente: Rodrguez, 2014


71

Clculo de la Asimetra y Kurtosis para el Ejem.2


x 496.25
Promedio:
Mediana:
- Datos ordenados:
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12
200 225 300 420 450 460 540 550 600 650 710 850

1
2.

El valor de n es 12; la mediana est entre los valores X6 y X7:


460 540
2
Me 500
Me

3. Varianza muestral:

S 2 38105.11

4. Desviacin estndar muestral:


S S 2 38105.11
S 195.21 Soles

3( X Me)
As
S

5. Reemplazando en la frmula de la Asimetra:


As

3(496.25 500)
195.21

= - 0.058
La distribucin presenta asimetra negativa
Clculo de la Kurtosis para datos no agrupados

Xi
200
225
300
420
450
460
540
550
600
650
710
850
Suma

(Xi X)
7702530667
5413510549
=Kurtosis =
1483333010
33803322.75
4575588.379
1726760.254
3663635.254
8346682.129
115865041.5
558805275.9
2087490432
15659784963
33073435928

nS

Reemplazando:

a=

33073435928
12(195.21) 4

a=Kurtosis= 1.90

1.90<3
platikrtica

Distribucin
72

Ejercicio desarrollado
La siguiente tabla muestra el nmero de empleados ausentes y los das de ausencia. Por
ejemplo: de 40 a 49 empleados, tuvieron 8 das de ausencia.

Das de
ausencia
fi
5
9
8
10
12
11
8
3
66

Empleados ausentes
20
29
30
39
40
49
50
59
60
69
70
79
80
89
90
99

Clculo de

Xi
24.5
34.5
44.5
54.5
64.5
74.5
84.5
94.5

Xifi
122.5
310.5
356
545
774
819.5
676
283.5
3887

fi
5914.71534
5355.57851
1657.48393
193.067034
377.134986
2679.0404
5245.36272
3803.37466
25225.7576

S 2 25225.76 /( 66 1) 388.09 S 4 (388.09) 2 150612.74


,

x
m4 =

a=Kurtosis =

a=1.96 <3

( Xi X )4

fi

n
294791.9
150612,74

m4 =

19456264.6
66

= 294791.9

= 1.961

La distribucin de los datos es platikurtica

73

6996771.5
3186913.47
343406.622
3727.48796
11852.5665
652477.953
3439228.76
4821886.26
19456264.6

PROBLEMAS PROPUESTOS
1) Cierto diccionario tiene 1459 pginas con palabras definidas, a continuacin se indica el
nmero de palabras definidas en cada una de las pginas de una muestra aleatoria simple
obtenida de dichas pginas. Se utiliza esta muestra como base para estimar el nmero total
de palabras definidas en el diccionario. Cul es la variacin que existe?
51
63 36
43
34
62
73
39
53
79
2) A continuacin se presentan los salarios anuales de una muestra aleatoria simple de
entrenadores de futbol americano de la NCAA. Qu cambios se observaran en la
desviacin estndar si se omitiera el salario ms alto?
$150000
$300000
$350147
$232425
$360000
$229000
3) A continuacin se presentan las duraciones (en segundos) de canciones que eran populares
cuando se escribi este libro.(Las canciones son de Pink, One Direction,Shakira, Rihanna,
entre otros)La desviacin estndar cambiara mucho si se eliminara la cancin de mayor
duracin?
448 242 231 246 246 293 280 227 244 213 262
4) En un examen de matemticas los 30 alumnos de una clase han obtenido las puntuaciones
recogidas en la siguiente tabla. Halla la varianza y la desviacin tpica.
Calificaciones
N
alumnos
[0,1)
2
[1,2)
2
[2,3)
3
[3,4)
6
[4,5)
7
[5,6)
6
[6,7)
1
[7,8)
1
[8,9)
1
[9,10)
1
5) En cierta clase se ha medido la altura de los 25 alumnos. Sus medidas, en cm, se reflejan en
la siguiente tabla agrupados en intervalos. Calcula la varianza y la desviacin tpica.
Alturas
N
alumnos
[150,155)
3
[155,160)
7
[160,165)
6
[165,170)
4
[170,175)
5
6) Para el ejercicio 1 calcule e interprete el coeficiente de asimetra y kurtosis
7) A partir del ejercicio 2 calcule e interprete la Kurtuosis.
8) Del ejercicio 3 calcular e interpretar las medidas de asimetra.
74

9) Hallar el ejercicio 4 el coeficiente de asimetra. Interpretar


10) Calcular e interpretar la Kurtuosis del ejercicio 5

CAPTULO V
Probabilidades

75

1. Probabilidad
1.1. Introduccin
La estadstica representa un mtodo para la toma de decisiones frente a la
incertidumbre y como tal, se basa en la teora de probabilidades, pues la
probabilidad es la medida de la incertidumbre y de los riesgos asociados con ella.
Por ello, el estudiante, antes que aprender procedimientos estadsticos para tomar
decisiones, debe tener un concepto claro de la teora de probabilidad. (Raymond, H.
y Myers, S. ,1998)
Un tratamiento preciso de la teora de probabilidad requiere de dos enfoques, uno
inicial, basado en la teora de conjuntos, y un segundo basado en las distribuciones
de probabilidad.
El primer enfoque nos permite comprender con claridad el concepto de
probabilidad, as como obtener un listado de axiomas y propiedades fundamentales
de la teora de probabilidad. Con el segundo enfoque, llegamos a representaciones
matemticas que facilitan el clculo de probabilidades, mediante frmulas que se
ajustan regularmente a ciertos fenmenos o experimentos. (Raymond, H. y Myers,
S. ,1998)
1.2. Experimento
En estadstica se considera experimento al proceso mediante el cul se obtienen los
datos, ya sea de naturaleza cualitativa o cuantitativa.
1.2.1. Experimento determinstico
Se llama as al fenmeno o experimento que siempre tiene que ocurrir. Es
decir se presenta de una nica manera y existen frmulas matemticas que
describen el fenmeno y con las que se pueden determinar el resultado del
experimento. (Raymond, H. y Myers, S. ,1998)
Ejemplos:
1. El experimento consiste en dejar en el aire un plumn, ste siempre tiene
que caer, pues la ley de la gravedad har que sea atrada al suelo.
2. Elevamos el precio de un bien, inmediatamente se reducir la cantidad
demandada.
76

1.2.2. Experimento no deterministico o aleatorio


Se llama as al fenmeno o experimento en el que no se puede determinar con
certeza su resultado, debido a que las causas que lo originan son no
predecibles por ser aleatorias. (Raymond, H. y Myers, S. ,1998)
Por qu se dice que el experimento es no determinstico o aleatorio?
Por que:
a. Sus resultados son producto del azar.
b. Se puede repetir, cada experimento muchas veces sin cambiar las
condiciones.
c. Sus resultados posibles se pueden enlistar en un conjunto.
Ejemplos:
1.

Lanzar una moneda sobre una mesa es un experimento aleatorio; unas


veces resulta cara otras veces sello. Si en este experimento cargsemos la
moneda (revistiendo la cara con un metal pesado) de tal manera que al
lanzarla a una mesa siempre resulte cara, el experimento deja de ser
aleatorio y pasara a ser determinstico.
2.
Consideremos un partido entre dos equipos de Ftbol; desde el punto de
vista de los resultados (goles). Siempre queda un margen de azar en la
determinacin del nmero de goles a favor o en contra.
3.
Los juegos de lanzar dados, barajas, loteras, ruletas, carrera de caballos,
etc. son tpicamente aleatorios.
4.
Observar la vida til de un artculo.
1.3. Espacio muestral ()
Se denomina espacio muestral, al conjunto formado por todos los resultados
posibles de un experimento aleatorio.
En notacin matemtica el espacio muestral se define como sigue:
= {x / x es resultado de un experimento aleatorio}

77

Ejemplos:
Describir el espacio muestral asociado a cada uno de los experimentos aleatorios:
1. Lanzar una moneda al piso y observar el resultado que ocurre en la cara superior
de la moneda.
= {c, s} n () = 2
2. Lanzar dos monedas consecutivas al piso y observar el resultado que ocurre en la
cara superior de las monedas.
= {(c, c), (c, s), (s, c), (s, s)} n () = 4

3. Elegir el Presidente de una asociacin, de un grupo de 5 candidatos (A, B, C, D,


E).
= {A, B, C, D, E} n () = 5
4. Lanzar una moneda hasta obtener cara y contar el nmero de lanzamientos.
= {1, 2, 3,}
5. Determinar el tiempo de vida til de una mquina.
= {t / t 0}
1.4. Evento o suceso
Se llama evento o suceso a todo subconjunto del espacio muestral. A los eventos se
les denota con las primeras letras maysculas del alfabeto, as decimos:
78

A = Es un evento A
A se le considera evento seguro y a evento imposible.
Ejemplo:
Suponga que se lanza dos monedas consecutivas al piso y se observa el resultado
que ocurre en la cara superior de las monedas. Enliste los siguientes eventos:
a). Se obtuvo exactamente una cara.
b). Se obtuvo exactamente dos sellos.
c). Se obtuvo por lo menos una cara.
d). Se obtuvo mas de una cara.
e). Se obtuvo a lo ms dos caras.
f). Se obtuvo menos de dos caras.
Solucin:
= {(c, c), (c, s), (s, c), (s, s)} n () = 4
a). A = {(c, s), (s, c)} n (A) = 2
b). B = {(s, s)} n (B) = 1
c). C = {(c, c), (c, s), (s, c)} n (C) =3
d). D = {(c, c)} n (D) = 1
e). E = {(c, c), (c, s), (s, c), (s, s)} n (E) = 4
f). F = {(c, s), (s, c), (s, s)} n (F) = 3
1.5. Algebra de eventos
Usando las leyes del lgebra de conjuntos se puede formar nuevos eventos, los
cuales son subconjuntos del mismo espacio muestral de donde provienen los
eventos dados. As para los eventos dados. As, para los eventos A, B Y C de se
cumplen las siguientes leyes:
1.5.1. Ley de idempotencia:
a) Unin: AA =A
b) Interseccin: AA =A
1.5.2. Ley asociativa:
a) Unin: A(BC) = (AB)C = (ABC)
79

b) Interseccin: A(BC) = (AB)C = (ABC)

1.5.3. Ley conmutativa:


a) Unin: AB = BA
b) Interseccin: AB =BA
1.5.4. Ley distributiva:
a) Unin: A(BC) = (AB) (AC)
b) Interseccin: A(BC) =(AB) (AC)
1.5.5. Leyes de morgan:
a) Unin: (AB) =A B
b) Interseccin: (AB) = A B
1.5.6. Leyes del complemento:
a) Unin: AA =
b) Interseccin: AA =
1.5.7. Ley de identidad:
a) Unin: A=A y A =
b) Interseccin: A = y A=A

1.6. Tcnicas de conteo


1.6.1. Permutaciones
Permutacin es un arreglo lineal de todos los elementos de un conjunto o parte
de los elementos del conjunto (subconjunto) tomados en un orden definido.
El nmero total de permutaciones est en funcin al nmero de elementos
tomados a la vez para cada permutacin. (Raymond, H. y Myers, S. ,
1998)Segn esto podemos distinguir tres casos:
a) Permutaciones simples.
a.1. nPn = n

80

a.2. nPr = n / (n-r)

b) Permutaciones con objetos repetidos.


P

n n1, n2, n3,...nk

= n / (n1 * n2 * *nk)

c) Permutaciones circulares.
PCn = (n-1)
Ejemplos:
1. Se invita a 5 gerentes de grandes Empresas de Chiclayo, para dar a los
alumnos de Marketing y Negocios Internacionales de la UCV, una
conferencia sobre exportacin. De cuntas maneras distintas se pueden
sentar los gerentes en una fila?
P = 5 = 5*4*3*2*1 =120

5 5

2. De un grupo de 4 personas, se tiene que elegir a 3 personas que deben


ocupar el cargo de presidente, secretario, y vocal. De cuntas maneras se
pueden hacer los arreglos?
P = 4 / (4-3) = 24

4 3

3. El nmero de formas diferentes de permutar 12 objetos iguales en todo,


salvo el color, de los cuales 3 son negros, 4 son blancos y 5 son rojos es,
P

12 3, 4, 5

= 12 / (3 * 4 *5) =27720

4. De cuntas maneras diferentes pueden sentarse 9 personas alrededor de


una mesa elipsoidal?
PC9 = (9-1) =8
1.6.2. Combinaciones
Cuando hablamos de combinaciones, no debemos tener en cuenta el orden de
los elementos; slo nos interesa que se combine un elemento con otro.
nCr = n / r(n-r)
Ejemplos:
81

1. Cuntos cables de conexin se necesitan para que dos aulas cualesquiera,


de doce aulas existentes en total en una Universidad, puedan comunicarse
directamente?
C2 = 12 / 2 (12-2) = 66

12

2. Una caja contiene 20 tornillos similares, de los cuales 10 son buenos, 8


tienen defectos del tipo A, 5 tienen defectos del tipo B, y 3 los dos tipos de
defectos.Cuntos elementos tiene el espacio muestral que resulta de
escoger al azar 11 tornillos de manera que 2 tengan defectos Ay B, 3
defectos slo A, 2 con defectos slo B y 4 sin defectos?
C4 * 5C3 * 3C2 * 2C2 = 6300

10

3. Dados los eventos A de 4 elementos, y B de 8 elementos.Cuntos eventos


de 6 elementos pueden formarse si cada uno debe contener:
a) Un solo elemento de A?
b) Por lo menos un elemento de A?
Solucin:
a)
b)

C1 * 8C5 = 224 formas.

C1 * 8C5+ 4C2 * 8C4+ 4C3 * 8C3+ 4C4 * 8C2 = 896 formas.

1.7. Probabilidad de ocurrencia de ocurrencia de un evento


1.7.1. Definicin de probabilidad clsica
Si A es un evento de , la probabilidad de que ocurra el evento A est dada por:
P(A)= n(A) / n ()

Experimento
aleatorio

Espacio muestral
n()

P(A)= n(A) / n ()

82

Evento (A)
n(A)

Ejemplo: Suponga que el experimento aleatorio consiste en lanzar un dado y


observar el resultado que ocurre en la cara superior del dado. Calcular la
probabilidad de que ocurra:
a)
b)
c)
d)

El nmero 6.
Por lo menos el nmero 4.
A lo ms el nmero 2.
Por lo menos el nmero 1.

Solucin:
= {1, 2, 3, 4, 5, 6} n () = 6
a) A= {6} n (A) = 1
P(A) = n(A) / n () = 1/6
b) B= {4, 5, 6} n (B) = 3.
P(B) = n(B) / n () = 3/6
c) C = {1, 2} n (C) = 2.
P(C) = n(C) / n () =2/6
d) D = {1, 2, 3, 4, 5, 6} n (D) = 6
P(D) = n(D) / n () =6/6
1.7.2. Definicin de frecuencia relativa
La probabilidad de un evento (que suceda o que resulte) es la proporcin de
veces que el evento sucedera en una serie prolongada de eventos repetidos.
Ejemplo:
La tabla siguiente, muestra el estado civil de 30 Trabajadores de una Empresa.
Ao 2005.
Estado civil
Soltero
Casado
Total

ni
20
10
30

83

Si se selecciona un trabajador al azar, cul es la probabilidad de que sea


soltero?
Solucin:
P(Soltero)= 20 / 30
1.8. Axiomas de probabilidad
A.1. 0 P(A) 1
A.2. P() =1
A.3. Si A y B son dos eventos en , tales que A y B son mutuamente excluyentes
(AB = )
P(AB) = P(A)+P(B)
Este axioma se puede extender para k eventos mutuamente excluyentes A1, A2,
, AK, es decir
P( A1A2 AK) = P(A1)+P(A2)++P(AK)
1.9. Teoremas de probabilidad
T.1. P () = 0
T.2. P (A) = 1- P(A)
T.3. Si AB P(A) P(B)
T.4. Si A y B no son mutuamente excluyentes ( AB )
P(AB) = P(A)+P(B) -P (AB)
T.5. Si A, B y C no son mutuamente excluyentes
P(ABC) = P(A)+P(B)+P(C) -P (AB) - P (AC)- P (BC)+ P (ABC)
Ejemplos:
1. La probabilidad de que la seora hablantina reciba por lo menos 8 llamadas
telefnicas en un da es 0.2 y la probabilidad de que reciba a lo ms 5 llamadas
telefnicas en un da es 0.3. Hallar la probabilidad de que la seora hablantina
reciba 6 7 llamadas en un da.
Solucin:
84

= {0, 1, 2 ,3 ,4 ,5, 6, 7, 8, 9,...}


A= {8, 9,} P(A) = 0.2
B= {0, 1, 2, 3, 4, 5} P(B)=0.3
C = {6, 7} P(C) = ?
ABC
P (ABC)

= P()

P(A) + P(B) + P(C) =

0.2 + 0.3 + P( C)

P( C) = 0.5

2. Un escolar entra a una tienda de golosinas. La probabilidad de que compre


caramelos es 0.7, la probabilidad de que compre galletas es 0.5 y la probabilidad
de que compre ambos (caramelos y galletas) es 0.3. Hallar la probabilidad de
compre caramelos, o galletas o ambos.
Solucin:
Sean los eventos:
A = El nio compra caramelos
B = El nio compra galletas
AB = El nio compra caramelos y galletas
P(AB) = P(A)+P(B) -P (AB)
= 0.7 + 0.5 0.3 = 0.9
1.10. Probabilidad condicional
A menudo se quiere determinar la probabilidad de que ocurra un evento sabiendo
que otro evento ha ocurrido. La probabilidad condicional (o condicionada) de que
un evento B ocurra dado que otro evento a ha ocurrido se denota por P(B/A). Esta
notacin se lee . La probabilidad de que B ocurra dado que A ha ocurrido o
simplemente la probabilidad de B dado A

Definicin: Sean A y B dos eventos en un espacio muestral . La


85

probabilidad condicional de B dado A, se calcula mediante la frmula:

P (B/A) =

B
A

con P(A) 0

El smbolo / se traduce en cualquiera de las formas condicionales, como


por ejemplo, dado que, siempre que, Si, etc.
La notacin P (B/A): La Probabilidad de que ocurra el evento B, dado que el evento
A ha ocurrido.
Nota

Si P (A) = 0, se define P (B/A) = 0


Si A B = , entonces P (B/A) = 0
Si A C B, entonces P (B/A) = P ( A/A) = 1
Si B C A, entonces P ( B/A) =

P( B)
P( A)

Ejemplo:
Un club consiste de ciento cincuenta miembros. Del total, 3/5 son hombres y 2/3
son profesionales. Adems, 1/3 de las mujeres son no profesionales.
a) Se elige al azar un socio del club:
a.1) Calcular la probabilidad de que sea hombre y profesional.
a.2) Calcular la probabilidad de que sea hombre, dado que es profesional.
b) Se eligen tres socios al azar:
b.1) Si las tres son mujeres, cul es la probabilidad de que slo l de ellas sea
profesional?
b.2) Si resultan ser del mismo sexo, cul es la probabilidad de que sean
mujeres?.
Solucin:
PROFESIONAL NO PROFESIONAL
TOTAL
HOMBRE
60
30
90
(H)
86

MUJER
(M)
TOTAL

40

20

60

100

50

150

a)
a.1) P(H P) = 60/150 = 0.4
a.2) P(H/P) = P (HP) / P(P) = (60/150) / (100/150) = 0.6
b)
b.1) A = Las tres son mujeres
B = Slo una es profesional
P(B/A) = ( 40C1 * 20C2)/ 60C3
b.2) A = Los tres son del mismo sexo
B = Las tres son mujeres
P(B/A) = ( 60C3 )/ (90C3 + 60C3) = 0.23

1.11. Regla de la multiplicacin


1.11.1. Eventos independientes
Se dice que el evento B es independiente del evento A, si,
P(B/A) = P(B) o P(A/B) = P(A)
P(AB) = P (A) P(B)
Ejemplo:
Suponga que en un proceso de produccin se utilizan las mquinas. 1 y 2, que
trabajan en forma independiente para producir cierto bien. Si la probabilidad
de que ambas mquinas fallen es 1/5 y de que falle slo la 2 es 2/15. Calcular
la probabilidad de que
a)
b)

Falle slo la mquina 1.


La produccin contine.
Solucin:
P(AB) =1/5 = 3/15, P(AB) = 2/15, entonces, P(B)= 5/15

87

Adems de P(AB) = P (A) P(B), resulta, P(A) = 9/15


a)
P(AB) = P (A) P(B) = 9/15 * 10/15 = 6/15
b)

P(AB AB AB ) = P(AB) + P(AB) + P( AB )


= P (A) P(B) + P(A) P(B) + P( A) P(B)
= 6/15 * 5/15 + 9/15*10/15 + 6/15 * 10/15 =

12/15
1.13. Probabilidad total
Si k eventos: A1, A2,..,AK, constituyen una particin del espacio muestral ,
entonces, para cualquier evento B en ,
P(B) = P(A1) * P(B/A1)+P(A2)*P(B/A2)++P(AK)*P(B/AK)

A1

A2

AK

A. Teorema de bayes
Sea {A1, A2,..., Ai,..., An} un conjunto de sucesos mutuamente excluyentes y exhaustivos,
y tales que la probabilidad de cada uno de ellos es distinta de cero. Sea B un suceso
cualquiera del que se conocen las probabilidades condicionales P(B | Ai). Entonces, la
probabilidad P(Ai | B) viene dada por la expresin:

Dnde:
88

P (Ai) son las probabilidades a priori.


P (B | Ai) es la probabilidad de B en la hiptesis Ai.
P (Ai | B) son las probabilidades a posteriori.
Esto se cumple
El Teorema de BAYES se apoya en el proceso inverso al del Teorema de la Probabilidad
Total:

Teorema de la probabilidad total: a partir de las probabilidades del suceso A (probabilidad


de que llueva o de que haga buen tiempo) deducimos la probabilidad del suceso B (que
ocurra un accidente).
Teorema de Bayes: a partir de que ha ocurrido el suceso B (ha ocurrido un accidente)
deducimos las probabilidades del suceso A (estaba lloviendo o haca buen tiempo?).
(Raymond, H. y Myers, S. ,1998)
La frmula del Teorema de Bayes es:

Tratar de explicar estar frmula con palabras es un galimatas, as que vamos a intentar
explicarla con un ejemplo. De todos modos, antes de entrar en el ejercicio, recordar que
este teorema tambin exige que el suceso A forme un sistema completo.
Ejemplo.
El parte meteorolgico ha anunciado tres posibilidades para el fin de semana:
a) Que llueva: probabilidad del 50%.
b) Que nieve: probabilidad del 30%
Segn estos posibles estados meteorolgicos, la posibilidad de que ocurra un accidente es la
siguiente:
a) Si llueve: probabilidad de accidente del 20%.
b) Si nieva: probabilidad de accidente del 10%
Resulta que efectivamente ocurre un accidente y como no estbamos en la ciudad no
sabemos qu tiempo hizo (llovi, nev o hubo niebla).
El teorema de Bayes nos permite calcular estas probabilidades:

89

Las probabilidades que manejamos antes de conocer que ha ocurrido un accidente se


denominan "probabilidades a priori" (lluvia con el 50%, nieve con el 30% y niebla con el
20%).
Una vez que incorporamos la informacin de que ha ocurrido un accidente, las
probabilidades del suceso A cambian: son probabilidades condicionadas P (A/B), que se
denominan "probabilidades a
posteriori".
Aplicacin de la frmula:

a) Probabilidad de que estuviera lloviendo:

La probabilidad expresada en porcentaje, de que efectivamente estuviera lloviendo el da


del accidente (probabilidad a posteriori) es del 71,4%.
b) Probabilidad de que estuviera nevando:

La probabilidad expresada en porcentaje de que estuviera nevando es del 21,4%.

Ejemplo
Un ensamblador de computadoras usa partes que provienen de tres proveedores A1, A2 y A3.
De 2000 partes recibidas 1000 provienen de A1, 600 de A2 y el resto de A3. Por anteriores
trabajos el ensamblador sabe que las partes defectuosas que provienen de A 1, A2 y A3 son
respectivamente 3%, 4% y 5%. Si se elige una computadora al azar:
a) Cul es la probabilidad que contenga una parte defectuosa?
b) Y si contiene una parte defectuosa. Cul es la probabilidad de que haya sido provedo
por A2?
Solucin:
Sean los eventos
Ai: Parte proveniente del proveedor Ai, i=1, 2,3
B: Parte defectuosa
90

Adems:
P (A1) =
(A3) =

400
2000

1000
2000

= 0.5

P (A2) =

600
2000

= 0.3

= 0.2
P (B/A1) = 0.03

P (B/A2) = 0.04

P (B/A3) = 0.05

Esquemticamente:
0.03
A1

P (Ai) x P (B/Ai)
0.5 x 0.03

0.3 x 0.04

0.2 x 0.05

0.5
0.3

0.04
A2
0.05

0.2

A3

a) Aplicando la regla de probabilidad total se obtiene:


3

P (B) =

P ( Ai ) x P(B/ Ai )
i=1

= P(A1) x P(B/A1) + P(A2) x P(B/A2) + P(A3) x P(B/A3)

P (B) = 0.5 x 0.03 + 0.3 x 0.04 + 0.2 x 0.05 = 0.037


b) Aplicando el Teorema de Bayes se obtiene:

P (A2/B) =

P ( A2 ) x P(B / A 2)
P(B)

Ejemplo:
91

0.3 x 0.04
0.037

= 0.3243

Las probabilidades de que los socios S1 y S2 sean elegidos presidente de un club son
respectivamente 0.4 y 0.6. Las probabilidades de que se aumenten las cuotas mensuales de
los socios son de 0.9 si sale elegido S1 y de 0.2 si sale elegido S2.
a) Cul es la probabilidad de que haya un aumento en las cuotas mensuales de los socios?.
b) Si se aumenta la cuota mensual, cmo se modifican las probabilidades de que salgan
elegidos los socios S1 y S2 ?.

Solucin:
S1

0.9

0.2

0.4

0.6

S2

a) P(A) = P(S1) * P(A/S1)+P(S2)*P(A/S2) = 0.4*0.9 + 0.6*0.2 = 0.48

b)
P(S1/A) = P (S1 ) P(A/ P(S1) / P(A) = 0.75
P(S2i/B) = P (S2) P(B/ P(S2) / P(A) = 0.25
La probabilidad de S1 se modifica de 0.4 A 0.75 y la de S2 se modifica de 0.2 a 0.25

92

PROBLEMAS PROPUESTOS
1. Cada uno de cuatro amigos elige una bebida al azar en la cafetera. Describa el espacio
muestral del experimento si hay disponibles en tres sabores denominados por L, N y F,
cuntos elementos tiene?.
2. Una caja contiene 8 dulces de pia; 6 de naranja y 4 de fresa. Cuntos elementos tiene el
espacio muestral que resulta de extraer al azar un dulce de cada sabor?
3. Cierta marca de sierra elctrica es calificada por especialistas, en cuanto a rendimiento,
como: Muy buena, (B1); o, buena, (B2); o regular, (B3), y en cuanto al precio, como
cara, (C1), o barata; (C2). De cuntas maneras es calificada la sierra elctrica por los
especialistas?.
4. Se sabe por estudios previos que el 0,1% de la poblacin tiene problemas vasculares. Un
estudio sobre individuos con problemas vasculares revela que el 20% de ellos son placas de
ateroma. Si el 10% de los individuos con placas de ateroma estn expuestos a muerte sbita
por desprendimiento de trombos qu probabilidad tiene un individuo cualquiera de estar
expuesto a muerte sbita por desprendimiento de trombos de una placa de ateroma.
5. Una rata es colocada en una caja con tres pulsadores de colores rojo, azul y blanco. Si pulsa
dos veces las palancas al azar:
a) Cul es la probabilidad de que las dos veces pulse la roja?
b) Cul es la probabilidad de que pulse la primera vez o la segunda o ambas la tecla azul?

93

6. Un lote contiene n objetos. La probabilidad de que al menos uno sea defectuoso es 0.06,
mientras que la probabilidad de que al menos dos sean defectuosos es 0.04. Calcular la
probabilidad de que:
a) Todos los objetos sean no defectuosos.
b) Exactamente un objeto sea defectuoso.
7. Doscientas personas estn distribuidas de acuerdo a su sexo y lugar de procedencia de la
siguiente manera: 130 son hombres, 110 son de la capital y 30 son mujeres y de provincias.
Si se eligen dos personas al azar calcular la probabilidad de que:
a) Ambos sean hombres y de provincias.
b) Al menos uno de los dos escogidos sea mujer.
8.

Un comerciante tiene 12 unidades de cierto artculo de los cuales 4 tienen algn tipo de
defecto. Un cliente pide para comprar 3 de tales artculos pero que no tengan defectos. Si el
comerciante escoge al azar y de una sola vez 4 de tales artculos, cul es la probabilidad de
que con las 4 unidades escogidas satisfaga el pedido del cliente?

9.

Cien personas fueron encuestadas acerca de sus preferencias sobre tres productos A, B, y
C. Se encontr que 50 prefieren el A, 37 el B, y 30 el C. Adems 12 prefieren A y B, 8 slo
A y C, 5 slo B y C, y 15 slo C. De cinco personas encuestadas elegidas al azar, calcular la
probabilidad de que 2 de ellas prefieran B, y C, 2 slo A y B, y una prefiera los tres
productos.

10. En cierto pas, el 99% de los detenidos y sometidos a juicio son culpables del delito que se
les imputa. Los jueces, al emitir veredicto, aciertan en el 95% de los casos, tanto si el
acusado es culpable como inocente. Segn estos datos, calclese la probabilidad de que:
a) un ciudadano inocente haya sido declarado culpable.
b) sea culpable, si ha sido declarado inocente.

94

CAPTULO VI
Distribuciones Probabilsticas

95

Funciones de distribuciones de probabilidades discretas y continas


A. Funcin de distribucin de probabilidades de una variable aleatoria discreta. Es una
lista de los valores de la variable aleatoria y sus respectivas probabilidades, donde cada
probabilidad toma valores entre 0 y 1 y adems la suma de las probabilidades de todos los
valores de la variable es igual a 1. (Raymond, H. y Myers, S. ,1998)
Ejemplo. La variable aleatoria X, nmero de veces que se interrumpe la electricidad en una
ciudad por mes, tiene la siguiente funcin de distribucin de probabilidades.
X

f(x) = probabilidad

1
2
3
4
5

0.35
0.30
0.20
0.10
0.05

B. Funcin de distribucin de probabilidades de una variable aleatoria contina. Es una


funcin f(x) no negativa con

f(x)dx 1

Ejemplo el tiempo. La variable aleatoria X, peso neto en libras de un herbicida qumico


empacado es
2.0, si 49.75 x 50.25
0, si x 49.75 o si x 50.25

f(x)

Note que f(x) es no negativo (valores mayores o iguales a cero) y que

f(x)dx

50.25

49.75

2dx 2x

(50.25)
(49.75)

2(50.25) 2(49.75) 1
.
96

C. Esperanza matemtica de una variable aleatoria discreta o media de la poblacin:

. Es un concepto matemtico y se define como sigue

E X xf(x)
x

En el ejemplo de funcin de distribucin de probabilidades continua tenemos que


5

E X xf(x) xf(x) 1(0.35) 2(0.30) 3(0.20) 4(0.10) 5(0.05) 2.2


i 1

D. Esperanza matemtica de una variable aleatoria continua:

. Se define

E X xf(x)dx

En el ejemplo de esperanza matemtica o media de una poblacin continua se tiene

2x 2
E X xf(x)dx x(2)dx

49.75
2

50.25

50.25

(50.25) 2 (49.75) 2 50
( 49.75)

E. Varianza de una variable aleatoria discreta:

. Se define como sigue

2 Var X E X x - f(x)
2

Calcularemos la varianza de la variable aleatoria X del ejemplo del caso discreto


5

2 Var X E X x - f(x) x 2.2 (2)


2

i 1

(1 2.2) (0.35) (2 2.2) 2 (0.30) (3 2.2) 2 (0.20) (4 2.2) 2 (0.10) (5 2.2) 2 (0.05)
2

1.6
F. Varianza de una variable aleatoria contina

97

. Se define de la siguiente manera

2 Var X E X x - f(x)dx
2

En el ejemplo del caso continuo tenemos


x3
Var X x - f(x)dx x - 50 (2)dx 2 x - 50 dx 2

49.75
49.75
3

50.25

50.25

50.25

49.75

2
(50.25) 3 (49.75) 3 0.0208
3

Distribuciones probabilsticas
7.1. Distribucin Binomial
Introduccin
En las empresas tenemos muchas situaciones donde se espera que ocurra o no un evento
especfico. ste puede ser de xito o fracaso sin dar paso a un punto medio. Por ejemplo,
en la produccin de un artculo, ste puede salir bueno o malo. Casi bueno no es un
resultado de inters. Para situaciones como stas se utiliza la distribucin binomial.
Describiremos el uso de la distribucin binomial para obtener la probabilidad de ocurrencia
de ese evento que representa un resultado esperado. (Raymond, H. y Myers, S. ,1998)
Utilidad:
La distribucin binomial se utiliza en situaciones cuya solucin tiene dos posibles
resultados.
Por ejemplo:
-Al nacer un beb puede ser hombre o mujer
-En el deporte un equipo puede ganar o perder.
-En pruebas de cierto o falso slo hay dos alternativas.
-Un tratamiento mdico puede ser efectivo o inefectivo.
98

-La meta de produccin o ventas del mes se pueden o no lograr.


-En pruebas de seleccin mltiple, aunque hay cuatro o cinco alternativas, se puede
clasificar como correcta o incorrecta.
La distribucin de probabilidad binomial es un ejemplo de distribucin de probabilidad
discreta. Est formada por una serie de experimentos de Bernoulli. Los resultados de cada
experimento son mutuamente excluyentes. Para construirla necesitamos:
1) la cantidad de pruebas n
2) la probabilidad de xitos p
3) utilizar la funcin matemtica.
A continuacin vemos La funcin de probabilidad de la distribucin Binomial.

P X x C xn p x q n x
P X x

n!
. p x .(1 p ) n x
n x !x!

x : es el nmero de aciertos.
n: es el nmero de experimentos.

p: es la probabilidad de xito
1-p q: es la probabilidad de fracaso

Medidas de resumen de la distribucin binomial:


a) Valor esperado o media aritmtica
E ( X ) np

b) Varianza
V ( X )= 2=npq
c) Desviacin estndar

npq

Ejemplo 1
Un comerciante tiene conocimiento de que el 12% de los artculos del lote recibido estn
defectuosos. Si un comprador elige 4 artculos, encuentre la probabilidad de que.
a) los 4 estn defectuosos.
P ( x=4 )=C 44 ( 0.12 )4 ( 0.88 )0=0.0002074
99

b) de 1 a 3 estn defectuosos.
4
1
3
4
2
2
4
3
1
P ( 1 x 3 )=C 1 ( 0.12 ) ( 0.88 ) +C2 ( 0.12 ) ( 0.88 ) +C3 ( 0.12 ) ( 0.88 ) =0.4009728

Ejemplo 2
En pruebas realizadas a un amortiguador para automvil se encontr que el 20%
presentaban fuga de aceite. Si se instalan 8 de estos amortiguadores, hallar la probabilidad
de que,
a) 4 salgan defectuosos
8
4
4
P ( x=4 )=C 4 ( 0.2 ) ( 0.8 ) =0.05
b) ms de 5 tengan fuga de aceite.
8
6
2
8
7
4
8
8
0
P ( x >5 ) =C6 ( 0.2 ) ( 0.8 ) +C7 ( 0.2 ) ( 0.8 ) +C 8 ( 0.2 ) ( 0.8 ) =0.00123136
c) de 3 a 5 amortiguadores salgan defectuosos.
8
3
5
8
4
4
8
5
3
P ( 3 x 5 ) =C3 ( 0.2 ) ( 0.8 ) + C 4 ( 0.2 ) ( 0.8 ) +C 5 ( 0.2 ) ( 0.8 ) =0,20185088
d) Determine el promedio y la desviacin estndar de amortiguadores con defectos.
E ( x )=np=8 ( 0.20 )=1,6 2

Ejemplo 3
Un ingeniero que labora en el departamento de control de calidad de una empresa elctrica,
inspecciona una muestra al azar de 20 alternadores de un lote. Si el 10% de los
alternadores del lote estn defectuosos. Cul es la probabilidad de que en la muestra,
a) Ninguno este defectuoso
20
0
20
P ( x=0 )=C 0 ( 0.1 ) ( 0.9 ) =0,12157665
b) uno salga defectuoso,
20
1
19
P ( x=1 )=C1 ( 0.1 ) ( 0.9 ) =0,27017034
c) A lo ms dos salgan defectuosos
20

20

20

19

20

18

P ( x 2 ) =C0 ( 0.1 ) ( 0.9 ) +C 1 ( 0.1 ) ( 0.9 ) + C2 ( 0.1 ) ( 0.9 ) =0,67692681


d) ms de tres estn con defectos
100

P ( x >3 ) =1P ( x 3 )
0
20
20
1
19
20
2
18
20
3
17
1P [ C 20
0 ( 0.1 ) ( 0.9 ) +C 1 ( 0.1 ) ( 0.9 ) +C2 ( 0.1 ) ( 0.9 ) +C 3 ( 0.1 ) ( 0.9 ) ]

P ( x> 3 )=0,13295332

Ejemplo 4
Un fabricante de piezas prepara lotes de 20 piezas y las enva a sus clientes. Suponer que
cada pieza esta defectuosa o no lo est, y que la probabilidad de que cualquiera de ellas est
defectuosa es de 0.05.
a) Cul es el nmero esperado de piezas defectuosas
b) Cul es la probabilidad de que determinado lote no contenga piezas defectuosas
a) E (x)

=np
= 20(0.05) = 1

b) P ( X =0 )

20
0
= C0 (0.05)

(0.95)200

= (0.95)20 = 0.3585

7.2. Distribucin Hipergeomtrica


Introduccin
La distribucin hipergeomtrica al igual que la distribucin binomial se aplica en
situaciones donde se espera que ocurra o no un evento especfico, la diferencia es que en la
distribucin binomial, cada producto es extrado con reemplazo y todos los intentos son
independientes, en cambio en la distribucin hipergeomtrica cada muestra es extrada sin
reemplazo y los intentos son dependientes. (Raymond, H. y Myers, S. ,1998)
Utilidad:
La distribucin hipergeomtrica es especialmente til en todos aquellos casos en los que se
extraigan muestras o se realizan experiencias repetidas sin devolucin del elemento
extrado o sin retornar a la situacin experimental inicial.
Por ejemplo:
-Se quiere seleccionar 2 hombres de 17 personas de las cuales hay slo 7 hombres
-En la agro industria se tiene 8 terneros de los cuales hay 3 enfermos, se quiere
seleccionar 2 para la venta.
- Se tiene 22 empleados de los cuales 12 tienen estudios tcnicos, se requiere 5 de ellos.
Este modelo presenta similitudes con el Binomial, pero sin la suposicin de independencia
de ste ltimo, la dependencia se debe al hecho de que N es finito y las extracciones se
efectan sin reemplazamiento
101

Se requiere los siguientes elementos:


1) la cantidad de pruebas N
2) n de elementos en la poblacin original que pertenecen a la categora deseada d
3) tamao de muestra extrada n

4) n de elementos en la muestra que pertenecen a la categora deseada x


5) utilizar la funcin matemtica.

Ejemplo 1
En una empresa industrial diariamente se producen 14 unidades de metalmecnica, de las
cuales generalmente 5 salen defectuosas. Se examina en un da cualquiera una muestra de 4
unidades. Hallar la probabilidad de:
a) 2 unidades sean defectuosas.
5 145
2 52
P ( x=2 )=
=0,8392
14
4

( )( )
( )

b) Las 4 sean defectuosas.


Tenemos
N= 14
d= 5

5 145
(
4 )( 54 )
( x=4 )=
(144)

n= 4

x= 2

= 0.0449

Ejemplo 2
Entre los 12 colectores solares en exhibicin en una feria comercial 9 son planos y los otros
3 son curvos. Si una persona que visita la feria selecciona aleatoriamente 3 colectores para
probarlos y luego comprarlos, cul es la probabilidad de que:
a) los 3 sean colectores planos?
b) los 3 sean colectores curvos?
Solucin:
102

a) P(x=3) =

9 3

3 0
12

3
9

b) P(x=0) =

= 0,3818

12

= 0,004545

Ejemplo 3
Un fabricante de tractores compra motores de una compaa, bajo una condicin, acepta un
lote de 40 motores si de una muestra de 8 motores ninguno presenta defectos. Cul es la
probabilidad de aceptar un lote que en realidad tiene 2 motores con defectos?
2

0

P(x=0) =

38

8
40

= 0,6359

Ejemplo 4
Una empresa manufacturera recibe un lote que contiene 100 artculos de los cuales cinco
son defectuosos. La compaa revisa constantemente lo que recibe para establecer la
calidad del producto. Si la calidad de un lote recibido es baja, regresa al proveedor el lote
completo. Suponga que la compaa recibe el lote y lo acepta si hay slo 1 o menos piezas
defectuosas en una muestra de tamao 6. Cul es la probabilidad de que acepta un lote de
100 artculos que contengan 5 defectuosos?
Solucin:

5 Defectuosos
95 No
defectuosos

n = 6 Tamao de
la muestra

Lote de n = 100 artculos


Sea X = 0, 1, 2, 3, 4, 5

nmero de artculos defectuosos

103

5 95
(
x )(6x )
1 5 95 5 95
=
+

100
100 (0 )( 6 ) (1 )( 5 )
(6) (6)
1

P (X 1) =

x=0

= 0.972

7.3. Distribucin de Poisson


Introduccin
Llamada as en honor al probabilista francs Simen Denis Poisson. Aqu interesa contar el
nmero de veces que un determinado suceso ocurre en un periodo de tiempo determinado
Es un proceso de tiempo continuo que consiste en "contar" eventos raros (de ah el nombre
"sucesos raros") que ocurren a lo largo del tiempo. (Raymond, H. y Myers, S. ,1998)
Utilidad
Su utilidad se da en general en los problemas llamados lneas de espera, teora de colas o
similares.
Ejemplo
- N de leucocitos en una gota de sangre
- N de veces que una planta de energa nuclear emite gases radiactivos en un periodo
de tres meses
- Nmero de bacterias nocivas por cada cm3 de agua.
- Nmero de personas que llegan a una posta mdica para ser atendidos
- Nmero de aviones que llegan a un aeropuerto durante el da.
Es una distribucin de variable aleatoria discreta en la que la variable representa al nmero
de xitos en el intervalo de tiempo o espacio, estos eventos son continuos e independientes,
lo que significa que el nmero de xitos que ocurren en un intervalo de tiempo dado o
espacio son independientes, de los que ocurren en cualquier otro intervalo, pero se supone
que la tasa de xitos por unidad de tiempo o espacio permanece constante, esta tasa lo
representaremos por . (Raymond, H. y Myers, S. ,1998)
Elementos:
1) Nmero promedio de ocurrencias por unidad de tiempo o espacio
2) Nmero de eventos de Poisson en un intervalo de tiempo o en un espacio de tamao t es
igual a x
3) e = 2.7182
4) = n*p (n=tamao de muestra y p= probabilidad de xito)
5) utilizar la funcin matemtica
Medidas de resumen de la distribucin de Poisson:

104

e x
x!

P(x) =
x: 0, 1, 2, 3,..
Donde e = 2,71828.
E(x) = =
2
V(x) = =
La aproximacin de una v.a del tipo binomial a una del tipo Poisson, es muy buena si n
100 y p 0,05
Ejemplo 1:
Se sabe que el nmero promedio de camiones que llegan a un terminal terrestre durante el
da es de 10, las instalaciones del terminal pueden atender como mximo 15 camiones al
da. Cul es la probabilidad de que la capacidad de atencin del terminal sea superado en
un da cualquiera?
Solucin:
X = nmero de camiones que llegan al terminal terrestre durante el da para ser atendidos.
X= 0, 1, 2, 3,..
P(x > 15) = 1 P(x 15)
e 10 10 x
x!
x 0
15

=1-

= 1 - 0,9513 = 0,0487

Ejemplo 2:
En cierto proceso de fabricacin en el que se producen artculos de porcelana ocurren
defectos que ocasionan problemas en las ventas, el fabricante asegura que en promedio uno
de cada 1000 artculos producidos es defectuoso. Cul es la probabilidad de que en una
caja de 3000 artculos haya:
a) exactamente 3 artculos con defectos?
b) al menos un artculo con defectos?
Solucin:
a) X: nmero de artculos defectuosos en la muestra.
= np = 3000(1/1000) = 3

P(x=3) =

e 3 33
3!

= 0,224042

Si se hubiera usado la distribucin binomial, se tendra:

105

3000

0,001)(0,999) 2997
3

P(x=3) =
= 0,224154
Nuevamente la diferencia es bastante pequea.
b) P(x 1) = 1 - P(x=0) = 1 1/e3 = 1 0,049787 = 0,950213
Aclaracin:
La probabilidad de que ocurra k eventos de Poisson en un intervalo de tiempo o en un
espacio de tamao t es:

( t )k
K!

P [ X=k ] =

Donde t es el nmero de ocurrencias de eventos en el periodo o espacio t


Ejemplo 3:
El nmero de clientes que llegan a un banco es en promedio 60 por hora, cul es la
probabilidad de que lleguen 2 clientes en:
a) un minuto?
b) dos minutos?
Solucin:
a) = 60(1/60) = 1
e 1 12
1 / 2e 0,1839
2!

P(x=2) =
b) = 120(1/60) = 2
P(x=2) = e-222/2! = 2/e2 = 0,27067
Ejemplo 4:
Se produce defectos en forma aleatoria en cierto tipo de tejidos de lana, con un promedio de
un defecto cada 100 metros cuadrados.
a) Cul es la probabilidad de que una pieza de 50 por 10 metros no tenga defectos?
b) De qu presente un defecto como mximo?
Solucin:
El problema es un proceso de Poisson, donde debemos llegar el parmetro t.
Veamos:
Si:

m2
100
50 x 10

Defectos
1
t

106

Luego t =

50 x 10
100

x 1 = 5 defectos

Sea X = 0, 1, 2,, el nmero de defectos


Se pide calcular:
a) P [ X=0 ] =
b) P [ X 1 ] =

2 ( 5 )0
0!
2 ( 5 )0
0!

= -5 0.007
+

2 ( 5 )1
1!

0.04

7.4. Distribucin Normal


Introduccin
Llamada tambin distribucin gaussiana, es la distribucin de v.a. continua ms importante
y la de mayor uso, es la distribucin modelo y sirve de aproximacin para las dems
distribuciones, asimismo de acuerdo a la ley de los grandes nmeros muchas estadsticas
muestrales tienen distribucin normal. Su grfica se llama curva normal, es una curva
simtrica en forma de campana, o acampanada que se extiende sin lmites en ambos
sentidos sobre la recta real o eje de las X (abscisas en el eje cartesiano). sin embargo, hay
que tener mucho cuidado para usarlo sin previa comprobacin, pues las consecuencias
pueden ser impredecibles. Ejemplo si se disea cierto material para resistir una cantidad
dada de presin que se supone se distribuye normalmente alrededor del valor promedio y el
diseo se hace con esta suposicin, el material puede verse seriamente daado al
aplacrsele una presin elevada pero dentro de los lmites permisibles. Ha sido estudiado
por muchos matemticos como La Place, De Moivre, Gauss, etc. (Walpole,1998)
Utilidad
Se utiliza en muchos fenmenos que ocurren en la naturaleza, en la industria y en cualquier
campo, tales como: la temperatura del medio ambiente, la precipitacin pluvial, las
mediciones de magnitudes fsicas, el peso y la talla de las personas, etc.
Ejemplos
Consumo de cierto producto por un mismo grupo de individuos,
Cociente intelectual, grado de adaptacin a un medio
Efecto de una misma dosis de un frmaco, o de una misma cantidad de abono
Propiedades
107

1.- Sus puntos de inflexin son: - y + , por lo tanto es cncava hacia abajo en el
intervalo - < x < + ,
2.- La media y la Varianza de la distribucin son: y 2 respectivamente, y que son los
parmetros de la distribucin.
3.- Las reas comprendidas bajo la curva normal son:
, corresponde al 68,26% del rea total.
2, corresponde al 95,44% del rea total.
3, corresponde al 99,74% del rea total.
4.- A cualquier v.a que tiene distribucin normal con media y varianza 2, se le representa
por: N(, 2)

Observaciones importantes:
La media y la varianza son los dos parmetros que determinan el comportamiento de la
distribucin normal, por lo tanto si comparamos dos poblaciones, tenemos que hacerlo
por medio de su media y varianza.

COMPARACIN DE TRES
DISTRIBUCIONES
NORMALES CON MEDIAS
DIFERENTES Y VARIANZAS
IGUALES

108

COMPARACIN DE TRES
DISTRIBUCIONES
NORMALES CON MEDIAS
IGUALES Y VARIANZAS
DIFERENTES

Definicin:
Se dice que una variable aleatoria contina X, tiene una distribucin normal, si su funcin
de densidad est dada por:
F (x) =

1
1 x 2
exp (
)
2
2

-<x<

Donde: - < < y > 0

Clculo Directo. Si Z N (0,1), Hallar.


a) P(Z1.60)

0.945
2

Segn la Tabla de la Distribucin Normal


Para Z1.60 P=0.9452

1.60

b)

P(Z-2.36)
Segn la Tabla de la Distribucin Normal

0.003
9

Para
Z-2.36 = 1Z2.36 P=10.9961=0.0039
Z-2.36 = 0.0039

-2.36

c) P(-2.50Z2.50)
Segn la Tabla de la Distribucin Normal
109

Para -2.50Z2.50 = Z2.50- Z-2.50 P=0.9938-(1-0.9938)=0.9938-0.0062=0.9876


-2.50

Z2.50 = 0.9876
0.987
6

2.50

2.50

Aplicaciones
1. Los tiempos de atencin al cliente en minutos en una entidad financiera BCP tienen
distribucin normal con medios 10 minutos y desviacin estndar de 0.6 minutos, hallar:
a) La probabilidad de que el tiempo de atencin sea menor a 11 minutos.
P [ X< 11]
1110
P( Z<
)
P(X < 11)
=
0.6
P( Z < 1.67)

P( Z 1.67)

P( Z < 1.67)

0.95254

P( Z < 1.67)

0.95254

Como se tiene 10 clientes entonces el nmero de tiempo de atencin de 11 minutos est


dada por:
n1 = n X P [X 11]
n1 = n X P [Z 1.67]
n1 = 10 X 0.95254
n1 = 9.53 minutos

110

0.9522

10

11

0.9

1.282

b) El porcentaje de clientes con un tiempo de atencin mayor a 8 minutos. P [ X>8 ]


P(X > 8)

P(Z - 3.33)
P( Z -3.33)
P( Z -3.33)

=
=
=

P( Z<

810
)
0.6

1 - P( Z -3.33 )
1 - 0.000434
0.999566

Como se tiene 10 clientes entonces el nmero de clientes porcentaje de 8 minutos est dada
por:
n1 = n XP [x> 8]
n1 = n X P [Z > - 3.33]
n1 = 10 X 0.00343
n1 = 3.43 de clientes

111

0.9996

10
X

c) Si en un da se atiende a 1500 clientes


c.1. Cuntos clientes son atendidos en menos de 10 minutos. P [X<10]

P(X < 10)

P( Z<

P( X < 10)

P( Z< 0 )

P( X < 10)

0.500000

P( X < 10)

0.500000

1010
)
0.6

Como se tiene 10 minutos entonces el nmero es de 10 clientes.


n1 = n x P [X<10]
n1=n x P [Z<0]
n1=1500 x 0.500000
n1 = 750 clientes

c.2. Cuntos clientes son atendidos en ms de 11 minutos. P[X > 11]


1110
P(Z>
)
P(X >11)
=
0.6
P( X > 11)

= 1 - P( Z> 1.67 )

P( X > 11)

= 1-0.952540

P( X > 11)

= 0.04746

Como se tiene 10 minutos entonces el nmero es de 11 clientes.


n1 = n x P [X> 11]
n1=n x P [Z< 1.67]
n1=1500 x 0.952540
n1 = 1428.81 clientes

112

0.04779
10
X

11

Normal Estandarizada
Introduccin
La distribucin normal estndar est tabulada (habitualmente en la forma del valor de la
funcin de distribucin ) y las otras distribuciones normales pueden obtenerse como
transformaciones simples de la distribucin estndar. De este modo se pueden usar los
valores tabulados de la funcin de distribucin normal estndar para encontrar valores de la
funcin de distribucin de cualquier otra distribucin normal.
La estandarizacin es un proceso que consiste en restar a la v.a. su esperanza y luego dividir
esta diferencia entre la desviacin estndar (Raymond, 1998):
x E ( x)
V ( x)

z=
x
~ N (0,1)

z=
Por lo tanto:
E(z) = E(

x
)

= E(x/) E(/) = E(x)/ - / = / - / = 0

x
)

V(z) = V(
= V(x/) V(/) = V(x)/2 0 = 2/2 = 1
En consecuencia:
f(z)=

1
1
exp z 2
2
2

-<z<

Las distribuciones normales son estrictamente estables.


Ejemplos:
Calcule las siguientes probabilidades:
a) P(z 1)
113

b) P(z > 2)
c) P (z < 1,5)
d) P ( -2 < z < 1.75)
e) P (0,05 < z > 1,96)
Solucin:
a) P (z 1) = F(1) = 0,8413
b) P (z > 2) = 1 P(z 2) = 1 F(2) = 1 0,9772 = 0,0228
c) P (z > 1,5) = F(1,5) = 0,9332
d) P ( -2 < z < 1.75) = F(1,75) F(-2) = 0,9599 0,0228 = 0,9371
e) P (0,05 < z > 1,96) = F(1,96) F(0,05) = 0,975 0,5199 = 0,4551
Nota.- la tabla usa valores de z con dos decimales como mximo, por lo que se debe
redondear los valores de z originales a dos decimales.
Ejemplos Prcticos:
Ejemplo 1:
El tiempo requerido para ensamblar una pieza mecnica es una v.a. cuya distribucin es
normal con media igual a 12,9 mn. y = 2 minutos, cul es la probabilidad de que una
pieza sea ensamblada en:
a) En menos de 11,5 mn.?
b) Entre 11 y 14,8 mn.?
c) En ms de 11,8 mn.?
d) Exactamente 11 mn.?
Solucin:
a) P(x < 11,5) = P ( z < z1) = P(z < - 0,7) = 0,2420
Donde z1 =

11,5 12,9
2

= -0.7

b) P (11 < x < 14, 8) = P (z2 < z < z3)= P(-0,95 < z < 0,95)
Dnde: z2 =

11 12,9
0,95
2

z3 =

14,8 12,9
0,95
2

P (-0,95 < z < 0,95) = 0,8289 0,1711 = 0,6578


c) P(x > 11,8) = P(z > z4) = P(z > -0,55) = 1 F(-0,55) = 1- 0,7088

114

Donde z4 =

11,8 12,9
055
2

P(z > -0,55) = 1 F(-0,55) = 1- 0,2912 = 0,7088


d) P(x=11) = 0, sin embargo es factible estimar la probabilidad entre 110,5, es decir P(10,5
x 11,5) = P(z1 z z2)
10,5 12,9
1,2
2

11,5 12,9
0,7
2

Dnde: z1 =
z2 =
P(-1,2 z - 0,7) = P(0,7 z 1,2) = 0,88493 0,75804 = 0, 12689
Como puede apreciar esta probabilidad es alta, por lo que la recomendacin es cuando los
valores sean bastante altos y no pequeos como lo que se tiene. O cuando se usa variables
discretas.
Ejemplo 2:
Un embarque de 2500 aros son enviados a una ensambladora con las especificaciones que
los dimetros de los aros deben estar en el intervalo 0,3 0,005 pulgadas. Si los dimetros
internos de los aros tienen una distribucin normal con media 0,302 pulg. Y una = 0,003
pulg.Qu porcentaje de aros cumplirn las especificaciones?
Solucin:
P(0,295 < x < 0,305) = P(z1 < z < z2) = P(-2,33 < z < 1,00)
0,295 0,302
0,003

0,305 0302
1,00
0,003

Donde. z1 =
= - 2,33 z2 =
P(-2,33 < z < 1,00) = F(1,00) - F(-2,33) = 0,8413 0,0099 =0,8314
En conclusin el 83,14% de los aros cumplen con las especificaciones, en tanto que el
16,86% no los cumple, en consecuencia 2500(0,1686) = 421,5 = 422 aros

Ejemplo 3:
Los hornos elctricos fabricados por una compaa tienen una duracin promedio de 15000
hrs. Y una = 2500 hrs.
115

a) si el fabricante promete reponer todo horno que falle antes de las 7500 hrs., qu
proporcin de sus hornos tendr que reponer?
b) si da como tiempo de garanta de 8500 hrs., qu proporcin de los hornos tendr
reponer?
c) si slo quiere reponer mximo el 1% de sus hornos, qu tiempo de garanta tendr que
dar?
Solucin:
a) P(x 7500) = P(z z1)
7500 1500
3
2500

Donde z1 =
P(z -3) = F(-3) = 0,0013 0,13% de sus hornos

b) P(x 8500) = P(z z2)


8500 1500
2,6
2500

Donde z1 =
P(z -2,6) = F(-2,6) = 0,0047 0,4,7% de sus hornos
c) P(x < x0) = P(z < z0) = 0,01 z0 = -2,3267
x 0 1500
2500

Donde -2,3267 =
x0 = 9183,25 hrs.
Nota.- En lo sucesivo en lugar de z = 2,3267 se usar z = 2,33
Ejemplo 4:
Se aplic un test a 10000 personas y los resultados se distribuyen segn una distribucin
normal de media 100 y varianza 36. Se quiere premiar a las 100 mejores personas que
obtuvieron los puntajes mas altos.
A partir de qu puntuacin hemos de seleccionar este grupo?
Solucin:
Variable X: Puntuiaciones de un Test
X
N (100, 36)
Se quiere conocer el puntaje mnimo de las 100 mejores personas
100
100 = 1%
Entonces:
10000

El 1% sern los mejores; en trminos de probabilidad equivale a 0.01


Por lo tanto:

116

P ( X X1)
X X 1

= 0.01

= 0.01

P ( Z Z1)
= 0.01
1 P ( Z < Z1) = 0.01
P ( Z < Z1)
= 0.99
Z1
= 2.33 ( se halla en la tabla Z)
X 1
= 2.33

X 1100
6
X1

= 2.33
= 114

Se debe seleccionar a partir de 114 puntos.

7.5. Distribucin de Probabilidad T-Student


Introduccin
En ocasiones es necesario inferir si dos muestras provienen de la misma poblacin, o nos
encontramos con la dificultad de no conocer la desviacin tpica poblacional y nuestra
muestra es menor de 30 datos, en estos casos aplicamos la distribucin t. (Walpole, 1998)
Utilidad
1) Para determinar el intervalo de confianza dentro del cual se puede estimar la media de
una poblacin a partir de una muestra pequea(n<30)
2) Para probar hiptesis cuando una investigacin se basa en muestreo pequeo.
3) Para probar si dos muestras proviene de la misma poblacin.
Ejemplos
-Para probar que el promedio de calificaciones de un grupo de 12 estudiantes, es el mismo
del ao anterior.
- El efecto del consumo de nicotina de mujeres embarazada con el contenido mineral seo
de su hijo.

La funcin de densidad t es simtrica con respecto a cero, adems, para > 1, E( T ) =0 y


para

> 2, V ( T ) =

v v

/ ( - 2 ). As vemos que una variable aleatoria con una distribucin

tiene el mismo valor esperado que una variable normal estndar. Sin embargo, una
variable aleatoria normal estndar siempre tiene una varianza de 1, mientras que la varianza
117

de una variable aleatoria con una distribucin


1997)

siempre es mayor que 1. (Montgomery,

Definicin: Sea Z una variable aleatoria normal estndar y sea


cuadrada con grados de libertad.
Entonces s

son independientes,
Z
T
2 /

se dice que tiene una distribucin t con grados de libertad.


Elementos
Grados de libertad, n-1
Significancia, = Alfa

Ejemplos:
1. Si T se distribuye mediante una t(20) hallar :
a) P[T 2.528] = 0.99

b) P [ -1.325 T 2.845]
P [T 2.845] P [T -1 .325]
0.995 0.1
P (T) = 0.895

7.6. Distribucin X2 Cuadrada


Introduccin
118

una variable aleatoria ji -

La distribucin ji-cuadrada (X2) es la distribucin muestral de varianza (s 2). O sea que si se


extraen todas las muestras posibles de una poblacin normal y a cada muestra se le calcula
su varianza, se obtendr la distribucin muestral de varianzas. (Walpole, 1998)
Utilidad
-Para poder estimar la varianza de una poblacin normal.
-La relacin entre el uso de un frmaco con la hipertensin de los pacientes
-La relacin entre la contaminacin del suelo y el crecimiento de cierta especie de rbol.
Propiedades de las distribuciones X2
a)

Los valores de X2 son mayores o iguales que 0.


b) La forma de una distribucin X2 depende del gl=n-1. En consecuencia, hay un nmero
infinito de distribuciones X2.

c)

El rea bajo una curva ji-cuadrada y sobre el eje horizontal es 1.


Para estimar la varianza poblacional o la desviacin estndar, se necesita conocer el
estadstico X2. Si se elige una muestra de tamao n de una poblacin normal con varianza
2, el estadstico:

El estadstico

tiene distribucin Ji-Cuadrada con (n-1)g.l.

Elementos
Grados de libertad (n-1)
Nivel de significancia = alfa
Varianza muestral S2
Varianza poblacional 2
Ejemplos:
Suponga que los tiempos requeridos por un cierto autobs para alcanzar un de sus destinos
en una ciudad grande forman una distribucin normal con una desviacin estndar =1
minuto. Si se elige al azar una muestra de 17 tiempos, encuentre la probabilidad de que la
varianza muestral sea mayor que 2.
Solucin:
Primero se encontrar el valor de ji-cuadrada correspondiente a s2=2 como sigue:
119

El valor de 32 se busca adentro de la tabla en el


rengln de 16 grados de libertad y se encuentra
que a este valor le corresponde un rea a la
derecha de 0.01. En consecuencia, el valor de la
probabilidad es P(s2>2)
Es una medida existente entre las frecuencias
observadas y esperadas Y es suministrada por el estadstico
Tambin se utiliza para
decidir si ciertas variables son independientes.
Por ejemplo un encuestador podra desear saber si, el sexo, los antecedentes tnicos o el
rango salarial de una persona son factores relevantes en la votacin para una eleccin de
algn legislador. (Walpole, 1998)
La definicin formal de la distribucin es la siguiente:
Sean Z1, Z2,,Zk, k distribuciones normales estandar independientes.
Se denomina tambin la distribucin Chi- cuadrado con k grados de libertad. que puede ser
cualquier entero positivo incluyendo al 1 y est representado por df.
Si x se distribuye mediante una x2, hallar:
a) P [ X 40.00]
= 1- P [ X 40.00]
= 1 - 0.995
0.005

b) P [ 15.45 X 40.00]
P [ X 40.00] - P [ X 15.45]
0.995 - 0.25
0.745

120

PROBLEMAS PROPUESTOS
1. Cada muestra de aire contiene 10% de posibilidades de contener una molcula rara
particular. Suponga que las muestras son independientes con respecto a la presencia de
la molcula rara. Encuentre la probabilidad de que las siguientes 18 muestras:
a. Exactamente 2 contengan la molcula rara.
b. De que al menos cuatro muestras contengan la molcula rara.
c. Determine la probabilidad de que 3 X < 7 contengan la molcula rara.
2. Las lneas telefnicas del sistema de reservaciones de una aerolnea estn ocupadas 40%
de su tiempo. Suponga que los eventos de que las lneas estn ocupadas en llamadas
sucesivas son independientes. Suponga que entran 10 llamadas a la aerolnea.
a. Cul es la probabilidad de que las lneas estn ocupadas para exactamente tres
llamadas?
b. Cul es la probabilidad de que las lneas no estn ocupadas para al menos una
llamada.
c. Cul es el nmero esperado de llamadas en las que todas las lneas estn ocupadas
d.
3. Suponga que X tiene una distribucin Hipergeomtrica con N = 20, n = 4 y r = 4.
Determine lo siguiente:
a. P(X = 1)
b. P(X = 4)
c. P(X 2)
4. De Un determinado producto industrial es recibido por un consumidor en lotes de 20
unidades. El escoge 5 artculos al azar uno por uno sin sustitucin de un lote y lo rechaza
si encuentra al menos dos defectuosos, en caso contrario acepta el lote.
a. Cul es la probabilidad de que rechace un lote que tiene 1 unidad defectuosa?
b. Cul es la probabilidad de que acepte un lote que tiene 3 unidades defectuosas?
5. Los pasajeros de aerolneas llegan al azar de manera independiente a la seccin de
documentacin en un gran aeropuerto internacional. La frecuencia promedio de llegada
es de 8 pasajeros por minuto.
a. Cul es la probabilidad de no llegadas en un intervalo de un minuto?
b. Cul es la probabilidad que lleguen 5 pasajeros o menos en un intervalo de un
minuto?
6. El nmero promedio de automviles que llegan a una garita de peaje es de 120 por hora.
a. Calcule la probabilidad de que en un minuto cualquiera no llegue automvil alguno?
121

b. Calcule la probabilidad de que en el periodo de 3 minutos lleguen ms de 5


automviles?
7. Si, Z

N (0,1). Graficar y hallar las probabilidades:

a. P (Z 1.96)
b. P (Z 1.8)
c. P (Z -1)
d. P ( 1 Z + )
8. Si, Z
a.
b.
c.
d.

N (0,1). Hallar los valores z

P(Z < z ) = 0.9


P(Z < z ) = 0.5
P(Z > z ) = 0.1
P(-1.24 Z z) = 0.8

9. Los puntajes en un examen de seleccin para seguir estudios superiores de maestra


estn distribuidos normalmente con media 76 y desviacin estndar 15. Se ha
establecido que el 10% de los concursantes que son mejores recibirn una beca integral
de estudios, en tanto que el 25% que se supone que son peores, definitivamente no podr
seguir estudios superiores.
a. El puntaje mnimo para seguir estudios superiores
b. El puntaje mnimo para ganar la beca
10. El volumen de llenado de una mquina automatizada usada para llenar latas de una
bebida carbonada tiene una distribucin normal con media de 12.4 onzas liquidas y una
desviacin estndar de 0.1 onzas liquidas.
a. Cul es la probabilidad de que un volumen de llenado sea menor que 12 onzas?
b. Si se desechan todas las latas con menos de 12.1 onzas o con ms de 12.6 onzas Qu
proporcin de las latas se desecha?
11. En una distribucin normal se tiene los siguientes datos:
P (X < 45) = 0.31;

P (X > 64) = 0.08

Hallar la media y la desviacin estndar de la distribucin?

122

CAPTULO VII
Muestreo

123

Tamao de Muestra
7.1. Tamao de Muestras
Para determinar un tamao de muestra es necesario identificar los siguientes componentes o
elementos:
1) La varianza (2): corresponde al grado de variabilidad que presentan las unidades de la
poblacin. Mientras ms grande sea 2 mayor ser el tamao de la muestra. El valor de 2x
supuestamente conocido, de lo contrario se debe estimar a travs de una investigacin
preliminar. En el caso de 2p = PQ, sucede algo similar, pero se tiene la costumbre de tomar
P= 0,50 con lo cual se obtiene el mximo valor posible de n. (Walpole, 1998)

2) Nivel de confianza: Tiene relacin directa con el tamao de la muestra, por lo tanto se dir
que a mayor nivel de confianza ms grande debe ser el tamao de la muestra. Los valores
de Z se obtienen mediante el uso de tablas como se ha venido haciendo. El nivel de
significacin es fijado por el investigador, de acuerdo a su experiencia.

3) Precisin de la estimacin: Corresponde al margen de error que el investigador fija de


acuerdo con el conocimiento que tenga acerca del parmetro que piensa estimar. Se le
conoce como error de muestreo (E). (Walpole, 1998)

Las frmulas para el clculo del tamao de muestra son los siguientes:

TAMAO DE

Cuando se conoce N

Cuando NO se conoce

MUESTRA

N
n=

NZ2 2
( N 1 )E2 + Z 2 2

n=

NZ2PQ
( N 1 )E2 + Z 2PQ

n=

Z 2 2
E2

Para la media

124

n=

Z 2PQ
E2

Para la proporcin
Donde:
n: Tamao de

muestra

Z: Nivel de confianza

Nivel de
confianza

Valor de
Z

E: Margen de

90%

1,65

error

95%

1,96

poblacional

99%

2,58

: Varianza

Desviacin estndar de la poblacin

P: Proporcin de la poblacin que tiene la


caracterstica de inters
Q: 1- P
N: Tamao de la poblacin
Ejemplo. 1:
El auditor de un banco desea estimar la proporcin de estados, de cuenta bancarias
mensuales para los depositantes del banco que tendrn errores de varias clases, y especifica
un coeficiente de confianza del 99% y un error mximo de 4%.
(a)Determinar el tamao de la muestra si no se dispone de informacin sobre la proporcin
verdadera de los estados de cuenta mensuales que tienen errores.
(b)Determinar el tamao de la muestra, si el auditor, por su experiencia, cree que la
verdadera proporcin de estados de cuenta con errores es 0.15.
Solucin A:
n=

Z 2PQ
E2

n=

2,5820,50,5
0,042

Z99% = 2,58
E = 4% = 0,04
125

P = 0,5
Q = 1-0,5 = 0,5

Solucin B:

n=

Z 2PQ
E2

n=

2,5820,150,85
2
0,04

Z99% = 2,58
E = 4% = 0,04
P = 0,15
Q = 1-0,15 = 0,85

Ejemplo. 2:
Se pretende realizar una investigacin para conocer el tiempo de estudio semanal dado
en horas, de los estudiantes de la Universidad Seor de Sipn. Si un estudio previo
determin que la varianza fue de 0,32 horas. Qu tamao de muestra sera
conveniente para la investigacin? Considerando un nivel de confianza del 95% y un
error tolerable de 0,05 horas.

Solucin :

Z95% = 1,96
E = 0,05

n=

Z 2 2
E2

n=

1,9620,32
0,052

n=492
126

2 = 0,32

7.2. Muestreo
El muestreo son las tcnicas o herramientas utilizadas para la realizacin de una
muestra. En la aplicacin de estas tcnicas es necesario conocer y manejar algunos trminos
indispensables en el desarrollo de una investigacin, tal como se detallan a continuacin:

A. Poblacin o Universo: es un conjunto de unidades o elementos que presentan una


caracterstica comn; tambin se le considera como un conjunto de medidas. Si la
caracterstica observada ha sido medida, recibe el nombre de variable continua; si por el
contrario, tan slo se hace recuento se le denomina atributo o puede ser una variable
discreta.
Considerar la poblacin como conjunto de unidades o elementos, debe entenderse como un
grupo de personas, familias, establecimientos, manzanas, barrios, etc., pero en realidad es
un conjunto de medidas obtenidas de las caractersticas estudiadas. (Martnez, 2012)

B. Unidad y Elemento: la unidad es divisible, por ejemplo una familia se puede subdividir en
personas que la conforman; una universidad se divide en facultades, a su vez puede
considerarse como unidad, ya que se subdivide en cursos y stos en estudiantes. En cambio
el elemento es indivisible, una persona, una cosa, etc., sigue siendo la forma ms elemental
de presentacin, sin embargo, generalmente se habla en forma indistinta de elemento o
unidad como una sola cosa.
La unidad hace referencia a una persona, una familia, una vivienda, una manzana, un
barrio, un establecimiento, etc., y se denomina elemento cuando con ella obtenemos la
informacin necesaria. Es el individuo, entidad u objeto, del cual deseamos observar todas
o algunas de sus caractersticas para ser medidas o contadas. (Martnez, 2012)

8.2.1 Tipos de muestreo


127

Aqu destacan los muestreos de tipo probabilstico y no probabilstico:


I.

Muestreo Probabilstico: Se denomina probabilstico cuando los elementos que


constituyen la poblacin o universo tienen la misma posibilidad de ser seleccionados.
A. Muestreo aleatorio simple: el mtodo de muestreo aleatorio simple es recomendable, en
especial, cuando la poblacin no es numerosa y las unidades se concentran en un rea
pequea; por otra parte, la caracterstica no debe tener gran variabilidad, porque implicara
un tamao muestral muy amplio lo que a su vez, incrementara costo y tiempo; por ltimo,
la poblacin debe facilitar su enumeracin para que permita la aplicacin de este mtodo:
-

Se requiere un listado de unidades de la poblacin.

No existe garanta de que todas las unidades queden representadas en la muestra,


cuando la caracterstica tienen una gran variabilidad.

Si el coeficiente de variacin es mayor del 30% el tamao de muestra se va haciendo


ms grande.

B. Muestreo Aleatorio Estratificado: se denomina tambin como muestreo aleatorio


restringido, este procedimiento implica una divisin de la poblacin en grupos,
denominados estratos, en tal forma que el elemento presenta una caracterstica tan definida
que slo le permite pertenecer a un nico estrato. (Martnez, 2012)
-

Afijacin igual: se da cuando los elementos quedan asignados o repartidos por igual
en cada estrato muestral.

Afijacin proporcional: los elementos se distribuyen en los estratos muestrales, en la


misma proporcin en que se distribuyen los elementos de la poblacin.

Afijacin ptima: cuando el tamao, tanto de la muestra general como para cada uno
de los estratos muestrales, depende del grado de variabilidad de la caracterstica en
cada estrato y del costo mnimo para una precisin dada.

C. Muestreo Sistemtico: ms que un mtodo de muestreo, es considerado como un mtodo


de seleccin, al que algunos denominan mtodo de seleccin a intervalos regulares. Se
aplica cuando la caracterstica a investigar se encuentra ordenada de acuerdo al valor,
tiempo, cantidad, etc.
128

D. Muestreo por conglomerados: este muestreo se utiliza cuando no existe listado, o bien las
unidades estn demasiado dispersas y no permiten llegar directamente a las fuentes de
informacin. Esto nos obliga a sustituir las unidades fsicas o elementales, por grupos de
unidades, que llamaremos conglomerados; generalmente son superficies o reas en las que
se ha dividido el espacio ocupado por la poblacin. Supongamos que se desea realizar
estudios a familias en una ciudad, cada unidad o familia se constituye en un conglomerado,
por tal razn se aplica en muestreo aleatorio monoetpico, es decir, se realiza la
investigacin en una sola etapa.(Martinez,2012)

II.

Muestreo No Probabilstico: Entre los diferentes tipos de muestreo no probabilstico se


pueden mencionar: el casual o fortuito, el de seleccin experta, el muestreo de poblaciones
mviles y el de cuotas.

A. El muestreo casual o fortuito: se utiliza en diferentes reas de la investigacin como


arqueologa, historia y medicina, entre otras. Aqu las muestras se integran por voluntarios
o unidades mustrales que se obtienen en forma casual. Otras ciencias que no se preocupan
por la representatividad de sus especmenes son astronoma, fsica y qumica.
B. El muestreo de seleccin Experta: denominado tambin como muestreo de juicio, es una
tcnica utilizada por expertos para seleccionar especmenes, unidades o porciones
representativas o tpicas, segn el criterio del experto; por ejemplo: la seleccin de un
conjunto de especmenes con determinadas caractersticas, para un experimento de
laboratorio, o la seleccin de determinadas semanas del ao para llevar a cabo algunas
auditoras.
Es importante hacer notar que en este caso los criterios de seleccin pueden variar de
experto a experto, al determinar cules son las unidades de muestreo representativas de la
poblacin.
C. El mtodo de poblaciones mviles: se basa en el concepto de captura-marca-captura. La
poblacin total se estima con base en la proporcin de individuos en la recaptura, esto es,
aqullos que han sido capturados previamente y marcados. Este tipo de tcnicas se utiliza
mucho en el muestreo de insectos, peces, venados, ballenas y, en general, poblaciones de
animales en extincin.

129

D. El Muestreo de Cuotas: es un tipo de muestreo ampliamente utilizado en encuestas sobre


opinin electoral, investigacin de mercado o similares. Los encuestadores reciben la orden
de obtener cierto nmero de entrevistas (cuotas), a partir de las cuales se construye una
muestra relativamente proporcional a la poblacin. Este esquema se ve como una
alternativa del muestreo probabilstico, en el que se busca seleccionar una muestra
representativa de la poblacin estableciendo proporciones de los diferentes segmentos que
la componen. La tcnica consiste en determinar, al seleccionar la muestra, la cuota de
entrevistas que se debe cubrir de cada grupo de la poblacin y por cada enumerador. El
supuesto bsico de esto es que con la conjuncin de todas las cuotas se obtiene una imagen
de la totalidad.
Los diferentes tipos de muestreo no probabilstico mencionados varan ampliamente
en grado y rea de justificacin, pero cada una de sus tcnicas tienen en comn la
generalidad de los supuestos que sustentan la distribucin de las variables en la poblacin.
(Pimienta,2000).

PROBLEMAS PROPUESTOS

1. De una poblacin N=40000 personas nos proponemos obtener una muestra, para estimar el
ingreso promedio por persona. Se quiere que la estimacin muestra, no se aparte en ms de
$5000 del promedio verdadero y que esto se cumpla en 95 de cada 100 casos. La
desviacin tpica es de $30000 Cul es el tamao de muestra ptimo?

130

2. Supongamos que en un rea dada, la proporcin de explotaciones agropecuarias que poseen


energa es de 0,36 Cul es el error de muestreo de la estimacin, utilizando una muestra al
azar de 300 explotaciones, con una confianza del 95% un total de 6000 explotaciones?

3. Qu tamaa deber tener una muestra para estimar dentro del 3% la proporcin de mujeres
casadas que van peridicamente a consulta ginecolgica, en una poblacin de 5000 mujeres
y una seguridad del 95%?

4. Se desea estimar el costo promedio de matrculas de los estudiantes universitarios de la


ciudad. Por estudios anteriores y a precios actuales se sabe que la desviacin tpica es de
$18000. a) Calcular el tamao de muestra fijando para ello un error de $3000 y una
confianza del 99% b) Si se considera que la poblacin estudiantil que se desea investigar es
de 12000 Cul sera el valor de n?

5. En cierta residencial se espera que el 60% de las familias tengan vehculo propio. Se desea
hacer una investigacin para estimar la proporcin de familias propietarias de vehculos,
con un error del 3% y un coeficiente de confianza del 90%. a) Determine el tamao de
muestra b) Qu sucedera si P=0,5?

6. Una oficina de investigaciones sobre salud considera que el 20% de las personas adultas de
una regin, padecen cierta enfermedad parasitaria. Cuntas personas tendrn que
seleccionar en la muestra al azar, para que el error del estimado de la proporcin sea del 7%
y tenga una confianza del 99%?

7. Interesa estimar el nmero promedio de accidentes de trnsito en una ciudad. Durante un


ao (365 das) se determina una desviacin tpica de 12 accidentes diarios. Cuntos das
(tamao de muestra) se requieren para no errar en ms de dos accidentes, con un 90% de
confianza?

131

8. Entre los estudiantes de cierta universidad privada, se desea tomar una muestra para estimar
la proporcin de alumnos que utilizan la biblioteca. El error debe conservarse en un 4% con
una confianza del 99%. Cul es el tamao de la muestra, si la universidad tiene 3200
alumnos matriculados?

9. A partir de una muestra de 500 observaciones se encontr que, en una remesa haba 50
acumuladores defectuosos. Utilizando un nivel de confianza del 95%. Calcule el error de
muestreo.

CAPTULO VIII
Introduccin a la Inferencia
Estadstica: Estimacin
132

8.1. INFERENCIA ESTADISTICA.


La estadstica tiene como finalidad inferir o generalizar informacin obtenida de una
muestra hacia la poblacin, para este fin la muestra debi ser seleccionada de manera
aleatoria de la poblacin en estudio.
La Poblacin tiene constantes desconocidas que la caracterizan, sobre estas
constantes se hace la inferencia. La inferencia consiste en estimar y probar hiptesis sobre
estas constantes desconocidas. (Martnez, 2012)
Primero presentaremos algunos conceptos bsicos
a) Parmetro. Es una constante, generalmente desconocida, que caracteriza a una poblacin.
Por ejemplo,

, la media de la poblacin.

Si consideramos como poblacin a los

estudiantes de la USS, calculamos la edad promedio ( ) de todos los estudiantes y


obtenemos 20 aos diremos que sta poblacin se caracteriza por ser una poblacin joven.
El promedio de la poblacin se calcula de la siguiente manera:

x 1 x 2 ... x n
N

b) Estimador. Es aquel que se calcula con los datos de la muestra (es una funcin de la
muestra). Como ejemplo: seleccionamos a un grupo aleatoria de 75 alumnos de la USS, a

X
los cuales consultamos su edad. Despus de calcular la edad promedio ( ) con los 75
datos obtenemos 19.2 aos, entonces diremos: la edad promedio de los 75 alumnos es 19.2

133

aos. Un promedio muestral (


frmula:

)se calcula con los datos de la muestra y con la siguiente

POBLACION

Media de la poblacin

Varianza de la poblacin
Desviacin estndar de la poblacin

Parmetros

Proporcin de la poblacin

MUESTRA

X
S2

Media de la muestra
Varianza de la muestra
Desviacin estndar de la muestra

Estimadores

Proporcin de la muestra
p

c) Estimador puntual. Es aquel que estima al parmetro mediante un solo valor o punto.
Ejemplo: Decir que si los 75 alumnos de la USS seleccionados de manera aleatoria tienen
19.2 aos, la edad promedio de todos los alumnos de la USS es 19.2 aos.

d) Estimador por intervalo. Llamado tambin intervalo de confianza, es aquel que estima al
parmetro mediante un intervalo con un coeficiente de confianza (1-

).

Ejemplo: Decir que si los 75 alumnos de la USS seleccionados de manera aleatoria tienen
19.2 aos, la edad promedio de todos los alumnos de la USS vara entre 17 y 21 aos con
un cierto nivel de confianza.

e) Hiptesis. Es una afirmacin sobre algo la cual puede ser falsa o verdadera.
Ejemplo. Maana llover.

134

f) Hiptesis estadstica. Es una afirmacin sobre uno o varios parmetros de una o varias
poblaciones.
Ejemplo.

=20, la edad promedio de todos los alumnos de la USS es 20 aos.

g) Hiptesis nula. Es una afirmacin sobre uno o varios parmetros que incluye la igualdad.
Se designa con Ho.
Ejemplo. Ho: La edad promedio de los alumnos de la USS es 20 aos.
h) Hiptesis alternativa. Es el complemento de la hiptesis nula.
Ejemplo. Ha o H1: La edad promedio de los alumnos de la USS no es 20 aos.
i) Error tipo I. Es el que se comete al rechazar Ho dado que Ho es verdadera.

=Probabilidad de cometer el error tipo I.

j) Error Tipo II. Es el que se comete al no rechazar Ho dado que Ho es falsa.

=Probabilidad de cometer el error tipo II


k) Puntos crticos. Son valores tabulares que delimitan la regin de rechazo de la hiptesis
nula (RR) y la de no rechazo (RA).

8.2 ESTIMACION DE PARAMETROS


En este tema veremos cmo estimar puntualmente y mediante un intervalo de
confianza al parmetro p (proporcin de una poblacin) y al parmetro
poblacin).

(media de una

1. Estimacin de la proporcin de la poblacin, p :


Solo veremos el caso donde el tamao de muestra n es mayor o igual a 30, puesto que
el estimador se construye con base en la proporcin de la muestra, considerando n valores
de una variable medida en escala dicotmica (con solo dos valores 0 y 1). El fundamento
terico es el teorema central del lmite, el cual indica que cuando n es grande, la proporcin
muestral tiene distribucin aproximadamente normal. (Martnez, 2012)

135

Primero presentaremos el resultado para estimar la proporcin de una poblacin y en


seguida un ejemplo.
Teorema 1

Si n 30, entonces:
p
a) El mejor estimador puntual para p es donde
p

x
n

.
Donde n es el tamao de muestra y x es el nmero de xitos obtenidos.
b) El estimador para p con un 100*(1por intervalos es

p - Z1

)% de confianza usando un estimador

pq
P p Z
1
n
2

pq

Donde:
p

x
n q

, =1- , n es el tamao de la muestra y


distribucin normal estndar.

es un valor en la tabla de Z o

Ejemplo 1.
Se realiz un estudio sobre la desocupacin en el distrito de Tumn, para lo cual se se tom
una muestra aleatoria de 200 personas en edad laboral del distrito en estudio. De estas 200
personas, 26 contestaron que no tienen trabajo.
a) Estimar puntualmente la proporcin de personas desocupadas en el distrito de
Tumn.
b) Encontrar con un 95% de confianza el intervalo para p.
c) Interpretar el estimador puntual y el estimador por intervalo.
Solucin
Puesto que n=200 es mayor que 30 y el nmero de xitos es x=26
a) El mejor estimador puntual de p es
p

x
26

0.13
n 200

136

p
El mejor estimador puntual para p es =0.13 (o 13%).

b) Un 95% de confianza para p se encuentra usando el inciso b) del teorema 1


Un 100(1-

) % intervalo de confianza para p es

p - Z1

pq
P p Z
1
n
2

pq

Donde:
p

=0.13,

=1- =1-0.13=0.87, n=200 y

Z
Para encontrar

, primero debemos calcular

usando la siguiente formula.

100 porciento del intervalo de confianza pedido 100 95


5

0.05.
100
100
100

0.05
1
0.9750
2
2

Entonces
, nmero que buscamos en la tabla de la normal
estndar (Tabla 1) en la zona de probabilidades. Obtendremos el valor Z con un
decimal en la primera columna y el segundo decimal en la primera hilera como se
indica en la tabla siguiente
0.06
1.9

0.9750

Z
Por lo tanto el valor de

es 1.96.

En seguida determinamos los valores del lmite inferior y del lmite superior de 95%
del intervalo de confianza para p
LI p - Z
2

pq
(0.13)( 0.87)
0.13 1.96
0.13 0.05 0.08
n
200

137

LS p Z
2

pq
(0.13)( 0.87)
0.13 1.96
0.13 0.05 0.18
n
200

Entonces se estima que la proporcin poblacional esta entre 0.08 y 0.18.


c) Interpretacin.
Si usamos un estimador puntual para estimar p, se concluye que el porcentaje de
desocupacin en la municipalidad de Tumn es alrededor del 13%.
Si usamos un estimador por intervalo para estimar p, se concluye que el porcentaje de
desocupacin en la municipalidad de Tumn est entre el 8% y el 18%, dicha conclusin se
hace con un confianza del 95% o con un error del 5%.

2. Estimacin de la media de una poblacin,


Existen muchos casos sobre estimacin puntual y por intervalo para la media de una
poblacin, tales como combinaciones de que la poblacin o variable en estudio tiene
distribucin normal o distribucin diferente de la normal, del tamao de muestra pequeo o
grande y con la varianza de la poblacin conocida o desconocida.
En este tema trataremos un solo caso para estimar la media de la poblacin considerando
2

que la poblacin o variable en estudio tiene distribucin normal con varianza


desconocida que es el caso ms frecuente y en nuestra opinin es el nico caso que se
encuentra en la realidad (aplicaciones), en el sentido de que la varianza de la poblacin es
desconocida. Si se tienen tamaos de muestras grandes los casos donde las variables en
estudio no tienen distribucin normal para estimar la media de una poblacin se pueden
usar las mismas frmulas que presentaremos luego puesto que el teorema central del lmite
nos dice que si se toma una muestra aleatoria de cualquier distribucin y el tamao de
muestra es grande la media de la muestra tiene distribucin aproximadamente normal que
es el requerimiento o suposicin para estimar la media de una poblacin. (Martnez, 2012)
En seguida se presenta el resultado y un ejemplo para estimar la media de la poblacin.

138

Teorema 2
Si se cumplen los dos requerimientos mencionados anteriormente; es decir, si la
variable en estudio tiene distribucin normal y la varianza poblacional de esta
distribucin es desconocida entonces:

X
a) El mejor estimador puntual para
es la media muestral .

b) Un 100(1-

)% intervalo de confianza para

es

Cuando n < 30:

X - t n -1,

S
S
, Xt

n -1,
n
n
2

Donde:
X
es la media de la muestra, S es la desviacin estndar de la muestra, n es el tamao

n 1,

de la muestra y

es un valor en la tabla de t de Student con n-1 grados de

libertad (GL) de tal manera que a su derecha esta una probabilidad de

Cuando n > 30:

X - Z1,

S
S
, XZ

1,
n
n
2

Ejemplo 2
En un estudio para estimar el salario promedio mensual de los profesores del departamento
de Lambayeque se tom una muestra aleatoria de tres profesores a los cuales se les registro
su salario mensual en soles. Se conoce que variable salario tiene distribucin normal. Los
datos de la muestra se dan a continuacin
1200
800
1000
a) Estimar en forma puntual a

b) Estimar a
mediante un intervalo de confianza del 95%.
c) Interpretar a los dos estimadores obtenidos.

139

Como los dos requerimientos se cumplen: la variable en estudio tiene distribucin normal y
la varianza

es desconocida, usaremos el teorema 2 para encontrar los estimadores de

a) El mejor estimador puntual para

es

i 1

1200 800 1000 3000

1000.
3
3

Entonces un estimador puntual para es


b) Un 100(1-

X - t n -1,

=1000,

2
i

=1000.

) % intervalo de confianza para

S
S
, Xt

n -1,
n
n
2

. Donde:

n=3,

( x i ) 2

n 1

0.05

0.025
2
2

(1200 800 1000) 2


3
40000
3 1

1200 2 800 2 1000 2

n 1,

y
se encuentra en la tabla de la distribucin de T de
Student ubicando en la primera columna los n-1=2 grados de libertad, en la

t
0.025

n 1,

primera hilera la probabilidad


y finalmente se detecta el valor
en la interseccin de estos dos valores como se indica en la tabla siguiente:

0.025
2

n-1=2

4.303

140

n 1,

n 1,

t 2, 0.025 4.303

Por lo tanto el valor de


es
.
Con estos datos podemos calcular el lmite inferior (LI) y el lmite superior
(LS) del intervalo de confianza pedido.

LI X t

n 1,
2

LS X t

n 1,
2

S
200
1000 4.303 *
1000 496.88 503.12.
n
3
S
200
1000 4.303 *
1000 496.88 1496.88.
n
3

A si un 95% intervalo de confianza para .12

es [503.12, 1496.88].

c) Interpretacin
Si se usa un estimador puntual, se concluye que el salario promedio mensual de
todos los profesores del departamento de Lambayeque es de 1000 soles, sin
embargo si se usa un estimador por intervalo para el salario promedio, se estima
que el salario promedio mensual de todos los profesores del departamento de
Lambayeque esta entre 503 soles y 1496.88 soles.

141

PROBLEMAS PROPUESTOS

1. Se ha tomado una muestra de los precios de un mismo producto alimenticio en 16


comercios, elegidos al azar en un barrio de una ciudad, y se han encontrado los
siguientes precios:
95, 108, 97, 112, 99, 106, 105, 100, 99, 98, 104, 110, 107, 111, 103, 110.
Suponiendo que los precios de este producto se distribuyen segn una ley normal con
varianza poblacional desconocida. Determine el intervalo de confianza, al 95%, para la
media poblacional.
2. La estatura promedio de una muestra aleatoria de 20 personas de una ciudad es 1,75 m y
una varianza de con varianza muestra de 0,16 m. Se sabe que la estatura de las personas
de esa ciudad es una variable aleatoria que sigue una distribucin normal con varianza
poblacional desconocida. Determine el intervalo de confianza, al 90%, para la media
poblacional.
3. Las ventas mensuales de una tienda de electrodomsticos se distribuyen segn una ley
normal. En un estudio estadstico de las ventas realizadas en los ltimos nueve meses, se
encontr que un promedio de 2400 soles y desviacin tpica 90 soles. Determine el
intervalo de confianza, al 99%, para la media poblacional.
4. Una marca de nueces afirma que, como mximo, el 6% de las nueces estn vacas. Se
eligieron 300 nueces al azar y se detectaron 21 vacas. Con un nivel de significacin del
1%, se puede aceptar la afirmacin de la marca?
5. La duracin de las bombillas de 100 W que fabrica una empresa sigue una distribucin
normal. Su vida media est garantizada durante un mnimo de 800 horas. Se escoge al
azar una muestra de 10 bombillas de un lote y, despus de comprobarlas, se obtiene una
vida media de 750 horas y desviacin de 120 horas. Con un nivel de significacin de
0,01, habra que rechazar el lote por no cumplir la garanta?
6. El ndice de resistencia a la rotura, expresado en kg, de un determinado tipo de cuerda
sigue una distribucin normal con desviacin tpica 15.6 kg. Con una muestra de 5 de
estas cuerdas, seleccionadas al azar, se obtuvieron los siguientes ndices:
280, 240, 270, 285, 270.
Obtenga un intervalo de confianza para la media del ndice de resistencia a la rotura de este
tipo de cuerdas, utilizando un nivel de confianza del 97%.

142

7. Se encuesto a 300 alumnos y se encontr que el 65% de los alumnos de cierta localidad
utiliza con regularidad la biblioteca del pueblo. Halla un intervalo en el que se encuentre
el 95% de las proporciones de alumnos que utilizan la biblioteca.
8. De una muestra de 100 familias de una poblacin, hay 20 que poseen lavaplatos. Calcula
el intervalo de confianza aproximado para la proporcin poblacional, para un nivel de
confianza del 99%.
9.
10. En una encuesta realizada a 150 familias de una determinada poblacin, se encontr que
en 25 de ellas haba tres o ms hijos. Halla el intervalo de confianza para estimar la
proporcin real de las familias en las que hay tres o ms hijos, con un nivel de confianza
del 90%.
11.
12. Se encuest a una proporcin de alumnos de cierto instituto que aprueban matemticas
es de 56/80. Halla el intervalo caracterstico para la proporcin de aprobados en
matemticas correspondiente al 99%.

143

CAPTULO IX
Introduccin a la Inferencia
Estadstica: Prueba de
Hiptesis

9.1 PRUEBAS DE HIPOTESIS


Otra de las finalidades de la inferencia estadstica, probablemente la ms importante
en investigacin, es la prueba de hiptesis. Es decir, probar enunciados o afirmaciones
sobre los parmetros de las poblaciones. (Martnez, 2012)
144

I. Metodologa para desarrollar pruebas de hiptesis:


Para desarrollar una prueba de hiptesis puedes hacerlo haciendo uso de estos siete pasos:
1. Planteamiento de hiptesis: aqu debers plantear H0 y H1
2. Nivel de significancia: es el valor que te ayudar a tomar la decisin de aceptar o
rechazar H0
3. Estadstico de prueba: aqu slo se plasmar la funcin pivotal.
4. Regin de aceptacin y rechazo: Se determinar en funcin a los puntos crticos.
5. Calculamos el estadstico de prueba: se reemplaza los datos en la funcin pivotal.
6. Decisin: en este paso se tomar la decisin de aceptar o rechazar H0.
7. Conclusin: se describir y/o dar respuesta al problema presentado.
II. Tipos de pruebas de hiptesis:
a. Hiptesis bilateral de dos colas
H 0 :=0
H 1 : 0

b.

Hiptesis unilateral hacia la derecha


H 0 :=0
H 1 :> 0

c. Hiptesis unilateral hacia la izquierda


H 0 :=0
H 1 :< 0

0 = es el valor del parmetro desconocido

III. Pruebas de Hiptesis para la proporcin p y para la media

A. Pruebas de hiptesis sobre el parmetro p, proporcin de una poblacin

145

Solamente trataremos el caso cuando n es mayor o igual a 30 (caso de muestras


grandes), para este caso se presenta una prueba de dos colas (Ha: p
una cola (Ha: p>p* y Ha: p<p*).

p*) y dos pruebas de

En los resultados o teoremas para pruebas de hiptesis presentaremos en cada uno de ellos
tres incisos describiendo brevemente los pasos a seguir para probar la hiptesis. Es decir, se
presenta el valor calculado (estadstica de prueba), el valor tabular o punto crtico, la regin
de rechazo (RR), regin de no rechazo o regin de aceptacin (RA), y la regla de decisin.

Teorema 3
Si n, el tamao de muestra, es mayor o igual a 30, entonces
a) Ho: p = p* versus
Ha: p

p*

Valor calculado o estadstica de prueba

p p*

Zc

p * (1 p * )
n

Valor tabular, valor en la tabla de la distribucin normal estndar

Z valor en la tabla de Z tal que a su derecha esta una probabilid ad


Zt=

2
.

Regin de rechazo (RR) y la regin de aceptacin (RA)


RR

RA
-Zt

RR
Zt

Regla de decisin
Rechazar Ho si Zc cae en la RR. Es decir,
Rechazar Ho si Zc<-Zt o si Zc>Zt

146

b) Ho: pp* versus


Ha: p>p*
Valor calculado o estadstica de prueba

Zc

p p*
p * (1 p * )
n

Valor tabular, valor en la tabla de la distribucin normal estndar

Zt=

Z valor en la tabla de Z tal que a su derecha esta una probabilid ad

Regin de rechazo (RR) y la regin de aceptacin (RA)


RA

RR
Zt

Regla de decisin
Rechazar Ho si Zc cae en la RR. Es decir,
Rechazar Ho si Zc>Zt
c) Ho: pp* versus
Ha: p<p*
Valor calculado o estadstica de prueba

Zc

p p*
p * (1 p * )
n

Valor tabular, valor en la tabla de la distribucin normal estndar

Zt=

Z valor en la tabla de Z tal que a su derecha esta una probabilid ad

Construir la regin de rechazo (RR) y la regin de aceptacin (RA)


RR

RA
-Zt

Regla de decisin
Rechazar Ho si Zc cae en la RR. Es decir,
147

Rechazar Ho si Zc<-Zt.
Ejemplo
Usando los datos del ejemplo del estudio de desocupacin en el municipio de T probar con

=0.05 que el porcentaje de desocupacin en el municipio de T es diferente del 4%,


afirmacin que hace el gobierno central.
Usaremos las frmulas de inciso a) del teorema 3
1. Planteamiento de hiptesis:
Ho: p=0.04 versus
H1: p

0.04

2. Nivel de significancia:

=0.05.

3. Estadstico de prueba:
p p *
Zc
p * (1 p*)
n
4. Regin de aceptacin y rechazo:
Z Z 0.05 Z 0.025 1.96
Zt=

Regin de rechazo (RR) y la regin de aceptacin (RA)


Zc=6.50
RR

RA
-Zt
-1.96

RR

Zt
1.96

5. Calculamos el estadstico de prueba:


p p *
0.13 0.04
Zc

6.50
p * (1 p*)
0.04(1 0.04)
n
200
6. Decisin:
Puesto que Zc cae en la RR, se rechaza H0 con

148

=0.05.

7. Conclusin:
Con un nivel de significancia del 5% se concluye que el porcentaje de desocupacin en
el municipio de T es significativamente diferente del 4% que afirma el gobierno central.
Tambin podramos haber probado la hiptesis considerando en la hiptesis alternante que
la proporcin de desocupados en el municipio de T es mayor del 4%, lo cual ilustraremos
en seguida.
Usaremos el inciso b) del teorema 3.
1. Planteamiento de hiptesis:

Ho: p=0.04 versus


H1: p>0.04
2. Nivel de significancia:

=0.05

3. Estadstico de prueba:
p p *
Zc
p * (1 p*)
n
4. Regin de aceptacin y rechazo:
Valor tabular Zt

Zt=

Z Z 0.05 1.96

Regin de rechazo y regin de aceptacin


Zc=6.50
RA

RR
Zt
1.96

5. Calculamos el estadstico de prueba:


p p *
0.13 0.04
Zc

6.50
p * (1 p*)
0.04(1 0.04)
n
200
6. Decisin:
Puesto que Zc cae en la RR, se rechaza Ho con
7. Conclusin:
149

=0.05.

Con un nivel de significancia del 5% se concluye que el porcentaje de desocupacin en


el municipio de T es significativamente diferente del 4% que afirma el gobierno central.

B. Pruebas de hiptesis sobre el parmetro , media de una poblacin


Trataremos solo el caso cuando la variable en estudio tiene distribucin normal con
varianza desconocida., para este caso se presenta la una prueba de dos colas (Ha:
*) y dos pruebas de una cola (Ha:
Teorema 4
a) Ho:
Ha:


>

* y Ha:


<

*).

* versus

Valor calculado o valor de la estadstica de prueba tc

X *
S
n

tc
Valor tabular tt

n 1,
2

valor en la tabla de Tcon n - 1 GL tal que a su derecha esta una probabilid ad

tt=
GL=grados de libertad
Regin de rechazo (RR) y la regin de aceptacin (RA)
RR

RA
- tt

tt

Regla de decisin
Rechazar Ho si tc cae en la RR. Es decir,
Rechazar Ho si tc < -tt o si tc > tt
b) Ho:
Ha:

* versus

>

RR

Valor calculado tc
150

2
.


tc

X *
S
n

Valor tabular tt

t n 1, valor en la tabla de Tcon n - 1 GL tal que a su derecha esta una probabilid ad

tt=
GL=grados de libertad

Regin de rechazo (RR) y la regin de aceptacin (RA)


RA

RR
tt

Regla de decisin
Rechazar Ho si tc cae en la RR. Es decir,
Rechazar Ho si tc > tt

c) Ho:

* versus

Ha: < *
Valor calculado tc

X *
S
n

tc
Encontrar el tt

t n 1, valor en la tabla de Tcon n - 1 GL tal que a su derecha esta una probabilid ad

tt=
GL=grados de libertad

151

Regin de rechazo (RR) y la regin de aceptacin (RA)


RR

RA
- tt

Regla de decisin
Rechazar Ho si tc cae en la RR. Es decir,
Rechazar Ho si tc < -tt
Ejemplo
Usando los datos del ejemplo de investigacin sobre estimacin del salario promedio de

todos los profesores del departamento de Lambayeque, probar con


=0.05 si el salario
promedio de los profesores es diferente a 1200 soles mensuales.
En el ejemplo tenemos los siguientes datos: n=3, la media muestral es igual a 1000 y la
desviacin estndar de la muestra es 200.
1. Planteamiento de hiptesis:
2.Nivel de significancia:
Ho:

=1200 versus

=0.05

H1:
1200
3. Estadstico de prueba:

tc
2.

X *
S
n

Regin de aceptacin y rechazo:


Valor tabular tt
t t 2,0.025 4.303
n 1,

tt=
tt es un valor en la tabla de T con 2 grados de libertad y una probabilidad de 0.025 a
la derecha de dicho valor.
Regin de rechazo (RR) y la regin de aceptacin (RA)
tc = -1.73
RR
RA
RR
- tt
-4.303
5. Calculamos el estadstico de prueba:

152

tt
4.303

5.

X * 1000 1200

1.73
S
200
n
3

tc
Decisin:
Como el tc = -1.73 cae en la RA, no se rechaza Ho.

6.

Conclusin:
Con un nivel de significancia del 5 % (error del 5%) se concluye que el salario
promedio de los profesores del departamento de Lambayeque no es significativamente
diferente de 1200 soles por mes. Es decir, con un nivel de significancia del 5% los datos de
muestra aleatoria no muestran evidencias para rechazar la hiptesis de que el salario
promedio de todos los profesores del departamento de Lambayeque es de 1200 soles
mensuales
PROBLEMAS PROPUESTOS
1. En un estudio sobre desocupacin en el Municipio de T se tom una muestra aleatoria de
400 personas en edad laboral del Municipio de T de las cuales 26 contestaron que no tienen
trabajo. El gobierno central afirma que el porcentaje de desocupados en el municipio de T
es del 4%. Pruebe la hiptesis de que el porcentaje de desocupacin en el municipio de T es
diferente del 4% usando una

=0.01 y de su conclusin en trminos del problema.

2. En un estudio para para estimar la proporcin de familias que usan un determinado


detergente, 196 familias fueron seleccionadas aleatoriamente. De las 196 familias se
determin que 108 usan el producto (detergente).

Probar con
=0.05 que ms del 90% de las familias usan el detergente. De su conclusin
en trminos del problema.
3. En un estudio realizado por Wall Street Journal, se tom una muestra aleatoria de 900
personas que estn suscritas en Wall Street Journal, de estas 900 personas el 40% indicaron
que terminaron al menos dos aos en una Universidad.

Probar con =0.05 que la proporcin de suscritores de Wall Street Journal que terminaron
al menos dos aos de estudios universitarios es del 50%.
4. Un gerente compro 10000 bateras para la empresa en la cual trabaja. El gerente toma una
muestra aleatoria de 300 bateras de las 10000 compradas las cuales fueron examinadas
resultando 42 bateras defectuosas.

Probar con
=0.05 que menos del 5%. De las bateras son defectuosas. De su conclusin
en trminos del problema.
5. Se est considerando un nuevo medicamento para curar una determinada enfermedad. El
medicamento que se est usando actualmente tiene una probabilidad de 0.8 de curar dicha
153

enfermedad. Se tom una muestra aleatoria de 40 pacientes que padecen la enfermedad y se


les aplico el nuevo medicamento, resulto que 34 de ellos se curaron de la enfermedad.

Probar con =0.05 que el nuevo medicamento es mejor que el actual. De su conclusin en
trminos del problema.
6. Un ingeniero civil est probando la resistencia de compresin del concreto. Prueba 6
muestras al azar y obtiene los siguientes resultados:
2212
2232
2245
2201
2225
2310
Se conoce que la resistencia de compresin del concreto tiene distribucin normal.

Pruebe la hiptesis Ho:


=2250 psi contra Ha:
conclusiones con base en el resultado de esta prueba.

2250 psi usando

=0.05. Saque

7. Un fabricante de llantas est investigando la vida de las llantas producidas con un nuevo
producto. Tomo una muestra aleatoria de 16 llantas producidas con este nuevo producto y
las ha probado hasta el fin de su vida til en una prueba de carretera. La media y la
desviacin estndar muestrales son 60139.7 y 3645.94 km. Se conoce que la vida til de las
llantas tiene distribucin normal. Al fabricante le gustara demostrar que la vida media de
esta nueva llanta es mayor de 60000 km. Formule y pruebe las hiptesis apropiadas con
=0.05, y establezca conclusiones.

8. Una muestra aleatoria de n=100 medidores de agua es controlada dentro de una comunidad
para estimar el promedio de consumo de agua diario por casa, durante un periodo estacional
seco. La media y la varianza muestral fueron 12.5 y 1252. Se supone que el consumo de
agua tiene distribucin normal.
Pruebe la hiptesis con

=0.05 que el consumo promedio diario de agua es menor que

9. Probar si los valores de la variable en estudio calificaciones tiene distribucin normal. Los
datos de la muestra se dan a continuacin.
11
09
03
03
03
05
10
06
05
02
03
15
04
07
01
08
18
02
03
02
01
11
03
03
03
04
02
06
05
05
03
05
08
01
04
Para probar si los datos de la muestra provienen de una distribucin normal construya un
histograma de frecuencias y observe si la distribucin de frecuencias tiene forma
154

acampanada lo cual indicara que los datos provienen de una distribucin normal en caso
contrario se concluye que los datos no provienen de una distribucin normal.
Hacer la prueba normal. Revisar un libro donde este descrito la prueba de bondad de ajuste
para prueba de normalidad. Por ejemplo puede revisar el libro: Introduccin a los mtodos
estadsticos un enfoque multidisciplinario de los autores Said y Zarate.
10. Saque conclusiones con base en el resultado de esta prueba.

CAPTULO X
155

Prueba Chi Cuadrado

En esta seccin veremos las principales aplicaciones de la Prueba Chi Cuadrado en la toma
de decisiones. La Prueba Chi Cuadrado llamada tambin Ji Cuadrado es una prueba no
paramtrica, que se utiliza para estudiar a las variables categricas. Entre las principales
aplicaciones de la Prueba Chi Cuadrado tenemos las siguientes. Bondad de Ajuste, que
permite determinar si una muestra de datos observados se ajusta a una conocida
distribucin terica. Asociacin de variables, que consiste en analizar si dos variables
cualitativas estn o no asociadas (variables dependientes). Homogeneidad. Que busca
comprobar si las muestras estudiadas provienen de la misma poblacin
1. La Prueba Chi Cuadrado en medidas de Bondad de Ajuste, consiste en determinar si
los datos de cierta muestra corresponden a cierta distribucin poblacional. En este caso es
necesario que los valores de la variable en la muestra y sobre la cual queremos realizar la
inferencia est dividida en clases de ocurrencia, o equivalentemente, sea cual sea la variable
de estudio, deberemos categorizar los datos asignando sus valores a diferentes clases o
grupos.
Supongamos que tenemos un nmero k de clases en las cuales se han ido registrando un
total de n observaciones (n ser pues el tamao muestral). Denotaremos las frecuencias
observadas en cada clase por O1, O2,, Ok (Oi es el nmero de valores en la clase Ai). Se
cumplir que:
O1 + O2 +... + O k = n
156

Lo que queremos es comparar las frecuencias observadas con las frecuencias esperadas
(tericas), a las que denotaremos por E1, E2,..., Ek. Se cumplir que:
E1 + E2 +... + E k = n
Variable Categorizada
Clase 1
Clase 2
Clase K
Total

Frecuencia Observada
O1
O2

Frecuencia Esperada
E1
E2

Ok
n

Ek
n

Veremos si las frecuencias observadas estn o no en concordancia con las frecuencias


esperadas (es decir, si el nmero de resultados observados en cada clase corresponden
aproximadamente al nmero esperado).
Para comprobarlo, haremos uso de un contraste de hiptesis usando la distribucin Chicuadrado.
2
k
( OE i )
2
=
Ei
i=1

Ejemplo
El director de Movil, tiene la responsabilidad de controlar el nivel de existencias para
cuatro tipos de automvil vendidos por la firma. En el pasado, ha ordenado nuevos
automviles bajo la premisa de que los cuatro tipos son igualmente populares y la demanda
de cada tipo es la misma. Sin embargo, recientemente las existencias se han vuelto ms
difciles de controlar, y el director considera que debera probar su hiptesis respecto a una
demanda uniforme. En la siguiente tabla de contingencia se muestra la expectativa
uniforme para una muestra de 48 autos vendidos durante el ltimo mes.
Tipo de auto
Tipo1
Tipo2
Tipo3
Tipo4

Ventas observadas
15
11
10
12

Ventas esperadas
12
12
12
12

Solucin
1. Planteamiento de hiptesis
H0: La demanda es uniforme para los cuatro tipos de autos.
157

H1: La demanda no es uniforme para los cuatro tipos de autos.


2. Nivel de significancia:
=0.05
3. Estadstico de prueba
2
k
( OE i )
2
=
Ei
i=1

( 1512 )2 ( 1112 )2 ( 1012 )2 ( 1212 )2


=
+
+
+
=1.17
12
12
12
12
2
c

4. Regin de aceptacin y rechazo


RA

RR

2t = 20.05;3 =7.81
5. Decisin
Si 2c 2t entonces se rechaza Ho
Si 2c < 2t entonces se acepta Ho

Como

2c < 2t , entonces se acepta Ho

6. Conclusin:
La demanda es uniforma para los 4 tipos de autos, con un nivel de significancia de
0.05.

2. Prueba Chi Cuadrado en la Independencia de variables. La prueba de ChiCuadrado para la independencia de variables nos permite determinar si existe una
relacin entre dos variables cualitativas analizadas en un estudio. Para saber si dos
variables cualitativas muestran algn grado de dependencia se construyen tablas de
doble entrada (filas y columnas) .Es necesario resaltar que esta prueba nos indica si
existe o no una relacin entre las variables, pero no indica el grado o el tipo de
relacin; es decir, no indica el porcentaje de influencia de una variable sobre la otra o
la variable que causa la influencia.
Caracterstica A

Caracterstica B (j)
158

Total A

b1

b2

a1

o1,1

o1,2

a2

o2,1

o2,2

(i)

.
.

af

o f ,1
n.1

Total n.j

.
.

bc

ni .

o1, c

n1.

o2, c

n2.

o f ,2

of , c

nf .

n.2

n. c

n..

oij = Frecuencia observada de la respuesta o clase a i de la caracterstica A,


correspondiente clase bj de la caracterstica B.
ni . = Frecuencia marginal de la clase ai de la caracterstica A.
n . j = Frecuencia marginal de la clase bj de la caracterstica B.
c

j=1

i=1

ni . = o ij n. j= oij

i=1

j=1

n= ni . = n. j
Con la informacin de este cuadro se procede a realizar la prueba de hiptesis, la
cual debe seguir el procedimiento que se muestra a continuacin.

Ejemplo
En una investigacin se quiere ver si existe alguna relacin entre grado de instruccin de
los trabajadores y el gnero. Mediante una muestra de 100 trabajadores, se elabora la
siguiente tabla de contingencia:

Grado de
Instruccin
Primaria
Secundaria

Gnero
Masculino

Femenino

Total

20

11

31

40

48

159

Superior

15

21

Total

75

25

100

Solucin
1. Planteamiento de hiptesis
H0: El grado de instruccin es independiente del gnero.
H1: El grado de instruccin es dependiente del gnero.
2. Nivel de significancia:
=0.1
3. Estadstico de prueba
2
k
( OE i )
2
=
Ei
i=1
Gnero
Masculino

Grado de
Instruccin
Primaria

20
23.25
40
36
15
15.75
75

Secundaria
Superior
Total

2c =

Total

11
7.75
8
12
6
5.25
25

31

( 2023.25 )2 ( 117.75 )2
( 65.25 )2
+
++
=3.7
23.25
7.75
5.25

4. Regin de aceptacin y rechazo


RA
2
t

Femenino

2
0.1; 2

RR

=4.605

5. Decisin
160

48
21
100

Si c t entonces se rechaza Ho
Si c < t entonces se acepta Ho

Como

2c < 2t , entonces se acepta Ho

7. Conclusin:
El grado de instruccin de los trabajadores es independiente al gnero, con un nivel
de significancia de 0.1

Ejemplo
Un investigador quiere estudiar si hay asociacin entre la prctica deportiva y la sensacin
de bienestar. Extrae una muestra aleatoria de 100 sujetos, obteniendo los resultados que se
adjunta en la siguiente tabla de contingencia.
Sensacin de
Bienestar

Prctica deportiva

Total

no

20

25

45

No

10

45

55

Total

30

70

100

Contraste la hiptesis de independencia entre bienestar y prctica de deporte


( = 0.01)
Solucin
1. Planteamiento de hiptesis
H0: La prctica deportiva y la sensacin de bienestar son independientes.
H1: La prctica deportiva y la sensacin de bienestar son dependientes.

161

2. Nivel de significancia:
=0.01

3. Estadstico de prueba
2
k
( OE i )
2
=
Ei
i=1

Sensacin de
Bienestar

Prctica deportiva
S

no

20
13,5

25
31.5

45

No

10
16,5

45
38,5

55

Total

30

70

100

Estadstico de prueba:
2c =

( 2013.5 )2 ( 2531.5 )2 ( 1016.5 )2 ( 4538.5 )2


+
+
+
13.5
31.5
16.5
38.5

2c =8.13

4. Regin de aceptacin y rechazo


RA
2
t

2
0.01;1

RR

=6.63

5. Decisin
Si 2c 2t entonces se rechaza Ho
Si 2c < 2t entonces se acepta Ho

Como

Total

2c > 2t , entonces se rechaza Ho


162

6. Conclusin:
Existe suficiente evidencia estadstica como para concluir que la prctica deportiva
y la sensacin de bienestar estn asociadas (son dependientes), con un nivel de
significacin =0,01

3. Prueba de Homogeneidad
Estamos interesados en determinar si los datos correspondientes a dos o ms muestras
aleatorias provienen de la misma poblacin. Nuevamente el conjunto de posibles
valores de las observaciones se divide en k conjuntos disjuntos: A1, A2, ..., Ak.;
clasificando en ellos las observaciones de cada muestra. Si n ij representa el nmero de
observaciones de la muestra i que pertenecen al conjunto Aj , los datos pueden
tabularse en lo que se denomina una tabla de contingencia.
Muestra
1
2
.
m
Total

A1
n11
n21

nm1
n.1

A2
n12
n22

nm2
n.2

..
.
.
.
.
..

Ak
n1k
n2k
.
nmk
n.k

Total
n1.
n2.

nm.
n

La hiptesis de que las m poblaciones son homogneas, se traduce en que cada conjunto Aj
debe tener una probabilidad terica pj, desconocida, pero que no vara de la poblacin i a la
poblacin i`. Esto debe verificarse para todas las categoras, i.e., las categoras deben ser
homogneas en las diversas muestras.
Ejemplo: En un estudio para evaluar la aceptacin de un producto X en tres
distritos de Chiclayo, se llev a cabo una encuesta y se encontraron los siguientes
resultados:
Opinin sobre
el producto X

Distrito

Total

La
Victoria

Jos
Leonardo
Ortiz

Chiclayo

Bueno

69

10

30

109

Regular

62

33

75

170

Malo

19

95

121

Total

150

50

200

400

163

Probar si la opinin sobre el producto X es semejante en los tres distritos.


Use (=0.05)
Solucin
1. Planteamiento de hiptesis
H0: La opinin sobre el producto X es semejante en los tres distritos.
H1: La opinin sobre el producto X No es semejante en los tres distritos
2. Nivel de significancia:
=0.05
3. Estadstico de prueba
k

=
2

i=1

( OE i )
Ei

4. Calculamos el estadstico de prueba


Opinin sobre el
producto X

Distrito

Total

La
Victoria

Jos Leonardo
Ortiz

Chiclayo

Bueno

69
40,875

10
13,625

30
54,5

109

Regular

62
63,750

33
21,250

75
85,0

170

Malo

19
45,375

7
15,125

95
60,5

121

Total

150

50

200

400

Estadstico de prueba:
2c =

( 6940,875 )2 ( 1013,625 )2 (3054.5 )2


( 9560.5 )2
+
+
+ +
40,875
13,625
54,5
60.5

164

c =78,42099
5. Regin de aceptacin y rechazo
Si 2c > 2t entonces se rechazala Ho
Si 2c > 2t entonces se rechazala Ho
2t =

20.05 ;4 =9,488
Grados de libertad=(r-1)(c-1)=(3-1)(3-1)=4
Al 0.05 de significancia =9,488

6. Decisin
2
2
Como c > t , entonces se rechaza Ho
7. Conclusin
Se concluye que la opinin sobre el producto X no es homogneo en los tres distritos,
con un nivel de significancia de 0.05

PROBLEMAS PROPUESTOS
1. Se realiza un estudio para investigar la asociacin entre la recuperacin de una
enfermedad y el uso de vitaminas. Se selecciona 200 pacientes aleatoriamente y se
recogen los datos que se muestra en la tabla.
Recuperacin de la enfermedad
Uso de
vitaminas

Se recupera

No se recupera

Total

Si

72

68

140

No

48

12

60

Total
120
80
200
A un nivel de significancia de =0.1 pruebe si existe relacin entre las variables
analizadas.
2. Se selecciona al azar 236 trabajadores de una poblacin y se les clasifica de acuerdo
con sus hbitos de beber licor y su rendimiento laboral, obtenindose los siguientes
resultados.
165

Hbito al licor
En exceso
Moderado
Espordicamente
No bebedor

Alto
28
29
17
27

Rendimiento laboral
Medio
31
16
9
19

Bajo
14
12
23
11

Pruebe la hiptesis de independencia entre las dos variables de estudio, para una
significancia =0.05.
3. Estamos interesados en estudiar la fiabilidad de cierto componente electrnico con
relacin al distribuidor que nos lo suministra. Para realizar esto, tomamos una muestra
de 100 componentes de cada uno de los 3 distribuidores que abastecen el producto,
comprobando el nmero de defectuosos en cada lote. La siguiente tabla muestra el
nmero de defectuosos en para cada uno de los distribuidores.
Distribuidor
Distribuidor 1
Distribuidor 2
Distribuidor 3

Componentes
defectuosos
15
25
10

Componentes
buenos
85
75
90

Probar la hiptesis de que los tres distribuidores de componentes electrnicos son


homogneos en relacin a la proporcin de componentes defectuosos, asumiendo un
nivel de significancia de 0.05
4. En una investigacin se quiere estudiar si hay alguna asociacin entre el lugar de
procedencia y el rendimiento acadmico de los estudiantes de la USS. Se tom una
muestra de 700 estudiantes de la diferentes escuelas profesionales, obtenindose los
siguientes resultados:
Lugar de
Rendimiento Acadmico
Total
Aprobado
Desaprobad
Procedencia
o
Costa
32
28
60
Sierra
225
290
515
Selva
50
75
125
Total
307
393
700
A un nivel de significacin del 5% pruebe si las variables de estudio estn
asociadas.
5. Doscientos clientes de una empresa comercial, fueron clasificados segn gnero y
166

opinin acerca del trato recibido durante su visita. Los resultados fueron:
Gnero

Opinin
Positiva

Total

Negativa

Masculino
Femenino

30
80

50
40

80
120

Total

110

90

200

Verifique la hiptesis que la opinin del cliente est asociado al gnero a un nivel de
6. Para conocer la opinin de los ciudadanos de Chiclayo sobre la gestin de su alcalde
se tom una muestra de 120 personas mayores de 18 aos( de ambos sexos) y se ha
obtenido los siguientes resultados:
valor
Gl
Valor p
Ji-cuadrado de
0,343
2
0,842
Pearson
Usando un nivel de significancia del 5%, se puede afirmar que la opinin sobre la
gestin del alcalde es independiente del gnero.
7. Una muestra de 500 jueces particip en un estudio diseado con el fin de evaluar
el nivel de sus conocimientos respecto a su gnero. La tabla siguiente
presenta la clasificacin de los jueces de acuerdo a las variables de estudio.
Genero
Masculino
Femenino
Total

Nivel de conocimiento.
Bueno
Malo
31
91
19
359
50
450

Total
122
378
500

Sugieren estos datos que existe una relacin entre el nivel de conocimiento
y genero de los jueces?. Use = 0.05
8. En una muestra aleatoria de 100 ciudadanos del distrito de Lambayeque, se les
clasific por su ocupacin: obrero, estudiante, profesional, y se les consult si estn
a favor o en contra de la integracin de un organismo de justicia, propuesto por el
congreso, los datos se muestran a continuacin.
Obrero
estudiante
profesional
A favor
23
29
27
167

En contra

25

39

35

Pruebe una hiptesis que la opinin de los ciudadanos es independiente de su


ocupacin, con el 5% de significancia.
9. En una fuente de soda se venden 4 tipos de bebida. Estamos interesados en
averiguar si la eleccin de cualquiera de estas bebidas se hace de forma aleatoria o
por el contrario existe algn tipo de preferencia en la seleccin de alguno de ellos
por los consumidores. La siguiente tabla muestra el nmero de bebidas vendidas en
cada uno de los 4 tipos durante una semana. Contrastar la hiptesis de que los tipos
de bebidas son seleccionados al azar a un nivel de significacin del 5%.
Tipo de bebida
1
2
3
4

Nmero de bebidas consumidas durante la semana


15
20
18
10

CAPTULO XI
168

REGRESIN Y
CORRELACIN LINEAL

Regresin y correlacin lineal simple


En muchas ocasiones surge la necesidad de estudiar la relacin que existe entre dos
variables cuantitativas que tienen distribucin aproximadamente normal. Por ejemplo,
promedio ponderado semestral y nmero de horas de estudio en una muestra de estudiantes
universitario del I Ciclo de estudios. Antes de establecer un modelo que relacione a ambas
variables, es necesario averiguar si estas dos variables esta correlacionadas entre s; es decir
realizar una anlisis de correlacin. (Sols, 2013)
12.1. Anlisis de correlacin de dos variables cuantitativas
El coeficiente de correlacin poblacional entre dos variables aleatorias x e y, se estima
con r.

n Yt X t Yt X t
r
2
2
n Yt 2 Yt n X t2 X t

Las sumatorias en la frmula anterior se realizan sobre las n observaciones, tomadas como
muestra.
169

Los del coeficiente de correlacin de Pearson se encuentran entre 1 y 1, esto es

1 rx , y 1
Por lo tanto a medida que el valor del coeficiente se acerca a 1 indica que ambas variables
estn fuertemente correlacionadas y de manera positiva o sea que ambas variables varan en
el mismo sentido, al aumentar una aumenta la otra o al disminuir una disminuye la otra.
Cuando el coeficiente se acerca a 1 indica que ambas variables estn fuertemente
correlacionadas y de manera negativa o sea que ambas variables varan en sentido opuesto,
al aumentar una disminuye la otra. (Sols, 2013)
Por otro lado si el valor de r es prximo a 0 indica ausencia de correlacin lineal entre
ambas variables, puede existir otro tipo de relacin entre las mismas (por ejemplo
curvilnea). Los valores de r=+1, r=-1 y r= 0, en la prctica rara vez se presentan.
Lo enunciado anteriormente se puede representar en una grfica llamada diagrama de
dispersin de los datos que permita observar la posible relacin entre las variables. (Sols,
2013)
Diagramas de dispersin que muestra los tipos de relacin entre las variables

Correlacin
positiva
Correlacinde
negativa
Ausencia de correlacin
12.2.
Significancia
estadstica del coeficiente
correlacin de Pearson
1. Planteamiento
de la hiptesis
Figura
1: se puede observar
los tipos de correlacin que existen entre las variables
H0: xy = 0 (las variables no estn correlacionadas)
H1: xy 0 (Las variables si esta correlacionadas)
2. Nivel de significancia: =0.05
3. Prueba estadstica:
t=

r( n2)

1r 2

4. Regin de rechazo
RR

RA

RR

RR: Regin de rechazo

t = T (/2; n-2)

RA: Regin de aceptacin


170

-t

5. Decisin: Si el valor de la prueba estadstica cae a la derecha o a la izquierda del


punto crtico, se rechaza Ho
6. Conclusin: Si se rechaza Ho, se concluye que las variables si estn
correlacionadas.
Si las variables estn correlacionadas podemos realizar un anlisis de regresin para
establecer la forma de esa relacin
12.3. Anlisis de Regresin Lineal Simple
El anlisis de regresin lineal simple es til para estudiar la forma probable de la relacin
entre dos variables (Y: variable dependiente y X: variable independiente), y su objetivo
final es predecir o estimar el valor de la variable dependiente, conociendo un valor
especfico de la variable independiente.
Para poder desarrollar este tipo de anlisis se siguen los siguientes pasos.
Tomar una muestra de n observaciones en las que se consideran dos variables, una variable
x independiente, considerada libre de error es decir una variable fijada de antemano y una
variable y, variable dependiente, considerada variable aleatoria, o sea una de las posibles
respuestas de la variable y a la variable x. Se tienen entonces un conjunto de n pares de la
forma (x,y)
a) Realizar un diagrama de dispersin de las variables (x,y) en un sistema de coordenadas
cartesianas, ya visto anteriormente y calcula el coeficiente de correlacin.
b) En base a la informacin anterior y si se considera apropiado un modelo de recta, encontrar
la ecuacin de la recta que mejor ajuste (o represente) a todos los puntos del diagrama. A
travs de esta ecuacin es posible predecir el valor de y para un determinado valor de x.
(Sols, 2013)
c) La ecuacin de la recta es la siguiente:

y 0 1 xi i
Dnde

: Es el intercepto o trmino independiente

Es la pendiente, representa el cambio en la variable y por unidad de cambio de


variable X. Tambin se le llama coeficiente de regresin
i :

la

Es el error aleatorio determinado por la diferencia entre yi y el valor esperado de y


como variable aleatoria determinada para la x en particular. No se agregarn
171

Otros supuestos sobre estos errores que son necesarios cuando se realiza un anlisis
inferencial en regresin.
d) Los parmetros poblacionales y deben ser estimados para obtener la recta de
regresin ajustada expresada de la siguiente manera:

y 0 1 x1
y i

ayb

Donde ( ) es el valor ajustado o estimado para un cierto valor de x y los valores


son los estimadores o valores que estiman a los parmetros poblacionales y y que se
calculan con los datos muestrales.
Estimacin de la recta de regresin por el mtodo de mnimos cuadrados:
Los valores estimados de 0 y 1 se encuentran utilizando el principio de mnimos
cuadrados:

0 y 1 x

n xi y i xi y i
n x i xi
2

Dnde:
y : media aritmtica de las y
x : media aritmtica de las x

12.4. Significancia Estadstica del Coeficiente de Regresin


Si existe una relacin lineal entre la variable Y y la variable X, el coeficiente de regresin

y 0 1 x1

de la ecuacin
siguiente prueba de hiptesis:

, debe ser diferente de cero, es decir debemos realizarse la

1. Planteamiento de las hiptesis

172

H 0 : 1 0
H 1 : 1 0
2. Nivel de significancia
= 0.05
3. Prueba estadstica

t
S

Donde, un estimador para


S 2

Var ( )

es:

2
( X t X )2

Y un estimador insesgado de la varianza del error es


n

e
i 1

2
t

n2

(Yt 0 1 X t ) 2
n2

Intervalo de confianza para el coeficiente de regresin:


Un intervalo de confianza (

)*100% para el coeficiente de regresin

n2

est dado por:

1 t1- [ EE ( 1 )]
2

t1-n2
Donde

es el percentil apropiado de la distribucin t con (n-2) grados de libertad.

12.5. El coeficiente de determinacin: R2


El coeficiente de determinacin en un anlisis de regresin simple es r2, es decir el
coeficiente de correlacin al cuadrado y nos indica el porcentaje de variaciones observadas
en la variable dependiente que es explicado por las variaciones de la variable
independiente. El coeficiente de determinacin expresa la variabilidad explicada por el
modelo de regresin. A partir de l podeos calcular el coeficiente de alineacin. Este
173

coeficiente expresa la proporcin de la variabilidad de la variable dependiente no explicada


por el modelo y viene dado por la siguiente expresin: [1 R2 ] (Sols, 2013)

Ejemplo
Se conduce un experimento en 12 sujetos para analizar si la dosis de cierta droga (en ml)
est relacionada con el tiempo de reaccin a un estmulo en segundos.
Droga (ml)
Tiempo (segs)

1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 6,5
1,0 0,8 1,8 1,4 2,1 1,8 2,2 3,0 2,75 3,0 4,1 4,9

Realizar un anlisis de correlacin de las variables en estudio. En el caso de que las


variables estn correlacionadas realizar un anlisis de regresin.
Grfico de dispersin del tiempo de reaccin a estmulo
versus dosis de droga
5

Tiempo de reaccin (seg)

R = 0.8824
0

Dosis de droga (ml)

Figura 2: se aprecia la correlacin positiva entre las variables


droga y tiempo.

12.6. Coeficiente de correlacin

n Y

r=

n Yt X t Yt X t
2

Yt

n X

2
t

X t

12130.928.8545

( 1285.7125 ) (12204.545 )
2

=0.939

174

Se puede concluir de existe una alta correlacin positiva entre el tiempo de reaccin y dosis
de la droga.

Significancia estadstica del coeficiente de correlacin de Pearson


1. Planteamiento de la hiptesis
H0: xy = 0 (las variables no estn correlacionadas)
H1: xy 0 (Las variables si esta correlacionadas)
2. Nivel de significancia: =0.05
3. Prueba estadstica:
t=

r( n2) 0.939 122


=
=8.63399455
1r 2
1(0.939)2

4. Regin de rechazo
RR

RA
-t

-2.2281

RR
t
+2.2281

(este valor se ha obtenido de la tabla T de Student


con

10 grados de libertad y con 0.025 de

probabilidad)
5. Decisin: Como el t calculado es mayor que el punto crtico 2.2281, se rechaza Ho
6. Conclusin: Si existe correlacin entre el tiempo de reaccin y dosis de la droga,
con un nivel de significancia de 0.05.
Como se observa que si existe una alta correlacin lineal directa entre las variables de
estudio, el siguiente paso es determinar un modelo que los relacione a ambas variables.
Anlisis de Regresin.

y 0 1 x1
Estimacin de la recta de regresin:
Se debe obtener los valores de a y b, mediante las siguientes relaciones:

175

n xi y i xi y i
n x i xi
2

0 y 1 x

12 ( 130.9 )45(28.85)
^
1=
=0.63531469
12 ( 204.5 )452
^
0 = (28.85/12) - 0,63531469 (45/12) = 0,02173658

y 0.023 0.64 x1
Significancia estadstica del coeficiente de regresin
Antes veamos algunos clculos auxiliares

Y
1
0,8
1,8
1,4
2,1
1,8
2,2
3
2,75
3
4,1
4,9

Y^
0,657
0,97465
1,2923
1,60995
1,9276
2,24525
2,5629
2,88055
3,1982
3,51585
3,8335
4,15115
suma

e^
0,117649
0,03050262
0,25775929
0,044079
0,02972176
0,19824756
0,13169641
0,0142683
0,20088324
0,26610122
0,07102225
0,56077632
1,92270699

176

x
x

7,5625
5,0625
3,0625
1,5625
0,5625
0,0625
0,0625
0,5625
1,5625
3,0625
5,0625
7,5625
35,75

1. Planteamiento de las hiptesis


H 0 : 1 0
H 1 : 1 0
2. Nivel de significancia
= 0.05
3. Prueba estadstica
t

t=

0.63531469
=8.663
0.07333622

Donde, un estimador para


2
S 2
(X t X )2

Var ( )

es:
0.1922707
=0.0053782
35.75

0.07333622
Y un estimador insesgado de la varianza del error es
n

e
i 1

2
t

n2

(Y

X t ) 2
n2

1,92270699/(12-2) = 0.1922707
=

4. Regin de rechazo
RR
RA

-t
-2.2281

RR

t
+2.2281

(este valor se ha obtenido de la tabla T de Student


con
10 grados de libertad y con 0.025 de
probabilidad)

5. Decisin: como el t calculado(8,66304113) es mayor que el t de tabla(2.2281), se


rechaza Ho
177

6. Conclusin: se concluye que si existe relacin entre tiempo de reaccin al estmulo


y dosis de la droga, con un nivel de significancia de 0.05
Como existe una relacin lineal entre las variables de estudio, se podra predecir el tiempo
de reaccin al estmulo que tendra un sujeto si la dosis fuera de 7 ml
y 0.023 0.64(7)

= 4,46893941

El tiempo de reaccin es aproximadamente de 4.5 segundos


Un intervalo de confianza del 95% para , es el siguiente:

1 t1-n2 [ EE ( 1 )]
2

0.63531469 2.2281x0.07333622
LI : 0.4719
LS : .0.7987
Como el intervalo de confianza no contiene a la unidad, el coeficiente de regresin es
diferente de cero, por lo que se concluye que el tiempo de reaccin al estmulo y la dosis de
droga estn linealmente relacionas y esta relacin es directa, con un nivel de confianza del
95%
El coeficiente de determinacin es (0.939)2 = 0.882, es decir el porcentaje de variaciones
observadas en el tiempo de reaccin al estmulo que es explicado por las variaciones de la
dosis de la droga es del 87.1%. El porcentaje de variacin del tiempo de reaccin al
estmulo que no es explicado por la dosis de la droga es del 0.118 [1 R2 ]

PROBLEMAS PROPUESTOS
En los ejercicios que se presenta a continuacin, se pide:
1. Realizar un anlisis de correlacin
2. Si las variables esta correlacionadas, realizar una anlisis de regresin.
3. Interpretar el coeficiente de regresin
4. Interpretar el coeficiente de determinacin

178

1. Se llev a cabo un experimento para estudiar el efecto de cierto medicamento para


disminuir la frecuencia cardiaca en adultos. La variable independiente es la dosis en
miligramos del medicamento, y la variable dependiente es la diferencia entre la frecuencia
cardiaca ms baja despus de la administracin del medicamento y un control antes de
administrarlo. Se reunieron los siguientes datos:
Dosis (mg)
: 0.5
0.75
1
1.25 1.5 1.75 2 2.25 2.5 2.75
Reduc. R.C(latidos /min): 10
8
12
12
14
12 16 18 17 20
2. Para una muestra de 10 personas disponemos de informacin respecto a su grado de
extroversin, y se desea evaluar su posible relacin lineal con la dimensin de personalidad
estabilidad emocional. Ambas variables se han medido con un test y se han obtenido las
puntuaciones para cada sujeto en una escala de 0 a 10. Los valores obtenidos se presentan
en la siguiente tabla:
Sujetos
X: Grado de
Y: Estabilidad Emocional
Extroversin
1
5
6
2
10
6
3
4
3
4
7
8
5
6
6
6
5
3
7
4
5
8
4
9
9
4
10
10
3
9
3. Los siguientes datos se relacionan con Y: Ventas anuales en miles de dlares de un
determinado producto y X: Nmero de veces de publicidad en el ao .Los datos son los
siguientes:
X
13
16
14
11
17
9
13
17
18
12
Y
6.2
8.6
7.2
4.5
9.0
3.5
6.5
9.3
9.5
5.7
4. Una empresa de mecnica industrial, tiene informacin de 10 meses, y quiere determinar si
existe alguna relacin entre el gasto mensual en miles de dlares y el nmero de piezas
fabricadas. Y: Gasto mensual y X: nmero de piezas fabricadas. Los datos se presentan a
continuacin:
Y 191
170 272
155 280 173 234
116 153
178
X 40
42
53
35
56
39
48
30
37
40
5. Se tiene la hiptesis de que el nmero de expedientes tramitados esta en relacin a los aos
de experiencia del secretario de juzgado. Se tom una muestra de 10 secretarios de juzgado
y durante 15 das de trabajo, se obtuvieron los siguientes datos:
N Exp.
4
9
10
14
4
12
20
3
17
15
179

tramitados
Aos de
experiencia

10

12

14

18

15

20

6. Un consultor de una corporacin, est interesado en el grado de precisin con que un nuevo
ndice de desempeo laboral mide. Una forma de
verificacin es analizando la relacin
entre el ndice de evaluacin en el trabajo (X) y el salario del empleado (Y). Se tom una
muestra de ocho empleados y se recabo informacin del salario y el ndice de evaluacin
en el trabajo (1 a 10, donde 10 es la mejor calificacin).
X
9
7
8
4
7
5
5
6
Y
2600
2500
2300
1500
2400 1800
1700 2200
7. En el 2011 se public un trabajo Diseando plantas en climas difciles en la revista Field
Crops Research, los datos usados en la investigacin son:
Duracin
92 92 96 100 102 102 106 106 121 143
Rendimiento 1.7 2.3 1.9 2.0 1.5 1.7 1.6 1.8 1.0 0.3
Con x = la duracin de la cosecha de porotos de soya en das, y = rendimiento de la cosecha
en toneladas por hectrea. Estime el rendimiento si la duracin de la cosecha fue de 104
das
8. Un investigador cree que la inteligencia de los nios, medida a travs del coeficiente
intelectual (CI en puntos), depende del nmero de hermanos. Toma una muestra aleatoria
de 15 nios y ajusta una regresin lineal simple. Los resultados aparecen en la salida
adjunta.
CI
110 115 120 118 110 108 105 104 98 99 98 100 90 93 90
Hermanos
0 1
1 1
2
2
2
3 3 4 4 5 5 5 6

180