You are on page 1of 34

Mtodos Cuantitativos

Ing. Jos Gabriel Gonzlez


Turrubiates
Universidad Autnoma de Tamaulipas
Unidad Acadmica de Ciencias Jurdicas y Sociales
Divisin de Estudios de Posgrado e Investigacin
Maestra en Desarrollo Regional
Programa del curso
Estadstica Descriptiva
Inferencia
Anlisis de regresin y correlacin.
Anlisis con SPSS ver 11.0
Evaluacin
Examen de medio termino 15%
Examen final 15%
Asignaciones 20%
Proyecto final 30%
Asistencia 20%
Bibliografa
ANDERSON, David R., Dennis J. Sweeney y Thomas A. Williams
(1999). Estadstica para administracin. 2da., ed. International
Thomson Editores. Mxico.
BERENSON, Mark L., David M. Levine. (1996). Estadstica bsica en
administracin. Conceptos y aplicaciones. 7ma. Ed; Prentice Hall.
Mxico.
BERK. Kenneth N. Y Patrick Carey. (2001). Anlisis de datos con
Microsoft Excel. Actualizado para Office 2000.Thomson Learning.
Mxico.
CARLBERG, Conrad (2003). Anlisis de los negocios con Excel XP.
2da. Ed; Prentice-Hall. Mxico.
FERRN, Magdalena (2001). SPSS para Windows. Anlisis
estadstico. McGraw-Hill. Espaa.
FERRN, Magdalena (2002). Curso de SPSS para Windows.
McGraw-Hill. Espaa.
JOHNSON, Robert. (1998). Estadstica Elemental. Grupo Editorial
Iberoamrica. Mxico.
MASON, Robert D; Douglas A. Lind y William G. Marchal. (2001).
Estadstica para administracin y economa. 10ma ed; AlfaOmega.
Mxico.
TRIOLA, Mario F. (2000). Estadstica Elemental. 7ma ed; Pearson
Educacin. Mxico

Variables, medidas y escalas.
Las variables son caractersticas no uniformes de las unidades de
informacin.
Unidades son las entidades de las que se obtienen las
observaciones.
Medicin es el proceso por el que se asignan nmeros a las
observaciones de una variable.
Medida : observacin cuantificada o categorizada.
Una misma variable puede ser medida de diversas maneras. El
investigador ha de procurar que sus medidas sean vlidas y
fiables.
Para representar a las variables se suelen emplear las ltimas letras
del alfabeto: X, Y, Z , etc.

El smbolo X representa una variable medible, pero si escribimos X
i

estamos representando el valor que toma la variable X en una
observacin concreta (la observacin i ).
Variables, medidas y escalas.


Las variables se pueden clasificar en:


Variable dependiente: es la variable que se quiere explicar

Variable independiente: es la variable que explica la variable
dependiente
Dependientes

Independientes
ESCALAS DE MEDIDA de las
variables
La escala nominal consiste en agrupar las observaciones de la
variable en varias categoras cualitativas: (hombre-mujer, agrupar
por nacionalidad, etc.) Las categoras pueden ser nombres o
nmeros, pero los nmeros no indican orden ni diferencias en
magnitud.
La escala ordinal, consiste en agrupar las observaciones de la
variable en categoras que se pueden ordenar. (Clase social, nivel
de estudios, etc.)
La escala de intervalo, existe una unidad de medida, pero el cero
se fija en funcin del instrumento de medida, no significa ausencia
de la caracterstica estudiada. Por ejemplo la temperatura (o C, o
F, etc.)
La escalas de razn cociente o proporcin, son escalas de
intervalo pero con un cero absoluto. Peso, edad, distancia, etc.
Tambin se suelen clasificar las variables en:

Cualitativas o categricas: indican a qu grupo o categora
pertenece un individuo (grupo sanguneo, estado civil, etc.)
Cuantitativas : la variable toma valores numricos con los que
tiene sentido hacer operaciones aritmticas.
ESCALAS DE MEDIDA de las
variables
ANLISIS EXPLORATORIO DE
LOS DATOS
La distribucin de una variable describe los valores que toma una
variable y la frecuencia de los mismos.
La forma, el centro y la dispersin sirven para conocer la
distribucin de las variables.

Para conocer la forma de las distribuciones se usan las:
Representaciones grficas.
Con la representacin grfica se puede ver si la distribucin es
simtrica o asimtrica y descubrir las observaciones extremas
(atpicas).
Para variables cualitativas, se emplean los diagramas de barras y
los diagramas de sectores.
ANLISIS EXPLORATORIO DE
LOS DATOS
Histogramas.
Las variables cuantitativas a veces toman muchos valores
diferentes, por lo que se suelen agrupar los valores prximos. Los
Histogramas son representaciones grficas por reas. Sobre el eje
de abcisas se marcan los extremos de los intervalos de clase y se
levantan rectngulos de base los intervalos y de altura tal que el
rea del rectngulo sea igual o proporcional a la frecuencia
correspondiente.
Marca de clase es el punto medio de cada intervalo.

Polgono de frecuencias.
Se obtiene uniendo los puntos medios de los lados superiores de
los rectngulos levantados en el histograma de frecuencias.
ANLISIS EXPLORATORIO DE
LOS DATOS
Ejemplo: tipos de familias en Suecia, segn datos Eurostat
1991.Tipos de familia
Tipos de familia Recuento en miles Porcentaje Grados
Parejas sin hijos 1.168 53,50 193
Parejas con hijos 830 38,02 137
H solos con hijos 27 1,24 4
M solas con hijos 158 7,24 25
Total 2.183 100 360
ANLISIS EXPLORATORIO DE
LOS DATOS
1168
830
27
158
0
500
1000
1500
P. sin hijos P. con hijos H. solos con h M.solas con h.
ANLISIS EXPLORATORIO DE
LOS DATOS
Grfico de tallos y hojas.

Se separa cada observacin en un tallo que contenga todos los
dgitos menos el de las unidades y en una hoja el dgito de las
unidades.
se sitan los tallos en vertical y en orden creciente de arriba abajo.
Se traza una vertical a la derecha de los tallos
Repasa todos los datos y sita cada hoja a la derecha de su tallo
Sita otra vez las hojas colocndolas esta vez en orden creciente
desde cada tallo.
ANLISIS EXPLORATORIO DE
LOS DATOS
Ejemplo:
El nmero de operaciones realizadas por los cirujanos de un hospital durante el
ltimo ao han sido: 27, 50, 33, 25, 86, 25, 85, 20, 31, 37, 44, 36, 59, 34 y
28.


2 7 5 5 0 8 2 0 5 5 7 8
3 1 7 6 4 3 1 3 4 6 7
4 4 4 4
5 0 9 5 0 9
6 6
7 7
8 6 5 8 5 6
Medidas de tendencia CENTRAL:
MEDIA, MODA Y MEDIANA.
La Media de la variable x que toma los valores : x1, x2, x3, ..., xn, es:



Si hay N observaciones y cada valor x i se presenta con frecuencia de ni la
media es


El inconveniente de la media es que le afectan los valores extremos.
( )

=
+ + + +
i
n
x
N N
x x x x 1 ...
3 2 1
i i
n x
N
1
Medidas de tendencia CENTRAL:
MEDIA, MODA Y MEDIANA.
La MODA es el valor (o el intervalo) ms frecuente en la
distribucin.
La MEDIANA es el valor que queda en el centro de los datos tras
ordenarlos de menor a mayor.
Cuartiles, deciles y percentiles
El primer cuartil se define como el valor que deja por debajo la
cuarta parte de la distribucin.
El segundo cuartil coincide con la mediana
El tercer cuartil es el valor que tiene por encima el 25% de la
distribucin
El primer decil es el valor de la variable tal que el 10% de las
observaciones son menores que l. (Hay 9 deciles)
El primer centil : 1% del las observaciones son menores que l.
(Hay 99 centiles)
Medidas de tendencia CENTRAL:
MEDIA, MODA Y MEDIANA.
GRAFICOS DE CAJA
a b c d e
a y e = valores mnimo y mximo de la distribucin;
b = primer cuartil de la distribucin
c = mediana de la distribucin ;
d = tercer cuartil de la distribucin
Medidas de dispersin:
Medidas de asimetra.: La asimetra de la distribucin se puede ver
en el histograma, para cuantificarla se usan :
Primer coeficiente de asimetra de Pearson: Se divide la
diferencia entre la media y la moda entre la desviacin tpica.
Segundo coeficiente de asimetra de Pearson: se divide el triple
de la diferencia entre la media y la mediana entre la desviacin
tpica.
Si dan positivo, la asimetra se da a la derecha. Si es nulo no hay
asimetra
Si es negativo hay asimetra a la izquierda. Pueden tener distinto
signo
Medidas de dispersin:
Tercer Coeficiente de asimetra :




Si g 1 > 0 asimetra a la derecha ; si g 1 = 0 distribucin
simtrica; si g 1 < 0 asimetra a la izquierda

Apuntamiento o Kurtosis



C > 3 distribucin ms apuntada que la curva normal (leptocrica)
C = 3 distribucin igual de apuntada que la curva normal (mesocrtica)
C < 3 distribucin menos apuntada que la curva normal (platicrtica)
( )
3
3
1
) (
1
s
x x n
N
g
i i

|
.
|

\
|
=
( )
4
4
) (
1
s
x x n
N
C
i i

|
.
|

\
|
=
Elaboracin de una distribucin de
frecuencias para datos continuos
Determinar la amplitud de variacin de los datos. Dato mayor
menos el dato menor. Esta amplitud es denominada rango (r).
Definir el nmero de clases a utilizar. Generalmente se recomienda
usar entre 5 y 15 clases; esta eleccin es un balance entre el grado
de resumen y la informacin que se pierde. Una regla emprica es
calcular la raz cuadrada de n (nmero de datos) y adaptarla, si
es necesario, a los limites 5 y 15.
Dividir la amplitud de variacin (r) entre k, que es el nmero de
clases, para obtener una amplitud de clase (a). Por lo regular se
recomienda formar intervalos de igual amplitud debido a que los
intervalos desiguales tienden a distorsionar las comparaciones.
Para nuestro ejemplo tenemos que la amplitud de clase es a = r / k
Establecer los intervalos preliminares. Se inicia a partir del dato
menor del conjunto de datos ordenados.
Media o promedio
Mediana
Moda
Comparacin de las MTC
Medidas de Tendencia Central
Medida de tendencia central que se define como
la suma de un conjunto de puntajes dividido entre
el nmero total de puntajes del conjunto:
n
x
n
i
i

=
= X
1
Media o promedio
La media puede considerarse como el centro de
gravedad ya que la suma de las desviaciones de
cada marca con respecto a la media ser siempre
cero.
Media o promedio
n
x f
x
m
i
i i
=
=
1
N
x f
m
i
i i
=
=
1

Donde: _
X = Media o promedio muestral.
= Media o promedio poblacional.
X
i
= Punto medio de dicha clase o marca de clase.
f
i
= Frecuencia de la clase i-sima
n = Nmero total de datos.
N = Nmero total de la poblacin.
Se define como la medida de tendencia central
que corta la distribucin en dos partes iguales.
2
1 +
=
n
Md
Mediana
Se le conoce como una medida de posicin.
La mediana es un punto tal que la mitad de las
observaciones son menores a l y la otra mitad
mayores.
Mediana para datos no agrupados
Mediana
Lm w
f m
f a
n
m +
(
(
(
(

+
|
.
|

\
|
+
=
) 1 (
2
1
~
Mediana para datos agrupados
Donde:
Mediana muestral.
n = Nmero total de elementos en la distribucin.
fa = Suma de todas las frecuencias de clase hasta pero sin incluir a la clase
mediana.
fm = Frecuencia de la clase mediana.
w = Ancho del intervalo de clase.
Lm = Limite inferior del intervalo de clase mediana.
= m
~
= m
~
Es el valor que aparece ms a menudo en la
columna de frecuencia de la tabla.
Mo = puntaje que ms se repite
La moda se encuentra por inspeccin ms que
por clculo.
Moda
La moda requiere slo un conteo de frecuencia,
puede aplicarse a cualquier conjunto de datos
en los niveles de medicin nominal, ordinal o
por intervalos.
La mediana requiere un ordenamiento de los
valores (segn la magnitud). Puede aplicarse a
los niveles de medicin ordinal o por intervalos.
El uso de la media se restringe exclusivamente
a los datos por intervalos.
Comparacin
Localizan la posicin de algn caso en relacin
con el grupo.
Cuartiles: dividen a la distribucin de valores en
4 partes iguales.
Deciles: dividen la distribucin en 10 partes
Percentiles: indican el porcentaje de casos que
caen por debajo de un puntaje.
Medidas de Posicin
Rango
Desviacin Media
Desviacin Estndar
Coeficiente de Variabilidad
Medidas de Dispersin
Rango intercuartlico
Se define como la diferencia entre el puntaje
ms alto y el ms bajo de la distribucin.
Se considera como un ndice preliminar o
aproximado de la variabilidad de una
distribucin.
A mayor rango mayor dispersin.

R = Dato
Mayor
- Dato
Menor
Rango
Rango intercuartlico
Se define como la diferencia entre el tercer
cuartil y el primer cuartil.
Contempla al 50% de los casos con valores
centrales.
Ignora los valores extremos de la distribucin de
valores.
R = Q
3
Q
1


Se define como la media aritmtica de las
diferencias absolutas de cada marca con
respecto a la media.
n
x x
DM
n
i
i
=

=
1
Es una medida de la dispersin alrededor de la
media y se utiliza con fines puramente
descriptivos.
Desviacin Media
Se define como la raz de la media aritmtica de
las desviaciones cuadradas con respecto a la
media.
n
x x
s
n
i
i
=

=
1
2
) (
Representa la variabilidad promedio de una
distribucin de datos.
Cuanto mayor es la dispersin alrededor de la
media tanto mayor es la desviacin estndar
Desviacin Estndar
Se define como la desviacin estndar dividida
entre la media por 100.
Permite comparar a varios grupos en relacin con
su homogeneidad relativa cuando los grupos
tienen medias distintas.
) 100 (
x
s
C
V
=
Coeficiente de variabilidad