Professional Documents
Culture Documents
Contiene:
El programa SPSS (Stadistical Package for the Social Science) es quizá en la actualidad, el paquete de
software más difundido a nivel mundial para el análisis estadístico de datos, La versión actual (V24)
sigue siendo de propiedad de la firma IBM.
El libro de texto Estadística con SPSS está compuesto por tres secciones:
La primera sección contiene las nociones básicas de Estadística; en esta parte el autor presenta
un resumen de los conceptos, definiciones y procesos de cálculo para la obtención de los
estadísticos que describen a un grupo de datos, su representación gráfica, como también los
diferentes métodos de muestreo, y herramientas de estadística inferencial para una población
como también para dos poblaciones.
La segunda sección contiene una detallada descripción, a manera de manual de usuario, de las
distintas opciones y herramientas que dispone el programa SPSS para la organización de datos,
el cálculo de los diferentes estadísticos que describen a un muestra, diversas opciones de
elaboración de gráficos estadísticos, técnicas de muestreo, estadística inferencial en una
población, dos poblaciones y varias poblaciones a través del ANOVA y el modelo de regresión y
correlación bivariable y multivariable.
La tercera sección (en edición separada) contiene 13 prácticas de laboratorio de estadística con
SPSS; el desarrollo académico de estas actividades permitirá al estudiante aplicar los conceptos,
definiciones y procesos de la Estadística Descriptiva e Inferencial, como también adquirir
destrezas y habilidades en el manejo del paquete estadístico.
El material desarrollado en las tres secciones es acorde con la malla curricular y el syllabus académico
de la asignatura de Estadística en los niveles I y II de las carreras de Contabilidad y Auditoría,
Administración de Empresas, Administración Pública, Economía, Marketing, Sicología y otras. Al igual
que constituye un importante material en los estudios de posgrado para las maestrías en Empresas,
Finanzas, Educación, etc.
El autor anticipa su agradecimiento a docentes y estudiantes que hagan uso de este material,
solicitando además remitir sus comentarios y sugerencias para futuras ediciones a
danielherrera_1960@hotmail.com
Hacia el año 3000 A.C. los babilonios usaban ya pequeñas tablillas de arcilla para recopilar datos
sobre la producción agrícola y de los géneros vendidos o cambiados mediante trueque.
Los egipcios fueron los primeros en analizar los datos de la población y renta del país, mucho antes
de construir las pirámides en el siglo XXXI A.C.
Los libros de “Números” y “Crónicas” incluyen, en algunas partes, cierta información que puede
considerarse como Estadística:
En China existían registros numéricos similares con anterioridad al año 2000, anterior a la Era
cristiana.
Los griegos clásicos realizaban censos, cuya información se utilizaba hacia el año 594 A.C. para cobrar
impuestos.
El Imperio romano fue el primer gobierno que recopiló una gran cantidad de datos sobre la población,
superficie y renta de todos los territorios bajo su control, para esto basta recordar lo que dicen las
Escrituras sobre el censo a realizarse previo al nacimiento de Jesús.
Durante la edad media sólo se realizaron algunos censos exhaustivos en Europa. Los reyes
carolingios, Pipino el Breve y Carlomagno ordenaron hacer estudios minuciosos de las propiedades de
la Iglesia en los años 758 y 762, respectivamente.
John Graunt.-
Hijo de un tapicero, nació en Londres de 1620, fue desde muy joven aprendiz de un comerciante de
mercancía y, en esta actividad se mantuvo toda su vida. De formación autodidacta, y en base a
esfuerzos propios, adquirió algunos conocimientos sobre todo de latín y francés. No tuvo una
formación académica ni tampoco autodidacta en lo que a matemática se refiere, situación que de
haberse dado habría sido de gran ayuda en la publicación de su obra sobre los registros de
mortalidad; sin embargo el análisis de Estadísticas nació en Londres, en el año de 1662. John Graunt
publicó “Observaciones Naturales y políticas sobre los registros de Mortalidad”.
Para ese entonces, Inglaterra contaba ya con una población de cien mil habitantes. Esta ciudad tenía
ya problemas propios de una superpoblación, dificultades en los servicios de salud, educación etc.,
que fueron la causa que originó el registro de nacimientos y muertes, registros que después de la
epidemia de 1603, fueron realizados semanalmente. Llegaron a formar con el tiempo, material de
gran utilidad para la previsión de eventos futuros.
1
Con la colaboración académica de Nelson Herrera Aráuz
El Análisis de Graunt se basó en comparaciones porcentuales año tras año, en lo referente a
nacimientos, muertes por accidentes, muertes por enfermedades, suicidios etc. observando que
eventos mortales mantenían valores constantes y que se presentaban con sorprendente regularidad.
También llegó a concluir, que el número de nacimiento de los varones era superior al de mujeres, sin
embargo, en ese entonces las labores destinadas a los hombres, entre estas la guerra, tendrían un
mayor riesgo, por lo que, a la edad de casarse, el número de varones y mujeres se igualaba por lo que
la monogamia debía ser la forma de vida que la misma naturaleza señalaba.
William Petty.-
La publicación de John Graunt fue avalada académicamente por Sir William Petty (1623-1687),
profesor de la Universidad de Oxford, y, más tarde médico del Ejercito inglés, calificó a la Estadística,
como la “Aritmética Política” y la definió como:
El arte de razonar por medio de cifras y gráficas, acerca de aspectos relacionados con el gobierno.
De ahí que la palabra Estadística se relacione con la palabra Estado.
Sin embargo, el verdadero aporte de Petty al desarrollo de la Estadística, fue tratar de cuantificar las
variables que conforman las ciencias sociales y, evitar así el uso de valores cualitativos y palabras
comparativas en la descripción de estas variables.
Edmund Halley.-
Halley, como astrónomo, dedujo que un cometa visto algunas décadas anteriormente, obedecía a un
fenómeno cíclico y predictible. Dedicó toda su vida a estudiarlo y, con la ayuda del gran matemático
inglés Isaac Newton, pudo calcular el año que retornaría. Desgraciadamente, murió algunos años
antes de que el cometa reaparezca, exactamente en el lugar del cielo y la fecha previstos.
Halley era un hombre muy versátil y no solo se preocupó de la astronomía, fue el creador de las tablas
de esperanzas matemáticas, empleadas para el cálculo de las pólizas del seguro de Vida, incluso
investigó el lugar exacto del desembarco de Julio César en Gran Bretaña.
En Francia, el rey Luis XIV, por esos mismos años, consiguió que la patria de los galos marque un siglo
de hegemonía. El gran asesor del Rey Sol Jean Baptiste Colbert que fue aprendiz de pañero, se
preocupó de que la economía de Francia se controle mediante los números; incluso, formó una
escuela económica llamada Colbertismo, que significa la protección del Estado a la producción
industrial.
Colbert, como asesor de Luis XIV se dio cuenta de la importancia de los registros numéricos
almacenados para manejar las importaciones y exportaciones del reino, es más, con los matemáticos
Huygens, holandés, y Leibniz, alemán sostuvo importantes diálogos científicos y fue convencido por
estos, en la necesidad de crear para la gloria de Francia el Observatorio Real y la Academia de
Ciencias de París.
L. T. Grosset.-
Fue el creador de la Distribución t, siendo empleado de una cervecería irlandesa a principios de 1900.
Desaprobaba el hecho de que las personas publicaran sus trabajos usando sus nombres verdaderos,
por lo que escribió acerca de las propiedades matemáticas de las distribuciones para pequeñas
muestras, y publicó bajo el seudónimo de student.
Ronald Fisher.-
Sir Ronald Fisher nació en Londres en el año de 1890 y murió en la misma ciudad en el año de 1962,
fue un científico eminente en dos campos: La Genética y la Estadística. Alrededor de los años veinte
de ese siglo, se dedicó al diseño de experimentos en agricultura. De estos trabajos nació una de las
herramientas más importantes en la toma de decisiones, el Análisis de Varianza, mediante la
comparación de varianzas entre muestras y en el interior de las mismas con valores críticos de una
distribución probabilística creada por el mismo.
Abraham Wald.-
Matemático alemán nacido en 1902, comenzó sus trabajos de investigación estadística motivado por
las acuciantes necesidades de estudios matemáticos que trajo consigo la Segunda Guerra Mundial,
murió en un accidente aéreo en el año de 1950, entre sus estudios y aportes importantes para la
Estadística, se tiene el Análisis Secuencial y la teoría de toma de decisiones.
A principios del siglo XX el escritor e historiador inglés HG Wells, comentó cierto día que el
aprendizaje y conocimiento de la estadística será tan necesario, como la aptitud y el gusto por la
lectura. Tómese en cuenta que en la época de este comentario aún no había florecido el desarrollo
industrial en el mundo entero; sin embargo se intuía ya la necesidad de establecer mecanismos de
control y herramientas para tomar decisiones dentro del mundo industrial.
Uno de los aportes más importantes en la Estadística, son las contribuciones realizadas por W.
Eduard Deming, a mediados del siglo anterior (1950). Este brillante estadístico, desarrolló modelos
para el Control de Calidad de los procesos productivos, basándose en la teoría de las desviaciones
alrededor de una medida de centralización.
En resumen:
NOCIONES
BÁSICAS DE
ESTADÍSTICA
PRIMERA SECCIÓN
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
pág. 1
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
8. TAMAÑO DE LA MUESTRA................................................................................................... 33
8.1. FACTORES QUE INFLUYEN EN EL TAMAÑO DE LA MUESTRA ................................................ 33
8.2. TAMAÑO DE LA MUESTRA PARA ESTIMAR LA MEDIA POBLACIONAL ................................. 33
8.3. TAMAÑO DE LA MUESTRA PARA ESTIMAR LA PROPORCIÓN POBLACIONAL ....................... 34
pág. 2
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
pág. 3
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
1. DEFINCICIONES BÁSICAS
Estadística Inferencial: Estudia los métodos y herramientas utilizadas para definir características y
propiedades de una población, basándose en el análisis de una muestra tomada de dicha población.
1.3. POBLACIÓN
En resumen, la población estadística es un conjunto universal, puesto que contiene a todos los
elementos de su especie.
1.4. MUESTRA
1. Un grupo de 100 electores, 5 de cada uno de los 20 recintos electorales del cantón; escogidos
aleatoriamente.
pág. 4
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
Resulta imposible analizar todos elementos (población) debido al tiempo de análisis, costos, etc.
Veamos un ejemplo:
Si se trata de establecer las causas por las que los niños de un cantón de la Sierra
Ecuatoriana presentan signos de desnutrición; sería imposible reunir a todos los niños de
este lugar, medir su estatura, su peso, averiguar la forma de alimentación, los ingresos
familiares de todos ellos, etc. Es mucho más sencillo, tomar una muestra de esta población y
sobre esa muestra realizar el análisis estadístico correspondiente que permitirá a su vez
deducir las causas de desnutrición de dicha población.
Se trata de determinar la resistencia de una bombilla eléctrica: para esto, se debe someter a
este elemento a una serie de sobrecargas eléctricas. Esta sobrecarga, obviamente va a
destruir o inutilizar dicho elemento; por esta razón, no será conveniente ensayar a todos los
elementos (población), sino solamente a algunos de ellos, es decir a una muestra.
La muestra estadística debe ser tomada con un criterio apropiado, de manera que las inferencias
que sobre la población de dicha muestra se hagan, sean confiables e idóneas.
Datos cualitativos.- Tal como: el género, la religión, el estado civil, el lugar de nacimiento, etc.
Es decir: la variación de estas variables se expresa con palabras y no con números.
Para el trabajo estadístico es necesario expresar la variación de estas variables mediante conteo,
razón proporcional o porcentaje. Veamos algunos ejemplos:
2. Dentro de esta población se estima que el 75% es de religión católica; mientras que el 25%
restante pertenece a otras religiones.
3. Datos proporcionados por el registro civil del cantón indican que el 35% de la población es
soltera, 45% de la población está casada y el 20% restante, corresponde a viudos, divorciados
y en unión libre.
pág. 5
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
Datos cuantitativos.- Son aquellos, cuya variación puede presentarse mediante números;
ejemplo: la estatura de un grupo de niños, el saldo promedio de cuentas corrientes de un banco,
la duración o vida útil de un repuesto eléctrico, etc.
Variable Discreta
Son aquellos cuya variación numérica se representa por números enteros; ejemplo: el número
de autos vendidos el año anterior, el número de personas que migraron hacia otros países, el
número de matrículas que emitió la Universidad Tecnológica Equinoccial el semestre pasado,
etc.
Variable Continua
Los datos de variable continua pueden asumir cualquier valor: entero o decimal, dentro de un
rango o intervalo específico; ejemplo de estas variables tenemos: la estatura y el peso de un
grupo de estudiantes de la costa ecuatoriana, el diámetro de un grupo de tornillos fabricados en
determinado tiempo, el peso de 20 enlatados de atún, etc.
Los estadísticos son valores numéricos obtenidos mediante técnicas y métodos apropiados que
indican las características de la muestra; ejemplo: la media aritmética, la mediana, la desviación
estándar, etc.
Mediante los estadísticos de muestra y con los métodos de la estadística inferencial se deducen los
parámetros de la población; es decir hablar de estadísticos y parámetros es referirse a valores
propios y característicos que representan a la muestra y población, respectivamente.
Los estadísticos y los parámetros, se representan con letras latinas y griegas respectivamente; el
cuadro que se indica a continuación describe la simbología utilizada para los estadísticos y
parámetros más utilizados en nuestro estudio:
pág. 6
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
Una vez que los datos de una muestra estadística han sido recolectados es conveniente organizarlos
de alguna manera; existen diversos métodos para la organización de los datos, entre ellos se
encuentran los siguientes:
Cuando la muestra no es muy numerosa, es posible ordenar los datos en orden creciente o
decreciente; ese ordenamiento permitirá visualizar los valores extremos y determinar en forma
inmediata el rango, es decir la diferencia entre el mayor y el menor de los valores de la muestra.
Cuando la variable se presenta en forma cualitativa, por ejemplo el sexo de una persona, los datos
podrán organizarse en una tabla en la que se indique los casos registrados para cada uno de los
valores de la variable cualitativa; se podrá también establecer el porcentaje de frecuencia en cada
una de estas variables, como también el porcentaje acumulado. El programa SPSS entrega como
resultado una tabla como la que se indica a continuación:
Es conveniente que estas tablas presenten además, a manera de resumen, un gráfico estadístico
representativo; para variable cualitativa existen dos tipos de gráficos muy comunes:
El gráfico circular, en cambio toma un círculo y distribuye su área (360º) en forma proporcional a la
frecuencia de la variable cualitativa; resulta muy conveniente cuando la variable es binomial, es decir
presenta dos resultados (Sexo: masculino, femenino); (Existencia: Vivo, muerto), etc.
A continuación se presenta el gráfico estadístico de barras verticales y de sector circular para los
datos de la tabla:
pág. 7
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
Tablas cruzadas
Una tabla cruzada, tabla de contingencia o tabla bivariable es una estructura tabular que permite
registrar los casos que ocurren en dos variables; a continuación se expone algunos ejemplos de
tablas cruzadas:
Tabla de contingencia Sexo del empleado * Nivel Académico
Recuento
Nivel Académico
Total
Posgrado Secundaria Superior
Sexo del empleado Femenino 7 10 8 25
Masculino 10 7 18 35
Total 17 17 26 60
pág. 8
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
Esta estructura tabular, comparable con la de una matriz, registra las variables en sentido horizontal
y vertical; no existe restricción en cuanto a la ubicación de las variables, inclusive, el programa SPSS
podrá pivotar la tabla, es decir presentarla en sentido contrario al original, tal como sucedería con la
transpuesta de una matriz.
Cuando la variable estadística se presenta de manera cuantitativa, sea esta discreta o continua,
se puede organizar la información mediante tablas de frecuencia, tablas cruzadas y tablas de
frecuencia por intervalos.
Veamos un ejemplo de cómo organizar los datos que se indican la antigüedad (en años) de
los empleados y funcionarios de la Agencia Nacional de Investigaciones:
pág. 9
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
Junto con el histograma se puede graficar el polígono de frecuencias, para lo cual es necesario
agregar en los extremos de la distribución dos intervalos de frecuencia cero, llamados intervalos
ficticios; el polígono de frecuencias se obtiene mediante un trazo continuo desde el intervalo ficticio
inferior y por los puntos medios superiores de cada una de las barras que conforman el histograma,
finalizando en el intervalo ficticio superior de la distribución de frecuencia.
Los valores que registra la variable cuantitativa continua presentan muchos casos, lo que conlleva a
elaborar tablas de frecuencia que no resultan ser muy prácticas en su manejo; en estos casos es
conveniente agrupar a los valores en intervalos. De esta manera, se obtendrán tablas de frecuencia
agrupadas en una escala de valores.
Por otro lado, se podrá también elaborar tablas cruzadas tomando en cuenta a variables
cuantitativas continuas entre sí; o una variable cuantitativa continua y una variable discreta o una
variable cualitativa.
INTERVALO INGRESOS
INTERVALO EDAD TOTAL GENERAL
< 1000 1000 - 2000 2000 - 3000
< 30 5 7 10 22
30 - 40 4 19 13 36
40 - 50 6 16 6 28
50 - 60 9 18 13 40
> 60 2 13 9 24
TOTAL 26 73 51 150
GENERAL
2.5. DISTRIBUCIONES DE FRECUENCIA POR INTERVALOS O CLASE
Cuando los datos son numerosos es conveniente organizarlos en una tabla de distribución de
frecuencias; esta tabla agrupa los datos en diversas clases, intervalos o categorías y permite obtener
la frecuencia absoluta, la frecuencia relativa y la frecuencia acumulada; la tabla adjunta es el modelo
estándar de esta organización de datos.
∑=
pág. 10
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
Rango
El rango de una muestra es la diferencia que existe entre el valor máximo y el valor mínimo del grupo
de datos a organizar.
Intervalos o Clases
Los datos recogidos se agrupan en intervalos o categorías, a estos grupos se los llama comúnmente
intervalos o clases; se recomienda que la muestra se la divida entre cinco (mínimo) y quince
intervalos (máximo).
Ancho de Clase
El ancho de clase ( ) es un valor que se obtiene al dividir el rango de la muestra para el número de
intervalos escogidos para la formar la distribución de frecuencias.
Como su nombre lo indica, son valores que limitan el intervalo, habrá entonces un límite inferior y
un límite superior, los límites de cada uno de los intervalos que forman la distribución de frecuencia
se calculan de la siguiente manera:
1. Se toma el valor mínimo, este valor será el límite inferior del primer intervalo, a este valor, se
suma el ancho de clase previamente calculado y se obtendrá el límite superior del primer
intervalo.
2. Para el cálculo de los límites de los demás intervalos, se asume como intervalo inferior el valor
del intervalo superior del intervalo anterior; a este valor, se suma el ancho de clase para obtener
el límite superior de este intervalo. El límite superior del último intervalo, será el valor máximo
de la muestra.
Frecuencia
Frecuencia Relativa
La frecuencia relativa ( ) de cada uno de los intervalos, es el cociente que se obtiene al dividir la
frecuencia de cada intervalo para el total de la muestra. La suma de las frecuencias relativas de todos
los intervalos, es igual a la unidad. Si a cada uno de los valores de la frecuencia relativa se multiplica
por 100 se tendrá el porcentaje de observaciones que se encuentran contenidas en cada uno de los
intervalos, obviamente la suma de estas frecuencias porcentuales, será igual a 1 o 100.
pág. 11
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
Frecuencia Acumulada
La frecuencia acumulada del primer intervalo será igual a la frecuencia del intervalo, la frecuencia
acumulada de los demás intervalos, será igual a la frecuencia acumulada del intervalo anterior más la
frecuencia del intervalo; la frecuencia acumulada del último intervalo, será igual al tamaño de la
muestra.
Marca de Clase
La marca de clase ( ), es el valor representativo de cada uno de los intervalos, este valor es igual al
promedio de los límites de cada uno de los intervalos.
12 10 9 11 15 16 9 10 10 11
12 13 14 15 11 11 12 16 17 17
16 16 15 14 12 11 11 12 12 11
12 15 13 14 16 15 18 19 18 10
11 12 12 11 13 13 15 13 11 12
Observe que se han agregado dos intervalos ficticios, al inicio y al final de la tabla; estos intervalos
ficticios de frecuencia cero permitirán construir el polígono de frecuencia.
pág. 12
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
pág. 13
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
3. ESTADÍSTICA DESCRIPTIVA
Una vez que los datos han sido organizados en una tabla de distribución de frecuencia y
representados gráficamente, corresponde ahora buscar ciertos valores que representen a la
muestra. A estos valores representativos se conoce como Medidas de Centralización, ya que estos
valores se ubican alrededor de la parte central de la misma.
Se estudiarán las siguientes Medidas de Centralización: Media Aritmética, Mediana, Moda, para
datos no agrupados y para datos agrupados en distribuciones de frecuencia simple y por intervalos;
por otro lado se llaman Cuantiles a las medidas de posición o ubicación de los datos de la muestra
previamente ordenada.
MEDIA ARITMÉTICA
Sean:
Los valores de una muestra de tamaño , la media aritmética (̅) de esta muestra es:
̅
MEDIANA
La mediana (̃), es el valor central de una muestra de datos previamente ordenados, es decir:
Si la muestra siguiente:
Si la muestra:
Está ordenada, la mediana será la media aritmética entre y , dado que la muestra es par.
MODA
La moda ( ̂) es el valor que se presenta con mayor frecuencia; en una distribución de frecuencia
puede haber más de una moda o simplemente no tiene moda; si la distribución tiene una sola moda
se denomina unimodal, bimodal, etc.
Las definiciones descritas hasta aquí permiten la determinación de los estadísticos de tendencia
central cuando el número de datos es pequeño; cuando los datos se encuentran organizados en
distribuciones de frecuencia simple o en distribuciones de frecuencia por intervalos, se deben aplicar
otras expresiones de cálculo.
pág. 14
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
Al organizar los datos en una distribución de frecuencias simple, se debe tomar en cuenta:
… … … …
Una vez organizada la tabla de distribución de frecuencia simple, se determina los estadísticos de
tendencia central de la siguiente manera:
MEDIA ARITMÉTICA
∑
̅
∑
MEDIANA
( )
MODA
La moda es el valor que corresponde al intervalo que presenta la mayor frecuencia; pude darse el
caso de que existan dos o más intervalos que contengan la máxima frecuencia entonces la
distribución de frecuencias será multimodal.
Al organizar los datos en una distribución de frecuencia por intervalos s debe tomar en cuenta:
MARCA DE Frecuencia
INTERVALO Frecuencia ( )
CLASE ( ) Acumulada
… … … … …
pág. 15
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
Una vez organizada la tabla de distribución de frecuencia simple, se determina los estadísticos de
tendencia central de la siguiente manera:
MEDIA ARITMÉTICA
∑
̅
∑
MEDIANA
( ∑ )
̂
El intervalo que contiene a la mediana es aquel que acumula por lo menos a la mitad de los
datos.
MODA
̂ ( )
El intervalo que contiene a la moda es aquel que presenta la mayor frecuencia absoluta.
pág. 16
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
Las medidas de posición son observaciones de la muestra que ocupan posiciones específicas una vez
que esta se ha ordenado; estas medidas se conocen en general como Cuantiles.
.............................
̃
Muestra ordenada dividida en 4 partes, cada una de esta partes se denomina Cuartil
.............................
Muestra ordenada dividida en 5 partes, cada una de esta partes se denomina Quintil
..............................
Entonces:
La Mediana es la medida de posición que divide a la muestra en dos partes, cada una de las
partes representa el 50%; de manera que la mediana está ubicada sobre el 50% más bajo de la
muestra.
Los Cuartiles son medidas de posición que dividen a la muestra en cuatro partes, cada una de las
partes representa el 25%; de manera que:
Los Quintiles son medidas de posición que dividen a la muestra en cinco partes, cada una de las
partes representa el 20%; de manera que:
pág. 17
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
Los Deciles son medidas de posición que dividen a la muestra en diez partes, cada una de las
partes representa el 10%; de manera que:
Los Percentiles o simplemente Centiles son medidas de posición que dividen a la muestra en cien
partes, cada una de las partes representa el 1%; de manera que:
El primer cuartil ( ), que se ubica sobre el 25% más bajo de la muestra, equivale entonces al
percentil 25 ( ).
El segundo quintil ( ), que se ubica sobre el 40% más bajo de la muestra, equivale entonces al
percentil 40 ( ).
El sexto decil ( ), que se ubica sobre el 60% más bajo de la muestra, equivale entonces al
percentil 60 ( ).
Una vez que se han ordenado los datos, los Cuantiles se los encuentra en la ubicación específica,
tomando en cuenta que un cuantil se ubica en la posición que resulta de aplicar la siguiente
expresión:
( ) ( )
Dónde:
pág. 18
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
Cuando los datos se encuentran agrupados en una distribución de frecuencias por intervalos, los
Cuantiles se determinan aplicando la siguiente expresión:
( ∑ )
( ∑ ) ( ∑ ) ( ∑ )
En clases anteriores se definieron algunas medidas de centralización, entre ellas, la más utilizada: la
media aritmética; sin embargo, el análisis estadístico requiere de una medida que exprese la
variabilidad de los datos con respecto a alguna medida de centralización; usualmente la media; en
otras palabras: es necesario determinar un valor estadístico que represente la variación de los datos,
tomando como punto de referencia de la variación la media aritmética.
3.3.1. RANGO
Como se recordará, el Rango permite, junto con el número de intervalos, determinar el ancho de
clase.
Sea:
pág. 19
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
las diferencias, de cada uno de los valores y la media aritmética, dividida para el número de términos
de la serie de datos, es decir:
∑( ̅)
√
Las medidas de dispersión son proporcionales con su magnitud; un valor pequeño indica una
pequeña desviación, mientras que un valor grande indica que existe una gran variabilidad o
dispersión.
3.3.3. VARIANZA
La varianza mide la variabilidad de los datos, esta medida estadística es de gran utilidad para el
análisis comparativo entre dos o más poblaciones.
Se define al rango intercuartil como la diferencia numérica entre el tercer cuartil y el primer cuartil,
es decir:
pág. 20
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
Para elaborar el diagrama de caja es necesario: el valor máximo, el valor mínimo, la mediana el
primer cuartil y el tercer cuartil; estos valores se colocan en una recta horizontal, tal como se indica
en la siguiente figura:
Una vez que se dispone de las medidas de tendencia central y las medidas de dispersión que
describen a un grupo de datos, sobre todo, la media aritmética y la desviación estándar, es
conveniente determinar además, una medida que exprese la simetría o asimetría de los datos.
Es decir: la media aritmética, la mediana y la moda son iguales, y se ubican en la parte central del
histograma de frecuencias.
A las muestras simétricas se las conoce también como muestras asesgadas; es decir, que no tienen
sesgo.
pág. 21
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
El sesgo es una forma cuantitativa de expresar la asimetría de una curva, este estadístico se
determina con las siguientes expresiones:
̅ ̂ ( ̅ ̃)
Que se conocen como Primer y segundo coeficiente de Pearson; se puede observar que el primer
coeficiente toma en cuenta la moda y el segundo coeficiente toma en cuenta a la mediana de la
distribución de frecuencias.
Sesgo a la derecha.-
Sesgo a la izquierda.-
pág. 22
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
4. DISTRIBUCIONES DE PROBABILIDAD
Se dice que un experimento es aleatorio, cuando no se conoce con certeza el resultado de dicho
experimento; sin embargo se conocen todos los resultados posibles de dicho experimento.
A pesar que estos ejemplos giran en torno a los juegos de azar, esto sirvió como material de trabajo
para la elaboración de un marco teórico matemático muy importante como es el cálculo de
probabilidades; dentro de la administración podemos citar los siguientes ejemplos como
experimentos aleatorios:
Se llama Espacio Muestral al conjunto finito formado por todos los resultados posibles (eventos) de
un experimento aleatorio.
( )
( )
( )
pág. 23
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
( ) ( )
Con lo que se puede expresar que:
( ) ( )
Cuando el número de casos favorables de la ocurrencia de un evento o el total de casos resulta difícil
de determinar, es conveniente recurrir a las técnicas de conteo establecidas en el Análisis
Combinatorio.
Sean A y B dos eventos, la probabilidad de ocurrencia de los dos eventos está dada por:
( ) ( ) ( ) ( )
Si A y B son independientes:
( ) ( ) ( )
Evento condicional:
( )
( )
( )
Recordemos que el Espacio muestral es el conjunto de todos y cada uno de los valores que puede tomar
una variable aleatoria; dicho en otras palabras, el Espacio muestral reúne a todos los resultados posibles
de un experimento aleatorio.
Si a cada uno de los valores del Espacio muestral, le hacemos corresponder su respectiva probabilidad de
ocurrencia, a esta correspondencia le llamaremos Distribución de probabilidad o Función de Probabilidad
o simplemente o Distribución Probabilística, es decir:
pág. 24
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
Una Distribución de Probabilidad, se puede representar de dos maneras: mediante una tabla de datos o
mediante un gráfico denominado histograma.
0,35
( ) 0,3
1 0.10
2 0.15 0,25
3 0.30 0,2
4 0.18
5 0.12 0,15
6 0.15
0,1
0,05
0
1 2 3 4 5 6
Un evento está bajo Distribución Binomial, si cumple con las siguientes condiciones:
( ) ( )
Dónde:
pág. 25
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
La distribución de probabilidad de Gauss o distribución Normal, está dada por la siguiente ecuación:
( )
Para mejor manejo de la ecuación de Gauss, se procede a tipificar la variable, haciendo el siguiente
cambio de variable:
La gráfica de una distribución normal, se asemeja a una campana, por eso se la conoce como la
campana de Gauss.
La curva es suave, unimodal y simétrica, entonces: la media, la mediana y, la moda coinciden en el eje
de simetría.
En sentido horizontal, la curva se extiende hacia el infinito, en los dos sentidos; sin embargo, con la
tipificación de la variable z, la distribución normal tiene dominio entre ]-4,4[
pág. 26
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
La curva de distribución normal queda totalmente identificada, mediante dos parámetros: la media
aritmética y la desviación estándar.
El área total de la curva normal, representa el 100% de probabilidad de dicha variable; dada la
simetría, el eje divide a la curva en dos áreas, representa cada una por el 50% del área total.
( )
Con estas características se tiene que:
La probabilidad de que una variable aleatoria que está distribuida normalmente asuma un valor entre
dos puntos cualesquiera, es igual al área bajo la curva normal entre estos dos puntos.
Mediante la distribución normal, se pueden calcular probabilidades para eventos de variable continua,
para este cálculo se deberá contar con:
Media aritmética:
Desviación estándar:
pág. 27
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
5. MÉTODOS DE MUESTREO
5.1. MUESTRA
Este factor de corrección siempre será menor que la unidad ( ) y depende del tamaño de la
población y del tamaño de a muestra.
La muestra estadística debe ser tomada con un criterio apropiado de manera que las inferencias que
sobre la población de dicha muestra se hagan sean confiables e idóneas.
Este criterio se resume en que todos los elementos de la población deben tener la misma
probabilidad de ser incluidos en la muestra; este criterio se cumple cuando los elementos de la
población que van a ser parte de la muestra son tomados al azar, el muestreo al azar se conoce
también como muestreo aleatorio.
Dentro del muestreo aleatorio existen varios métodos de muestreo, en forma resumida se tiene:
Muestreo Aleatorio simple.- Es el método de muestreo más común, consiste en seleccionar al azar,
uno a uno, los elementos de la población que van a formar parte de la muestra; el criterio del azar se
establece el momento en que todos los miembros de la población tienen la misma probabilidad de
ser elegidos como parte de la muestra. Una forma de realizar un muestreo aleatorio simple es
numerar previamente a los elementos de la población y luego, con la ayuda de una tabla de números
aleatorios escoger al azar los elementos de la muestra.
pág. 28
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
6. DISTRIBUCIÓN DE MUESTREO
Con la media aritmética y la proporción de muestras de diferente tamaño se pueden formar las
denominadas distribuciones muestrales, entonces podrán existir:
Muestras grandes.
Muestras pequeñas.
Esta clasificación se debe a la experiencia estadística que señala que se considera como muestra
grande cuando esta contiene al menos 30 elementos, si el tamaño de la muestra es menor a 30, se
considera como muestra pequeña.
Este es uno de los temas más importantes en la estadística inferencial, este teorema se enuncia de la
siguiente manera:
Se define al error de muestreo como la diferencia entre los valores de los parámetros poblacionales y
los estadísticos de una muestra; este error es inversamente proporcional al tamaño de la muestra, es
decir mientras mayor sea el tamaño de la muestra menor será el error que se presenta en el
muestreo.
A continuación se presentan algunas fórmulas que permiten determinar el error de muestreo para
las siguientes distribuciones muestrales.
√
Donde:
pág. 29
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
( )
√
Donde:
El caso de pequeñas muestras deberá tomarse en cuenta que los datos ya no tienen el
comportamiento de una distribución normal; deberá entonces utilizar la distribución , de Student,
tal como se estudiará más adelante.
pág. 30
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
7.1. INTRODUCCIÓN
La Estimación es una herramienta estadística que permite: partiendo del análisis de los estadísticos
de una muestra deducir los parámetros de una población; siendo las estimaciones más usuales: la
media poblacional y la proporción poblacional.
Una estimación por intervalos especifica un rango dentro del cual está el parámetro desconocido;
este intervalo con frecuencia va acompañado de una afirmación sobre el nivel de confianza que se
da sobre su probabilidad de ocurrencia, por esta razón a este intervalo se lo conoce también como
intervalo de confianza (IC)
En la práctica, es común tomar como nivel de confianza valores tales como el 99%, el 95% y el 90%;
en realidad no hay nada de especial en estos valores, por lo que el nivel de confianza puede ser
cualquier valor.
1. Se requiere conocer si la población se encuentra bajo una Distribución Normal; sin embargo,
esta información no siempre está disponible.
2. En términos estadísticos, se considera que una muestra es grande cuando su tamaño es mayor o
por lo menos igual a 30, entonces de acuerdo con el Teorema del Límite Central que dice: “Si
una muestra es grande, entonces está bajo la Distribución Normal”.
Muestras grandes.-
̅ ̅
Donde:
pág. 31
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
Cuando el tamaño de la población es conocida se debe multiplicar al error estándar de la media por
el factor de corrección de población finita, este factor es igual a:
Muestras pequeñas.-
Cuando los datos provienen de una Distribución Normal, la desviación estándar de la población es
desconocida y si el tamaño de la muestra es pequeño ( ), entonces se debe trabajar con la
distribución t, conocida también como la Distribución de Student; en estos casos, la media
poblacional se estima como:
̅ ̅
Donde:
Donde:
Donde:
( )
√
pág. 32
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
8. TAMAÑO DE LA MUESTRA
Por otro lado, el tamaño de la muestra depende además de la estimación del parámetro que se va a
realizar, entonces se tiene como factores particulares:
̅ ̅
Dónde:
̅
√
Por otro lado, el error de estimación de la media poblacional , es la diferencia entre la media
poblacional y la media de la muestra entonces:
̅
√
Despejando se tiene:
( )
pág. 33
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
̅ ̅
Dónde:
̅ ̅
√
√
Despejando se tiene:
( )
Dónde:
( )
√
( )
√
( )
√
pág. 34
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
Despejando se tiene:
( )
Dónde:
( )
√ √
( )
√ √
Despejando se tiene:
( )
[ ( ) ( )]
pág. 35
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
9.1. INTRODUCCIÓN
Al igual que en la estimación de los parámetros poblacionales, en este tema se realizarán las
siguientes pruebas de hipótesis:
9.2. PROCESO
Básicamente el método de pruebas de hipótesis es el mismo para este tipo de pruebas, la diferencia
entre una y otra prueba está en la determinación del estadístico de prueba y la distribución
estadística (Normal o t) que respalden dicha prueba.
1. Planteamiento de la hipótesis
Se deben plantear dos hipótesis: la Hipótesis Nula (Ho) que es un enunciado o afirmación que se hace
sobre alguna característica de la población, y la Hipótesis Alternativa (H1) que se plantea como la
negación de la hipótesis nula.
En ocasiones las hipótesis nula y alternativa vienen como parte del enunciado del problema.
La selección del tipo de prueba depende del sentido de la desigualdad expresada en la hipótesis
alternativa.
Para pruebas de hipótesis de medias, con poblaciones bajo la Distribución Normal, o de tamaño
grande o con desviación poblacional conocida, el estadístico de prueba es:
pág. 36
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
̅
̅
Para pruebas de hipótesis de medias, con poblaciones bajo Distribución Normal, de tamaño pequeño
y con la desviación estándar de la población desconocida, el estadístico de prueba es:
̅
̅
Para pruebas de hipótesis sobre la proporción o fracción poblacional, se asume que bajo la
Distribución Normal, entonces el estadístico de prueba es:
Dependiendo del nivel de significancia escogido, como también del tipo de prueba se determina el
valor crítico de la prueba ( );
( )
( )
5. Toma de decisión
Se define como p value al mínimo valor del nivel de significancia con el que se rechaza la
hipótesis nula; entonces la regla de decisión es:
El programa SPSS representa al p value como sig. bilateral (nivel observado significancia de
dos extremos).
6. Conclusión de la prueba
pág. 37
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
10.1. INTRODUCCIÓN
En los temas anteriores se realizaron deducciones de una población en base del análisis de una
muestra tomada de dicha población; en este tema se tratará de establecer herramientas estadísticas
que permitan establecer estimaciones de la diferencia que existe entre los parámetros de la
población, y comprobar hipótesis acerca de las semejanzas o diferencias que presentan las dos
poblaciones.
Por otro lado, es muy importante conocer la forma como se han tomado las muestras de las dos
poblaciones que intervienen en el análisis estadístico; estas muestras pueden ser:
Por pares: Las observaciones o elementos de la muestra de la primera población se toman en forma
correspondiente con los elementos de la segunda población; un ejemplo característico del muestreo
por pares se denomina “antes y después”.
Vamos a revisar la diferencia que existe entre los parámetros de dos poblaciones, así podremos
estimar:
La diferencia entre los salarios promedio de hombres y mujeres cuando realizan el mismo
trabajo.
Cuando el tamaño de cada una de las muestras tomadas de las dos poblaciones es grande, es decir:
(̅ ̅ ) ̅ ̅
Donde:
pág. 38
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
̅ ̅ √
Si las varianzas de las poblaciones no se conoce se deberá utilizar las varianzas de la muestra, por lo
que la expresión anterior se transforma en:
̅ ̅ √
Recuerde que el interés de este capítulo es estimar la diferencia que existe entre las medias
poblacionales de dos poblaciones, no es el de determinar el valor de las diferencias entre las medias
poblacionales.
Cuando las muestras tomadas de cada una de las poblaciones son pequeñas, es decir si:
Si existen evidencias de que las varianzas poblacionales son iguales, a pesar de no conocerlas se debe
determinar la varianza común ponderada; en función de las varianzas muestrales y tomando como
peso el tamaño de la muestra, es decir:
( ) ( )
Una vez establecido el valor de la varianza común ponderada, se puede entonces definir el intervalo
de estimación de la diferencia de la media poblacional de la siguiente manera:
( ̅ ̅ ) ̅ ̅
Donde:
̅ ̅ √
pág. 39
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
* +
( ) ( )
Una vez determinado este grado de libertad se procede a leer en la tabla el valor de para
finalmente poder establecer el intervalo de valores de estimación de la diferencia de la media
poblacional.
El intervalo de estimación para la diferencia de la proporción poblacional está dado por la expresión:
( )
Donde:
( ) ( )
√
Al igual que en la estimación de la diferencia entre los parámetros de dos poblaciones se podrán
realizar las siguientes pruebas de hipótesis.
PROCESO
1. Planteamiento de la hipótesis:
Se deben plantear dos hipótesis: la Hipótesis Nula (Ho) que es un enunciado o afirmación que se hace
sobre la relación de igualdad entre las medias de las poblaciones y la Hipótesis Alternativa (H1) que se
plantea como la negación de la hipótesis nula.
pág. 40
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
3. Estadístico de prueba.
Para pruebas de hipótesis de diferencias entre las medias poblacionales, con poblaciones bajo la
distribución normal, o de tamaño grande o con desviación poblacional conocida, el estadístico de
prueba es:
( ̅ ̅ ) ( )
̅ ̅
Para pruebas de hipótesis de diferencias entre medias poblacionales, con poblaciones bajo
distribución normal, de tamaño pequeño y con la desviación estándar de la población desconocida, el
estadístico de prueba es:
( ̅ ̅ ) ( )
̅ ̅
Para pruebas de hipótesis sobre la diferencia proporción o fracción poblacional, se asume que la
distribución es normal, entonces el estadístico de prueba es:
( ) ( )
Prueba z: ( )
Prueba t: ( )
5. Toma de decisión:
Se puede establecer otra regla de decisión en función del intervalo de confiabilidad: Si el valor del
parámetro poblacional está dentro del intervalo de confiabilidad, entonces se acepta la hipótesis
nula, caso contrario se rechaza.
pág. 41
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
11.1. INTRODUCCIÓN
La herramienta ANOVA está diseñada específicamente para probar si dos o más poblaciones tienen la
misma media; aunque el propósito de la ANOVA es comparar las medias, el proceso se fundamenta
en el análisis de la variabilidad de cada una de las muestras; siendo esta la razón de su nombre, en
otras palabras:
Mediante el estudio de la variabilidad que presentan las muestras (ANOVA) se pueden realizar
inferencias sobre la igualdad de la medias de las poblaciones de donde se tomaron dichas
muestras.
Algunos ejemplos donde se puede aplicar el Análisis de Varianza.
Se trata de medir los efectos relativos en la producción de los empleados de una fábrica a los
cuales se los ha capacitado mediante tres programas: tradicional, audiovisual y con ayuda de
medios informáticos.
Comparar los efectos causados por cuatro promociones mensuales en las ventas de un almacén:
muestra gratis; obsequios, descuentos, envío a domicilio.
Una cadena de restaurantes está preocupada por las excesivas quejas sobre la demora en la
atención de las órdenes solicitadas en sus cuatro locales: Centro, Norte Sur y Periferia y desea
saber si la demora en que incurren los empleados es la misma en los cuatro locales o en cuál de
ellos la demora es diferente.
El análisis de varianza está basado en una comparación de dos estimaciones diferentes de la varianza
de la población total; estas estimaciones de la varianza están claramente establecidas:
La primera estimación de la varianza, conocida como variación intergrupal o inter muestral está
dado por la variabilidad de las medias de las muestras, en términos estadísticos se conoce como
varianza entre columnas.
La segunda estimación de la varianza, se la denomina varianza dentro de las columnas y está dado
por la variabilidad de los datos de cada una de las muestras o grupos, es decir será una varianza intra
muestral o intra grupal.
pág. 42
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
Se trata de un conjunto de datos agrupados en k muestras; y cada una de las muestras dispone de un
número n de datos; el número de datos u observaciones de cada una de las muestras no
necesariamente tienen que ser iguales.
̅ ̅ ̅ ̅
2. Determinación de la gran media.
La gran media o media de las medias muestrales se obtiene ponderando cada una de las medias
muestrales, tomando como peso el tamaño de cada una de las muestras, es decir:
̅ ̅ ̅ ̅
̿
( ̅ ̿) ( ̅ ̿) ( ̅ ̿) ( ̅ ̿)
∑ ( ̅ ̿)
pág. 43
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
A continuación se deberá calcular las varianzas de cada una de las muestras, aplicando la
siguiente expresión:
∑ ( ̅)
( ) ( ) ( ) ( )
∑ ( )
∑ ( )
6. Prueba F
7. Estadístico F
Los valores de F se los puede tomar directamente de una tabla de distribución F o también
utilizar software estadístico en la categoría de funciones.
pág. 44
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
Es muy común, presentar los resultados del ANOVA en una tabla que contiene la información
obtenida, esta tabla tiene la siguiente estructura:
1. Planteamiento de hipótesis:
Hipótesis nula:
Hipótesis alternativa:
Se tomará el valor de la tabla de distribución F en función del nivel de significación y los grados
de libertad del numerador y denominador.
4. Toma de decisión.
5. Conclusión de la prueba:
Se conoce como diseño balanceado al evento en que todas las muestras que intervienen en el
ANOVA son del mismo tamaño; si esta situación no se cumple entonces diremos que el diseño no
está balanceado.
pág. 45
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
Por otro lado, si la prueba de hipótesis que determina igualdad de la media poblacional de varias
poblaciones es rechazada; entonces será necesario establecer cuáles son las poblaciones que
presentan diferente media poblacional; para esto se han diseñado las siguientes pruebas:
Prueba de Tukey.
Prueba de la Diferencia Mínima Significativa (DMS).
Prueba de DMS alternativo para diseños no balanceado.
Donde:
b. Se establecen las diferencias absolutas entre las medias poblaciones para cada dos muestras y
este valor se lo compara con el valor obtenido de Tukey si la diferencia es mayor entonces se
concluye que esos grupos presentan la media poblacional diferente, es decir:
| ̅ ̅|
Entonces la media poblacional del grupo no es igual a la media poblacional del grupo
Donde:
Valor de la Distribución F ( )
Segunda estimación de la varianza para el ANOVA.
Tamaño de las muestras (el mismo en todos los grupos).
b. Se establecen las diferencias absolutas entre las medias poblaciones para cada dos muestras y
este valor se lo compara con el valor DMS, si la diferencia es mayor entonces se concluye que
esos grupos presentan la media poblacional diferente, es decir:
| ̅ ̅|
Entonces la media poblacional del grupo no es igual a la media poblacional del grupo
pág. 46
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
√* +
Donde:
Valor de la Distribución F ( )
Segunda estimación de la varianza para el ANOVA.
b. Se establecen las diferencias absolutas entre las medias poblaciones para cada dos muestras y
este valor se lo compara con el valor DMS, si la diferencia es mayor entonces se concluye que
esos grupos presentan la media poblacional diferente, es decir:
| ̅ ̅|
Entonces la media poblacional del grupo no es igual a la media poblacional del grupo
pág. 47
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
12.1. INTRODUCCIÓN
Las pruebas no paramétricas agrupan una serie de pruebas estadísticas que tienen como propiedad
común la ausencia de supuestos o presunciones acerca de la ley de probabilidad que sigue la
población de la que ha sido extraída la muestra. Por esta razón es común referirse a ellas como
pruebas de distribución libre.1
Permite determinar que si dos variables, en formato de tabla de contingencia, son independientes o
si estas variables están relacionadas entre sí.
1. Planteamiento de hipótesis:
Hipótesis nula:
Hipótesis alternativa:
( )
∑
Donde:
( )
1
Clasificación de pruebas no paramétricas. Cómo aplicarlas en SPSS. Vanesa Berlanga Silvente y María José Rubio Hurtado
Universitat de Barcelona. Institut de Ciències de l’Educació
pág. 48
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
4. Toma de decisión.
5. Conclusión de la prueba:
pág. 49
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
13.1. INTRODUCCIÓN
Determinar en forma cuantitativa la relación que existe entre el peso y la estatura de una
persona.
El grado de relación que existe entre el precio de ciertos productos y la cantidad disponible
para su venta.
Por otra parte, la necesidad de disponer de una calificación del grado de relación entre las variables
involucradas en un problema de regresión conduce a determinar el coeficiente de correlación; es
decir:
El coeficiente de correlación es una medida del grado de cohesión existente entre las
variables involucradas en un problema de regresión como también una indicación del
sentido (directo o inverso) de la relación existente.
Regresión lineal.
Regresión no lineal.
Esta clasificación se debe a la tendencia de comportamiento matemático que presentan las variables
cuando estas se asocian. Una forma de estimar esta tendencia consiste en observar la nube de
pág. 50
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
Variable dependiente
12
25
Variable dependiente
10
8 20
6 15
4
2 10
0 5
0 5 10
0
Variable independiente 0 2 4 6 8
Variable independiente
Cuando se tiene un modelo de dos variables, la ecuación de mejor ajuste tiene la forma:
Donde y son los coeficientes del modelo, estos coeficientes se denominan intercepto y
pendiente del modelo respectivamente; el signo del coeficiente permite determinar si la relación
entre las variables es creciente o decreciente.
Una vez que el modelo ha sido determinado se pueden realizar pronósticos sobre el
comportamiento de las variables.
Si el modelo está formado por más de dos variables, de las cuales una de ellas depende de todas las
demás, se lo conoce como modelo multivariable; la ecuación del modelo multivariable tiene la
siguiente estructura:
Donde , son los coeficientes del modelo, estos coeficientes se denomina intercepto y
coeficientes de las variables independientes del modelo; la determinación de los coeficientes que
pág. 51
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
intervienen en el modelo es una tarea extensa y laboriosa, por lo que el uso de sistemas
informáticos es lo más recomendado.
Una vez encontrada la ecuación de regresión que mejor ajuste a los datos de las variables que
intervienen en un modelo no determinístico, surge preguntas como:
Estas preguntas pueden ser respondidas mediante una medida estadística de la relación entre las
variables, denominada correlación; se puede afirmar que:
La correlación es una medida estadística que determina el grado de relación existente entre las
variables involucradas en un modelo de regresión.
Una relación positiva ( ) entre dos variables significa que los valores altos de una variable
forman pares con los valores altos de la otra, y que los valores bajos de la una variable forman
pares con los valores bajos de la otra.
Una relación negativa ( ) significa que valores altos de una variable forman pares con
valores bajos de la otra.
Una relación cero ( )significa que algunos valores altos forman pares con valores bajos y
otros, con valores altos.
pág. 52
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
Mediante prueba de hipótesis se puede determinar si verdaderamente las variables que constan en
la ecuación pertenecen al modelo, el proceso de prueba de hipótesis es el siguiente:
1. Planteamiento de hipótesis:
Hipótesis nula:
Hipótesis alternativa:
Se tomará el valor de la tabla de distribución F en función del nivel de significación y los grados de
libertad del numerador y denominador.
4. Toma de decisión.
1. Planteamiento de hipótesis:
Hipótesis nula:
Hipótesis alternativa:
2. Estadístico de prueba:
3. Decisión
pág. 53
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
Modelo potencial:
Modelo exponencial:
Modelo logarítmico: ( )
Donde:
Variable dependiente.
Coeficiente del modelo, intercepto.
Coeficientes del modelo, donde .
Variable independiente.
Los coeficientes del modelo se los determina mediante el método de mínimos cuadrados; para
decidir cuál es el modelo más adecuado es conveniente analizar el gráfico de dispersión.
Determinar los coeficientes en forma manual es una tarea muy laboriosa por lo que será necesario el
uso de paquetes estadísticos.
El programa SPSS presenta la opción de encontrar varios modelos en forma simultánea lo que
permite escoger el modelo más adecuado, es decir el que mejor se ajusta a los datos.
Es un modelo que resulta especialmente adecuado para modelar valores enteros no negativos,
especialmente cuando la frecuencia de ocurrencia es baja.
En este modelo, las variables de conteo o recuento se definen como el número de sucesos o eventos
que ocurren en una misma unidad de observación en un intervalo espacial o temporal definido. Así,
por ejemplo, el número de artículos adquiridos por una tienda deportiva durante un año es un
conteo; en los conteos o recuentos el valor 0 es bastante habitual.
A partir de esta definición propuesta por Lindsey (1995b), se derivan dos características principales
de una variable de recuento, lo cual la diferencia de una variable cuantitativa continua, estas son su
naturaleza discreta y no negativa.
pág. 54
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
Donde:
Variable dependiente.
Constante del modelo, intercepto.
Coeficientes del modelo, donde .
Variable independiente.
Los coeficientes del modelo deben determinarse mediante el uso de algún paquete informático para
cálculo estadístico, puede ser el SPSS u otro paquete.
Los modelos de regresión logística son modelos estadísticos en los que se desea conocer la relación
entre:
Una variable dependiente cualitativa, dicotómica (regresión logística binaria o binomial) o con
más de dos valores (regresión logística multinomial).
Predecir la probabilidad de que a alguien le ocurra cierto evento: por ejemplo, “estar desempleado”
=1 o “no estarlo” = 0; “ser pobre” = 1 o “no ser pobre” = 0; “graduarse como sociólogo” =1 o “no
graduarse” = 0;
( )
2
Regresión logística CEQC
pág. 55
ESTADÍSTICA CON SPSS.- NOCIONES BÁSICAS DE ESTADÍSTICA
Donde:
La variable independiente puede ser nominal dicotómica o continua, si la variable independiente está
expresada en más de dos valores nominales, será necesario categorizarla en n-1 grupos.
El modelo regresión logística también puede presentar más de una variable independiente, es decir:
( )
Como se ve, las covariables pueden ser cuantitativas o cualitativas; las covariables cualitativas deben
ser dicotómicas, tomando valores 0 para su ausencia y 1 para su presencia (esta codificación es
importante, ya que cualquier otra codificación provocaría modificaciones en la interpretación del
modelo).
Los coeficientes del modelo logístico se obtienen por métodos diferentes al de mínimos cuadrados;
su cálculo manual es excesivamente laborioso por lo que será necesaria la utilización de algún
paquete estadístico.
La evaluación global del modelo se puede efectuar mediante los coeficientes de determinación de
Cox y Snell, y el de Nagelkerke, los valores de estos coeficientes de determinación se pueden ver en
la tabla de “Resumen del modelo” del SPSS.
Una vez que se ha obtenido los coeficientes del modelo es muy sencillo estimar la probabilidad
cuando los valores de las variables regresoras asuman diferentes valores; para hacer esto, es
suficiente con sustituir los valores en el modelo. Si la probabilidad de que el sujeto este encuadrado
en esa categoría es mayor que 0,5 se le asigna, si es menor se le asigna a la otra categoría.
pág. 56
ESTADÍSTICA CON SPSS
MANUAL DE
USUARIO
SEGUNDA SECCIÓN
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
pág. 57
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
pág. 58
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
1. EL PROGRAMA SPSS
1.1. INTRODUCCIÓN
El SPSS que corresponde a Stadistical Package for the Social Science, es el programa de software de
cálculo estadístico de mayor difusión en el mundo informático, los derechos de autor de este
programa corresponden a la Firma IBM.
El programa SPSS es muy amigable con el usuario, gracias a su diseño e implementación bajo la
plataforma Windows, su aprendizaje es rápido y sencillo; es similar al manejo de las Hojas de Cálculo,
y se pueden migrar archivos de datos desde la Hoja electrónica hasta el programa.
De hecho se puede hacer cálculo estadístico en la Hoja Excel, pues en la Hoja de cálculo se puede
obtener gráficos estadísticos, parámetros y medidas estadísticas mediante funciones electrónicas y la
herramienta Análisis de Datos, se puede también determinar estadísticos en bases de datos
mediante las funciones BD como también con la herramienta de tablas dinámicas; sin dejar de lado la
herramienta gráfica para el modelo de regresión.
Si bien la hoja de cálculo Excel puede hacer todo el trabajo estadístico mencionado en el párrafo
anterior, en situaciones complejas, por ejemplo en la estadística multivariable, el trabajo se torna
laborioso.
Esta es la nueva presentación del programa SPSS en su versión 24; la misma que difiere con versiones
anteriores, sin embargo se puede trabajar con versiones anteriores.
pág. 59
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
Para empezar con un trabajo nuevo el usuario deberá activar la opción Nuevo conjunto de datos, al
dar un clic sobre este botón se desplegará la ventana que se indica:
Seguramente el usuario notará la similitud de esta pantalla con la de la Hoja electrónica de cálculo
Excel; por otro lado, el programa SPSS se encuentra desarrollado bajo el entorno WINDOWS,
entonces dispondrá de barras, menús desplegables, tarjetas y cuadros de diálogo y demás elementos
de esta plataforma informática.
Barra de identificación
En la parte superior se encuentra la barra de identificación del programa y del archivo en ejecución:
Junto con el ícono del programa se encuentra la leyenda que contiene el nombre del archivo,
por defecto y hasta que se registre el nombre del archivo aparecerá “Sin título 1”;
En el extremo derecho de esta barra aparecerán finalmente los botones que permiten la
manipulación de la ventana, es decir: Minimizar, Restaurar y Salir del programa.
En cuanto a los botones del extremo derecho: el primero de estos botones (Minimizar) reduce la
pantalla del escritorio hasta su mínima expresión y, en forma de ícono, lo ubica en la barra de tareas;
el segundo botón, denominado Restaurar, permite modificar el tamaño y la posición de la pantalla
en cualquier punto de escritorio.
Para modificar el tamaño se debe colocar el cursor en los bordes verticales u horizontales de la
ventana y con el movimiento del cursor del mouse se puede variar el tamaño de la misma, tanto en
sentido vertical como horizontal; también podrá modificarse el tamaño en los dos sentidos en forma
simultánea al ubicar el puntero del mouse en las esquinas de la pantalla, observe como el cursor
cambia de forma.
pág. 60
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
Estos botones que permiten modificar la posición y el tamaño de la ventana resultan ser de gran
utilidad para disponer en el escritorio de más de un programa activo, permitiendo sobre todo el
control visual de la información que puede provenir de otros programas.
Menú Principal
En la segunda barra se encuentran las opciones del Menú Principal, estas son: Archivo, Edición, Ver,
Datos, Transformar, Analizar, Marketing directo, Gráficos, Unidades, Ventana y Ayuda.
A continuación se presenta una descripción ligera de estas opciones del Menú principal:
Archivo: Es esta opción se encuentran agrupadas las operaciones que trabajan con los archivos:
Abrir, Guardar, Guardar como, Imprimir etc. Además, se encuentran opciones de conexión con
base de datos y repositorios digitales ubicados en la web.
Edición: En esta opción el usuario encuentra las operaciones de Cortar, Copiar, Pegar, Buscar
Reemplazar etc.; además, como opciones particulares de este programa, se encuentran las
opciones para insertar variables e insertar casos.
Ver: En esta opción se encuentran los comandos que permiten personalizar la hoja de trabajo del
programa mediante la personalización de barras, la selección del tipo de fuente, la
activación/desactivación de la cuadrícula, la presentación de la lista de variables etc.
Datos: En esta opción el usuario podrá encontrar los comandos que permiten manipular la
información, tales como: ordenar casos y variables, transponer tablas, fundir archivos,
seleccionar casos, etc.
Analizar: Es la opción de mayor uso en el programa SPSS, aquí se encuentran las herramientas
para el análisis estadístico tanto para Estadística Descriptiva como Estadística Inferencial;
dispone además de herramientas para el Análisis de regresión y de Series de tiempo.
Cada una de estas opciones del Menú principal presentan a su vez varias opciones que se encuentran
registradas en su respectiva tarjeta de menú , las mismas que despliegan una vez que se haya
activado la Opción principal.
Barra de íconos
La tercera barra del programa presenta los íconos universales de la plataforma Windows (Abrir,
Almacenar, Imprimir, etc.) junto con otros iconos que representan las herramientas propias del
programa; al acercar el puntero del mouse a cualquiera de los íconos el sistema mostrará un
pequeño rótulo de identificación/descripción del mismo.
pág. 61
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
La cuarta barra del programa funciona de la misma manera que la barra de fórmulas de la Hoja de
cálculo Excel, en esta barra se registra en forma dinámica la información almacenada en cada una de
las celdas que conforman la matriz rectangular; está dividida en dos regiones, en la región izquierda
aparecen las coordenadas de ubicación de la celda activa y en la derecha aparece la información
registrada y almacenada en dicha celda.
El usuario podrá personalizar estas barras, es decir: podrá agregar nuevas herramientas o desactivar
las que no sean de utilidad frecuente.
Matriz de Datos
El área denominada Matriz de datos es el sector donde se almacena la información, en esta Hoja se
registran los datos para el análisis estadístico; esta hoja de cálculo es similar a la del programa Excel,
aquí las filas toman el nombre de Casos y las columnas toman el nombre de Variables.
Una celda queda perfectamente identificada por su columna (Variable) y por su fila (Caso); por
defecto, las columnas o variables se identifican con Var, mientras que las filas o casos se identifican
con la secuencia numérica de los números naturales: 1, 2, 3, etc.
Como es de suponer, los datos o casos de una misma variable se almacenarán en una sola columna;
el programa recepta datos de tipo numérico de texto o cadena, de fecha, de moneda, etc.
No está permitido ingresar en una misma variable diversos tipos de datos; por ejemplo no podrá
ingresar información numérica en un caso e información de texto en otro caso; el programa no
registrará el segundo caso.
pág. 62
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
El usuario ingresa cada uno de los datos por medio del teclado; deberá también ingresar las
características de la variable; se recomienda utilizar el teclado numérico.
Tome en cuenta además las flechas direccionales para movilizarse a través de esta ventana; hacia
arriba, abajo, izquierda o derecha; una vez que ha ingresado la información en una celda,
proceda a presionar la tecla Enter.
Por defecto, si el usuario no ha indicado las características de las variables, el programa asumirá
que se trata de una variable numérica con dos decimales.
Cuando se ingresan números, al igual que en el Excel, el valor ingresado quedará alineado al
margen derecho de la celda.
Cuando se ingresan textos, al igual que en el Excel, el valor ingresado quedará alineado al margen
izquierdo de la celda.
La situación cambia el momento en que se ingresa datos en formato fecha; si aún no se han
indicado las características de la variable, el programa asumirá como variable de cadena.
Cuando se trata del formato punto o coma, para separar decimales y millares, el usuario deberá
previamente definir las características de las variables.
Las herramientas copiar y pegar funcionan de la misma forma que en todos los programas,
deberá primero definir las celdas que quiere copiar, activar la herramienta Copiar y luego ubicar
el lugar donde se va a colocar los valores a copiar; en ese lugar deberá activar la herramienta
Pegar. Recuerde que copiar y pegar se encuentran listos al dar clic en el botón derecho del
mouse.
Para abrir un archivo previamente almacenado en el disco o en una unidad exterior, el usuario
deberá proceder de la siguiente manera:
pág. 63
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
Si se encuentra dentro del programa SPSS deberá desarrollar el proceso Archivo/Abrir/Datos, con
lo cual se desplegará la siguiente ventana:
Una vez que se ha ubicado el archivo deseado, será suficiente dar un sobre el botón Abrir, con lo
cual el archivo seleccionado se desplegará en el escritorio del SPSS.
Como alternativa el usuario podrá navegar hacia el sitio donde se encuentra el archivo y
proceder a dar doble clic sobre el mismo.
El SPSS permite trabajar con archivos importados de otros programas, siempre y cuando los
datos se encuentren almacenados en formato de tablas, entonces podrá importar archivos de
Excel, de gestores de bases de datos como el Access, o inclusive de un Block de notas.
Para importar archivos en otro formato el usuario deberá partir del interior del programa y
desarrollar el proceso para recuperar un archivo, es decir: Archivo/Abrir/Datos, con lo cual se
desplegará la ventana que se indica en esta página; entonces ahora el usuario deberá navegar
hasta el lugar donde se encuentre el archivo de Excel o de formato tabla; debe tomar en cuenta
que previamente deberá seleccionar el tipo de archivo, para lo cual es necesario abrir la flecha de
despliegue colocada en el lado derecho del campo Archivos de tipo.
Una vez que ha ubicado al archivo de Excel de donde desea importar la información al dar clic en
aceptar se desplegará la siguiente ventana:
pág. 64
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
A continuación deberá seleccionar la Hoja de trabajo del libro de Excel donde se encuentran los
datos que desea importar al SPSS, finalmente, la dar clic sobre el botón Aceptar se desplegará
sobre el escritorio del SPSS los datos requeridos para el análisis.
Para configurar las diferentes características del programa SPSS es necesario desarrollar el proceso:
Editar/Opciones, con lo cual se desplegará en el escritorio la siguiente ventana:
pág. 65
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
En la pestaña General el usuario podrá entre otras cosas indicar por ejemplo la forma de salida
de las variables en los cuadros de diálogo, el uso de notación científica para valores numéricos
pequeños, la unidad de medida, etc.
Una configuración muy importante es el idioma, para esto el usuario deberá activar la pestaña
Idioma y proceder a seleccionar el idioma, tanto para la salida como también para la interfaz del
usuario.
En la pestaña Visor el usuario podrá modificar las características que tiene la hoja de resultados
en cuanto se refiere a su aparición, tipo y tamaño de fuente, etc.
En la pestaña Datos se encuentran las opciones para las operaciones de cálculo, el ancho de
columna y el número de decimales, la forma en que se presenta el formato años, etc. Aquí
también se puede configurar la Vista de variables.
El programa SPSS presenta varias vistas de trabajo, las mismas que se irán desplegando conforme se
desarrolle el mismo; inicialmente el SPSS presenta dos vistas:
Vista de datos,
Vista de variables.
Vista de resultados.
Editor de tablas.
Editor de gráficos.
El usuario puede acceder a estas Vistas al dar un clic sobre los botones correspondientes que se
encuentran en la barra inferior de escritorio del programa; al activar estos botones el usuario podrá
verificar las semejanzas y diferencias de estas ventanas:
Vista de datos
En esta hoja se almacenan los datos para el análisis estadístico, las filas de la Hoja se denominan
CASOS y las columnas se denominan VARIABLES; en esta Vista las casos (filas) disponen de una
numeración natural, mientras que las columnas tiene en nombre VAR; una vez que se ingrese el
nombre de las variables, este quedará registrado en el inicio de cada columna.
pág. 66
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
Al dar un clic sobre el botón de Vistas de variables se desplegará una Hoja similar a la anterior, en
esta hoja deberán ingresarse el nombre y demás características de las variable estadísticas que van a
intervenir en el análisis.
Variable tipo Numérico.- Representada por números, tienen preestablecido un ancho de campo de 8
caracteres y dos decimales; el usuario podrá establecer un ancho de campo y un número de
decimales diferente.
Cuando ingresa un dato al que se ha asignado el tipo Numérico, se presenta las siguientes
características:
Variable tipo Punto.- Representada por números, tienen preestablecido un ancho de campo de 8
caracteres y dos decimales; el usuario podrá establecer un ancho de campo y un número de
decimales diferente.
Cuando ingresa un dato al que se ha asignado el tipo Punto se presenta las siguientes características:
pág. 67
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
Variable tipo Coma.- Representada por números, tienen preestablecido un ancho de campo de 8
caracteres y dos decimales; el usuario podrá establecer un ancho de campo y un número de
decimales diferente.
Cuando ingresa un dato al que se ha asignado el tipo Coma se presenta las siguientes características:
Variable tipo Notación Científica.- Representada por números, tienen preestablecido un ancho de
campo de 8 caracteres y dos decimales; el usuario podrá establecer un ancho de campo y un número
de decimales diferente.
Cuando ingresa un dato al que se ha asignado el tipo Notación científica, el programa convierte al
número al formato 0,00E±001.
Variable tipo Fecha.- Representada por números, tienen preestablecido un ancho de campo de 9
caracteres sin decimales; cuando ingresa un dato al que se ha asignado el tipo Fecha, el programa
devuelve la fecha en formato previamente establecido; se puede cambiar el formato al dar un clic en
la celda Fecha de la columna Tipo en la hoja de variables.
Variable tipo Dólar.- Representada por números, tienen preestablecido un ancho de campo de 8
caracteres sin decimales; cuando ingresa un dato al que se ha asignado el tipo Dólar, el programa
devuelve el número con el prefijo $.
Variable tipo Moneda personalizada.- Representada por números, tienen preestablecido un ancho
de campo de 8 caracteres sin decimales; cuando ingresa un dato al que se ha asignado el tipo
Moneda personalizada, el programa devuelve el número con el prefijo o sufijo previamente
establecido (ejemplo: ptas., USD, euros, etc.) para esto el usuario deberá previamente personalizar el
formato moneda, mediante el proceso: Editar/Opciones/Moneda.
Variable tipo Cadena.- Representada por letras, números o una combinación de letras y números; se
las conoce también como variables alfanuméricas y presentan las siguientes características:
Variable tipo Número restringido.- Representada por números cuyos valores están restringidos para
enteros no negativos. Los valores aparecen con los ceros iniciales llenando el ancho máximo de la
variable.
pág. 68
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
En la vista de Variables existe una columna en la cual el usuario podrá escribir un texto breve que
describa a la variable, esta información será de utilidad para la generación de tablas y gráficos en los
cuales se utilizará la información registrada en la etiqueta en lugar de la variable.
El programa SPSS presenta los cuadros de diálogo que permiten al usuario escoger las variables que
intervienen en el análisis estadístico; los cuadros de diálogo presentan a todas la variables que
conforman la base de datos, en esa lista se puede apreciar el nombre de las variables precedidas por
un ícono que identifica a la variable como variable de cadena, nominal y de medición; tal como se
indica en la siguiente ventana:
El programa SPSS dispone de una herramienta que permite crear nuevas variables a partir de las
variables existentes; estas variables se pueden crear utilizando una calculadora virtual que se
encuentra dentro del programa.
El proceso para acceder a la calculadora virtual es: Transformar/Calcular variable; entonces, realizado
el mismo, aparecerá la siguiente ventana:
pág. 69
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
Para crear una nueva variable el usuario deberá desarrollar el siguiente procedimiento:
b. Ingresar la expresión numérica con la cual se determinarán los valores de la variable creada,
para esto el usuario deberá auxiliarse de las variables que se encuentran en el recuadro de la
izquierda, como también de los botones de la calculadora virtual ubicada en el centro de la
ventana desplegada.
c. En la calculadora virtual aparece, en el recuadro derecho, una lista de funciones, similar a las
funciones de la hoja electrónica Excel; el usuario podrá utilizar estas funciones utilizando como
argumentos de las mismas valores numéricos o valores las variables almacenadas en la base de
datos.
En SPSS se conoce como recodificar al proceso de asignación de un valor numérico al valor de una
variables de carácter cualitativo que previamente ha sido almacenada en el programa; por ejemplo
asignar 1 al valor masculino y 2 al valor femenino en el caso de la variable sexo; o también asignar un
código al valor de la variable si este se encuentra dentro de un intervalo previamente establecido.
pág. 70
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
La diferencia entre estados modalidades radica en que en la opción Recodificar en las mismas
variables el programa cambia los valores originales por los códigos establecidos, perdiéndose así la
variable original, mientras que la opción Recodificar en distintas variables el programa crea una
nueva variable en la cual registra los códigos establecidos; de esta manera los valores originales se
mantienen en su contenido y ubicación.
Al tomar la modalidad Recodificar en las mismas variables se presentan las siguientes ventanas:
Ingrese la variable a recodificar y luego debe activar el botón Valor antiguos y nuevos y se desplegará
la siguiente ventana:
pág. 71
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
En esta ventana deberá registrarse el valor antiguo y el valor nuevo, los cambios pueden hacerse
para valores puntuales o dentro de un rango o intervalo; siempre y cuando la variable en análisis sea
cuantitativa.
Una vez registrados los códigos el usuario deberá dar clic en el botón continuar, y regresar a la
ventana anterior donde finalmente deberá dar un clic en el botón Aceptar.
A diferencia del proceso anterior, ahora aparece un campo adicional en el cual se podrá el nombre
de la variable resultado, su etiqueta y el botón para cambiar la variable original por la variable
codificada; finalmente se debe dar un clic en el botón Valores antiguos y nuevos para trasladar el
sistema a la siguiente ventana:
En esta ventana el usuario deberá ingresar el valor y su código, este recodificación puede ser
puntual, por rango o en intervalo; siempre y cuando sea variable cuantitativa; al finalizar deberá dar
un clic en Continuar para regresar a la ventana anterior en la cual deberá dar un clic en el botón
Aceptar.
pág. 72
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
A los valores asignados como códigos se les debe ahora asignar su etiqueta de identificación, para
esto el usuario deberá, partiendo de la Vista de variables, activar la columna Valores con lo cual se
desplegará la siguiente ventana:
Aquí el usuario deberá ingresar el valor asignado como código y su etiqueta correspondiente, luego
dar clic en el botón Añadir, con lo cual la etiqueta quedará almacenada en el sistema, al finalizar
deberá dar clic en el botón Aceptar.
Para almacenar en forma permanente, el usuario deberá dar un clic en el ícono de almacenamiento;
si es primera vez entonces se desplegará la ventana característica de Guardar como; en la cual el
usuario deberá ingresar el nombre del archivo y el lugar donde va a almacenarlo.
Archivos.sav: Son los que almacenan los datos que han sido utilizados en el proceso estadístico.
Archivos.spv. Son los archivos que almacenan los resultados del proceso estadístico que realiza
el SPSS, es decir almacenan la información de la ventana Resultados.
Los archivos indicados son independientes y se los puede almacenar en forma individual con el
nombre y lugar asignado por el usuario.
Estaos archivos podrán ser utilizados posteriormente cuando el usuario los necesita, para esto será
suficiente acceder a los mismos y dar doble clic sobre el nombre; inmediatamente el sistema abrirá el
programa SPSS y mostrará en el escritorio la hojas de datos o la hoja de variables.
pág. 73
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
2. ORGANIZACIÓN DE DATOS
Una vez que los datos han sido recolectados, es necesario organizarlos, la herramienta más eficaz
para ordenar los datos son las tablas de frecuencia; el programa SPSS organiza los datos de varias
maneras:
El programa SPSS puede organizar los datos en una tabla de frecuencia simple, para lo cual el usuario
deberá realizar el proceso: Analizar/Estadísticos descriptivos/Frecuencias, entonces el programa
activará el siguiente cuadro de diálogo:
pág. 74
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
A continuación se expone el resultado del proceso estadístico que el programa realiza al tomar la
Variable Gerencia:
La tabla resultado presenta 5 columnas, en las cuales se establece los diferentes valores que toma la
variable Gerencia, la Frecuencia absoluta (Frecuencia), la Frecuencia relativa (Porcentaje) y la
Frecuencia relativa acumulada (Porcentaje acumulado); en cuanto a la columna Porcentaje válido es
un control interno que realiza el programa SPSS para verificar que toda la información ha sido
procesada y que no existen valores ocultos ni valores perdidos.
El gráfico obtenido puede ser editado y personalizado por el usuario, para lo cual deberá, en la
ventana de resultados, dar doble clic sobre el mismo; inmediatamente se desplegará la ventana del
menú de opciones de edición de gráficos; podrá agregar, cambiar títulos, rótulos, leyendas, colores,
proyecciones en tres dimensiones, sombras, etc.
Conocidas también como tablas de doble entrada o tablas bivariables, permite la organización de la
información de varias variables, generalmente dos, sin embargo se puede introducir más variables
que actúan como capas superpuestas.
pág. 75
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
En esta ventana el usuario podrá observar, en el recuadro izquierdo, la lista de variables (cualitativas
y cuantitativas) que conforman la base de datos; deberá tomar la variable que se ubicará en las filas
de la tabla como también la variable que se ubicará en las columnas.
Puede ocurrir que se tomen variables para el campo filas como también variables para el campo
columnas; entonces el programa entregará tablas bivariables resultado.
Se pueden añadir variables a la tabla, las mismas que se ubicarán como capas superpuestas, estas
variables deberán ubicarse en el campo correspondiente (capa 1 de 1).
El programa incluye también el gráfico de barras adjuntas, para esto el usuario deberá activar la
casilla correspondiente; de la misma forma, el usuario podrá suspender la salida de las tablas y
permitir solamente la salida de gráficos y estadísticos.
A continuación se incluye un ejemplo de la tabla de contingencia que resulta al cruzar las Variables
Proceso contractual con Tipo de obra:
pág. 76
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
El programa SPSS permite que el usuario pueda organizar los datos en una tabla de frecuencia
dividida en varios intervalos o categorías; estos intervalos podrán ser personalizados de acuerdo con
el criterio del usuario.
En esta ventana el usuario podrá observar que las variables que aparecen en el recuadro de la
izquierda son variables cuantitativas; entonces se puede concluir que se podrá organizar datos en
intervalos solamente en este tipo de variables; el proceso continúa el momento en que el usuario
seleccione la variable que desea agrupar.
pág. 77
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
En esta ventana el usuario podrá observar en primer lugar, en el recuadro izquierdo la lista de
variables seleccionadas, como también algunas características particulares de la variable
seleccionada; existe también un histograma que representa a los datos seleccionados.
Ingresando los valores en las casillas del campo Cuadrícula; conforme ingresan los valores que limitan
al intervalo el programa creará un renglón adicional; la palabra SUPERIOR indica que el valor del
intervalo será hasta el valor superior de los datos.
300.000; 600.000; 1’000.000; más de 1’000.000; entonces deberá ingresar la siguiente información:
pág. 78
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
Nótese que:
b. En las casillas del campo Valor del recuadro cuadrícula se han ingresado los valores 300000;
600000; 1’000.000; en el último valor se ha dejado la palabra SUPERIOR.
c. Al dar un clic sobre el botón Crear etiquetas, el programa agregará las etiquetas correspondiente
para cada uno de los valores ingresados como límites del intervalo.
d. El usuario tiene además la opción de incluir o no al valor del límite superior del intervalo; por
defecto el programa incluye el límite superior (ver botón Incluidos<= activo).
Al dar un clic sobre el botón Aceptar, en la hoja de resultados aparecerá la indicación que la variable
Agrupada MONTO1, ha sido creada, entonces, en la última columna de la hoja de datos aparecerá
esta variable.
Una vez creada esta nueva variable se podrá realizar el proceso para obtener la tabla de frecuencias
agrupada en intervalos:
Puede también crearse una distribución de frecuencia con varios puntos de corte, tal como se indica
a continuación:
pág. 79
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
Cuando los datos han sido agrupados previamente en una distribución de frecuencia por intervalos,
es necesario ponderar los casos, dado que el SPSS considerará a cada intervalo como un solo caso; al
ponderar los casos, se da a cada intervalo o clase su peso propio que viene a ser la frecuencia de
cada intervalo.
Para ponderar los intervalos se debe realizar el siguiente procedimiento: Datos/ponderar casos; con
lo cual se desplegará la siguiente ventana:
En este cuadro de diálogo el usuario deberá previamente activar el botón Ponderar casos mediante,
y luego tomar la variable que va a ser ponderada; para el ejemplo de tablas de distribución de
frecuencia agrupadas en intervalos o categorías la variable a ponderar es la variable FRECUENCIA;
cuando existen variables ponderadas, en el extremo inferior derecho del escritorio aparecerá la
frase: Ponderación activada.
El programa SPSS puede elaborar tablas personalizadas, es decir tablas en las cuales el usuario
selecciona las variables que deben aparecer, tanto en filas como en columnas, algo similar a las
tablas dinámicas que genera el programa Excel.
Partiendo de esa similitud con las tablas dinámicas del Excel, el SPSS entrega también tablas en las
que se involucra a tres variables; como valores de resumen, las tablas personalizadas del SPSS
entregan resultados del conteo de datos, porcentajes, y medidas estadísticas que describen a la
muestra o población; el procedimiento a realizar es: Analizar/Tablas/Tablas personalizadas.
pág. 80
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
Deberá trasladar las variables que conforman la tabla y ubicarlas en el campo Filas y Columnas.
Una vez que se han ubicado las variables en filas y/o columnas, en forma inmediata se activará el
botón Estadísticos de resumen; al activar este botón el programa permitirá que el usuario
seleccione el estadístico de resumen que desea que aparezca en la tabla.
El usuario podrá ingresar títulos, pies de página y demás información que desea que aparezca en
la tabla; para esto deberá activar la pestaña Títulos.
En la pestaña Estadístico de Prueba el usuario podrá realizar las operaciones necesarias para
pruebas de inferencia estadística, tales como: Prueba t para dos muestras, prueba Chi cuadrado,
etc.
Finalmente, si el usuario ha incluido en el análisis una tercera variable y activado el botón Capa,
en la tabla que aparece como resultado aparecerá un botón de filtro, al activar dicho botón, se
desplegarán como opciones los diferentes valores que tiene la variable ubicado en Capas.
pág. 81
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
3. ESTADÍSTICA DESCRIPTIVA.
El programa SPSS entrega, en solo proceso los estadísticos que describen a una muestra, es decir: Las
medidas de tendencia central (media aritmética, mediana, moda, etc.); las medidas de posición en
términos de percentiles, las medidas de dispersión (rango, varianza, desviación estándar), medidas
de simetría y de apuntalamiento.
Partiendo desde el la opción Analizar del Menú Principal, tomar la opción Estadísticos
descriptivos/Frecuencia, con lo cual se desplegará la siguiente ventana:
En el recuadro de la izquierda el usuario podrá observar las variables (cualitativas y cuantitativas) que
conforman la base de datos, como también la opción Mostrar tablas de frecuencia que se encuentra
activa; El usuario deberá previamente seleccionar la(s) variable(s) cuyo análisis estadístico quiere
obtener y trasladarlas virtualmente al campo Variables; luego deberá presionar el botón
Estadísticos con lo cual se desplegará la siguiente ventana:
pág. 82
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
El usuario deberá activar las casillas cuyos estadísticos desea obtener en su análisis, tome en cuenta:
Para obtener otros Cuantiles, tales como Deciles, Quintiles, etc. el usuario deberá activar la
casilla Puntos de corte para… grupos iguales, debiendo también indicar el Cuantil genérico que
desea obtener.
̅
√
Una vez que el usuario ha seleccionado los estadísticos que desea obtener en su análisis, deberá dar
un clic en el botón Continuar, con lo cual el sistema retornará a la ventana anterior.
Antes de dar un clic en el botón Aceptar es conveniente que se desactive la casilla Mostrar tablas de
frecuencias; entonces el análisis estadístico solicitado se procesará y mostrará los resultados en la
hoja correspondiente.
El programa SPSS ofrece como alternativa para el cálculo de estadísticos que describen a la muestra
el siguiente proceso: Analizar/Estadísticos descriptivos/Descriptivos, con lo cual se desplegará la
siguiente ventana:
pág. 83
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
El programa SPSS ofrece un proceso para calcular algunos estadísticos que describen a una variable
en función de otra variable de carácter independiente; por ejemplo, se puede obtener los
estadísticos de la variable Monto contractual en función de la zona distrital. Para esto el proceso es:
Analizar/ Comparar medias/Medias, con lo cual se desplegará la siguiente ventana:
En esta ventana el usuario deberá ingresar en la lista de dependientes la(s) variable(s) que se desea
analizar, por ejemplo la variable Monto contractual; en la Lista de independientes el usuario deberá
ingresar la variable que categoriza a la variable dependiente, por ejemplo la variable Zona distrital.
pág. 84
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
Una vez que se han seleccionado los estadísticos que requiere el análisis, ahora el usuario deberá dar
un clic en el botón Continuar, con lo cual el programa regresará a la ventana anterior donde deberá
finalmente dar un clic sobre el botón Aceptar para finalizar el proceso; los resultados se despegarán
en la hoja correspondiente.
El programa SPSS ofrece la herramienta más completa para el análisis de datos: la herramienta
Explorar, esta herramienta entrega al usuario el análisis integral de un grupo de datos previamente
almacenados en alguna(s) variable del SPSS; este análisis presenta no solamente los valores
numéricos que describen a la muestra sino que incluye gráficos para observación de su variabilidad
(diagrama de cajas y bigote) y detalle de la variación (diagrama de tallo y hojas).
Esta herramienta permite realizar el análisis de una variable dividida en varias categorías por ejemplo
analiza la variable ingresos de los empleados de una empresa categorizados por el sexo; entonces el
programa entrega datos del análisis de esta variable, tanto para los casos de sexo masculino, como
sexo femenino.
El rango intercuartil es la diferencia entre el Tercer cuartil y el Primer cuartil; estos valores se verán
representados gráficamente en el diagrama de caja y bigotes.
Finalmente, se conoce como valores atípicos aquellos casos cuyos valores numéricos se encuentran
bajo o sobre el rango intercuartil a una distancia de 1.5 veces el rango.
1
Valderey Sanz Pablo.- Extracción del Conocimiento a partir del Análisis de datos con SPSS
pág. 85
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
El usuario deberá ingresar en el campo Lista la(s) variable(s) que van a ser analizadas; además deberá
ingresar en el campo Lista de factores la variable de agrupación esta debe ser una variable
cualitativa.
Luego de esto, al dar un clic en el botón Estadísticos, el usuario deberá ingresar el intervalo de
confianza, por defecto el programa trabaja con el 95%; además deberá encender, si desea obtener, la
casilla para los Valores atípicos y percentiles.
Después deberá activar el botón Gráficos, entonces se despegará una tarjeta en la cual el usuario
deberá indicar si aparece o no el diagrama de Tallo y hojas como también los diagramas que
involucra el estudio de normalidad de la muestra; por defecto el programa tiene activado el
diagrama de caja.
Finalmente, en la parte inferior de esta ventana el usuario deberá escoger la forma de visualización
de los resultados; el programa permite mostrar los estadísticos, los gráficos o ambos.
pág. 86
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
Descriptivos
Error
Zona distrital Estadístico
estándar
Media 768,50 63,40
Límite inferior 635,80
95% de intervalo de
Límite
confianza para la media 901,20
superior
Media recortada al 5% 772,33
Mediana 770,50
Varianza 80393,53
Centro
Desviación estándar 283,54
Mínimo 258,00
Máximo 1210,00
Rango 952,00
Rango intercuartil 434,50
Asimetría ,00 ,51
Curtosis -,72 ,99
Media 896,85 141,67
Límite inferior 608,27
95% de intervalo de
Límite
confianza para la media 1185,43
superior
Media recortada al 5% 776,04
Mediana 731,00
Longitud de redes de agua Varianza 662354,76
Norte
potable Desviación estándar 813,85
Mínimo 73,00
Máximo 3959,00
Rango 3886,00
Rango intercuartil 614,50
Asimetría 2,95 ,41
Curtosis 9,30 ,80
Media 875,43 75,71
Límite inferior 721,88
95% de intervalo de
Límite
confianza para la media 1028,99
superior
Media recortada al 5% 827,27
Mediana 818,00
Varianza 212106,81
Sur
Desviación estándar 460,55
Mínimo 248,00
Máximo 3104,00
Rango 2856,00
Rango intercuartil 463,00
Asimetría 3,19 ,39
Curtosis 15,05 ,76
pág. 87
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
Valores extremos
Número del
Zona distrital Valor
caso
1 84 1210,00
2 27 1187,00
Mayor 3 70 1181,00
4 31 1130,00
5 87 1063,00
Centro
1 26 258,00
2 89 356,00
Menor 3 13 408,00
4 12 425,00
5 29 558,00
1 74 3959,00
2 80 3650,00
Mayor 3 46 1255,00
4 66 1245,00
Longitud de redes de agua 5 88 1239,00
Norte
potable 1 86 73,00
2 19 220,00
Menor 3 6 359,00
4 79 360,00
5 16 386,00
1 77 3104,00
2 25 1341,00
Mayor 3 60 1215,00
4 35 1201,00
5 32 1184,00
Sur
1 7 248,00
2 48 413,00
Menor 3 52 421,00
4 8 473,00
5 56 496,00
4,00 0 . 2344
11,00 0 . 56677777888
5,00 1 . 01112
pág. 88
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
1,00 0 . 0
5,00 0 . 23333
7,00 0 . 4445555
7,00 0 . 6667777
2,00 0 . 88
6,00 1 . 000011
3,00 1 . 222
2,00 Extremos (>=3650)
1,00 2 . 4
,00 3 .
4,00 4 . 1279
2,00 5 . 02
6,00 6 . 124566
4,00 7 . 0467
7,00 8 . 1112478
2,00 9 . 14
2,00 10 . 38
5,00 11 . 03568
2,00 12 . 01
1,00 13 . 4
1,00 Extremos (>=3104)
pág. 89
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
4. GRAFICOS ESTADÍSTICOS
El programa SPSS elabora gráficos estadísticos de distinta índole, clasificados en gráficos estáticos
que se obtiene a partir de los datos almacenados y gráficos dinámicos a partir de los modelos de
regresión.
El usuario podrá observar que el programa presenta todas las alternativas de gráficos de carácter
estadístico; además se incluye el gráfico de Diagrama de cajas.
Al tomar, por ejemplo, el tipo barras el programa desplegará la ventana que se adjunta; en esta
ventana el usuario encuentra la posibilidad de seleccionar el tipo de gráficos de barras verticales
simples, verticales agrupadas y verticales apiladas.
Por otro lado, se debe seleccionar también si los datos que conforman el gráfico son:
Resúmenes para grupos de casos.- Esta opción permite realizar gráficos tales que
las barras verticales representan el número de casos de una variable cuantitativa
(eje vertical) en función de otra variable que puede ser cualitativa o cuantitativa;
por ejemplo el número de empleados que laboran en la empresa clasificados por
su sexo o el número de empleados clasificados por su nivel de instrucción.
Este tipo de gráfico permite además representar otro estadístico que no sea el de
conteo, por ejemplo la suma, la media, la mediana, etc.; como ejemplo podemos
indicar el promedio de los ingresos en función del área laboral, la suma de
inversiones realizadas en cada zona distrital, etc.
En todas las opciones el usuario dispone de un botón para agregar títulos, subtítulos y pies de página;
una vez finalizado el gráfico el usuario podrá dar doble clic sobre el mismo activando de esta manera
la ventana de edición de gráficos.
pág. 90
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
Una vez que se obtiene esta ventana el necesario continuar con las siguientes actividades:
Trasladar las variables cualitativas o categóricas al campo Filas y al campo Columnas, por defecto
se activará la operación recuento o contar.
Activando mediante un clic a cada una de las variables de Fila y columna, se activa ahora, en
forma individual, el botón Categorías y Totales, de manera que disponga al programa la orden
que totalice filas y columnas; tal como se indica en la siguiente ventana:
pág. 91
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
Una vez realizado el proceso indicado, al dar clic en el botón Aceptar, se desplegará la tabla de
contingencia para las variables seleccionadas. En el ejemplo se incluye la tabla de contingencia al
cruzar las variables Proceso de contratación y Zona distrital:
Con los resultados de esta tabla se obtendrán probabilidades de eventos combinados, eventos
marginales y eventos condicionales.
Para el cálculo de probabilidades de eventos que se encuentran dentro de una distribución binomial,
el SPSS dispone de las funciones: y . Estas funciones se encuentran en el
recuadro inferior derecho de la calculadora virtual, recuerde que para acceder a la calculadora virtual
debe desarrollar el proceso: Transformar/Calcular variable.
Una vez que se encuentra en la ventana de la calculadora virtual el usuario podrá ubicar a las
funciones requeridas dando clic sobre la opción todas; entonces se desplegará en el recuadro inferior
la lista, ordenada alfabéticamente, de todas las funciones.
Cada una de estas funciones tiene una descripción literaria de los argumentos que requiere y del
resultado que entrega; para las funciones y . Se tiene:
pág. 92
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
Con estas dos funciones y aplicando las propiedades de la Distribución Binomial se tiene un resumen
de las fórmulas que permitan calcular probabilidades bajo esta distribución en la mayoría de los
escenarios posibles:
Para el cálculo de probabilidades de eventos que se encuentran dentro de una distribución normal, el
SPSS dispone de las funciones: y . Estas funciones se
encuentran en el recuadro inferior derecho de la calculadora virtual, recuerde que para acceder a la
calculadora virtual debe desarrollar el proceso: Transformar/Calcular variable.
Una vez que se encuentra en la ventana de la calculadora virtual el usuario podrá ubicar a las
funciones requeridas dando clic sobre la opción todas; entonces se desplegará en el recuadro inferior
la lista, ordenada alfabéticamente, de todas las funciones.
Cada una de estas funciones tiene una descripción literaria de los argumentos que requiere y del
resultado que entrega; para las funciones y . Se tiene:
IDF.NORMAL (p, media, desv_típ) Numérico. Devuelve el valor de la distribución normal con la
media y desviación típica especificadas, cuya probabilidad acumulada es p.
CDF.NORMAL (c, media, desv_tip) Numérico. Devuelve la probabilidad acumulada de que un valor
de la distribución normal, con la media y desviación típica especificada sea menor que c.
pág. 93
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
6. MUESTREO ESTADÍSTICO
El muestreo estadístico se lo realiza de manera similar al manejo de filtros en la hoja de cálculo Excel;
en esencia el muestreo en SPSS se lo realiza seleccionando casos, sean estos de manera aleatoria o
mediante el cumplimiento de alguna condición.
En SPSS se podrá realizar muestreos de tipo aleatorio, por estratos y sistemático, para lo cual se debe
cumplir con varios procesos.
Para obtener una muestra aleatoria el usuario debe desarrollar el siguiente proceso:
Datos/Seleccionar casos; con lo cual se desplegará la siguiente ventana:
En esta ventana, el usuario deberá activar el botón Muestra aleatoria de con lo cual el sistema
activará el botón Ejemplo, al dar un clic sobre este botón se desplegará la siguiente ventana:
pág. 94
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
En esta ventana, el usuario deberá ingresar el tamaño de la muestra a obtener, este tamaño puede
ser:
Una vez señalado el tamaño de la muestra procederá a dar un clic sobre el botón Continuar con lo
cual se regresará a la ventana anterior en la cual el usuario deberá escoger la forma de salida de los
resultados presentándose las siguientes opciones:
Descartar casos no seleccionados: Al activar esta opción, el programa presentará los casos
seleccionados en la misma Hoja de datos, señalando aquellos que no han sido tomados en cuenta en
el muestreo.
Copiar casos seleccionados a un nuevo conjunto de datos: Al activar esta opción el sistema
presentará los casos seleccionados en otra hoja de datos, a la cual previamente el usuario deberá
darle un nombre en el campo que se activa una vez que se haya tomado esta alternativa, como
opción de salida; la nueva Hoja de datos se ubicará precisamente debajo de la hoja de datos.
Eliminar casos no seleccionados: Al tomar esta opción el programa presentará en la misma hoja de
datos los casos seleccionados eliminando los que no ha sido tomados en cuenta; hay que tener
mucho cuidado con el manejo de esta opción puesto que algunos registros (casos) de la base de
datos han sido eliminados y sin darse cuenta el usuario pude almacenar la hoja, con lo cual se
perderá definitivamente los datos iniciales.
En realidad este no es un muestreo, sino más bien una selección de casos o registros de la base de
datos que cumplen con alguna condición previamente especificada; entonces el usuario deberá
desarrollar el proceso: Datos/Seleccionar casos y en la ventana que se despliega seleccionar la
opción Si satisface la condición; finalmente el botón Si la opción… se activará y al dar un clic sobre el
mismo se desplegará la ventana de la Calculadora virtual del SPSS (Calcular variable):
pág. 95
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
Una muestra compleja puede ser distinta de una muestra aleatoria simple en muchos aspectos: en
una muestra aleatoria simple, las unidades de muestreo individuales se seleccionan aleatoriamente
con la misma probabilidad y sin reposición (SR) directamente a partir de la totalidad de la población.
Por lo contrario, una muestra compleja determinada puede tener alguna o todas las características
siguientes:
Con la estratificación, puede asegurar que los tamaños muestrales de los subgrupos de interés son
adecuados, mejorar la precisión de las estimaciones globales y utilizar distintos métodos de
muestreo entre los diferentes estratos.
2
Muestras complejas de SPSS.- IBM Manual de Usuario
pág. 96
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
En esta ventana el usuario deberá seleccionar si desea Diseñar un plan de muestreo, Editar un diseño
muestral existente o extraer una muestra de un diseño existente.
Si va a diseñar un plan es necesario que en el campo activo se escriba el nombre del archivo en el
cual se ha de registrar el plan; el programa genera un archivo con extensión csplan.
Después de que el archivo que contiene el plan de muestreo ha sido creado el programa desplegará
la siguiente ventana, en la cual deberá escoger la variable de estratificación y agregar una etiqueta.
Al dar clic sobre el botón Siguiente, el programa SPSS desplegará una ventana en la cual el usuario
deberá escoger el tipo de muestro, por defecto el programa tiene activada la opción Muestreo
aleatorio simple, sin reemplazo; después de esto deberá dar un clic sobre el botón Siguiente.
En la siguiente ventana el usuario deberá escoger el tamaño de cada uno de los estratos, puede
hacerlo fijando un número o una proporción porcentual; el tamaño puede ser el mismo para cada
estrato o diferente en cada uno de ellos.
pág. 97
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
Una vez que el usuario ha indicado el tamaño de la muestra, sea esta por unidades o proporciones
ahora deberá dar un clic en el botón Aceptar, con lo cual el sistema abrirá la ventana siguiente
En la ventana abierta ahora el usuario deberá seleccionar algunas variables que desea almacenar
junto con los datos; si no desea añadir ninguna de las variables indicadas, simplemente debe dar un
clic para que el sistema active la siguiente ventana.
En la siguiente ventana el usuario deberá decidir si desea extraer la muestra y de que etapa desea
hacerlo; en esta ventana también puede generar una semilla de números aleatorios.
Finalmente, en la siguiente ventana el usuario deberá indicar al programa donde desea almacenar los
datos muestra creada, tiene como opción: en el mismo conjunto de datos (hoja actual), como nuevo
conjunto de datos (nueva hoja) o como archivo externo; si toma las dos últimas opciones deberá
ingresar el nombre de la nueva hoja o del nuevo archivo en el campo que se activa.
Para obtener una muestra sistemática, básicamente el usuario deberá desarrollar el mismo
procedimiento que el realizado para el muestreo estratificado; entonces el proceso es:
pág. 98
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
En esta ventana el usuario deberá seleccionar si desea Diseñar un plan de muestreo, Editar un diseño
muestral existente o extraer una muestra de un diseño existente.
Si va a diseñar un plan es necesario que en el campo activo se escriba el nombre del archivo en el
cual se ha de registrar el plan; el programa genera un archivo con extensión csplan.
Después de que el archivo que contiene el plan de muestreo ha sido creado el programa desplegará
la ventana, en la cual deberá escoger la variable de estratificación y agregar una etiqueta; para un
muestreo sistemático simple no es necesario seleccionar ninguna variable como estrato de
muestreo, sin embargo si el muestreo lo requiere se deberá hacerlo.
Al dar clic sobre el botón Siguiente, el programa SPSS desplegará una ventana en la cual el usuario
deberá escoger el tipo de muestro; por defecto, el programa tiene activada la opción Muestreo
aleatorio simple, sin reemplazo. En este filtro de selección el usuario deberá seleccionar Muestreo
sistemático simple, tal como se indica en la siguiente ventana; después de esto deberá dar un clic
sobre el botón Siguiente.
pág. 99
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
En la siguiente ventana el usuario deberá escoger el tamaño de la muestra; el programa SPSS divide
al tamaño (número total de casos) para el número ingresado como tamaño de la muestra
obteniendo de esta manera el número de subgrupos.
El muestreo sistemático consiste en tomar aleatoriamente un elemento del primer grupo; los demás
que forman la muestra se los tomará, uno de cada subgrupo, de acuerdo con la posición del primer
elemento seleccionado.
Por ejemplo de una población de 250 elementos se desea una muestra sistemática de 10 elementos;
entonces:
Luego se toma aleatoriamente un elemento del primer grupo y el numeral que indica la posición del
número seleccionado servirá como punto de partida para la ubicación de los siguientes elementos.
Por ejemplo, si se selecciona del primer grupo el elemento que se encuentra en la cuarta posición (4),
los elementos que conforman la muestra serán los que se encuentran en las posiciones:
Nótese que la ubicación de cada uno de ellos se obtiene sumando 25 a la posición inicial.
Una vez que el usuario ha indicado el tamaño de la muestra ahora deberá dar un clic en el botón
Aceptar, con lo cual el sistema abrirá la ventana siguiente.
En la ventana abierta ahora el usuario deberá seleccionar algunas variables que desea almacenar
junto con los datos; si no desea añadir ninguna de las variables indicadas, simplemente debe dar un
clic para que el sistema active la siguiente ventana.
En la siguiente ventana el usuario deberá decidir si desea extraer la muestra y de que etapa desea
hacerlo; en esta ventana también puede generar una semilla de números aleatorios.
Finalmente, en la siguiente ventana el usuario deberá indicar al programa donde desea almacenar los
datos muestra creada, tiene como opción: en el mismo conjunto de datos (hoja actual), como nuevo
conjunto de datos (nueva hoja) o como archivo externo; si toma las dos últimas opciones deberá
ingresar el nombre de la nueva hoja o del nuevo archivo en el campo que se activa.
pág. 100
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
La variable en análisis deberá ingresar en la Lista de dependientes; luego deberá dar un clic en el
Botón Estadísticos con lo cual se desplegará el cuadro de diálogo donde podrá ingresar el nivel de
confiabilidad:
Una vez que el usuario ha ingresado el nivel de confiabilidad, deberá dar un clic en el botón
Continuar y al regresar a la ventana anterior deberá ahora dar un clic en el botón Aceptar; el
intervalo de la estimación de la media aparecerá en el segundo renglón de la tabla de resultados;
pág. 101
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
Para obtener el intervalo de estimación de la media poblacional para una variable el usuario deberá
realizar el proceso: Analizar/Comparar medias/Prueba T para una muestra independiente, con lo
cual el programa despegará la siguiente ventana:
En esta ventana el usuario deberá ingresar en el campo Variables de prueba la variable en análisis, al
dar un clic en el botón Opciones se desplegará la ventana en la cual podrá ingresar el nivel de
confiabilidad; tal como se indica en la siguiente ventana:
Al finalizar el programa entregará una tabla de resultados en el cual queda registrado el intervalo de
estimación de la media poblacional parta el nivel de confianza dado.
pág. 102
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
Para realizar una prueba de hipótesis sobre la media poblacional en una población, el SPSS presenta
el proceso Analizar/Comparar medias/Prueba T para una muestra; al desarrollar este proceso se
desplegará la siguiente ventana:
En esta ventana el usuario deberá ingresar la variable en análisis al campo Variables de prueba; en la
casilla Valor de prueba debe colocar el valor de la media poblacional asumido para la hipótesis nula;
entonces al dar un clic sobre el botón Opciones se desplegará la ventana donde debe colocar el nivel
de significación.
Una vez que ha ingresado el nivel de significación, debe dar un clic en el botón Continuar y luego, en
la ventana que se despliega deberá dar un clic en el botón Aceptar para finalizar el proceso.
Para tomar la decisión de aceptar o rechazar la hipótesis nula el usuario deberá aplicar la regla:
( )
En prueba de un extremo: s
pág. 103
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
El programa SPSS dispone de algunas herramientas y opciones para el análisis estadístico en dos
poblaciones; considerando a estas como independientes o relacionadas entre sí; el proceso a realizar
es: Analizar/Comparar medias.
Opciones.- Al dar un clic en el botón Opciones el programa desplegará la ventana que permitirá
ingresar el nivel de significación en términos del intervalo de confianza.
Al finalizar el proceso en la vista Resultados el programa SPSS entrega los siguientes cuadros:
pág. 104
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
Estadísticas de grupo
Desviación Media de error
SECTOR N Media estándar estándar
RENTA Norte 7 682,86 95,17 35,97
Sur 7 582,86 167,00 63,12
En esta ventana el usuario deberá ingresar la variable que presenta los datos antes de la prueba
específica y los valores de la variable después de la prueba específica; al dar un clic en la ventana
Opciones se despliega la siguiente ventana:
pág. 105
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
Luego de ingresar el nivel de significación en términos del intervalo de confianza el programa SPSS
dispondrá en la hoja de Resultados los siguientes cuadros:
pág. 106
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
Si se trata de analizar la media poblacional en varias poblaciones se debe realizar una prueba
estadística de comparación entre la variabilidad entre los grupos y la variabilidad dentro de los
grupos; esta relación estadística se la realiza con el proceso de ANOVA en una sola vía o en un solo
factor.
ANOVA EN UN FACTOR
En esta ventana el usuario deberá ingresar la variable de análisis en el campo Lista de dependientes
y en el campo Factor deberá ingresar la variable de agrupación; al dar un clic en el botón Post hoc el
programa desplegará la ventana adjunta, en la cual deberá escoger la prueba DMS o la Prueba
Tukey; también deberá finalmente ingresar el nivel de significación.
pág. 107
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
La prueba chi cuadrado es el estadístico más adecuado para comparar variables categóricas o
cualitativas; permite también realizar pruebas para determinar la bondad del ajuste de un grupo de
datos a una determinada distribución estadística.
La prueba chi cuadrado requiere de los valores observados y esperados, organizados en una tabla
cruzada entonces, el proceso en el programa SPSS es el siguiente:
Una vez ubicadas las variables categóricas en el campo filas y en el campo columnas, ahora el
usuario deberá dar un clic en el botón Exacta, con lo cual se desplegará la ventana en la que se
registra el nivel de significación en términos del nivel de confiabilidad.
Al presionar el botón Estadísticos, en la ventana que se despliega el usuario deberá activar la casilla
correspondiente a la prueba Chi-cuadrado, también podrá activar la casilla correspondiente al
Cuadro de correlaciones.
Al final del proceso; el programa SPSS entregará en la vista de resultados los cuadros que registran la
información sobre la prueba estadística realizada, estos cuadros son los que a continuación se
indican:
pág. 108
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
En cuanto a la prueba Chi cuadrado el programa entrega el valor de estadístico chi cuadrado de
Pearson, los grados de libertad, el valor del nivel de significación bilateral y el intervalo de
confiabilidad para el nivel asumido.
Pruebas de chi-cuadrado
Sig. Monte Carlo (bilateral)
Significación Intervalo de confianza al
Valor df asintótica 99%
Significación
(bilateral) Límite Límite
inferior superior
Chi-cuadrado de Pearson 9,768a 2 0,008 0,008b 0,005 0,010
Razón de verosimilitud 9,657 2 0,008 0,009b 0,007 0,012
b
Prueba exacta de Fisher 9,560 0,009 0,007 0,012
N de casos válidos 300
a. 0 casillas (0,0%) han esperado un recuento menor que 5. El recuento mínimo esperado es 30,72.
b. Se basa en 10000 tablas de muestras con una semilla de inicio 2000000.
La toma de decisión con respecto a aceptar o rechazar la hipótesis nula que expresa el grado de
relación o independencia entre las variables categóricas en análisis puede hacerse comparando el
valor del estadístico Chi cuadrado con el valor de la tabla de distribución correspondiente o a través
de la comparación del valor del Sig bilateral con el nivel de significación asumido.
pág. 109
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
El programa SPSS presenta algunos procesos para la obtención del modelo de regresión, una vez
realizado el proceso necesario, el programa devolverá una estadística de las variables que
intervienen en el modelo, los coeficientes de correlación y determinación y los coeficientes de
modelo; entregará también las herramienta e insumos necesarios para hacer inferencia estadística
con los coeficientes obtenidos.
El usuario podrá observar que está seleccionada por defecto la opción Dispersión simple, el ícono
indica que se trata de obtener una nube de puntos que representa la tendencia de las variables; el
usuario deberá dar un clic en el botón Definir; inmediatamente se desplegará la siguiente ventana:
En esta ventana el usuario deberá ubicar en el campo denominado Eje Y la variable dependiente y en
el campo denominado Eje X la variable independiente, podrá también incluir rótulos y títulos en el
gráfico; una vez ubicadas las variables el usuario deberá dar un clic en el botón Aceptar, con lo cual
se desplegará el diagrama de dispersión que se indica:
pág. 110
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
Al dar doble clic sobre el diagrama de dispersión se desplegará la ventana del Editor de gráficos; al
activar en el menú del editor de gráficos el proceso: Elementos/Línea de ajuste total se despliega la
siguiente ventana:
En esta ventana el usuario deberá seleccionar las características de la línea de ajuste que representa
al modelo; por defecto el programa SPSS asume el modelo lineal, además asume como siempre el
nivel del 95% para el intervalo de confianza; finamente está activa la opción Adjuntar etiqueta a
pág. 111
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
línea, esta última acción, al ser activada entrega la ecuación de la recta o curva que mejor ajuste a los
datos.
El SPSS entrega el siguiente proceso para la obtención del modelo de regresión lineal bivariable y
multivariable: Analizar/Regresión/Lineales, al desarrollar el mismo se desplegará la siguiente
ventana:
pág. 112
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
El usuario deberá colocar la variable dependiente y la(s) variable(s) independiente(s) en los campos
correspondientes; al dar clic sobre el botón Estadísticos el usuario podrá ingresar las características
para el análisis estadístico de los coeficientes, entre ellos el nivel de confiabilidad, como siempre el
programa sume por defecto el valor del 95%; con esto, el programa desplegará la siguiente ventana:
Una vez cumplido con los requisitos del programa, al dar clic en el botón Continuar, el programa
regresará a la ventana anterior en la cual, al dar clic en el botón Aceptar dará finalizado el proceso,
entregando entre otros los siguientes resultados:
a
Coeficientes
Coeficientes no Coeficientes 95,0% intervalo de
estandarizados estandarizados confianza para B
Modelo t Sig.
Error Límite Límite
B Beta
estándar inferior superior
(Constante) -2,55 0,39 -6,53 0,00 -3,46 -1,65
1
Temperatura ambiental ° F ,06 0,00 ,98 12,60 1,48E-6 ,05 ,07
a. Variable dependiente: Ventas de helado en miles USD
En el último cuadro de resultados el usuario tendrá a su disposición los coeficientes del modelo con
lo cual podrá construir el mismo y hacer proyecciones sobre el comportamiento de la variable
dependiente en función de la variable independiente.
El programa SPSS presenta la posibilidad de realizar el análisis de regresión lineal múltiple por diverso
métodos; por defecto el programa trabaja con el método Intro; sin embargo el programa permite
trabajar por el método “Entre pasos”.
El método “Entre pasos” desarrolla en forma rápida el proceso de ingresar y eliminar las variables
independientes que no aportan significativamente al modelo. Presentando como último resultado la
lista de variables que han sido eliminadas.
El usuario una vez que conoce las variables que el método “Entre pasos” ha eliminado, podrá volver a
desarrollar el análisis de regresión múltiple, esta vez solamente con las variables que no han sido
eliminadas.
El mejor ajuste del modelo se verá reflejado ahora en el coeficiente de determinación; el usuario
podrá ahora disponer de un modelo en el cual están las variables que verdaderamente aportan al
modelo.
De acuerdo con el valor del coeficiente de determinación el usuario podrá detectar la necesidad de
introducir nuevas variables en el modelo, con la finalidad de mejorar su ajuste; de cualquier manera
las nuevas variables que ingresen al modelo no podrán ser las variables que ya fueron eliminadas.
pág. 113
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
El programa SPSS tiene una herramienta que permite obtener modelos alternativos al modelo no
lineal, mediante una estimación curvilínea bivariable; el proceso a desarrollar es: Analizar/Regresión/
Estimación curvilínea con lo cual se desplegará la ventana que se indica:
En esta ventana el usuario deberá colocar las variables dependientes e independiente en los campos
correspondientes, luego deberá seleccionar los modelos de curvas que desea estimar; luego de esto,
al dar clic en el botón Aceptar se desplegará un cuadro de resultados con los coeficientes de todos
los modelos seleccionados como también un gráfico simultáneo de las curvas obtenidas.
pág. 114
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
pág. 115
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
Al dar un clic en el botón continuar el usuario regresará a la ventana anterior; ahora deberá dar un
clic en el botón Guardar con lo cual el programa desplegará la siguiente ventana:
El usuario deberá activar la casilla Probabilidades con lo cual aparecerá en la vista de datos los
valores estimados de la probabilidad investigada de acuerdo con el modelo obtenido.
En el botón Opciones el usuario podrá ingresar el valor del nivel de significación asignado al modelo.
Al finalizar el proceso el programa SPSS entregará el cuadro de resumen en el que se registran los
coeficientes del modelo, el error estándar y el coeficiente Exp(B) junto con el intervalo de confianza
asumido.
pág. 116
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
Variables en la ecuación
Error 95% C.I. para EXP(B)
B Wald gl Sig. Exp(B)
estándar Inferior Superior
E_civil 1,511 4 0,825
E_civil(1) 0,237 0,810 0,085 1 0,770 1,267 0,259 6,193
E_civil(2) -0,508 1,016 0,250 1 0,617 0,602 0,082 4,412
E_civil(3) -0,223 0,914 0,059 1 0,807 0,800 0,133 4,800
E_civil(4) -0,316 1,082 0,085 1 0,770 0,729 0,088 6,077
Empleo 0,541 0,550 0,968 1 0,325 1,718 0,585 5,048
Vivienda 1,129 0,486 5,394 1 0,020 3,091 1,193 8,011
Paso 1a
Vehículo -0,047 0,509 0,009 1 0,926 0,954 0,352 2,589
Antecedentes 1,322 0,534 6,123 1 0,013 3,749 1,316 10,679
Cifras 0,393 2 0,822
Cifras(1) 0,352 0,708 0,248 1 0,619 1,422 0,355 5,698
Cifras(2) -0,075 0,496 0,023 1 0,879 0,928 0,351 2,452
Tasa(1) -0,538 0,511 1,110 1 0,292 0,584 0,215 1,588
Constante -1,432 0,964 2,207 1 0,137 0,239
Al igual que en el modelo de regresión múltiple el programa SPSS presenta en el modelo de regresión
logística binaria varios métodos para su análisis entre estos, el método Intro, el método de Wald
hacia adelante, hacia atrás, etc.
En esta ventana el usuario deberá colocar en el campo Variables aquellas variables cuantitativas que
intervienen en el análisis; por defecto el programa devuelve el coeficiente de correlación de Pearson,
pudiendo también entrega el coeficiente de Kendall y el Spearman.
pág. 117
ESTADÍSTICA CON SPSS MANUAL DE USUARIO SPSS
Al dar un clic en el botón Opciones se despliega una ventana que sugiere al usuario la obtención de
estadísticos como también el nivel de confiabilidad para la inferencia estadística del coeficiente;
finalmente al dar un clic en el botón Aceptar se desplegará un cuadro de resultados a manera de
tabla cruzada en la cual se registran los coeficientes de correlación entre las variables involucradas.
Años de
Cargas Estatura Sueldo del Peso en
servicio en la
familiares en m empleado libras
Empresa
Años de Correlación de Pearson 1,00 0,03 -0,11 0,06 0,09
servicio en Sig. (bilateral) 0,70 ,19 0,46 ,28
la Empresa N 150 150 150 150 150
Correlación de Pearson 0,03 1,00 -0,02 0,05 -0,01
Cargas
Sig. (bilateral) 0,70 0,77 0,56 ,86
familiares
N 150 150 150 150 150
Correlación de Pearson -0,11 -0,02 1,00 0,03 0,04
Estatura
Sig. (bilateral) ,19 ,77 0,70 ,60
en m
N 150 150 150 150 150
Correlación de Pearson 0,06 0,05 0,03 1,00 0,01
Sueldo del
Sig. (bilateral) 0,46 0,56 0,70 0,94
empleado
N 150 150 150 150 150
Correlación de Pearson 0,09 -0,01 0,04 0,01 1,00
Peso en
Sig. (bilateral) 0,28 ,86 ,60 0,94
libras
N 150 150 150 150 150
pág. 118
BIBLIOGRAFIA
5. LIND Douglas, Marchal Williams, Wathen Samuel, “Estadística aplicada a los Negocios y la
Economía”, Editorial McGraw Hill, Colombia 2008.
7. QUEZADA Lucio Nel, “Estadística con SPSS”, Empresa Editora Macro, Perú, 2012.
11. WEBSTER Allen L. “Estadística aplicada a los Negocios y la Economía”, Editorial McGraw Hill,
Colombia 2000.
Comentarios: danielherrera_1960@hotmail.com
www.cedicaped.com
Pedidos a: 0992745563; 022801667; 023444480