You are on page 1of 56

Universidad Nacional de Trujillo

Facultad de Ciencias Econmicas


Escuela de Economa
Curso:

Investigacin Econmica

Docente:
Integrantes:

Dra. Cecilia Zavaleta Lpez


Chafloc Zavaleta Lucero
Cueva Gamboa Laura
Lavado Ramirez Marcela
Llaque Lpez David
Reyna Prncipe Johanna

Anlisis de los datos


cuantitativos

Qu procedimiento se sigue para analizar


cuantitativamente los datos?

Seleccionar un programa estadstico en


Fase 1 computadora (ordenador) para analizar los datos.

la

Ejecutar el programa: SPSS, Minitab, Stars, SAS u


Fase 2 otro equivalente.
Explorar los datos:
Analizar descriptivamente los datos por variable.
Fase 3
Visualizar los datos por variable.

Qu procedimiento se sigue para analizar


cuantitativamente los datos?
Evaluar la confiabilidad y validez logradas por el o los
Fase 4 instrumentos de medicin.
Analizar mediante pruebas estadsticas las hiptesis
Fase 5 planteadas (anlisis estadstico inferencial).

Fase 6

Realizar anlisis adicionales.

Preparar los resultados para presentarlos (tablas,


Fase 7 grficas, cuadros, etctera).

Paso 1: Seleccionar un programa de anlisis

Existen diversos programas para analizar datos. En


esencia su funcionamiento es muy similar, incluyen
dos partes : definiciones de las variables y la matriz
de datos.
Lo que hace el investigador una vez recolectados
los datos, es precisar los parmetros de la matriz de
datos en el programa e introducir los datos en la
matriz.

SPSS (Paquete Estadstico para las Ciencias


Sociales)

SPSS contiene las dos partes citadas que se denominan:


a) vista de variables (para definiciones de las variables)
b) vista de los datos (matriz de datos).

Trabaja de una manera muy sencilla: abre la matriz de datos y el


investigador usuario selecciona las opciones ms apropiadas para
su anlisis, tal como se hace en otros programas.

Minitab
Es un paquete muy completo para computadoras personales que
contiene una variedad considerable de pruebas estadsticas;
adems, es muy sencillo de manejar.

Se abre una sesin y se abre una matriz u hoja de trabajo. Se


definen las variables: nombre, formato, ancho, su descripcin y
orden de los valores. Los anlisis realizados aparecen en la sesin
y las grficas se reproducen en recuadros.

Paso 2: Ejecutar el programa

En el caso de SPSS y Minitab, ambos paquetes son


fciles de usar, pues lo nico que hay que hacer es
solicitar los anlisis requeridos seleccionando las
opciones apropiadas.
Antes de tales anlisis, se debe verificar que el
programa corra o funcione en nuestra
computadora. Comprobando esto, comienza la
ejecucin del programa y la tarea analtica.

Paso 3: Explorar los datos

En esta etapa, se inicia el anlisis. Cabe sealar que si hemos


llevado a cabo la investigacin reflexionando paso a paso, esta
etapa es relativamente sencilla, porque:

formulamos la pregunta de investigacin que pretendemos


contestar,
visualizamos un alcance,
establecemos nuestras hiptesis,
definimos las variables,
elaboramos un instrumento (conocemos que tems miden qu
variables y qu nivel de medicin tiene cada variable),
recolectamos datos.

Conceptos estadsticos que se aplican a la


exploracin de datos
Apunte 1
Las variables de la matriz de datos son columnas o tems.
Las variables de investigacin son las propiedades medidas que
forman parte de las hiptesis. En ocasiones, requieren un nico
tem para ser medidas, en otras se necesitan varios tems para tal
finalidad.

Apunte 2
Los anlisis de los datos dependen de tres factores:
El nivel de medicin de variables.
La manera como se hayan formulado las hiptesis.
El inters del investigador.

Estadstica descriptiva para cada variable


Qu es una distribucin de
frecuencias?
Es un conjunto de puntuaciones ordenadas en sus
respectivas categoras y generalmente se presenta
en una tabla.
Qu otros elementos contiene una
distribucin de frecuencias?
Las distribuciones de frecuencias pueden
completarse agregando los porcentajes de casos en
cada categora, los porcentajes vlidos y los
porcentajes acumulados.

De qu otra manera pueden presentarse las


distribuciones de frecuencias?

Cules son las medidas de tendencia central?

Son puntos en una distribucin obtenida, los valores medios o


centrales de sta, y nos ayudan a ubicarla dentro de la escala de
medicin.
Moda

Mediana

Es la categora o puntuacin que ocurre con mayor frecuencia.

Es el valor que divide la distribucin por la mitad.

Es la medida de tendencia central ms utilizada y puede definirse


como el producto aritmtico de una distribucin, es la suma de
Media todos los valores dividida entre el nmero de casos.

Qu son las medidas de la variabilidad?

Indican la dispersin de los datos en la escala de medicin.


Son intervalos que designan distancias o un nmero de
unidades en la escala de medicin.

Rango

Tambin llamado recorrido, es la diferencia entre la


puntuacin mayor y la puntuacin menor, e indica el nmero
de unidades en la escala de medicin que se necesitan para
incluir los valores mnimo y mximo.

Es el promedio de desviacin de las puntuaciones con


Desviacin respecto a la media. Se interpreta en relacin con la media.
estndar

La varianza

Cmo se interpretan las medidas de


tendencia central y de la variabilidad?
Al describir nuestros datos, respecto a cada variable
del estudio, consideramos todos los valores.

Hay alguna otra estadstica descriptiva?

Asimetra
Es una estadstica necesaria para reconocer cunto se
parece nuestra distribucin a una distribucin terica y
constituye un indicador del lado de la curva donde se
agrupan las frecuencias.
Si es cero, la distribucin es simtrica; cuando es
positiva, quiere decir que hay ms valores agrupados
hacia la izquierda de la curva; cuando es negativa,
significa que los valores tienden a agruparse a la
derecha de la curva.

Curtosis

Es un indicador de lo plana o picuda que es una


curva.
Cuando es cero, significa que puede tratarse de una
curva normal. Si es positiva, quiere decir que la curva
es ms picuda. Si es negativa indica que es ms plana.

Paso 4: Evaluar la confiabilidad o fiabilidad


y validez lograda por el instrumento de
medicin
Medida de estabilidad
Un mismo instrumento de medicin se
aplica dos o ms veces a un mismo grupo
de personas, despus de cierto periodo. Si
la correlacin entre los resultados es
altamente positiva, el instrumento es
confiable.
Medida
de formas alternativas o
paralelas
No se administra el mismo instrumento de
medicin, sino dos o ms versiones
equivalentes de ste.
El instrumento es confiable si la correlacin
entre los resultados de ambas
administraciones es positiva de manera

Mtodo de mitades partidas


Necesita slo una aplicacin de la medicin.
Especficamente el conjunto total de tems o
reactivos se divide en dos mitades equivalentes y
se comparan las puntuaciones o los resultados de
ambas.
Medidas de coherencia o
consistencia interna

El alfa de Cronbach
Los coeficientes KR 20 y KR 21
El mtodo de clculo en ambos casos requiere
una sola administracin del instrumento de
medicin. Su ventaja reside en que no es
necesario dividir en dos mitades a los tems del
instrumento, simplemente se aplica la medicin
y se calcula el coeficiente.

LA VALIDEZ

VALIDEZ DEL CONTENIDO


Opiniones de expertos
Dimensiones medidas representen al
universo
VALIDEZ DE CRITERIO
Correlacionar puntuaciones con valores
logrados

Una correlacin asocia puntuaciones obtenidas por la muestra

en 2 o ms variables

VALIDEZ DEL CONSTRUCTO


Anlisis de Factores

DETERMINAMOS

confiabilidad

validez

Seguimos con el anlisis descriptivo.

tems problemticos

PASO 5: ANALIZAR MEDIANTE PRUEBAS


ESTADSTICAS LAS HIPTESIS
PLANTEADAS
(ANLISIS ESTADSTICO INFERENCIAL)

EN ESTE PASO SE ANALIZAN LAS HIPTESIS A LA LUZ DE PRUEBAS


ESTADSTICAS, QUE A CONTINUACIN DETALLAMOS:

ESTADSTICA INFERENCIAL: DE LA
MUESTRA A LA POBLACIN
UTILIDAD DE LA ESTADSTICA INFERENCIAL

El propsito de la investigacin:
Probar hiptesis
Generalizar resultados

Los datos se recolectan de una muestra y sus resultados estadsticos se


denominan estadgrafos.
Estadsticas de la poblacin: parmetros.
Estos no son calculados porque no se recolectan datos de toda la
poblacin, pero pueden ser inferidos de los estadgrafos, de ah el
nombre de ESTADSTICA INFERENCIAL.

PROCEDIMIENTO
Recoleccin de
los datos en la
muestra

Clculo de
estadgrafos

Inferencia de
los parmetros
mediante
tcnicas
estadsticas

Poblacin
o
Universo

La estadstica inferencial se utiliza


para dos procedimientos
vinculados:
Probar hiptesis poblacionales
Estimar parmetros

PRUEBA DE HIPTESIS

HIPTESIS
Proposicin respecto a uno o varios parmetros

PRUEBA DE HIPTESIS
Relacin entre hiptesis poblacional y datos de
la muestra
Una hiptesis se retiene como un valor aceptable del parmetro, si
es consistente con los datos.

TIPOS DE
ANLISIS
Paramtri
cos
No
Paramtri
cos

Depende
de:
Hiptesis
Nivel de
medicin
de
variables

ANLISIS PARAMTRICOS
Para realizar anlisis paramtricos debe partirse
de los siguientes supuestos:
La distribucin poblacional de la variable
dependiente es normal: el universo tiene una
distribucin normal.
El nivel de medicin de las variables es por
intervalos o razn.
Cuando dos o ms poblaciones son estudiadas,
tienen una varianza homognea: las poblaciones
en cuestin poseen una dispersin similar en sus
distribuciones.

PRUEBAS PARAMTRICAS MS
UTILIZADAS:

COEFICIENTE DE CORRELACIN DE
PEARSON

Prueba estadstica para analizar la relacin entre

dos variables medidas en un nivel por intervalos


o de razn.
El coeficiente de correlacin de Pearson se

calcula a partir de las puntuaciones obtenidas


en una muestra en dos variables.

Regresin Lineal
Es un modelo estadstico para estimar el efecto de
una variable sobre otra. Est asociado con el
coeficiente r de Pearson.
Brinda la oportunidad de predecir las puntuaciones
de una variable tomando las puntuaciones de la otra
variable.
Entre mayor sea la correlacin entre las variables
(covariacin), mayor capacidad de prediccin.

Hiptesis: Correlacionales y causales.


Variables: Una se considera como independiente y otra como
dependiente. Pero, para poder hacerlo, debe tenerse un slido
sustento terico.
Nivel de medicin de variables: Intervalos o razn.
Procedimiento e interpretacin: La regresin lineal se
determina con base en el diagrama de dispersin. ste
consiste en una grfica donde se relacionan las puntuaciones
de una muestra en dos variables.

Vemoslo con un ejemplo sencillo de ocho casos.


Una variable es la calificacin en Filosofa y la otra
variable es la calificacin en Estadstica; ambas
medidas, hipotticamente,
de 0 a 10.
Puntuaciones

1
2
3
4
5
6
7
8

Filosofa (X)
3
8
9
6
10
7
6
5

Estadstica (Y)
4
8
8
5
10
8
7
5

El diagrama de dispersin se construye graficando


cada par de puntuaciones en un espacio o plano
bidimensional. Sujeto 1 tuvo 3 en X (filosofa) y 4
en Y (estadstica):

As se grafican todos los pares:

Los diagramas de dispersin son una manera de visualizar


grficamente una correlacin. Por ejemplo:
Si aplicramos los exmenes de filosofa y estadstica (escala
de 0 a 10 en ambas mediciones) a 775 alumnos y
obtuviramos el siguiente resultado: r = 0.814** (significativa
al nivel del .01). La correlacin es considerablemente positiva y
el diagrama de dispersin sera el siguiente:

La tendencia es ascendente, altas puntuaciones en Y, altas


puntuaciones en X (mejores calificaciones en Estadstica estn
asociadas con mejores calificaciones en Filosofa).
En cambio, si administrramos una prueba sobre la
depresin (escala de 0 a 50) y una que mida el sentido de
vida (0 a 100) y el resultado fuera: 0.926** (signifi cativa al
nivel del .01). La correlacin es sumamente negativa y el
diagrama de dispersin sera el siguiente: La tendencia es
descendente, altas puntuaciones en depresin se encuentran
vinculadas con bajas en sentido de vida, y viceversa.

En el caso de que dos variables no estn correlacionadas, por


ejemplo: r = .006 (no significativa) (digamos entre
inteligencia 90 a 140 y motivacin al trabajo 0 a 50). El
diagrama de dispersin no tiene ninguna tendencia.

As, cada punto representa un caso y un resultado de la


interseccin de las puntuaciones en ambas variables. El
diagrama de dispersin puede ser resumido a una lnea, si hay
tendencia.
Conociendo la lnea y la tendencia, podemos predecir los
valores de una variable conociendo los de la otra variable.

Esta lnea es la recta de regresin y se expresa mediante la


ecuacin de regresin lineal:

En donde Y es un valor de la variable dependiente que se


desea predecir, a es la ordenada en el origen y b la
pendiente o inclinacin, X es el valor que fijamos en la
variable independiente.
Los programas y paquetes computacionales de anlisis
estadstico que incluyen la regresin lineal, proporcionan
los datos de a y b.
Para predecir un valor de Y, se sustituyen los valores
correspondientes en la ecuacin.

Consideraciones
La regresin lineal es til con relaciones lineales, no con
relaciones curvilineales. Porque como se seala, es un
error atribuir a la relacin causal una covariacin
exclusivamente lineal: a mayores valores en la variable
independiente, mayores valores en la dependiente.
Existen muchas relaciones de causa-efecto que no son
lineales, como por ejemplo: la vinculacin entre ansiedad
y rendimiento. Cierto grado de ansiedad ayuda a
conseguir mejores resultados en un examen o la prctica
de un deporte; pero, por encima de cierto nivel
(nerviosismo extremo), la ejecucin empeora.

Las relaciones curvilineales son aquellas en las cuales la


tendencia vara: primero es ascendente y luego
descendente, o viceversa.
Se ha demostrado que una estrategia persuasiva con
niveles altos de apelacin al temor, por ejemplo, un
comercial televisivo muy dramtico, provoca una baja
persuasibilidad, lo mismo que una estrategia persuasiva
con niveles muy bajos de apelacin al temor.
La estrategia persuasiva ms adecuada es la que utiliza
niveles medios de apelacin al temor. Esta relacin es
curvilineal; se representara as:

Qu es la prueba t?
Definicin: es una prueba estadstica para evaluar si dos grupos difieren entre s de
manera significativa respecto a sus medias en una variable.
Se simboliza: t
Hiptesis: de diferencia entre dos grupos. La hiptesis de investigacin propone que
los grupos difieren de manera significativa entre s y la hiptesis nula plantea que los
grupos no difieren significativamente. Los grupos pueden ser dos plantas comparadas
en su productividad, dos escuelas contrastadas en los resultados a un examen, dos
clases de materiales de construccin cotejados en su rendimiento, etctera.
Variables: la comparacin se realiza sobre una variable (regularmente y de manera
terica: dependiente). Si hay diferentes variables, se efectuarn varias pruebas t (una
por cada par de variables), y la razn que motiva la creacin de los grupos puede ser
una variable independiente. Por ejemplo, un experimento con dos grupos, donde a
uno se le aplica el estmulo experimental y al otro no, es de control.

Clculo e interpretacin
La prueba t se basa en una distribucin
muestral o poblacional de diferencia de
medias conocida como la distribucin t de
Student que se identifica por los grados de
libertad, los cuales constituyen el nmero
de maneras en que los datos pueden variar
libremente. Son determinantes, ya que nos
indican qu valor debemos esperar de t,
dependiendo del tamao de los grupos que
se comparan.


Cuanto mayor nmero de grados de libertad se tengan, la
distribucin t de Student se acercar ms a ser una
distribucin normal y usualmente, si los grados de libertad
exceden los 120, la distribucin normal se utiliza como una
aproximacin adecuada de la distribucin t de Student.
Los grados de libertad se calculan con la frmula siguiente, en
la que n1 y n2 son el tamao de los grupos que se comparan:

Qu es el tamao efecto

Al comparar grupos, en este caso con la prueba t es importante


determinar el tamao del efecto, que es una medida de la fuerza de
la diferencia de las medias u otros valores considerados (Creswell,
2005; Alhija y Levy, 2009). Resulta ser una medida en unidades de
desviacin estndar.

Cmo se calcula? El tamao del efecto es justo la diferencia


estandarizada entre las medias de los dos grupos. En otras palabras:

La
desviacin estndar sopesada es la estimacin reunida de la desviacin
estndar de ambos grupos, basada en la premisa que cualquier diferencia
entre sus desviaciones es solamente debida a la variacin del muestreo
(Creswell, 2005).

La desviacin estndar sopesada (denominador en la frmula) se calcula as:

Donde NE y NC son el tamao de los grupos (grados de libertad),


respectivamente; en tanto que, SDE y SDC son sus desviaciones estndares.

Qu es la prueba de diferencia
de proporciones?
Definicin: es una prueba estadstica para analizar si
proporciones o porcentajes difieren significativamente entre s.

dos

Hiptesis: de diferencia de proporciones en dos grupos.


Variable: la comparacin se realiza sobre una variable. Si hay
varias, se efectuar una prueba de diferencia de proporciones por
variable.
Nivel de medicin de variable de comparacin: cualquier nivel,
incluso por intervalos o razn, pero siempre expresados en
proporciones o porcentajes.

Qu es el anlisis de varianza
nidireccional o de un factor? (ANOVA
Definicin: es una prueba estadstica para analizar si ms de dos
grupos difieren significativamente entre s en cuanto a sus medias y
varianzas. La prueba t se usa para dos grupos y el anlisis de
varianza unidireccional se usa para tres, cuatro o ms grupos.
Aunque con dos grupos se puede utilizar tambin.
Hiptesis: de diferencia entre ms de dos grupos. La hiptesis de
investigacin propone que los grupos difieren significativamente
entre s y la hiptesis nula propone que los grupos no difieren
significativamente.
Variables: una variable independiente y una variable dependiente.

Nivel de medicin de variables:


La variable independiente es categrica y la dependiente es por intervalos o
razn.
El hecho de que la variable independiente sea categrica signifi ca que es
posible formar grupos diferentes. Puede ser una variable nominal, ordinal, por
intervalos o de razn (pero en estos ltimos dos casos la variable debe reducirse
a categoras).
Por ejemplo:
Religin.
Nivel socioeconmico (muy alto, alto, medio, bajo y muy bajo).
Antigedad en la empresa (de cero a un ao, ms de un ao a cinco aos,
ms de cinco aos a 10, ms de 10 aos a 20 y ms de 20 aos).

ANLISIS NO PARAMTRICOS
Para realizar estos anlisis, debemos partir de las
siguientes consideraciones:
La mayora de estos anlisis no requiere de
presupuestos acerca de la forma de la distribucin
poblacional. Aceptan distribuciones no normales
Las variables no tienen que estar medidas por
intervalos, pueden analizar datos nominales u
ordinales

MTODOS NO PARAMTRICOS MAS


UTILIZADOS

CHI CUADRADA
Evala hiptesis de la relacin entre
dos variables categricas
No considera relaciones causales
Se calcula por medio de una tabla de
contingencia

OTROS COEFICIENTES DE CORRELACIN

COEFICIENTE
DE
CORRELACI
N DE
PEARSON

Para variables
medidas por
intervalos y
relaciones
lineales.

PASO 6: REALIZAR ANLISIS ADICIONALES

Una vez realizados nuestros anlisis, es posible que decidamos

efectuar otros anlisis o pruebas extra para confirmar


tendencias y evaluar los datos desde diferentes ngulos.
Paso clave para verificar que no se nos haya olvidado un anlisis

pertinente.
Aqu elegimos anlisis multivariados

PASO 7: PREPARA RESULTADOS PARA


PRESENTARLOS
Revisar cada resultado
Organizar los resultados
Cotejar diferentes resultados: congruencia y en caso
de inconsistencia lgica, volver a revisar. Evitar
combinacin de tablas o diagramas que repitan datos
Priorizar informacin
Copiar y/o formatear tablas

Comentar o describir anlisis, valores,


tablas, diagramas, grficas
Volver a revisar resultados
Elaborar reporte de investigacin

You might also like