You are on page 1of 11

0

ANÁLISIS DE DATOS APLICADOS A


INVESTIGACIÓN CUANTITATIVA

Profesor:

HORACIO MIRANDA VARGAS

CAPÍTULO - I

Metodología de Investigación: Selección de Métodos


Estadísticos Aplicados frecuentemente en
Investigación Empírica Cuantitativa.
1

Introducción

En este informe se desarrolla una forma esquemática de selección de métodos estadísticos


aplicados frecuentemente en investigación empírica cuantitativa para datos independientes.

En este apartado no se considera el análisis de datos correlacionados o del tipo procesos


estocásticos que pueden ser analizados a través de modelos de series de tiempo o dinámica
de sistemas (modelos de simulación dinámica).

Una clasificación de las formas de generar conocimiento corresponde al entorno en el cual se


realizan las pruebas y verificaciones de las hipótesis de investigación, cuando esto es llevado a
cabo completamente en la mente del investigador, sin requerir de una verificación en el entorno
físico se dice que el procedimiento seguido corresponde a investigación teórica la cual
permite en primer lugar crear una teoría y posteriormente desarrollar los comportamientos
particulares de cada una de sus leyes, este procedimiento corresponde al método deductivo
propio de las ciencias abstractas como la matemática o la física teórica entre otras.

En cambio cuando la verificación de las hipótesis se realiza comprobando su veracidad en el


medio físico, se indica que el procedimiento seguido corresponde a una investigación de tipo
empírica en la cual es habitual que de un todo o población se estudien sus partes o muestras a
partir de las cuales se comprueban algunas leyes las cuales se pueden ir uniendo hasta
constituir una teoría, este procedimiento se denomina método inductivo propio de las
ciencias empíricas o fácticas.

En el caso de la investigación empírica, ésta puede tener como propósito profundizar en una
situación particular sin pretender generalizar las conclusiones obtenidas, a lo cual se le
denomina estudio de casos, o bien intentar obtener conocimiento de una situación global a
través del estudio de todas las entidades que forman parte del problema lo que se denomina
investigación censal.
2

Pero debido a que en la mayoría de los casos existen restricciones económicas o físicas
solamente se puede realizar la investigación empírica sobre algunas de las entidades, lo que
se denomina investigación muestral, la que dependiendo del tipo de muestra puede ser
denominada muestra probabilística la cual intenta proporcionar una representatividad de la
situación global, y muestra no-probabilística la cual no asegura que los resultados obtenidos
sean representativos de la situación global o universo.

En algunos casos el investigador necesitará evaluar la magnitud y significancia del cambio que
se produce en las variables aleatorias analizadas como resultado del efecto de variables
controladas en las cuales se fijan determinadas intensidades en las unidades estudiadas lo que
se denomina investigación experimental, en cambio pueden haber situaciones en las cuales
no es posible intervenir sobre las entidades o situaciones estudiadas y por lo tanto la totalidad
de las variables o atributos investigados presentan sus valores en forma aleatoria o al azar lo
que se denomina investigación no-experimental.

Denominación de variables.
En el caso de la investigación experimental la variable aleatoria analizada se denomina
variable dependiente (y), y la o las variables fijas o controladas se denominan variables
independientes (x). En el caso de la investigación no-experimental la variable aleatoria
estudiada se denomina simplemente variable analizada, y la o las variables relacionadas se
denominan variables asociadas. Un caso especial de investigación no-experimental que tiene
como propósito verificar la causalidad entre variables se sugiere denominar a la variable
analizada como variable de respuesta y a la(s) variables relacionadas como variables
influyentes.

Dimensionalidad del análisis de las variables.

Las variables analizadas pueden ser estudiadas en forma individual lo que se denomina
análisis unidimensional o que también denominado análisis de una sola muestra.
3

Además se pueden relacionar dos variables diferentes a través de análisis bivariado lo que
también se denomina análisis univariado simple o bidimensional. A su vez se puede relacionar
una variable de análisis con varias otras lo que se denomina análisis univariado múltiple o
multivariable, y finalmente se puede realizar un estudio de varias variables de respuesta
incorporando la covariación presente entre ellas o con otras variables relacionadas, lo que se
denomina análisis multivariado o multivariante (análisis multidimensional).

Análisis Univariado Análisis Univariado


Simple Múltiple
Y Y
Xm
X2
X1
X

Análisis Multivariado Análisis Multivariado


Simple Múltiple
Y1, Y2..Yn Y1,Y2..Yn
Xm

X X1

(Una excepción en multivariante es el análisis discriminante el cual contiene una sola variable
dependiente cualitativa (Yc), pero debido al uso de toda la información de las variables
independientes cuantitativas o numéricas(Xn) corresponde a un análisis multivariado).

En la mayoría de los casos los análisis de los datos se realizan a través de métodos
estadísticos y en algunos casos se recurre a técnicas pertenecientes a los métodos
numéricos los cuales no cuentan con funciones de distribución para el término de error
residual de los datos.
4

Los métodos estadísticos se pueden clasificar como aquellos pertenecientes a la estadística


descriptiva cuando los resultados se refieren a la muestra o en inferencia estadística
cuando los resultados se pretenden generalizar a la población o universo.

Metodología
Estadística
(Muestra) Distribución Poblacional

Estadística Inferencia
Estadística
Descriptiva

Pruebas de
Hipótesis

Estimación Relación entre Supuestos


Parámetros Variables
Tablas Gráficos Valores (usuales)

Barra/Sector Centralizac. Est. Puntual Yc~Xc = Frecuencias Normalidad

Líneas Dispersión Int.Confianza Yn~Xn = Corr./Regre. Homocedast.

Histograma Yn~Xc = Comp.Prom. Autocorrelac.

Cajas-Rango Yc~Xn = Mod.Categ. Aleatoriedad

Barras-Error

Unidimen. Bidimen. Tridimen. Multidimen.

Dispersión
5

La estadística descriptiva presenta una serie de métodos que deben seguir una relación con
la escala de medida de cada variable analizada, pudiéndose emplear métodos
correspondientes a las variables de menor información en variables de mayor contenido de
información, pero no en sentido contrario.

Contenido de Nombre de Nombre de Valor de Valor de Gráfico


Información centralización
la escala la subescala dispersión
Igual o distinto Moda Tabla de Barras

(mínima relación) Cualitativa, simples,


Nominal frecuencias

No-métrica Sectores
Mayor o menor Mediana Rango Cajas y

(más que relac. ant) Ordinal Intercuartílico Rangos


Suma, resta, Promedio Desviación Histograma,

- origen variable - Cuantitativa, Intervalar Aritmético Estándar Barra Error


(Más que relac. ant.) Métrica Error Típico
Razón, Media Coeficiente Tallo y hojas,
(numérica)
- origen fijo - Razón o Geométrica, de Variación Ojiva
(más que relac. ant.) Proporciones M. Armónica Kernel

En el caso de la inferencia estadística de estimación de parámetros esta se debe realizar a


través de la estimación de intervalos de confianza, para lo cual se suma, y resta al valor de
centralización, el producto de la multiplicación del error estándar del valor de centralización por
un coeficiente de confianza extraído de una distribución correspondiente al tipo de valor de
centralización analizado.

Límite de Confianza Superior (LCS) = [ Valor Centralización ] + [ (Coef.Conf.) * (Err.Est.) ]

Límite de Confianza Inferior (LCI) = [ Valor Centralización ] - [ (Coef.Conf.) * (Err.Est.) ]


6

Para el caso de una variable cuantitativa la inferencia estadística de prueba de hipótesis de


estimación de un valor de centralización se debe realizar a través de la prueba T de Student
de una sola muestra, y para el caso de una variable cualitativa de dos categorías o
modalidades a través de la prueba no-paramétrica binomial, y a través de la prueba no-
paramétrica de bondad de ajuste de Chi-Cuadrado para el caso de una variable cualitativa
politómica o de más de dos categorías o modalidades.

En el caso de los métodos estadísticos de inferencia estadística univariada simple y múltiple de


estimación de la relación entre variables, esto será esquematizado en forma separada para
investigación experimental y no-experimental, tomando en consideración la escala de medida
de la variable analizada y la o las variables relacionadas.

Investigación Experimental (Métodos de estadística paramétrica con datos independientes)

Variable dependiente (Y) ↑ Análisis de frecuencias (tablas Modelos Categóricos:


(siempre es var. aleatoria) de contingencia):
Modelo Probit, Modelo Logit,
Cualitativa Modelo Logit-Multinomial, Análisis de Regresión Logística

Prueba Chi-cuadrado de
Homogeneidad
Comparación de Promedios: Modelos Predictivos:
Prueba T de Student 2 muestras,
Cuantitativa Análisis de regresión simple,
ANOVA, ANCOVA (Anova con
múltiple, lineal, no lineal, ridge.
covariable cuantitativa)
Análisis de Series de tiempo.
Variable independiente (X) Cualitativa Cuantitativa
(siempre es var. Fija) 
7

Investigación No-Experimental (estadística paramétrica con datos independientes)

Variable dependiente (Y) ↑ Análisis de frecuencias (tablas Modelos Categóricos:


(siempre es var. aleatoria) de contingencia):
Modelo Multinivel univariado
Cualitativa Modelo Log-Lineal, Prueba Chi-
cuadrado de Independencia
Componentes de Varianza: Análisis de Correlación:

Cuantitativa ANOVA y ANCOVA Modelo Análisis de correlación lineal


Aleatorio y Modelo Mixto de Pearson simple, múltiple y
Parcial
Variable asociada (X) Cualitativa Cuantitativa
(variable aleatoria y “fija”) 

En el caso de los métodos estadísticos Multivariados estos serán esquematizados en forma


separada para investigación experimental y no-experimental, tomando en consideración la
escala de medida de las variables analizadas y la o las variables relacionadas.

Métodos Multivariantes de Dependencia ( Var. Relacionada Fija - Investigación Experimental )

Variable dependiente (Y) ↑ Análisis de frecuencias (tablas Modelos Categóricos:


(siempre es var. aleatoria) de contingencia):
Análisis Discriminante, Redes
Cualitativa Análisis Conjunto, Ecuaciones Neuronales Supervisadas,
Estructurales Ecuaciones Estructurales
Comparación de Promedios: Modelos Predictivos:
Prueba T2 de Hotelling de 2
Cuantitativa AF Confirmatorio
muestras, MANOVA, MANCOVA
(Ec.Estructurales), Análisis de
(Manova con covariable
regresión multivariante, Análisis
cuantitativa)
Canónico
Variable independiente (X) Cualitativa Cuantitativa
(var. Fija o aleatoria) 

Mét. Multivariantes de Interdependencia ( Var. Relac. Aleat. - nvestigación No-Experimental )

Variable dependiente (Y) ↑ Análisis de frecuencias (tablas Modelos Categóricos:


8

(siempre es var. aleatoria) de contingencia):

Cualitativa Análisis de Correspondencias, Modelo Multinivel Multivariado


MDS No-Métrico, PRINQUAL
Componentes de Varianza: Análisis de Asociación:

Cuantitativa Análisis de Ecuaciones AF Componentes Principales,


Estructurales, MANOVA y AF Exploratorio, MDS Métrico,
MANCOVA Modelo Aleatorio y Cluster, Redes Neuronales No
Modelo Mixto Supervisadas, Modelo Multinivel
Multivariado
Variable asociada (Y) Cualitativa Cuantitativa
(variable aleatoria y “fija”) 

Finalmente, dependiendo del grado de explicación de los resultados obtenidos de los análisis
se pueden indicar las siguientes categorías:

1.- Estudios piloto.

2.- Investigación exploratoria.

3.- Investigación Descriptiva.

4.- Investigación Correlacional.

5.- Investigación de Identificación.

6.- Ensayos pre-experimentales o cuasi-experimentales.

7.- Investigación Comparativa.

8.- Investigación Predictiva.

Se debe hacer notar que la exposición de los temas planteados corresponde a una visión
simplificada de los métodos disponibles en la actualidad, ya que en los contenidos no están
referidos aspectos como métodos para datos pareados, métodos de estadística no
paramétrica, métodos de submuestreo, métodos numéricos, algoritmos genéticos,
geoestadística, análisis espacial de datos, métodos de segmentación, Data Mining, entre otros
9

actualmente en uso.

A continuación se presenta un esquema de los métodos cuantitativos aplicados usualmente en


investigación empírica, en función del tipo de resultado y la dimensionalidad de acuerdo al
número de variables incluidas en los análisis.

Métodos cuantitativos según dimensionalidad y tipo de resultado de investigación

Objetivo del Análisis Unidimensional Bidimensional Multidimensional Mét.Cuantitativos


Tablas, Promedios,
Dispersiograma, Cajas y
Descriptivo Dispersión,
Rangos por Grupos
Gráficos Gráficos Radial,..
Valores influyentes,
Valores influyentes, Valores
Exploratorio Asimetría, Curtosis, Valores atípicos
atípicos
Distribución
T-Student 1
Estimación de Parámetros muestra, Binomial,
Chi-Cuadrado
Chi-2 Indep., Log-Lineal, r-
Análisis de
A. Asociación Pearson, Tau-Kendall,
Correspondencias,
Correlacional Comp.Varianza, Regre-
Mod. Multinivel
Aleat

Chi-2 Homog, Logit-


Multinomial, Probit, Logit, T2 de Hotelling,
Mét.odos de Comparación Reg-Logística, Reg-Cox, Manova, Ecuac.
entre Grupos Reg-Hazard, T-St.2 Estructurales-
muestras, Anova, Modelo Causal
Regresión

Series de Tiempo, Regresión Redes Neuronales


Pronósticos
Simulación Dinámica Multivariante Supervisadas

Análisis Factorial:
Componentes Algoritmos
Identificación
Principales, A. Fac. Genéticos
Común

Ecuac.
Modelo Causal Regresion Paso a Paso Estructurales-
Modelo Causal

Preferencias Análisis Conjunto


Arboles de
Segmentación Chaid, Aid
Regresión

Redes Neuronales
Tipologización A. Conglomerados
No-Supervisadas

Escalamiento
Posicionamiento
Multidimensional
10

Redes Neuronales
Clasificación A. Discriminante
Supervisadas

Data Mining “ Todo lo anterior “ “ Todo lo anterior “ “Todo lo anterior“


Geoestadísticas,
A. Espacial de Datos
Simulación
Fiabilidad,
A.Factorial Exp., Ec.
Evaluación de Encuestas
Estructurales-
Modelo de Medida

Bibliografía.

J.J. Hair, R.E. Anderson, R.L. Tatham, and W.C. Black. Análisis Multivariante de Datos. Ed.
Prentice-Hall. Pearson de México, 2004