You are on page 1of 20

Investigacin de Mercados

Preparacin de los Datos


Distribucin de frecuencias
Tablas cruzadas

Guadalupe Rosazza V.

Proceso de preparacin de los datos


Preparacin preliminar del plan de
anlisis de datos

Revisin del cuestionario

Edicin

Codificacin

Transcripcin

Depuracin de los datos

Ajuste estadstico de los datos

Eleccin de una estrategia de anlisis


de datos

Revisin del cuestionario


En esta etapa se debe verificar que todos los cuestionarios en cuanto a ala calidad
de las entrevistas y a que estn completos. En caso de que el cuestionario este
incompleto debe regresar a campo, razones:
Partes incompletas del cuestionario

Patrn de respuestas indica que el encuestado no entendi la pregunta


Las respuestas muestran poca varianza
Fsicamente el cuestionario esta incompleto
El cuestionario se recibi despus de la fecha establecida
El cuestionario fue contestado por alguien que no debi pasar el filtro

Edicin
Es la revisin de los cuestionarios con el objetivo de incrementar su exactitud y
precisin.

Consiste en examinar los cuestionarios para identificar respuestas

ilegibles, incompletas, incongruentes o ambiguas.

Devolucin al
campo

Asignacin de
valores
faltantes

Descartar a los
encuestados
insatisfactorios

Codificacin
Los cuestionarios cuyas respuestas son tratadas mediante un programa
deben estar totalmente codificadas, esto quiere decir que deben tener una
identificacin mediante un nmero de cdigo

Has consumido durante los 4 ltimos meses alguno de estos productos?

GOMAS DE MASCAR
CHUPETES
CARAMELOS MENTOLADOS
CARAMELOS MASTICABLES

SI CONSUMIO
1
2
3
4

Codificacin
Aquellas preguntas cuya respuesta es una cifra o cantidad es aconsejable
dejar estas preguntas abiertas.

Cul es tu edad? _________

Estas cantidades se ingresan directamente al software que se esta usando

Codificacin
El libro de cdigos contiene las instrucciones para la codificacin y la
informacin necesaria sobre las variables en el conjunto de datos.
Num.
Columna

Instruc.
Codific.

Num.
registro

Num.
Pregunta

Num.
variable
Nombre
Variable

Transcripcin

Depuracin de datos
esta basado en controles de errores, el cual se inicia con la prueba piloto
del cuestionario en el que se ajustan las preguntas y las respuestas que
surgirn de ella.
Control de
errores

Captura de la
informacin

Relaciones
lgicas

Debe
obtener
solamente
los cdigos
designados
para cada
respuesta

Trata de
detectar
inconsistenci
as entre las
rptas de
distintas
preguntas

Control de filtros

Sirven de
base para
continuar el
cuestionario,
para saltar a
otras preg.

Control de
secuencia

Se realiza
para detectar
la falta de
algn caso o
duplicacin
de casos

Recodificaciones

Utilizadas
para asignar
pesos a cada
caso en una
ponderacin.

Clasificacin delas tcnicas estadsticas


Tcnicas Univariadas

Pruebas no paramtricas
(datos no mtricos)

Pruebas paramtricas
(datos mtricos)
Una muestra

* Prueba t
* Prueba Z

Dos o ms
muestras

Muestras
independientes
* Prueba t de
dos grupos
Prueba Z
ANOVA

Muestras
pareadas
* Prueba t
pareada

Dos o ms
Chi cuadrada muestras
K-S
Rachas
Binomial

Una muestra
*
*
*
*

Muestras
independientes
*
*
*
*

Chi cuadrada
Mann-Whitney
Mediana
K-S

Muestras
pareadas
*
*
*
*

Del signo
Wilcoxon
McNemar
Chi cuadrada

Clasificacin delas tcnicas estadsticas


Tcnicas
multivariadas

Tcnicas de
dependencia

Mas de una
variable
dependiente

Una variable
dependiente

Tabulacin

Anlisis

cruzada

multivariado de

Anlisis varianza y

Var y Cov.

covarianza

Regresin mltiple

Anlisis de
discriminante

Correlacin
cannica

Discriminante
mltiple

Tcnicas de
interdependencia

Interdependencia
de variables

Anlisis factorial

Semejanza entre
objetos

Anlisis de
conglomerados

Escalamiento
multidimensional

Anlisis descriptivo de los datos

Distribucin de frecuencias
Tabulaciones cruzadas

Distribucin de frecuencias
En una distribucin de frecuencias se considera una variable a la vez.
Una distribucin de frecuencias de una variable produce una tabla de conteo de
frecuencias, porcentajes y porcentajes acumulados para todos los valores
asociados con esa variable.

Etiqueta de valores
Muy poco familiarizado

Muy familiarizado
Faltantes

Valor
1
2
3
4
5
6
7
9
TOTAL

Frecuencia (N)
0
2
6
6
3
8
4
1
30

Porcentaje
Porcentaje vlido

Porcentaje
acumulativo

0.0
6.7
20.0
20.0
10.0
26.7
13.3
3.3

0.0
6.9
20.7
20.7
10.3
27.6
13.8

0.0
6.9
27.6
48.3
58.6
86.2
100.0

100.0

100.0

Histograma de frecuencias
Son diagramas de barra empleados para resumir e ilustra la variacin que se
presenta en un conjunto de datos. Sirven para investigar como se puede
solucionar un problema o mejorar un proceso
8
7

Frecuencia

6
5
4
3
2
1
0

4
Familiaridad

Estadsticos asociados con las Distribucin de


Frecuencia Medidas de Localizacin
La media, o valor promedio, es la medida de tendencia central ms
utilizada. La media, X , est dada por
n

X = S X i /n
i =1

donde,
Xi
= valores observados de la variable X
= nmero de observaciones (tamao de la muestra)

La moda es el valor que ocurre con mayor frecuencia. Representa el


pico ms alto de la distribucin. La moda es una buena medida de
localizacin cuando la variable es inherentemente categrica o se
ha agrupado en categoras.

Estadsticos asociados con las Distribucin de


Frecuencia Medidas de Variabilidad

La varianza es la desviacin promedio al cuadrado a partir de la


media. La varianza nunca puede ser negativa.
La desviacin estndar es la raz cuadrada de la varianza.

sx =

(Xi - X)2
S
i =1 n - 1

El coeficiente de variacin es el cociente de la desviacin estndar


con respecto a la media, expresado en porcentaje, y es una medida
de variacin relativa sin unidades.

CV = sx /X

Tabulaciones Cruzadas
Mientras que una distribucin de frecuencias describe una variable a la vez, una
tabulacin cruzada describe dos o ms variables de forma simultnea.

La tabulacin cruzada produce tablas que reflejan la distribucin conjunta de


dos o ms variables con un nmero limitado de categoras o valores distintos.

Sexo
Uso de Internet

Hombre

Mujer

Total por
rengln

Espordico (1)

10

15

Frecuente (2)

10

15

15

15

Total por columna

Tabulaciones Cruzadas
Compra de
ropa de
moda

Sexo
Hombre
Casado

No
casado

Mujer
Casada

No
casada

Alta

35%

40%

25%

60%

Baja

65%

60%

75%

40%

Totales por
columna
Nmero de
casos

100%

100%

100%

100%

400

120

300

180

Estadsticos asociados con la tabulacin cruzada


Chi Cuadrada
Para determinar si existe una asociacin sistemtica, se estima la
probabilidad de obtener un valor de chi cuadrada, tan grande o ms grande
que el calculado a partir de la tabulacin cruzada.
Una caracterstica importante del estadstico chi cuadrada es el nmero de

grados de libertad (gl) asociados a ste. Es decir, gl= (r - 1) (c -1).


La hiptesis nula (H0) de que no hay relacin entre las dos variables, se
rechaza nicamente cuando el valor calculado del estadstico de prueba es

mayor que el valor crtico de la distribucin chi cuadrada, con el nmero


apropiado de grados de libertad.

Estadsticos asociados con la tabulacin cruzada


Chi Cuadrada
El estadstico chi cuadrada ( X2 ) se utiliza para
probar la significancia estadstica de la asociacin
observada en una tabulacin cruzada.

No rechazar

H0

Rechazar H0

Valor
crtico

You might also like