CAPITULO N° 14: Preparación de los datos

EL PROCESO DE PREPARACIÓN DE LOS DATOS
El primer paso consiste en verificar que los cuestionarios sean aceptables, seguido por
la verificación, codificación y trascripción de los datos. Se depuran los datos y se
recomienda un tratamiento para las respuestas faltantes. Con frecuencia resulta
necesario un ajuste estadístico de los datos para que sean representativos de la
población de interés. El investigador debe entonces elegir la estrategia apropiada para
el análisis de los datos. La estrategia final de análisis de los datos difiere del plan
preliminar de análisis, debido a la información y los conocimientos obtenidos desde
que se formuló el plan original. La preparación de los datos debe empezar tan pronto
como se reciba el primer grupo de cuestionarios del campo, mientras el trabajo de
campo continúa. De este modo, si se detecta algún problema, es factible modificar el
trabajo de campo para incorporar alguna acción correctiva.
REVISIÓN DEL CUESTIONARIO
El paso inicial en la revisión del cuestionario implica verificar todos los cuestionarios en
cuanto a la calidad de las entrevistas y a que estén terminados. A menudo estas
revisiones se realizan mientras el trabajo de campo sigue en proceso.
Un cuestionario que regresa del campo podría ser inaceptable por varias
razones:
1. Algunas partes del cuestionario están incompletas.
2. El patrón de respuestas indica que el encuestado no entendió o siguió las
instrucciones. Por ejemplo, cuando no se siguieron los patrones de salto.
3. Las respuestas muestran poca varianza. Por ejemplo, un encuestado sólo marcó la
opción número 4 en una serie de escalas de calificación de 7 puntos.
4. Los cuestionarios entregados están físicamente incompletos: faltan una o más
páginas.
5. El cuestionario se recibió después de la fecha establecida.
6. El cuestionario fue contestado por alguien que no estaba calificado para participar

EDICIÓN
La revisión del cuestionario con el objetivo de incrementar la exactitud y la precisión.
Consiste en examinar los cuestionarios para identificar respuestas ilegibles,
incompletas, incongruentes o ambiguas.
Tratamiento de las respuestas insatisfactorias
Devolución al campo: Los cuestionarios con respuestas insatisfactorias pueden
devolverse al campo, donde los entrevistadores vuelven a hacer contacto con los
encuestados. No obstante, los datos obtenidos en la segunda ocasión quizá sean
diferentes de los obtenidos en la encuesta original.
Asignación de valores faltantes: Este enfoque sería deseable si 1. El número de
encuestados insatisfactorios es pequeño, 2. La proporción de respuestas
insatisfactorias para cada uno de estos encuestados es pequeña o 3. Las variables
con respuestas insatisfactorias no son las más importantes.

nombre de la variable. número de columna. 2. el sexo de los encuestados se codifica con 1 para las mujeres y 2 para los hombres. Si el cuestionario contiene preguntas no estructuradas. código del entrevistador. se realiza una codificación previa. La proporción de encuestados insatisfactorios es pequeña (menos del 10 por ciento). 3. La proporción de respuestas insatisfactorias para cada uno de estos encuestados es grande o 5. 4. CODIFICACIÓN La asignación de un código para representar una respuesta específica a una pregunta concreta de un cuestionario. faltan respuestas para las variables más importantes. Por ejemplo. Por lo general. Una forma práctica de ingresar los datos es usar una hoja de cálculo como EXCEL. Codificación de las preguntas: Para cada encuestado tienen que incluirse los siguientes códigos adicionales: código de proyecto. número de registro. 3. . 4. Si el cuestionario sólo contiene preguntas estructuradas o muy pocas preguntas no estructuradas. a discos o cintas magnéticas o directamente a la computadora por medio del teclado. y código de validación. que permite asignar con facilidad columnas específicas para preguntas y respuestas concretas. si sólo hay un registro para cada encuestado puede prescindirse del código de registro. 5. debería informar cuál fue el procedimiento adoptado para identificarlos y cuántos fueron. TRASCRIPCIÓN La trascripción implica transferir los datos codificados de los cuestionarios o de las hojas de codificación. códigos de fecha y hora. número de la pregunta. los códigos se asignan después de que el cuestionario se haya devuelto del campo (codificación posterior). Sin embargo. en factores demográficos o características de uso del producto). número de variable. y 6.Descartar a los encuestados insatisfactorios: Dicha estrategia resulta apropiada cuando 1. Si el investigador decide descartar a los encuestados insatisfactorios. Libro de códigos: Libro que contiene las instrucciones para la codificación y la información necesaria sobre las variables en el conjunto de datos. Cada fi la contiene los datos de un encuestado. instrucciones para la codificación. Códigos de campo fijo: Código en que el número de registros para cada encuestado es el mismo y donde aparecen los mismos datos en las mismas columnas para todos los encuestados. un libro de códigos contiene la siguiente información: 1. Los encuestados insatisfactorios no difieren de los encuestados satisfactorios de forma evidente (por ejemplo. 2. Esto significa que se asignan códigos antes de realizar el trabajo de campo. El tamaño de la muestra es grande. en particular junto con el registro de los datos y la posición en la columna que ocupará el código.

son lógicamente incongruentes o tienen valores extremos. Comprobación de la congruencia: Parte del proceso de depuración de datos en que se identifican los datos que están fuera de rango. en las entrevistas personales cada vez es más común el uso de sistemas computarizados de análisis sensorial debido al incremento en el uso de las computadoras de bolsillo (gridpads) y las computadoras lap top. Los datos con valores no definidos por el esquema de codificación son inadmisibles. una encuestada que indica que paga las llamadas de larga distancia con tarjetas prepagadas aunque no posea una de esas tarjetas. Por ejemplo. en centros comerciales o por correo. . Sin embargo. DEPURACIÓN DE DATOS Verificaciones minuciosas y exhaustivas de la congruencia y el tratamiento de las respuestas faltantes. Los lectores ópticos pueden usarse en entrevistas estructuradas y repetitivas. Si se utilizan sistemas computarizados como CATI o CAPI. mientras que las formas de marcado sensorial se usan en casos especiales. La captura en un teclado con terminal CRT se utiliza más a menudo para entrevistas telefónicas. en casa. O un encuestado que informa que no está familiarizado con un producto pero también dice que lo usa con frecuencia. Las respuestas llegan a presentar diversas incongruencias lógicas. los datos se ingresan directamente en la computadora.La elección del método de trascripción de datos depende del tipo de entrevista utilizado y de la disponibilidad de equipo.

De esta forma no cambia la media de la variable ni se afectan demasiado otras estadísticas. Estas son un Procedimiento de redefinición que utiliza variables que sólo adoptan dos valores. Por lo tanto. Dado que muchos encuestados podrían tener algunas respuestas faltantes. Estandarización: Proceso de corrección de los datos para reducirlos a la misma escala. Redefinición de las variables: La transformación de los datos para crear nuevas variables o la modificación de las variables existentes para hacerlas más congruentes con los objetivos del estudio. sustituye las respuestas faltantes. en el cual no se descartan en forma automática todos los casos o encuestados con algún valor faltante. Por ejemplo. las variables de actitud con una escala de calificación continua y las variables de estilos de vida con una escala Likert de 5 puntos. que consiste en restar la media de la muestra y dividir entre la desviación estándar. Raíz cuadrada.Tratamiento de respuestas faltantes: Las respuestas faltantes son valores de las variables que se desconocen porque los encuestados no dieron respuestas inequívocas a la pregunta. . por lo regular la respuesta promedio a la variable. La ponderación se usa sobre todo para hacer que los datos de la muestra sean más representativos de una población meta en características específicas. Sustituir con una respuesta atribuida: Se usa el patrón de respuestas de los encuestados a otras preguntas. por lo regular 0 o 1. AJUSTE ESTADÍSTICO DE LOS DATOS Ponderación: Ajuste estadístico de los datos donde a cada caso o encuestado de la base de datos se le asigna un peso. la proporción de estas últimas sería una variable nueva creada al obtener la razón entre ambas (X2/X1). Si se han medido la cantidad de compras hechas en tiendas departamentales (X1) y la cantidad de compras cargadas a crédito (X2). Un importante procedimiento de redefinición supone el uso de variables ficticias para la redefinición de variables categóricas. como las correlaciones. Eliminación por casos: se descartan del análisis los casos o encuestados con alguna respuesta faltante. sino que para cada cálculo sólo se consideran los casos o encuestados con respuestas completas. para atribuir o calcular una respuesta adecuada para las preguntas faltantes. no tendría sentido hacer comparaciones entre las escalas de medición de ningún encuestado. Transformación de la escala: Manipulación de los valores de la escala para asegurar que sea comparable con otras escalas o adecuar de otra manera los datos para el análisis. las cuales suelen utilizarse para mejorar la utilidad del modelo estimado. para reflejar su importancia en relación con otros casos o encuestados. este enfoque daría como resultado una muestra pequeña. Se dispone de las siguientes opciones para el tratamiento de las respuestas faltantes: Sustituir con un valor neutro: Un valor neutro. las variables de imagen pueden medirse con una escala de diferencial semántico de 7 puntos. Eliminación por pares: Procedimiento para manejar los valores faltantes.

Pareadas: Las muestras son pareadas cuando los datos de dos muestras se relacionan con el mismo grupo de encuestados Técnicas multivariadas: Técnicas estadísticas adecuadas para el análisis de los datos cuando hay dos o más mediciones de cada elemento y las variables se analizan al mismo tiempo. Sin embargo. . También es importante tomar en cuenta las propiedades de las técnicas estadísticas. Las técnicas multivariadas se interesan en las relaciones simultáneas entre dos o más fenómenos. Cuando hay una sola variable dependiente. la regresión. o cuando hay varias mediciones de cada elemento. El siguiente paso es considerar las características conocidas de los datos. Las técnicas multivariadas pueden clasificarse en: Técnicas de dependencia: Técnicas multivariadas que son apropiadas cuando puede identificarse como variables dependientes a una o más de las variables. desarrollo del enfoque (paso II) y diseño de la investigación (paso III). las técnicas apropiadas serían el análisis multivariado de varianza y covarianza. El investigador experimentado y con formación estadística empleará una variedad de técnicas que incluye los procedimientos estadísticos avanzados. el análisis discriminante de dos grupos y el análisis conjunto. y al resto como variables independientes. pero cada variable se analiza por separado. el análisis de varianza es adecuado para el análisis de los datos experimentales de los diseños casuales. el análisis de varianza y covarianza. Por último. Dichas técnicas también se clasifican de acuerdo con el uso de una. CLASIFICACIÓN DE LAS TÉCNICAS ESTADÍSTICAS Técnicas univariadas: Técnicas estadísticas apropiadas analizar los datos cuando hay una sola medición de cada elemento de la muestra. dos o más muestras. Las técnicas univariadas pueden clasificarse en: Datos métricos: Datos que por naturaleza son de intervalo o de razón. la experiencia y la filosofía del investigador influyen en la elección de la estrategia de análisis de datos. Las muestras pueden ser: Independientes: Las muestras son independientes si se toman al azar de diferentes poblaciones. Datos no métricos: Datos derivados de una escala nominal u ordinal. se puede utilizar la tabulación cruzada. si hay más de una variable dependiente. Por ejemplo. la correlación canónica y el análisis discriminante.ELECCIÓN DE UNA ESTRATEGIA DE ANÁLISIS DE DATOS La elección de la estrategia de análisis de datos debe iniciar con una consideración de los primeros pasos del proceso: definición del problema (paso I). en particular su propósito y sus suposiciones subyacentes.