You are on page 1of 13

TECNICAS DE ANALISIS DE DATOS

1. CONCEPTO

Son herramientas tiles para organizar, describir y analizar los datos recogidos con los
instrumentos de investigacin. El anlisis de datos encierrados procedimientos:

* La organizacin de los datos y
* la descripcin y anlisis de los datos.

Veamos cada una de ellas.

2.1. ORGANIZACIN DE LOS DATOS

Una vez recogidoslos datos, necesitas organizarlos, es decir, prepararlos para su anlisis
posterior.

Los datos cuantitativos se organizacin en una matriz de tabulacin (hecha en Excel o
SPSS). El anlisis de losdatos se efecta sobre esta matriz, la cual est guardada en un
archivo y contiene todos los datos recopilados.

Los datos cualitativos se organizan en archivos de documento (hechos en Word u
otrosemejante). El anlisis de datos se efecta sobre estos documentos. Siempre es
recomendable grabar las entrevistas a profundidad y copia de los documentos revisados.

2.2.1. QU ES LAMATRIZ DE TABULACIN? CMO SE HACE?
La matriz de tabulacin es una tabla de doble entrada, de filas por columnas que contiene
toda la informacin obtenida mediante los instrumentos cuantitativos. Cadacolumna
representa un indicador de tus variables y cada fila representa un sujeto de tu muestra.

Tendrs tantas columnas como variables tengas. Si tienes 23 indicadores, entonces tendrs
23columnas. La cantidad de columnas depende de cuantos indicadores tengas.

Tendrs tantas filas como sujetos tengas. Cada cuestionario, escala, prueba, observacin
representa una fila. Si haz encuestado,por ejemplo, a 250 personas, entonces tendrs 250
filas. Si se ha observado, 20 situaciones o veces distintas, entonces tendrs 20 filas. Cada
observacin, cada entrevistado, cada registro, cadadocumento representa siempre una fila.


El anlisis de datos es un proceso de inspeccionar, limpiar y transformar datos con el objetivo de
resaltar informacin til, lo que sugiere conclusiones, y apoyo a la toma de decisiones. El anlisis
de datos tiene mltiples facetas y enfoques, que abarca diversas tcnicas en una variedad de
nombres, en diferentes negocios, la ciencia, y los dominios de las ciencias sociales


El anlisis de datos de la encuesta tiene como objetivo la deteccin de grupos variables
altamente relacionados, para ello se utilizan los siguientes anlisis :
Anlisis Descriptivo : ayudar a observar el comportamiento de la muestra en estudio, a
travs de tablas, grficos.....
Los resultados recogidos en la muestra se resumen en una matriz de datos N x M , en la
cual N es el nmero de unidades de anlisis utilizadas ( nmero de casos ) y M es el
nmero de caractersticas de dichas unidades , unidades de las que tenemos informacin.
Anlisis Exploratorio : la analizacin exploratoria pretende partir de un conocimiento
profundo y creciente de los datos para , trabajando inductivamente , llegar a un modelo
ajustado de los datos. Los pasos en este tipo de anlisis son los siguientes :
Anlisis de cada una de las variables incluidas en la matriz de datos. Los datos se
agrupan de un modo rpido y a ser posible grfico , las tcnicas mas utilizadas son :
Tronco y hoja
La caja
Ambas pretenden :
Conocer la variable analizada para determinar si su distribucin es simtrica o no.
Poder descubrir valores extremos y analizarlos antes de poder pasar al anlisis
multivariante.
Transformacin de los datos : la transformacin persigue la consecucin de una
distribucin aproximada a la normal. Tipos de transformacin :
Lineales : suma , resta , divisin , multiplicacin , cambia los valores brutos ( datos
obtenidos ) de la variable sin alterar nada mas.
No lineales monotnicas : cambian los valores originales y tambien sus distancias
pero no el orden
No lineales no monotnicas : similar a la anterior pero no altera el orden..
Anlisis Confirmatorio / Explicativo : la mayor parte de las tcnicas tradicionales de
anlisis estadstico de los datos tienen un carcter deductivo confirmatorio. De todas las
tcnicas de anlisis confirmatorio la ms til para el socilogo es aquella que parte del
anlisis de variables , entre las que cabe distinguir : nominales y de intervalo o de razn .
En la investigacin sociolgica las de tipo ordinal son muy frecuentes , pero las tcnicas de
anlisis escasas , de modo que se tratan como variables de intervalo o razn , labor muy
complicada o como nominales.
Investigacin con Variables Nominales
En la investigacin con variables nominales se utilizan tcnicas como el anlisis de
varianza o factorial.
Dentro de las tcnicas multivariantes de anlisis de variables nominales existen dos de
caracterespecial :
Los coeficientes <d> J. Davis ha perfeccionado un modelo que se basa en las
diferencias porcentuales. Los coeficientes <d> son diferencias entre proporciones y
se utilizan como indicadores del impacto causal de unas variables sobre otras.
Modela <log-linear> explican la probabilidad de que una persona elegida al azar
presente una determinada combinacin de categoras/ niveles del conjunto de
variables de clasificacin utilizados
6. Investigacin con variables de intervalo o de razn : en estas se utiliza el anlisis de
regresin : puede utilizarse siempre que la variable dependiente sea una variable de
intervalo.
2. Anlisis de los Datos de Encuesta
El anlisis de los datos de la encuesta , como cualquier otro tipo de datos de inters
cientfico , ha de guardar relacin con el problema de conocimiento que se trata de
esclarecer y con la mtrica de la informacin emprica que se tiene entre manos , es
decir lo primero que se debe realizar en una encuesta no es ver que dicen los datos
sino que dicen en relacin con el problema que se plantea y las hiptesis que uno se
haba planteado previamente.
Una serie de conclusiones importantes sobre los datos de una encuesta son :
La cantidad y calidad del conocimiento que se desea obtener sobre un problema no
est necesariamente en funcin del tamao de la muestra empleada para hacer una
encuesta.
Ni el margen global de error en los resultados de una encuesta disminuye
necesariamente aumentando el tamao de la muestra.
Los datos de la encuesta son mas tiles cuanto mayor sea la posibilidad de poderlos
comparar con otros similares y anteriores en el tiempo o procedentes
simultneamente de otras poblaciones.
Tipos de Anlisis :
Anlisis de Correlacin : Con los datos mas simples de respuestas a varias preguntas
se pueden fabricar medidas combinatorias de los mismos en forma de ndices o
escalas.
Estas medidas constituyen la operacionalizacin de los conceptos, es la referencia
emprica reducida a valores empricamente manejables.
Los conceptos son elaboraciones tericas con las que definimos un determinado aspecto de
la realidad y de la que nos servimos para expresar teoras e hiptesis.
Las variables : son dimensiones de la realidad que deseamos estudiar.
Los indicadores : son expresiones numerables de las distintas dimensiones de un concepto.
Con los datos indexados podemos hacer anlisis de correlacin de diferentes tipo.
La correlacin entre dos o mas variables expresa la extensin en que una incide en la otra
interseccin, la interseccin de ambas, su grado de asociacin... . Pero no indica si a partir
de los valores de una de ellas podemos predecir los valores de la otra , esto se consigue
mediante el coeficiente de regresin que indica si la correlacin entre variables es tal que a
partir de una podemos calcular los valores de otra. Todo esto lo podemos realizar con
medidas de la estadstica no paramtrica no pueden ser calculadas.
A partir del Anlisis de Correlacin se puede trabajar con distintos modelos de
anlisis multivariable :
Un conjunto de modelos de anlisis podra denominarse como el del anlisis causal : aqu
se incluiran los anlisis de cadena (< path anlisis>) , el de regresin mltiple y el de
segmentacin por arborescencia (<tree anlisis>) el cual es una tcnica multivariable
que produce una serie de agrupamientos dicotomizados en un modelo que se asemeja a las
ramas de un arbol. La divisin de las cosas en grupos dicotomizados la realiza el anlisis
de segmentacin de modo que en ellos quede explicada de la mejor forma posible la
variacin de una cierta variable que llamamos dependiente , respecto a otras que llamamos
independientes. La divisin en grupos dicotomizados e deberalizar en cada paso de tal
manera que la variacin en ellos sea mnima, que sean lo mas homogneos posibles al
mismo tiempo que la variacin entre si sea la mayor posible, que los dos grupos resultantes
sean lo mas heterogneos posibles entre si.
Otro conjunto estara formado por distintos modelos que implican conglomerados de
variables o asociaciones entre los que se encuentran :
El anlisis factorial : es una forma de anlisis de matrices. El objeto de este
mtodo es resumir la informacin obtenida de las variables iniciales expresando las
mismas como combinacin lineal de otras variables no observables ( subyacentes)
denominadas factores. Se busca una estructura de interrelacin en muestras
variables. Para decidir si esta anlisis factorial es factible utilizaremos ciertas
medidas como pude ser la :
Kaiser-Meyer-Olkin : basada en los coeficientes de correlacin
parcial situando su rango de variacin entre 0 y 1.
Medida de adecuacin muestral : la cual nos indica hasta que
punto debe entrar una variable en el anlisis factorial.
El anlisis Tipolgico : es un anlisis de estructuras latentes , nos permite
identificar dentro de una poblacin determinada un cierto nmero de grupos, los
cuales tienen una igualdad caractersticas en una multiplicidad de dimensiones.
El del espacio mas pequeo.
2. Anlisis de los Datos de Encuesta
El anlisis de los datos de la encuesta , como cualquier otro tipo de datos de inters
cientfico , ha de guardar relacin con el problema de conocimiento que se trata de
esclarecer y con la mtrica de la informacin emprica que se tiene entre manos , es
decir lo primero que se debe realizar en una encuesta no es ver que dicen los datos
sino que dicen en relacin con el problema que se plantea y las hiptesis que uno se
haba planteado previamente.
Una serie de conclusiones importantes sobre los datos de una encuesta son :
La cantidad y calidad del conocimiento que se desea obtener sobre un problema no
est necesariamente en funcin del tamao de la muestra empleada para hacer una
encuesta.
Ni el margen global de error en los resultados de una encuesta disminuye
necesariamente aumentando el tamao de la muestra.
Los datos de la encuesta son mas tiles cuanto mayor sea la posibilidad de poderlos
comparar con otros similares y anteriores en el tiempo o procedentes
simultneamente de otras poblaciones.
Tipos de Anlisis :
Anlisis de Correlacin : Con los datos mas simples de respuestas a varias preguntas
se pueden fabricar medidas combinatorias de los mismos en forma de ndices o
escalas.
Estas medidas constituyen la operacionalizacin de los conceptos, es la referencia
emprica reducida a valores empricamente manejables.
Los conceptos son elaboraciones tericas con las que definimos un determinado aspecto de
la realidad y de la que nos servimos para expresar teoras e hiptesis.
Las variables : son dimensiones de la realidad que deseamos estudiar.
Los indicadores : son expresiones numerables de las distintas dimensiones de un concepto.
Con los datos indexados podemos hacer anlisis de correlacin de diferentes tipo.
La correlacin entre dos o mas variables expresa la extensin en que una incide en la otra
interseccin, la interseccin de ambas, su grado de asociacin... . Pero no indica si a partir
de los valores de una de ellas podemos predecir los valores de la otra , esto se consigue
mediante el coeficiente de regresin que indica si la correlacin entre variables es tal que a
partir de una podemos calcular los valores de otra. Todo esto lo podemos realizar con
medidas de la estadstica no paramtrica no pueden ser calculadas.
A partir del Anlisis de Correlacin se puede trabajar con distintos modelos de
anlisis multivariable :
Un conjunto de modelos de anlisis podra denominarse como el del anlisis causal : aqu
se incluiran los anlisis de cadena (< path anlisis>) , el de regresin mltiple y el de
segmentacin por arborescencia (<tree anlisis>) el cual es una tcnica multivariable
que produce una serie de agrupamientos dicotomizados en un modelo que se asemeja a las
ramas de un arbol. La divisin de las cosas en grupos dicotomizados la realiza el anlisis
de segmentacin de modo que en ellos quede explicada de la mejor forma posible la
variacin de una cierta variable que llamamos dependiente , respecto a otras que llamamos
independientes. La divisin en grupos dicotomizados e deberalizar en cada paso de tal
manera que la variacin en ellos sea mnima, que sean lo mas homogneos posibles al
mismo tiempo que la variacin entre si sea la mayor posible, que los dos grupos resultantes
sean lo mas heterogneos posibles entre si.
Otro conjunto estara formado por distintos modelos que implican conglomerados de
variables o asociaciones entre los que se encuentran :
El anlisis factorial : es una forma de anlisis de matrices. El objeto de este
mtodo es resumir la informacin obtenida de las variables iniciales expresando las
mismas como combinacin lineal de otras variables no observables ( subyacentes)
denominadas factores. Se busca una estructura de interrelacin en muestras
variables. Para decidir si esta anlisis factorial es factible utilizaremos ciertas
medidas como pude ser la :
Kaiser-Meyer-Olkin : basada en los coeficientes de correlacin
parcial situando su rango de variacin entre 0 y 1.
Medida de adecuacin muestral : la cual nos indica hasta que
punto debe entrar una variable en el anlisis factorial.
El anlisis Tipolgico : es un anlisis de estructuras latentes , nos permite
identificar dentro de una poblacin determinada un cierto nmero de grupos, los
cuales tienen una igualdad caractersticas en una multiplicidad de dimensiones.
El del espacio mas pequeo.
El Anlisis de Contenido
Definicin : El anlisis de contenido es una tcnica de investigacin para la descripcin
objetiva, sistemtica y cualitativa del contenido manifiesto de la comunicacin ( Berelson
1952) , esta es la definicin mas imporatante pero tambin existen otras como puede ser la
de Krippendorff ( 1980 ) segn la cual el anlisis de contenido es una tcnica de
investigacin para hacer inferancias reproductibles y vlidas de los datos.
Aplicaciones del anlisis de Contenido
Los objetivos del anlisis de contenido son tres :
La descripcin precisa y sistemtica , de las caractersticas de una comunicacin.
La formulacin de inferencias sobre contenidos exteriores al contenido de la
comunicacin.
La prueba de hiptesis para su verificacin o rechazo.
Para Janis ( 1965 ) todo anlisis de contenido debera tener como fin el someter a prueba
alguna relacin entre caractersticas del contenido y otras variables.
Dada esta definicin se pueden obtener diferentes tipos de anlisis de contenido :
Anlisis de contenido semntico : clasificacin de los signos segn su significadao :
ejemplo nmero de referencias al Fc.Barcelona.
Anlisis de designaciones : nmero de veces que aparecen referencias a determinados
objetos.
Anlisis de atribucin : proporciona la frecuencia con que aparecen ciertas
caracterizaciones : nmero de veces que aparece una caracterstica.
Anlisis de Afirmaciones : proporciona la frecuencia en la que ciertos objetos aparecen
caracterizados de una determinada manera.
Anlisis de contenido pragmtico : clasificacin de signos segn sus causas o efectos
probables.
Anlisis de vehculo del signo : clasificacin del contenido segn las proporciones
psicofsicas de los signos.
El contenido tradicional del anlisis de contenido es la descripcin; se centra en el
contenido y no en hiptesis , por lo tanto el objetivo principal es entonces la descripcin de
ese contenido, de su fondo y de su forma. ( suelen ser investigaciones de carcter
exploratorio o de ndole histrica).
La clasificacin ms completa del anlisis de contenido de carcter descriptivo es la
realizada por Berelson ( 1952 ) el cual utiliz el criterio de la < funcin > del anlisis de
Holsti ( 1969 ) es la siguiente :
Anlisis de las caractersticas del contenido en cuanto a su sustancia o fondo :
Para descubrir tendencias y cambios en el contenido de la comunicacin.
Para averiguar la evolucin de los intereses y de las actividades del pensamiento
erudito.
Para revelar diferencias internacionales en el contenido de la comunicacin.
Para realizar comparaciones entre diferentes medios de comunicacin y entre
diferentes niveles de comunicacin.
Para analizar el contenido de la comunicacin en trminos de sus objetivos
explcitos o implcitos.
Para elaborar y poner en vigor ciertos estndares de comunicacin as como
examinar el contenido de las comunicaciones en trminos de tales estndares.
Para ayudar en operaciones tcnicas de investigacin, como en la codificacin de
datos obtenidos en entrevistas u observaciones no es-estrucuturadas.
Para relaciones caractersticas conocidas de las fuetes de la comunicacin con los
mensajes que tales fuentes producen.
Para relacionar caractersticas conocidas de la audiencia con mensajes creados para
ella.
Anlisis de las caractersticas del contenido en cuanto a su forma :
Para revelar tcnicas de propaganda o persuasin.
Para medir la legibilidad ( inters, amenidad.......) de material impreso.
Para descubrir rasgos estilsticos en lenguajes, en periodos histricos en tipos de
discurso y en autores individuales.
El anlisis de contenido de carcter descriptivo se caracteriza por producir determinados
tipos de generalizaciones , las cuales muchas provienen de la comparacin de contenidos de
comunicaciones de diferente origen ( diarios italianos , franceses...), o comunicaciones de
nico origen pero diferente tiempo, o comunicaciones de nico origen pero de situaciones
distintas, en otras ocasiones son generalizaciones que proceden de la comparacin del
contenido de una o mas comunicaciones y finalmente las que proceden del anlisis de
relacin o asociacin entre dos o mas variables, destacando aqu el anlisis de contingencia
: el de la aparicin simultanea de determinadas variables.
Otro objetivo del anlisis de contenido es la realizacin de inferencias , cuando el
contenido de los mensajes es analizado para apoyar conclusiones no relacionadas con el
contenido, entonces adquiere la investigacin n carcter explicativo o inferencial.
Hay dos categoras de inferencias :
Las que se refieren al origen, causas ,condiciones, antecedentes de la comunicacin y
especialmente al autor de la misma, estas inferencias responden a las preguntas < quien > y
< por qu >.
La segunda est formada por las inferencias que se refieren a efectos o resultados de la
comunicacin y el anlisis responde al interrogante < con que efecto >.
Combinando las aportaciones de Berelson y Holsti se obtiene la siguiente clasificacin del
anlisis de contenido de carcter inferencial :
Anlisis para realizar inferencias acerca de las causas , de los productores o de los
antecedentes de la comunicacin :
Para identificar las intenciones y otras caractersticas de los creadores de las
comunicaciones.
Para analizar rasgos psicolgicos de individuos o determinar el estado psicolgico
de personas o grupos.
Para detectar la existencia de propaganda.
Para obtener informacin poltica y militar.
Para determinar actitudes, intereses, a valores de grupos o poblaciones , as como el
cambio en los mismos que haya podido tener lugar.
Para proporcionar pruebas jurdicas.
Para decidir disputas sobre paternidad literaria.
Anlisis para realizar inferencias de las consecuencias o efectos de la comunicacin
:
Para determinar qu actitudes y comportamientos son consecuencia de la
comunicacin.
Para analizar la corriente de informacin.
Para medir la legibilidad de textos.
De todo esto dicho anteriormente se extraen dos conclusiones :
el anlisis de contenidos puede ser defectuoso por aplicacin errnea de las tcnicas de
anlisis, en cuyo caso l descripcin del contenido de las comunicaciones estar mas o
menos llena de errores.
el anlisis de contenido puede ser defectuoso aun cuando la descripcin del contenido sea
correcto, por aplicacin errnea de la tcnicas de inferencia o interpretacin.
De la clasificacin de Krippendorff se extraen dos conclusiones :
que el objetivo del anlisis de contenido parte de dos ideas interrelacionadas.
que el anlisis de contenido pude adoptar diversas formas, entre las que destacan :
Sistemas : aparatos conceptuales que se utilizan para describir una porcin de realidad.
Estndares : criterios con los que se comparan objetos , para dterminar cuan buenos son o
de qu tipo son.
ndices : variables cuya significacin en una investigacin depende del grado en que
verse correlacionado con otros fenmenos.
Elementos componentes del Anlisis de contenidos
Los Datos : Es una unidad de informacin grabada en un medio resistente y duradero (
papel, cinta...) que se distingue de otros datos en que es analizable por medio de tcnicas
explcitas siendo significativos para un problema determinado.
El Muestreo
Las unidades de Anlisis : son los elementos de la comunicacin en que se va a centrar el
anlisis.
Las unidades de muestreo : son las diversas partes de la realidad sometida a observacin
que el investigador considera como independientes entre si pudiendo ser objeto de anlisis.
Tipos :
Artificiales : bloques de lneas, columnas....
Naturales: editoriales, artculos, carteles....
La unidad de registro : es la mnima porcin del contenido que el investigador aisla y
separa por aparecer all uno de los elementos, smbolos, slogans , que el investigador
considera significativos.
La unidad contexto : es la porcin de la unidad de muestreo que tiene que ser examinada
para poder caracterizar una unidad de registro.
El Registro : proceso por el cual cada unidad de registro es codificada, descrita en forma
analizable.
La codificacin es el proceso por el cual los datos brutos son transformados y clasificados
en categoras.
Categoras :
Materia , tema , asunto : da respuesta al interrogante : De que se trata la
comunicacin?
Direccin o punto de vista : de este derivan categoras de tratamiento que pude ser
desfavorable o favorable.
Criterio o valor : determina la base\s que sirven para hacer la clasificacin en trminos
de direccin o punto de vista, la base sobre la que descansa la presentacin o el tratamiento
del asunto o materia por el autor de la comunicacin.
Autoridad Frente a Prueba : de aqu surgen categoras que identifican a las personas,
grupos, instituciones....
Objetivo Meta : las categoras que se derivan de este se refieren los objetivos que se
desean alcanzar o que se consideran deseables. El interrogante al que da respuesta es :
Qu es lo que la gente desea, que persigue, cuales son sus ambiciones?.
Medio o mtodo : como se consiguen los objetivos que se consideran deseables.
Actores : son los grupos , personas , actores, que ocupan posiciones centrales o que
llevan a cabo determinadas acciones , es decir , clasificaa aquellos que en el texto sometido
a anlisis son representados como realizadores de determinados actos.
Caractersticas personales y rasgos de carcter : en este principio de clasificacin se
incluyen categoras que describen caractersticas personales ( edad, sexo, raza...)
Origen : clasifica el lugar de origen de las comunicaciones.
Destino : clasifica el grupo al que la comunicacin est especialmente dirigida.
Formas de la afirmacin : este principio elabora subcategoras como la distincin entre
proa y poesa , entre novela y ensayo.....
Intensidad : clasifica el componente emocional de la comunicacin, el entusiasmo,
excitacin.....
Mecanismo o recurso : se utiliza con fines propagandsticos o persuasorios o
tendenciosos.
La Validez en el Anlisis de Contenido : la validez de un anlisis se juzga por el grado en
que los resultados que produce son compatibles con otras pruebas u testimonios
importantes y pertinentes.
La prctica muestras dos tipos de validez :
Interna : la que descansa en la existencia de una relacin lgica entre indicadores ,
categoras y resultados de anlisis.
Externa : la que se apoya en una relacin emprica. Los tipos de validez externa
que mas se adecuan al anlisis de contenido son :
La validez Pragmtica : cuando el inters se centra en la utilidad de
los resultados del anlisis para indicar o precisar algn
comportamiento o alguna caracterstica especfica de individuos,
grupos..... Esta validez puede ser concurrente : cuando el
investigador est interesado en alguna caracterstica del presente o
predictiva : cuando est interesado en alguna caraterstica del
pasado.
Validacin de rasgos abstractos : se utiliza para hacer referencias
respecto a algn rasgo abstracto y multidimensional que se supone
est reflejado en los resultados del anlisis de contenido.
Validez del Contenido : se dice que la muestra o el contenido es
vlido si su composicin corresponde a la composicin de universo
de posibles indicadores de la caracterstica, atributo o
comportamiento de que se trata.
Validez Semntica : podr comprobarse la validez semntica
comprobando si son similares o no los resultados de dos
reparticiones diferentes del mismo conjunto de unidades de anlisis,
una realizada analticamente y otra segn el criterio externo.
1