capítulo

1 HISTORIA DE LOS ENFOQUES
CUANTITATIVO, CUALITATIVO Y MIXTO:
RAÍCES Y MOMENTOS DECISIVOS

Introducción

En este capítulo no se pretende abarcar la historia de la investigación, mucho menos la
historia de la ciencia. Una enciclopedia completa no bastaría para abordar este tema.
Solamente queremos ubicar al estudiante que se inicia en la investigación sobre algunos
de los momentos históricos más importantes en la indagación cuantitativa, cualitativa
y mixta. Asimismo, el capítulo pretende sentar las bases para comprender un poco más
estas tres formas de efectuar un estudio.

El enfoque cuantitativo: sus dos principales antecesores

Como ya se mencionó en el primer capítulo de Metodología de la investigación, 6ª
edición, el enfoque cuantitativo en las ciencias sociales se origina en la obra de Auguste
Comte (1798-1857) y Émile Durkheim (1858-1917), con la influencia significativa de
Francis Bacon (1561-1626), John Locke (1632-1704) e Immanuel Kant (1724–1804).
Es decir, el “abuelo” de tal enfoque es el positivismo.
A mediados del siglo XIX, el racionalismo iluminaba la actividad científica,
la revolución iniciada por Isaac Newton se encontraba en plena consolidación,
particularmente por los avances científicos y tecnológicos alcanzados en la época.
2       Capítulo 9  Recolección de los datos cuantitativos

Con la publicación en 1849 del Discurso sobre el espíritu positivo, de Auguste Comte, se inició
en las ciencias sociales un paradigma denominado “positivista”. Cabe señalar que, en términos
sencillos, un “paradigma” es una manera de concebir al mundo; un conjunto de creencias y
premisas respecto a la naturaleza de éste (Greene, 2007).
Esta visión proclama, entre otras cuestiones, que la realidad es una sola y es necesario
descubrirla y conocerla. Asimismo, el sentido de la percepción resulta la única base admisible
del conocimiento humano y del pensamiento preciso. Las ideas esenciales del positivismo
provienen de las denominadas ciencias “exactas”, como la Física, la Química y la Biología; por
tal motivo, los positivistas se fundamentaron en científicos como Galileo Galilei (1564-1642),
Isaac Newton (1642-1727),1 Nicolás Copérnico (1473-1543), Thomas Robert Malthus (1766-
1834) y Charles Darwin (1809-1882).2 Así, “el mundo social puede estudiarse de manera
similar al mundo natural” (tal como se investigan los átomos, las moléculas, los planetas y los
invertebrados; se pueden analizar los patrones de conducta de los trabajadores, las razones
de las enfermedades mentales, los efectos de un método educativo sobre el aprendizaje o las
migraciones humanas) y existe un método exclusivo para indagar ese mundo social, que es libre
de los valores del investigador. Por ello, para el positivismo, la objetividad es muy importante,
el investigador observa, mide y manipula variables; además de que se desprende de sus propias
tendencias (la relación entre éste y el fenómeno de estudio es de independencia). Lo que no
puede medirse u observarse con exactitud se descarta como “objeto” de estudio. Además, éste
se encuentra determinado por leyes y axiomas. El positivismo solamente acepta conocimientos
que proceden de la experiencia, esto es, de datos empíricos. Los hechos son lo único que
cuenta. Es decir, los positivistas establecen como fundamental el principio de verificación: una
proposición o enunciado tiene sentido sólo si resulta verificable por medio de la experiencia y
la observación. Todo debe ser comprobable y esta condición es válida para cualquier ciencia.
Asimismo, este paradigma considera que es posible establecer generalizaciones libres del
contexto y del tiempo, así como vínculos causales (causas reales que preceden temporalmente
a los efectos). La experimentación constituyó la forma principal para generar teoría.
El positivismo (muy rígido) fue remplazado por el “pospositivismo”, fundamentado en
el paradigma anterior, pero más abierto y flexible. Tal visión comienza a gestarse hacia fines del
siglo XIX, pero realmente se consolida hacia la mitad del siglo pasado. La germinación la inician
las obras de autores como Wilhelm Dilthey (1833-1911) y William James (1842-1910). Karl
Popper (1902-1994) lo impulsa de forma notoria. Además, en cada campo o disciplina, diversos
autores lo desarrollan.
Sus propuestas esenciales se pueden resumir en los siguientes puntos:
• Existe una realidad, pero solamente puede ser conocida de manera imperfecta debido a las limitaciones
humanas del investigador (Mertens, 2005). Por tanto, tal realidad es factible descubrirla con cierto grado
1
643, según el calendario gregoriano.
2 Note el lector que estamos hablando de casi 300 años de conocimiento previo para la consolidación de un paradigma.
¿Qué significa medir? 3

de probabilidad.
• El observador no se encuentra aislado de los fenómenos que estudia, sino que forma parte de
éstos, lo afectan y él, a su vez, influye en ellos.
• Las teorías y explicaciones se consolidan y eliminan otras posibles teorías y explicaciones rivales.
• La investigación es influida por los valores de los investigadores y por la teoría o hipótesis en que
se apoyen éstos. La objetividad es solamente un estándar que guía la investigación, por lo que el
investigador debe estar atento y tratar de permanecer neutral para prevenir que sus valores o ten-
dencias influyan en su estudio, además de seguir rigurosamente procedimientos prescritos y estan-
darizados.
• La experimentación en el laboratorio es una forma central para probar hipótesis, pero no la única.
Por ello, se desarrollaron los diseños cuasiexperimentales (Mertens, 2005).
• Los conceptos de las teorías consideradas y las hipótesis a probar deben tener referentes empíricos
y consecuentemente, es necesario medirlos, aunque estas mediciones nunca son “perfectas”, siem-
pre hay un grado de error.
En conclusión, pudiéramos establecer que la diferencia esencial entre el paradigma
positivista y el pospositivista se ubica en su concepción del conocimiento. En el segundo,
se supera el esquema que considera la percepción como simple reflejo de las “cosas
reales” y el conocimiento como “copia” de esa realidad. Éste, en cambio, se visualiza como
el resultado de una interacción, de una dialéctica, entre el conocedor y el objeto conocido.
El pospositivismo es una especie de “padre” del enfoque cuantitativo y le otorga tres
principales elementos que lo caracterizan:

1. Recolectar datos en la forma de puntuaciones (que se origina en las
matemáticas). Es decir, los atributos de fenómenos, objetos, animales,
personas, organizaciones y colectividades mayores son medidos y ubicados
numéricamente.
2. Analizar tales datos numéricos en términos de su variación.
3. La esencia del análisis implica comparar grupos o relacionar factores
sobre tales atributos mediante técnicas estadísticas (en el caso de las
ciencias del comportamiento, mediante experimentos y estudios causales o
correlacionales).

El enfoque cuantitativo se consolida a lo largo del siglo XX y tiene momentos
claves como los que se presentan a continuación.

EL ENFOQUE CUANTITATIVO: MOMENTOS CLAVE
Es difícil definir con precisión cuándo se inició el enfoque cuantitativo, más bien sus
comienzos provienen de distintas fuentes y su evolución ha sido continua (algunos
4       Capítulo 9  Recolección de los datos cuantitativos

autores de la historia de la ciencia los ubican desde Aristóteles y otros en diferentes puntos
de los siglos XVI, XVII y XVIII).

Gottfried Achenwall (en 1748 o 1749) acuñó el término en alemán “Statistik” para
referirse al análisis de los datos del Estado, en particular los censos poblacionales (Aliaga,
2000 y Columbia Encyclopedia, 2009).
En 1801, William Playfair, un ingeniero y economista, desarrolla las gráficas
estadísticas como un mejor medio para representar los resultados (anteriormente se
utilizaban tablas). En 1816, Carl Friedrich Gauss propone la desviación media, y alrededor
de esa época genera el análisis de la distribución normal y plantea la técnica de mínimos
cuadrados que posteriormente derivarían en el análisis de varianza (Scott y Rice, 2005).
En 1817, el francés Marc Antoine Jullien realiza una encuesta sobre diversos sistemas
educativos en el mundo.
Alrededor de 1880, se genera el análisis de correlación en Inglaterra y Karl
Pearson, profesor desde 1884 en The University College (Londres), presenta en la
última década del siglo XIX: la moda (medida de tendencia central), una fórmula
producto del momento de correlación, un procedimiento para calcular el tamaño de
muestra adecuado para representar a una población, la regresión lineal y múltiple
(con la identificación de la capacidad para predecir puntuaciones mediante la infor-
mación sobre la correlación entre las variables), así como el coeficiente de contin-gencia y
la chi-cuadrada (χ2) (Creswell, 2005, Aldrich, 2005 y Aliaga, 2000). Otro investigador que
trabajó sobre la correlación múltiple fue George U. Yule (1897).
En 1901, Pearson junto con Frank Raphael Weldon y Francis Galton fundan
Biometrika, una revista que se dedicó al desarrollo de análisis estadísticos en el campo de la
Biología (Norton, 1978). A finales del siglo XIX ha nacido un pilar del enfoque cuantitativo:
la estadística.
Asimismo, en la década de 1890 a 1900 se desarrollan las primeras pruebas mentales
con los esfuerzos de investigadores como Francis Galton, James McKeen Cattell y Alfred
Binet (Lachapelle, 2008).
Para 1901, Edward Lee Thorndike y Robert S. Woodworth discuten sobre la
necesidad y valor del grupo de control en los experimentos. En 1904, Charles Spearman
presenta su coeficiente rho. Además por esos años se aplica el pro-cedimiento para reducir
variables denominado el análisis de factores y la prueba t (Creswell, 2005).
En 1910 la armada estadounidense, comienza a usar pruebas psicológicas
estandarizadas, particularmente durante la Primera Guerra Mundial (Creswell, 2005). De
igual forma surgen por tal año, los diseños experimentales como los latinos cuadrados de
Thorndike. Además, las encuestas (surveys) incrementan su popularidad en las primeras
décadas del siglo XX. En 1916, William Anderson McCall concibe la asignación al azar en
experimentos y en 1917, F. Stuart Chapin publica sobre la experimentación en ciencias sociales
¿Qué significa medir? 5

(Downey, 2006).
Durante la década de 1920 se continúa el desarrollo de pruebas psicométricas y
de logro, así como la estadística inferencial (conclusiones de la muestra a la población) se
comienza a utilizar y diversos procedimientos se fortalecen. McCall publica a mediados de
esa década su famosa obra: Cómo experimentar en Educación. Entre 1924 y 1932, Elton Mayo
realiza sus experimentos en la planta Hawthorne de la compañía Western Electric, lo que da
inicio a este tipo de estudios en las organizaciones.

En la siguiente década, se desarrollan las pruebas de selección de personal y un
sinnúmero de tests estandarizados en diferentes campos. En 1935, Sir Ronald
Fisher consolida en su libro El diseño de experimentos el análisis de varianza y las
pruebas de significancia en general, además de los experimentos modernos. En
1938, este último autor publica junto con Frank Yates, las tablas estadísticas para
la investigación en la Agricultura, la Biología y la Medicina. Asimismo, la Asocia-
ción de Educación Progresiva de Estados Unidos comienza a realizar estudios longitudinales.
Durante la década de 1950, la investigación cuantitativa se encuentra en su apogeo,
surgen diversas encuestas, experimentos, revistas científicas, diseños, etcétera. También
comienzan a desarrollarse las máquinas para calificar pruebas y la computadora.
En los años de 1960, Donald T. Campbell y Julian Stanley (1966) generan una tipología
sobre los estudios experimentales que priva hasta nuestros días (incluso en la presente
obra) y un análisis de las fuentes que pueden atentar contra la claridad de sus resultados.
De igual forma, el querido profesor Fred Kerlinger identifica tipos de diseños cuantitativos
y fortalece el enfoque respectivo. Por otra parte, se desarrolla una concepción que explica
cómo los ítems difieren en dificultad y discriminación (teoría de las respuestas a los ítems)
(Creswell, 2005). Surgen una gran cantidad de textos de estadística. Los programas de
análisis de datos se desarrollan, particularmente el Paquete Estadístico para las Ciencias
Sociales (SPSS).
En la década comprendida entre 1970 y 1980 se identifican diversos modelos causales
multivariados (por ejemplo, el modelamiento de ecuaciones estructurales), se desarrolla el
metaanálisis (técnica para analizar datos provenientes de distintos estudios con mediciones
similares) y autores como Thomas Dixon Cook y Donald T. Campbell sugieren los tipos de
validez que más recientemente se conciben como clases de evidencia acerca de la validez
(Shadish y Cook, 1998). Asimismo, John W. Tukey empieza con el análisis exploratorio de
datos (publica en 1977).
En la década de 1980, se reta a las aproximaciones clásicas con las pruebas
estadísticas, esto es, mediante el examen de la magnitud de la relación entre variables, a
través de la estimación del tamaño del efecto (Creswell, 2005). Se introduce el concepto de
sensibilidad experimental.
6       Capítulo 9  Recolección de los datos cuantitativos

En la última década del siglo XX surgen mediciones y análisis multivariados más
complejos, además se consolida la idea de “poder de medición” mediante la utilización
de diferentes instrumentos para medir las variables de la investigación. Los programas
de análisis se sofistican y comercializan. En la primera década de este tercer milenio se
cuenta con gran cantidad de escalas y posibilidades de análisis sumamente avanzados y
diversos. Y es aquí donde ahora estamos.
Cabe señalar que el primer enfoque de la investigación en desarrollarse completamente
fue el cuantitativo.

EL ENFOQUE CUALITATIVO: SUS COMIENZOS
Diferentes autores ubican sus orígenes en distintos momentos, por ejemplo, Vidich y
Lyman (2002) los sitúan en los siglos XV y XVI con la denominada etnografía temprana, en
la que se estudiaba a los pueblos primitivos; o Lincoln y Denzin (2003) fundamentalmente
los circunscriben a principios del siglo XX, al igual que Creswell (2005). A nuestro juicio,
el enfoque cualitativo realmente se inicia como un proceso investigativo a finales del
siglo XIX y sobre todo en el comienzo del siglo XX, aunque algunos arqueólogos realizaron
estudios inductivos en la mitad del XIX.
El primer problema es que hay diversas visiones que se han considerado como
tipos de investigación cualitativa (Tesch, 1990, ubica 26 clases) y las bases epistemológicas
son variadas. Sin embargo, concordamos con Mertens (2005) en que el constructivismo
es tal vez el paradigma que influyó más en el enfoque cualitativo (ciertamente muchos
diferirán, pero su peso es innegable). Éste tiene sus primeros cimientos en Immanuel
Kant (siglo XVIII), quien señala básicamente que el mundo que conocemos es construido
por la mente humana. Las “cosas” en sí mismas existen, pero nosotros las apreciamos
del modo como es capaz de percibirlas nuestra mente. De los postulados de Kant va a
surgir el constructivismo, en un intento de conciliar el racionalismo y el asociacionismo.
Otro autor clave para esta corriente paradigmática es Max Weber (1864-1920), quien
introduce el término verstehen o “entender”, reconoce que además de la descripción
y medición de variables sociales, deben considerarse los significados subjetivos y la
comprensión del contexto donde ocurre el fenómeno.
El constructivismo propone:

1. No hay una realidad objetiva, la realidad es edificada socialmente, por
consecuencia, múltiples construcciones mentales pueden ser “aprehendidas”
sobre ésta, algunas de las cuales pueden estar en conflicto con otras; de este
modo, las percepciones de la realidad son modificadas a través del proceso
del estudio (Mertens, 2005).
¿Qué significa medir? 7

2. El conocimiento es construido socialmente por las personas que participan
en la investigación.
3. La tarea fundamental del investigador es entender el mundo complejo de la
experiencia vivencial desde el punto de vista de quienes la experimentan, así
como comprender sus diversas construcciones sociales sobre el significado
de los hechos y el conocimiento.
4. La investigación es en parte producto de los valores del investigador y no
puede ser independiente de ellos.
5. El investigador y los individuos estudiados se involucran en un proceso
interactivo. El conocimiento resulta de tal interacción social y de la influencia
de la cultura.
6. No es posible establecer generalizaciones libres del contexto y del tiempo.

Entre algunos de los autores que durante el siglo XX influyeron en el desarrollo
del constructivismo tenemos a Mary Parker Follett (1868-1933), en el campo de la
Administración y las organizaciones; Jean Piaget (1896-1980) y Lev Semenovich
Vygotsky (1896-1934) en la Educación y John Dewey (1859-1952) en la Pedagogía; así
como Margaret Mead (1901-1978) en la Antropología.
El constructivismo como uno de los “padres”3 del enfoque cualitativo le otorga los
énfasis principales que lo caracterizan:
• El reconocimiento de que el investigador necesita encuadrar en los estudios los puntos de vista de
los participantes.
• La necesidad de inquirir cuestiones abiertas.
• Dado que el contexto cultural es fundamental, los datos deben recolectarse en los lugares donde
las personas realizan sus actividades cotidianas.
• La investigación debe ser útil para mejorar la forma en que viven los individuos.
• Más que variables “exactas” lo que se estudia son conceptos, cuya esencia no solamente se captura
a través de mediciones.

EL ENFOQUE CUALITATIVO: MOMENTOS CLAVE
En la década de 1920, Bronislaw Malinowski realiza y publica su estudio de las islas
Trobriand y un grupo de investigadores conocidos como la Escuela de Chicago comenzaron
a realizar diversos estudios cualitativos, entre los autores destacan: Albion Small, William
Isaac Thomas, Florian Znaniecki y el filósofo George Herbert Mead. Por ejemplo, Thomas
y Znaniecki publicaron una investigación en 1927 sobre los inmigrantes polacos, en la
cual se utiliza la biografía de los participantes como herramienta de recolección de los
datos. Otros estudios se centraron en culturas específicas y grupos urbanos marginados.
Margaret Mead (uno de cuyos maestros fue Franz Boas) publica sus conocidas obras
Coming of age in Samoa y Growing up in New Guinea, en 1928 y 1930, respectivamente
3 Podríamos decir “padres” o “madres”, para no generar susceptibilidades.
8       Capítulo 9  Recolección de los datos cuantitativos

(Sullivan, 2004; Mead, 2001); y para 1932, un libro que reseña su indagación sobre
la cultura de una tribu india. Posteriormente, en la misma década se agregaron otros
estudios de Robert E. Park y Ernest W. Burgess.
Everett C. Hughes y Herbert Blumer, en la siguiente década, comenzaron a
desarrollar una aproximación conocida como el interaccionismo simbólico, el cual influyó
en la evolución del enfoque cualitativo.

Prácticamente, de manera simultánea, en las décadas de 1920 y 1930 Edward
Evan Evans-Pritchard (1902-1973) realiza investigaciones etnográficas con los azande
en el Nilo y los nuer en Sudán y Etiopía. En 1940, publica su obra The Nuer: A description of
the modes of livelihood and political institutions of a Nilotic people, que ayudó a consolidar
la etnografía.
Ruth Benedict publica en 1934 su libro Patrones en la cultura. Zora Neale Hurston,
en los años treinta efectúa sus estudios antropológicos (etnográficos) sobre el folklore
rural del sur de los EE. UU. (Murchison, 2010) y la práctica del vudú y el judú (hoodoo)
en el Caribe inglés (Hemenway, 1977).
En las décadas de 1940 y 1950 decayó la importancia del enfoque cualitativo
debido al posicionamiento de su “rival” cuantitativo (Gobo, 2005), y a que la Segunda
Guerra Mundial exigía estudios basados en mediciones y estadística para la industria
bélica, de construcción e incluso la propaganda (Hernández Sampieri y Mendoza, 2008);
aunque en 1945, Morris Edward Opler establece los principios del análisis temático
cualitativo al analizar sistemas culturales. Señaló que la importancia de una categoría o
tema está relacionada con la frecuencia de aparición, qué tanto se presenta en diferentes
ideas y prácticas culturales, cómo reaccionan las personas cuando se infringe y el grado
en el cual el número, fuerza y variedad de expresiones temáticas son controladas por el
contexto. Además, se realizaron algunos trabajos etnográficos de investigadores como
Elizabeth y Allison Davis, y Burleigh y Mary Gardner, que estudiaron las clases sociales en
Natchez, Mississippi, Estados Unidos; al igual que Conrad Arensberg, quien hizo algunas
investigaciones similares en Irlanda. Clair Drake y Horace Cayton publicaron una obra
que fue el resultado de los análisis efectuados en la población afroamericana del sur
de Chicago (Strong, 1946). George Spindler también trabajó la antropología educativa
y George M. Foster estudió diversas culturas latinoamericanas. Asimismo, Howard S.
Becker analiza diferentes profesiones.
Cabe destacar que la investigación-acción comienza a desarrollarse en esta etapa
(1945-1955) con nombres como John Collier, Ronald Lippitt y Marian Radke y Stephen
Maxwell Corey. Todos ellos siguieron a quien muchos autores consideran el fundador
¿Qué significa medir? 9

formal de tal visión, Kurt Lewin (Masters, 2000; Creswell, 2005).
En la década de 1960, el enfoque cualitativo recobra vitalidad e importancia. La
etnometodología surge con vigor. Peter L. Berger y Thomas Luckmann en 1966 presentan sus
modelos de construcción de la realidad (Berger y Luchmann, 1966). Dos sociólogos —Barney
G. Glaser y Anselm L. Strauss—, con pacientes en estado terminal en el San Francisco Medical
Center de la Universidad de California, realizan diversos estudios y de sus experiencias
publican el libro Discovery of grounded theory (1967), así emerge la Teoría Fundamentada
(después ambos autores presentan visiones diferentes de dicha teoría, como se comentó en
el libro).
Philip W. Jackson publica un trabajo cualitativo derivado de sus estudios en las aulas
(1968). A esta época se le denomina la “primera encrucijada del paradigma cualitativo”
(Shank, 1995). Asimismo, Paulo Freire comienza con la investigación participativa en América
Latina, específicamente en Brasil.
En la década de 1970, el enfoque cualitativo continúa popularizándose. Norman K.
Denzin (1970) reanaliza el concepto de triangulación. Egon G. Guba consolida la propuesta
de un enfoque alternativo, el naturalista (1978). La Teoría Fundamentada continúa
evolucionando.
Para la década de 1980, Terrence E. Deal y Allan A. Kennedy proponen estudiar las
culturas organizacionales al estilo etnográfico. John K. Smith (1983) distingue entre dos
aproximaciones filosóficas: idealismo y realismo. Matthew Miles y Michael Huberman (1984)
presentan procedimientos para el análisis cualitativo.
Yvonna Lincoln y Guba (1985) identifican diferencias entre el naturalismo y otras
clases de investigación. Strauss publica en 1987 su obra: Qualitative analysis for social
scientists. Cabe destacar que la investigación bajo el marco de referencia feminista, se
desarrolla notablemente en esta década con los trabajos de McRobbie (1982), Patai (1983),
Clegg (1985), Cook y Fonow (1986), y McCormack (1989).4
John Elliot propone el concepto de triangulación en la investigación cualitativa en 1991
y la investigación-acción deliberativa y a lo largo de la década de 1990, Strauss y Corbin (1990
y 1994) publican procedimientos más avanzados sobre la Teoría Fundamentada, y LeCompte,
Milroy y Preissle (1992) presentan nuevos esquemas etnográficos. De igual forma, Denzin
y Lincoln (1994) muestran alternativas del proceso cualitativo. Creswell (1998) distingue
entre cinco diferentes procedimientos de indagación cualitativa. Las editoriales McGraw-Hill
y SAGE publican varios libros de investigación cualitativa. Surgen diversas revistas científicas
cualitativas en todos los campos, continúan la tendencia de la década anterior. Cabe señalar
que entre 1989 y 1992, se desarrolla un software para análisis cualitativo: el Atlas.ti®, por

4Hasta este punto se han mencionado los nombres completos de los fundadores y autores iniciales del enfoque
cualitativo, ahora no se mencionarán nombres completos porque se trata de referencias.
10       Capítulo 9  Recolección de los datos cuantitativos

Thomas Muhr en la Universidad Técnica de Berlín; así, para 1993, se presenta el prototipo
y en 1996 se realiza la primera versión. De igual forma, Decision Explorer® fue diseñado
a principios de la década para apoyar la labor de mapeo cognitivo realizada por Colin
Eden en las universidades de Bath y Strathclyde. Posteriormente es comercializado por
Banxia Software. Otros programas son generados durante el periodo.
A partir de 2000, es un hecho que pocos dudan ya de lo valioso del enfoque
cualitativo. Clandinin y Connelly (2000) revitalizan los diseños narrativos; mientras que
Kemmis y McTaggart (2000) hacen lo mismo con la investigación participativa.
Los diferentes marcos conceptuales cualitativos comienzan a integrarse en
diseños con autores como Álvarez Gayou (2002) y Creswell (2005).
Mertens (2005) comenta que las aproximaciones feminista, participativa y
marxista —entre otras— más bien son parte del paradigma transformativo, que reconoce
diversas realidades y la influencia del contexto social y cultural en todas sus dimensiones
(política, económica, de género y origen étnico, de habilidades y capacidades distintas).
La relación entre el investigador y los participantes es de total interdependencia y se
sugiere que la investigación debe servir para mejorar las condiciones de vida de los
grupos marginados de la sociedad.
Hacia el final de la primer década del siglo surgen textos de metodología cualitativa
aplicada a diferentes disciplinas: Relaciones Públicas y Mercadotecnia (Daymon, 2010),
Geografía Humana (DeLyser et al., 2009) y Educación (Luttrell, 2009), solamente por
mencionar algunas. Y aquí estamos.

EL ENFOQUE MIXTO: LA TERCERA VÍA
El enfoque mixto surge como consecuencia de la necesidad de afrontar la complejidad
de los problemas de investigación planteados en todas las ciencias y de enfocarlos
holísticamente, de manera integral. En 1973, Sam Sieber (citado por Creswell, 2005)
sugirió la combinación de estudios de caso cualitativos con encuestas, creando “un nuevo
estilo de investigación” y la integración de distintas técnicas en un mismo estudio. En
1979 dos trabajos fueron “detonantes” clave de los métodos mixtos: Trend (1979) y
Jick (1979). El primero hizo un llamado a combinar el análisis de datos cuantitativos y
cualitativos para resolver las discrepancias entre los estudios cuantitativos y cualitativos;
y el segundo introdujo los conceptos básicos de los diseños mixtos, propuso recabar
datos mediante técnicas cuantitativas y cualitativas, e ilustró la triangulación de datos;
además de comentar la necesidad de obtener “una fotografía más enriquecedora y con
mayor sentido de entendimiento de los fenómenos”.
Como señalan Hernández Sampieri y Mendoza (2008), dos nociones fueron
importantes para la concepción de la investigación mixta: la referente a la triangulación
y la de utilización de varios métodos en un mismo estudio para incrementar la validez del
análisis y las inferencias.
¿Qué significa medir? 11

La idea de la triangulación, la cual durante años impulsó el enfoque cualitativo
al referirse a la triangulación de distintas fuentes para verificar los datos, fue aplicada
a los métodos cuantitativo y cualitativo.5 En su trabajo titulado: “Mezclando métodos
cualitativos y cuantitativos: La triangulación en acción”, Jick (1979) propuso que cuando
una hipótesis o resultado sobrevive a la confrontación de distintos métodos, tiene un
grado mayor de validez que si se prueba por un único método.
La utilización simultánea de diferentes procedimientos de indagación fue
“catapultada” en la matriz de multimétodos-multirasgos de Campbell y Fiske (1959),
quienes sostenían que el hecho de utilizar varios métodos para medir las variables
de interés incrementaba la validez convergente y discriminante del instrumento o
instrumentos para recolectar los datos (Jacobson y Carlson, 1973; Jackson, 1977; Hubert
y Baker, 1978).
En los años de 1970 y 1980, se manifestó la denominada “guerra de los
paradigmas”, tal vez en parte debida a la noción popularizada por Tomas Kuhn (1962) de
los “paradigmas en competencia” en su libro La estructura de las revoluciones científicas
(Teddlie y Tashakkori, 2009). El caso es que la rivalidad entre los seguidores del enfoque
cuantitativo y cualitativo fue abierta, con los argumentos mencionados en el capítulo 1
del texto impreso “Definiciones de los enfoques cuantitativo y cualitativo, sus similitudes
y diferencias”. La tesis generalizada fue la de la “incompatibilidad de paradigmas”.
En América Latina el debate resultó muy intenso, al grado que diversas
instituciones separaron físicamente a los investigadores de una u otra aproximación.
La discusión se volvió dicotómica y se enfatizaron las diferencias entre
constructivistas y positivistas en cuestiones filosóficas como la ontología, epistemología,
axiología, posibilidad de generalización y vínculos causales (Teddlie y Tashakkori, 2009).
Hasta algunos autores en materia de metodología de la investigación incluyeron tablas
que contrastaban al constructivismo y al positivismo (por ejemplo: Lincoln y Guba, 1985).
La mayoría de los investigadores se adhirió a un enfoque único y consideró que el
constructivismo y el positivismo como métodos, eran irreconciliables, porque provenían
de paradigmas cuya lógica y premisas eran muy distintas, incluso opuestas (Hernández
Sampieri y Mendoza, 2008). Tal incompatibilidad se asociaba con la supuesta conexión
entre los paradigmas y los métodos de investigación. De acuerdo con esta idea, los
paradigmas se vinculaban con los métodos en una especie de correspondencia “uno a
uno”. Consecuentemente, si las premisas subyacentes de los paradigmas entraban en
conflicto, los métodos relacionados con éstos no podían combinarse (Lincoln, y Guba,
1988; Teddlie y Tashakkori, 2009).
Pero en la década de 1980, unos cuantos metodólogos e investigadores siguieron
trabajando en la mezcla de ambas visiones a la investigación, por ejemplo: Connidis (1983)

5 El término triangulación proviene de la ciencia naval militar como un proceso que los marineros utilizan, y
consiste en tomar varios puntos de referencia para localizar la posición de un objeto en el mar (Jick, 1979).
12       Capítulo 9  Recolección de los datos cuantitativos

y Howe (1988). Greene, Caracelli y Graham (1989), así como Rossman y Wilson (1985)
identificaron varios motivos para usar la investigación mixta, tales como: enriquecer la
información, triangular datos, complementar perspectivas, clarificar resultados, iniciar
nuevos modelos de pensamiento, etcétera.
Asimismo, el pospositivismo desplazó al positivismo y ello permitió mayor
flexibilidad de algunos investigadores tanto cuantitativos como cualitativos, y la
conceptualización de la triangulación se expandió (Hernández Sampieri y Mendoza,
2008).
Por otro lado, el desarrollo de los métodos mixtos fue posible en parte a: 1) la
introducción de una variedad de nuevos instrumentos metodológicos tanto cuantitativos
como cualitativos, 2) la vertiginosa evolución de las nuevas tecnologías para accesar y
utilizar las herramientas metodológicas más fácilmente (hardware y software e internet),
y 3) el incremento en la comunicación a través de las distintas ciencias y disciplinas.
Para la década de 1990, el debate sobre los modelos mixtos “amainó” en el
panorama internacional, pero en Iberoamérica fue sumamente conflictivo y se pola-
rizaron opiniones: rechazo y aceptación, las cuales desafortunadamente se mantienen al
comenzar el tercer lustro del presente siglo, más por desconocimiento de los detractores
de la visión mixta que por otras cuestiones.
Entre 1990 y 2000, en el mundo anglosajón, comenzó la institucionalización del
enfoque mixto (Teddlie y Tashakkori, 2009).
Tal hecho no hubiera ocurrido sin el surgimiento de un sustento filosófico de
los métodos mixtos: el pragmatismo (Hernández Sampieri y Mendoza, 2008), el cual
representó una vía alternativa ante el pospositivismo y el constructivismo, ya que:6

1. Rechaza la dicotomía entre dualismos tradicionales (racionalismo versus
empirismo, realismo en contraposición al antirrealismo, libre albedrío vs.
determinismo, etc.) (Teddlie y Tashakkori, 2009). El pragmatismo objeta la
visión de que debe escogerse entre las dos categorías de la dicotomía sobre
el contexto, va en contra tanto de que los resultados sean completamente
específicos de un contexto en particular como de que los resultados son una
instancia de algún conjunto de principios generalizados (Hernández Sampieri
y Mendoza, 2008).
2. Concibe a los paradigmas no solamente como visiones globales del mundo
(entendimientos comunes sobre la “realidad” que afectan cada aspecto de
la indagación científica), posturas epistemológicas (sistemas de creencias
que influyen la manera como son elaboradas y contestadas las preguntas de
investigación) y sistemas de creencias compartidos por los miembros de un
área del conocimiento (consenso sobre qué preguntas son las más significativas
6 Este paradigma toma diversas ideas de John Dewey (1859–1952), William James (1842-1910) y Charles S.
Peirce (1839-1914), entre otros.
¿Qué significa medir? 13

y qué procedimientos son los más apropiados para responderlas); sino también
como “ejemplos modelo de investigación”, flexibles respecto a la forma en que
debe inquirirse en un campo determinado del quehacer científico (Hernández
Sampieri y Mendoza, 2008).7
3. Considera que el conocimiento es construido pero que también se basa en
la realidad del mundo que experimentamos y en el cual vivimos (Teddlie y
Tashakkori, 2009).
4. Se orienta a la “acción” más que a la discusión filosófica (Teddlie y Tashakkori,
2009).
5. Endosa a la “teoría práctica”, a lo que funciona.
6. Refuerza el pluralismo y la compatibilidad (Johnson y Onwuegbuzie, 2004).
7. Adopta una aproximación hacia la investigación explícitamente orientada a
valores, que se deriva de los valores culturales.8

Este crecimiento de los métodos mixtos en la década de 1990 fue vertiginoso:
Patton (1990) en el campo de la evaluación señaló las siguientes combinaciones de
métodos: a) diseño experimental, datos cualitativos y análisis de contenido cuantitativo y
cualitativo; b) diseño experimental, datos cualitativos y análisis estadístico; c) indagación
naturalista (cualitativa), datos cualitativos y análisis estadístico; y d) indagación
naturalista, datos cuantitativos y análisis estadístico.
Morse (1991) delineó dos tipos de triangulación: simultánea y secuencial. Para
esta autora, la triangulación simultánea (CUAN + CUAL o CUAL + CUAN) representaba
usar al mismo tiempo métodos cualitativo y cuantitativo, con una interacción limitada
entre las dos fuentes de datos al momento de la recolección de datos, pero en el momento
de interpretar los descubrimientos ambos métodos se podían complementar. Asimismo,
la triangulación secuencial (CUAN → CUAL o CUAL → CUAN) era utilizada cuando los
resultados de un enfoque resultaban necesarios para planear el método subsecuente.
También, Janice Morse concibió el sistema utilizado hoy en día para simbolizar los
diseños mixtos y propuso modelos.
Steckler et al. (1992) propusieron cuatro modelos:

• Modelo 1: métodos cualitativos para desarrollar medidas cuantitativas.
• Modelo 2: métodos cuantitativos para reforzar descubrimientos cualitativos.
• Modelo 3: métodos cualitativos para explicar descubrimientos cuantitativos.
• Modelo 4: métodos cuantitativos y cualitativos para ser usados por igual en paralelo.

7 Estas concepciones de lo que son los paradigmas provienen de Morgan (2008); así como Neal, Hammer y
Morgan (2006).
8 Para profundizar un poco más sobre el pragmatismo, se sugiere ver el capítulo 12 del centro de recursos
en línea: Ampliación y fundamentación de los diseños mixtos.
14       Capítulo 9  Recolección de los datos cuantitativos

Dzurec y Abraham (1993), así como Sechrest y Sidana (1995), fortalecieron las
razones para utilizar los métodos mixtos y agregaron otras, como facilitar el monitoreo
de los datos recolectados, reducir la complejidad para entender los fenómenos bajo
estudio, innovar, obtener mayor significado de los datos, etcétera.
En 1997 Richard Grinnell visualizó diseños específicos, al igual que Creswell
(1998).
Tashakkori y Teddlie (1998) proporcionaron otras posibilidades para análisis
en los diseños mixtos y revisan la reciente historia de los métodos mixtos. Durante
esta década el enfoque mixto se aplica en diversos campos, como la Educación, la
Comunicación, la Psicología, la Medicina y la Enfermería. Se realizan varios congresos
para debatir el tema. Denzin y Lincoln (2000) presentaron una amplia discusión sobre la
triangulación.
Creswell, Plano Clark, Guttman y Hanson (2003) proponen una tipología
de diseños mixtos. Tashakkori y Teddlie (2003) efectúan una revisión del estado
del arte en la materia. En el 2004 y 2005 se realizan diversas revisiones de
las posibilidades del enfoque mixto (Creswell, 2005; Mertens, 2005; Grinnel y
Unrau, 2005).
Mertens (2005, pp. 8 y 9) compara los paradigmas presentados en el presente

capítulo, haciéndose las siguientes preguntas:
1. La pregunta relativa a la realidad (ontológica): ¿cuál es la naturaleza de la realidad? (¿cómo se
concibe?).
2. La pregunta sobre la naturaleza del conocimiento y la relación entre el investigador y el fenómeno
estudiado (epistemológica): ¿cómo son concebidos el conocimiento y la relación entre el investi-
gador y el fenómeno estudiado?
3. La pregunta sobre el método: ¿de qué manera el investigador obtiene el conocimiento deseado y
comprende el fenómeno?

Hemos adaptado las respuestas en la tabla 1.1.

Cabe señalar que en octubre de 2003, la prestigiada publicación British Educational
Research Journal editó un número especial para celebrar e incluir “algunos de los mejores
estudios recientes” en el campo de la investigación educativa, ocho en total, de los cuales
seis eran mixtos (Scott, 2007).9
Asimismo, en 2007 se comenzó a publicar la revista Journal of Mixed Methods
Research. En 2010 se publica la segunda edición de la obra SAGE Handbook of Mixed
Methods in Social & Behavioral Research, que hace notables aportaciones para estructurar
el campo de la investigación híbrida.
En años recientes (2010 a 2014), el incremento en los textos de metodología mixta
9 La fuente original en la cual se basó Scott (2007) fue: Gorard, S. y Taylor, C. (2003). “In praise of educational
research”, British Educational Research Journal, 29, 5, 619–622.
¿Qué significa medir? 15

  Tabla 1.1  Principales paradigmas en la investigación

Características y Pospositivismo Constructivista Transformativo Pragmático
supuestos
Etiquetas asociadas Experimental Naturalista Teoría crítica Métodos y modelos mixtos o
con el paradigma Cuantitativo Fenomenológico Neomarxista híbridos
Causal Hermenéutico Feminista
Comparativo Interaccionista simbólico Participativo
(interactivo) Emancipatorio
Etnográfico
Cualitativo
Supuesto de realidad Una realidad conocida en Múltiples realidades construi- Múltiples realidades Lo que es útil
términos de probabilidad das socialmente formadas por el contexto para explicar integralmente un
social, político, económi- fenómeno es lo verdadero
co, cultural y étnico
Supuesto del cono- La objetividad El conocimiento es interac- El conocimiento es Las relaciones
cimiento y relación es importante, tivo, producto del vínculo interactivo, producto del entre el investigador
entre el investigador y el investigador observa, entre el investigador y los vínculo entre el investiga- y el fenómeno o participantes del
el fenómeno mide participantes o fenómeno. Los dor y los participantes o estudio, están determinadas por
y manipula variables; trata valores y tendencias de todos fenómeno. Se sitúa social lo que el investigador considera
de desprenderse de sus los involucrados son hechas e históricamente como apropiado para cada estu-
tendencias explícitas, generan descubri- dio en particular
mientos y por el contexto
Supuesto metodo- Básicamente cuantitativo e Básicamente cualitativo, her- Con bases cualitativas, El método depende del plantea-
lógico intervencionista menéutico y dialéctico pero pueden utilizarse miento específico del estudio.
métodos cuantitativos y Son válidas las técnicas cuantita-
mixtos. Los factores his- tivas, cualitativas y mixtas
tóricos están incluidos
ha sido considerable, los nombres de los pioneros en esta materia, como John Creswell,
Abbas Tashakkori, Alan Bryman, Donna Mertens, Janice Morse, Michael Patton, Jennifer
Greene, Richard Grinnell, Charles Teddlie, etc., seguirán dando de qué hablar.
En América Latina, la propuesta de los métodos mixtos ha provenido, desde 1993,
de algunos autores y se ha consolidado en el trabajo de Hernández Sampieri y Mendoza
(2008).
El siglo XX inició con un enfoque principal, el cuantitativo, y culminó con dos enfoques
fundamentales: cuantitativo y cualitativo. No es el caso de que uno sustituyera al otro, sino
que el segundo se agregó al primero. El siglo XXI comenzó con una tercera vía (que se vino
gestando desde décadas atrás): el enfoque mixto. Los próximos años son fundamentales
para que este adolescente (o híbrido) siga consolidándose.
capítulo

2 Ética en la investigación

La investigación involucra a seres humanos
La investigación en cualquier rama siempre involucra a seres humanos en diferentes roles:
como realizadores (investigadores), participantes (sujetos del estudio) y/o usuarios (desde sim-
ples lectores de los informes en distintos formatos hasta quienes utilizan los reportes para
desarrollar nuevas investigaciones o tomar decisiones). En el caso de las ciencias de la salud, las
administrativas y sociales, o aquellas donde se consideran procesos en los que participan indi-
viduos, la implicación es en los tres papeles. Veamos algunas cuestiones éticas respecto a cada
rol.

Aspectos éticos de los seres humanos como participantes
Como participantes las personas son medidas, observadas, evaluadas y/o analizadas. Aun cuan-
do estas tareas sean indirectas (por ejemplo: revisión de registros escolares, cartas y materiales
audiovisuales), se les involucra. Y desde luego, tienen derechos como sujetos de un estudio. Por
ello, los aspectos éticos son sumamente relevantes.

Respeto a los derechos de los participantes
Todos los seres humanos nacemos libres y con los mismos derechos. Debemos ser tratados con
idéntico respeto, fraternidad y dignidad. Estos principios consignados en la Declaración
Universal de los Derechos Humanos de 1948, guían la investigación en todas las disciplinas
(Bell, 2008).
Tal documento y varios principios éticos en las ciencias fueron reforzados en gran parte
como consecuencia del Código de Nuremberg, desarrollado en 1947, y el cual, a su vez, resul-
tó del juicio a 23 científicos nazis que habían realizado experimentos atroces con diferentes
prisioneros de campos de concentración (Lurie, 2010).1
A partir de entonces, se han generados diversos documentos, como la Declaración de
Helsinki de 1964 y otros códigos éticos y de conducta que consideran que los participantes en
una investigación tienen al menos los siguientes derechos:2
1
Los acusados estaban encabezados por Karl Brandt, médico personal de Hitler. De los 18 condenados se ahorcó a siete y los 11
restantes recibieron condenas desde diez años hasta cadena perpetua (Coronado, Alfaro y Ramírez, 2006).
2 Por ejemplo: The Belmont Report de 1979 (surgido a partir de los excesos de experimentos de la CIA), The Ethical Guidelines for
Good Research Practice de la Association of Social Anthropologists of the UK and the Commonwealth (ASA) (1999), International
Ethical Guidelines for Biomedical Research Involving Human Subjects (en 2002), The Code: Standards of Conduct, Performance and
2       Capítulo 9  Recolección de los datos cuantitativos

• Estar informados del propósito de la investigación, el uso que se hará a los resultados obtenidos y
las consecuencias que puede tener en sus vidas.
• Negarse a participar en el estudio y abandonarlo en cualquier momento que así lo consideren
conveniente, así como negarse a proporcionar información.
• Cuando se utiliza información suministrada por ellos o que involucra cuestiones individuales, su
anonimato debe ser garantizado y observado por el investigador (Ogden, 2008b). Por ejemplo,
podemos usar datos de un censo sin tener que pedir la aprobación de toda la población incluida,
pero estos datos no son individuales ni personales.

Comstock (2013), deRoche y deRoche (2009) y Wiersma y Jurs (2008) identifican dos aspectos
relacionados con tales derechos:

• Consentimiento o aprobación de la participación. Además de conocer su papel en una investiga-
ción específica, es necesario que los participantes proporcionen el consentimiento explícito acerca
de su colaboración (preferentemente por escrito) (Owens, 2010). Las formas de aprobación deben
adaptarse a los requerimientos legales de la localidad donde se lleve a cabo la investigación (en
varios países no existe todavía una regulación en la materia, entonces debemos explicitar en el
documento algo así como: Yo, nombre de la persona, consiento o apruebo participar en el estudio
—nombre de éste— de manera voluntaria y en el pleno uso de mis facultades físicas y menta-
les…). En el caso de menores de edad se requiere la autorización de los padres de familia o tutores
y de los propios niños o jóvenes participantes (por escrito). Si, además, se involucra a una o varias
instituciones, se requiere también de la aprobación de su representante legal (por ejemplo, en
escuelas, empresas, asociaciones, centros deportivos o comerciales). A veces, por cuestiones de
tiempo, podemos tener una sola forma con la leyenda o frase de anuencia y espacios para que cada
participante la firme (formato colectivo). Esto es muy común en encuestas. De igual manera, en
una parte del cuestionario se puede agregar un breve mensaje: “el responder a este cuestionario
implica su autorización para participar en el presente estudio”. El consentimiento depende de qué
tan efectivos seamos al presentar los objetivos de la investigación. Asimismo, si vamos a grabar a
los participantes (audio y video), ellos deben aprobar tal acción. Todo lo anterior aplica también
cuando se usa internet para recolectar datos e información.
• En Estados Unidos, y de acuerdo con McNutt (2007), los formularios de consentimiento infor-
mado utilizados una afirmación contundente y clara de que la participación es voluntaria.
• Confidencialidad y anonimato. Se refiere a que no se revele la identidad de los participantes ni se
indique de quiénes fueron obtenidos los datos (Ogden, 2008c y Kennedy, 2008). Por ejemplo, en
un estudio del clima organizacional que hace patentes aspectos delicados de una empresa como la
moral interna y la motivación, no resulta conveniente señalar el nombre de la organización, salvo
que así lo soliciten la directiva y los representantes de los trabajadores. En el caso de una investi-
gación cualitativa en que se manifiestan sentimientos profundos, la confidencialidad debe ser
absoluta ya que es una promesa que se hace a los participantes. En una ocasión, el autor principal
de esta obra efectuó un estudio sobre clima laboral y los directivos quisieron que les proporciona-
ra los nombres de quienes habían evaluado desfavorablemente a la empresa, por supuesto, la
negativa a tal petición fue rotunda, lo que significó la renuncia inmediata y sin concesiones.
Traicionar la confianza de los participantes es una seria violación a los principios de la ética y la
moral… es inaceptable. En el caso de los materiales de audio y video, éstos nunca podrán ser
mostrados a personas ajenas al equipo de investigación, cuyos miembros se comprometen por
escrito a nunca revelar la identidad de los participantes ni enseñar los materiales. Se deben guardar
en un lugar seguro y destruirse en un tiempo razonable. Los participantes deben decidir cuándo
eliminarse. Por lo anterior, en la investigación se utilizan seudónimos y no nombres reales de los
sujetos involucrados.
Ethics for Nurses and Midwives (de 2008) y The American Psychological Association's Ethical Principles of Psychologists and Code Conduct
(2010), el cual es revisado periódicamente desde el decenio de 1960. Su página es: http://www.apa.org/ethics/code/index.aspx.
¿Qué significa medir? 3

Otro elemento importante es el respeto a la privacidad de los participantes, no podemos entrome-
ternos en las vidas de las personas (Ogden, 2008a). Cuando se filma abiertamente (por ejemplo, en un
parque o un centro comercial), por lo regular las conductas de las personas son públicas (observadas
por otros) y no es una situación crítica (de hecho, las cámaras de seguridad graban de forma perma-
nente el comportamiento de los individuos que transitan por el lugar), pero dentro de un hogar, en
una escuela o un hospital, debemos obtener la autorización de los gatekeepers y de los participantes,
quienes al principio estarán conscientes del hecho, pero paulatinamente se olvidarán de éste, normal-
mente no se afecta la calidad de los resultados si se procede con cuidado y profesionalismo.
El investigador está obligado a proteger a los participantes de riesgos, daños y amenazas que
pudieran afrontar ellos y el equipo de investigación (Ogden, 2008e). Cualquier cuestión que los pue-
da afectar física y/o mentalmente, de manera irreversible o aún reversible, debe cancelarse.3
Una cuestión debatida sobre las amenazas potenciales a participantes ocurre frecuentemente en la
medicina, pues siempre hay una primera persona que se expone a un nuevo tratamiento o medicamento
y corre un riesgo elevado. Tal fue el caso de una bebé (Eileen Saxon y sus padres), quien en 1944 debió
someterse en el hospital Johns Hopkins a una operación innovadora para su época y que la comunidad
médica de ese entonces, en su mayoría, concebía como algo casi imposible. La cirugía implicó
ensamblar una arteria que se dirigía al corazón a una arteria que conducía a los pulmones, en una
tentativa de dar a la sangre una segunda oportunidad para su oxigenación. Esta primera operación del
“bebé azul” vino a ser conocida como la desviación de Blalock-Taussig. La intervención quirúrgica era
parte de una investigación. El dilema para el médico cirujano-investigador y su asistente (doctor
Alfred Blalock y Vivien Thomas, respectivamente) fue que para continuar el estudio y salvar muchas
vidas, se necesitaba efectuar la cirugía, que evidentemente colocaba en riesgo a la pequeña participante.
¿Qué hacer en estos casos? La respuesta es compleja. En el ejemplo todo resultó bien y la operación de
la bebé (cuya esperanza de vida era de unos meses) fue un éxito.4 Pero no siempre ocurre así, por ello,
el doctor Roberto Hernández Galicia recomienda que en estos casos deben agotarse todas las demás
posibilidades antes de seguir adelante, minimizarse los riesgos, experimentar con animales (con el
debido cuidado y apego a las leyes que los protegen) hasta que los procedimientos estén asegurados y
así se evite que sea el ego del investigador quien “guíe” las decisiones. También es importante que en
todo estudio se observen los derechos de respeto por la dignidad humana, la igualdad, la autonomía
individual y la libertad de expresión (los participantes deben poder manifestarse abierta y libremente),
así como la justicia y el acceso a la información (Serago et al., 2009; Lo, 2009; Bell, 2008; e Israel y
Hay, 2006).
Adicionalmente, mencionaremos que es conveniente que los participantes reciban “algo” en reci-
procidad de su involucramiento en un estudio, un beneficio (Ogden, 2008f ). Por ejemplo, capacita-
ción, información, un regalo, ayuda de algún tipo (como una terapia, soporte emocional después de
que el estudio concluyó, una consulta médica, consejos, entre otros), recursos económicos (aunque
como señala Creswell, 2009, este financiamiento no debe ser excesivo), un reconocimiento (un diplo-
ma, una carta) o al menos, un agradecimiento particularizado. Asimismo, es sumamente importante
que conozcan los resultados finales de la investigación, asunto que en los estudios cualitativos es nece-
sario para garantizar la calidad de éstos.
Cuando se recolectan opiniones, especialmente en un estudio cualitativo, debemos intentar
incluir todas las voces y puntos de vista de los diferentes actores y grupos sociales. No podemos mar-
ginar a ciertas personas. Asimismo, en la investigación no tienen cabida el racismo o la discriminación.
Todos los participantes, sin importar el género, nivel socioeconómico y origen étnico, son igualmente
importantes y merecen el mismo respeto.
Otro aspecto es que, normalmente la institución que encarga un estudio, para verificar la calidad
de la información, solicita los ejemplares de los instrumentos contestados por los participantes (por
ejemplo cuestionarios) y las bases de datos, ¿qué debemos hacer? La ética de la investigación marca que
tenemos que entregarlos a quien o quienes solicitaron el estudio, pero ellos también deben compro-
3
Este principio es conocido ampliamente como “no maleficencia” e incluye cuestiones físicas, psicológicas y morales (incluyendo la reputa-
ción) (Herrera, 2010 y Ogden, 2008d).
4
Hernández Galicia (2005).
4       Capítulo 9  Recolección de los datos cuantitativos

meterse a respetar los principios esbozados previamente, a no utilizar información para perjudicar a
algún participante y mantener la confidencialidad (en el ejemplo de la investigación del clima laboral
mencionado previamente debe pactarse, desde antes de que se inicie la recolección de los datos, que
no se entregarán ejemplares de los instrumentos si hay forma de saber quién respondió). Incluso,
cuando se captura en un medio electrónico (internet, intranet, cuestionario en PC, etc.), debe llevarse
un registro del momento en que se recabó la información. Transparencia es el “nombre del juego”.
Otros conceptos o cuestiones éticas que deben observarse respecto a los participantes, algunas de
las cuales están vinculadas con las expuestas anteriormente en es5te capítulo, se incluyen en la tabla
2.1.
Aspectos éticos de los investigadores
Además de considerar y observar los principios éticos con los participantes, los investigadores
  Tabla 2.1  Cuestiones éticas adicionales

Cuestión Comentario
Sensibilidad El investigador debe ser sensible a las ideas, características, inclinacio-
nes y preferencias de los participantes, mostrando respeto y evitando
criticar a los individuos. Esto es particularmente necesario en el caso
de cuestiones como la conducta sexual, la religión y los valores per-
sonales. También debe mostrarse una gran sensibilidad y respeto a la
cultura de los sujetos del estudio (Low, 2008).
Confianza El investigador debe ganarse la confianza de cada participante; una
vez lograda, ello implica una seria responsabilidad. A lo largo del
estudio tiene que demostrar a los sujetos que se puede confiar en él
(Haggerty, 2008).
Decepción Es importante no decepcionar a los participantes con el estudio
(O'Neill, 2008). Siempre tenemos que hablarles con claridad sobre
los beneficios o ventajas de participar en el estudio y nunca prometer
algo que no pueda cumplirse ni levantar las expectativas más allá de
la realidad.
Reciprocidad Este concepto se refiere a un equilibrio entre lo que se le solicita a
un participante y lo que se le otorga. En la medida de lo posible, es
conveniente que se mantenga tal equilibrio y esto se relaciona con
los beneficios que reciban los sujetos del estudio (desde conocimiento
hasta una compensación económica) (Crow, 2008 y Goodyear, 2004).
Vulnerabilidad Algunos participantes son más vulnerables que otros al contexto de
la investigación o al proceso mismo por sus características o condicio-
nes, lo cual se debe tomar en cuenta. Especialmente tratándose de
aspectos médicos, psicológicos o legales (Duffy, 2008). Ejemplos de
grupos o poblaciones vulnerables son las mujeres embarazadas, los
enfermos, aquellos seres humanos que viven en condiciones de po-
breza y marginalidad, las personas de edad avanzada, los individuos
con trastornos mentales o capacidades diferentes y desde luego, los
menores de edad.
Presión o coerción Nunca debe presionarse ni la participación en un estudio ni la induc-
ción de respuestas.
Imparcialidad Es una postura que todo investigador debe mantener en cualquier es-
tudio (Kushner, 2004). No se puede dar preferencia a algún individuo
o grupo de participantes sobre otro (por ejemplo, a quienes están en
una condición experimental).
Legalidad Todo estudio debe conducirse de manera legal y con estricto apego a
las normas.
¿Qué significa medir? 5

también deben estár sujetos a otros criterios. El primero de éstos es la honestidad o integridad (Dik, 2006
y Fitzpatrick, 2004), lo cual implica: 1) adherirse a los datos, resultados y hechos, 2) no manipular infor-
mación , 3) veracidad en el reporte de resultados (Comstock, 2013, Smith y Li-Ching, 2008 y Aagaard-
Hansen y Johansen, 2008), 4) describir a detalle el método y resultados y 5) asegurar que los
colaboradores no incurran en falsificación en la recolección, codificación y análisis (Guterbock, 2008) .
Asimismo, involucra citar apropiadamente las referencias bibliográficas y no incurrir en piratería o plagio.
Previamente se había comentado que nunca se debe poner en riesgo tanto a los participantes como al
equipo de investigación. Respecto a lo segundo, el investigador es responsable de la seguridad de sus cola-
boradores (Hughes, 2008). Por ejemplo, tiene que vigilar que en los casos necesarios (como en un expe-
rimento con sustancias químicas o en el cual se utilizan materiales delicados) todos utilicen los equipos de
seguridad requeridos. Asimismo, no debe exponer a alguien a amenazas o peligros. Por ejemplo, hace
algunos años un grupo de investigadores realizó un estudio en una prisión para evaluar los factores que
contribuyen a la readaptación positiva de los reos a la sociedad. En este trabajo participaron estudiantes.
Cuando concluyó la etapa exploratoria, uno de los investigadores les pidió a los alumnos que obtuvieran
información sobre la corrupción dentro de la cárcel, lo cual obviamente ponía en un severo riesgo a los
jóvenes; eso es algo que resulta inadmisible. Se impidió que tal situación se presentara, pues si al investi-
gador le interesaba el fenómeno de la corrupción, él mismo debía investigarlo bajo su propia responsabi-
lidad.
Otro ejemplo ilustrativo sucedió en 2011: nueve encuestadores fueron secuestrados en un municipio
de la provincia de Michoacán en México mientras recolectaban datos sobre preferencias en una elección
para la alcaldía. Afortunadamente, su liberación ocurrió pocos días después (Martínez, 2011 y Milenio,
2011). En situaciones donde el clima social sea crítico, violento y riesgoso debe evitarse enviar a investi-
gadores, encuestadores y observadores. Adicionalmente, ellos deben contar con seguros médicos y de vida.
En el caso de estudiantes que levantan información en el campo, resulta indispensable que los seguros
escolares cubran esta actividad.
Por otra lado, un elemento muy importante es el evitar un conflicto de intereses (Herrera, 2010,
deRoche y deRoche, 2009 y Fitzpatrick, 2004). Resulta relevante asegurar que ningún interés pueda
influir el estudio (desde el planteamiento hasta los resultados).
Incluso, diversas revistas científicas solicitan explícitamente una declaración de no conflicto de inte-
reses. Por ejemplo: “El autor(a) (o los autores) declara(n) que no hay conflictos de interés potenciales con
respecto a la autoría y/o publicación de este trabajo (artículo, libro,
etc.)”. Conflicto de intereses Se presenta cuan-
Sobra señalar que todo lo anterior se aplica no sólo al investiga- do un investigador o alguien que finan-
dor sino a todo el equipo que colabora en el estudio. cia el estudio tienen un interés personal
que puede influir negativamente en la
búsqueda de la verdad en el proceso de
investigación.
Aspectos éticos de los usuarios
También el usuario o consumidor de la investigación debe apegarse
a cuestiones éticas. Tiene que utilizar los resultados para el bien común y la justicia, así como tomar deci-
siones éticas con un alto y genuino sentido de responsabilidad social. Desde luego, no siempre ocurre así.
Hay empresas, agencias y gobiernos que han patrocinado estudios y utilizado los resultados de investiga-
ciones para injuriar al prójimo, destruir ciudades, desarrollar medicamentos dañinos, etcétera… es una
lástima. Desde un punto de vista personal, el conocimiento no debe generarse si implica lastimar a seres
humanos o a la sociedad. Para una discusión sobre el tema “ciencia versus las personas” se recomienda a
deRoche y deRoche (2009).
6       Capítulo 9  Recolección de los datos cuantitativos

Respeto al lugar donde se efectúan las investigaciones

El contexto en el cual se conducen las investigaciones debe ser respetado. Primero, obteniendo los
debidos permisos para acceder al lugar de parte de personas autorizadas (gatekeepers). Segundo, al
observar y cumplir con las reglas del sitio y recordar que somos “invitados”, por lo cual tenemos la
obligación de ser amables, cooperativos, cordiales y respetuosos de las personas, sus creencias y cos-
tumbres.

Los comités de investigación
Todas las universidades, colegios, asociaciones e instituciones de todo tipo, deben integrar comités o
figuras que vigilen que se observe cuidadosamente la ética de la investigación. Desafortunadamente en
América Latina estamos rezagados en esta materia. Para ampliar este último tema y lo expuesto en el
capítulo se recomiendan las siguientes referencias: Comstock (2013), deRoche y deRoche (2009),
Aagaard-Hansen y Johansen (2008), Larkin, de Casterlé y Schotsmans (2008); y Watson, Jones y
Burns (2007), además de la bibliografía citada. Para el tema de la ética en la investigación en ciencias
de la salud se recomienda a Iltis (2007).
capítulo
Perspectiva teórica: comentarios

3 adicionales

Introducción
Este capítulo complementa al capítulo 4 de Metodología de la investigación, 6ª edición, parte
impresa: “Desarrollo de la perspectiva teórica: revisión de la literatura y construcción del marco
teórico”. Se profundiza en los conceptos relativos a la teoría, sus funciones, valor y criterios para
evaluar distintas teorías. Asimismo, se amplían las diferentes fuentes que alimentan la búsqueda
de la literatura (particularmente en internet) y el desarrollo de una perspectiva teórica.
Además, se ejemplifican los diversos tipos de información que podemos obtener de las referen-
cias y la extensión que es recomendable para el marco teórico. Finalmente, se comentan las
principales enciclopedias que pueden ayudarnos a integrar nuestros marcos teóricos y el capí-
tulo de método en el reporte de investigación.

Teorías: ampliación de conceptos
Profundicemos en conceptos relativos a las teorías.

Acepciones del término teoría 
El término “teoría” se utiliza de diferentes formas para indicar cuestiones distintas. Cuando
revisamos la literatura al respecto, nos encontramos con definiciones contradictorias o ambi-
guas; además, ocasionalmente, conceptos como teoría, orientación teórica, marco teórico de
referencia, esquema teórico o modelo se usan como sinónimos y otras veces con leves matices
diferenciales (Sjoberg y Nett, 1980, p. 40).
En ocasiones, con teoría se indica una serie de ideas que una persona tiene respecto de algo (“yo
tengo mi propia teoría sobre cómo educar a los hijos”). Otra concepción considera a las teorías
como conjuntos de ideas no comprobables e incomprensibles, que están en las mentes de los
científicos, y que tienen muy poca relación con la “realidad” (Black y Champion, 1976). Con
frecuencia, las teorías se perciben como algo totalmente desvinculado de la experiencia cotidia-
na. Hay incluso quienes piensan que, debido a que no tratan “problemas relevantes” de la vida
2       Capítulo 3  PERSPECTIVA TEÓRICA: COMENTARIOS ADICIONALES

diaria (por ejemplo, cómo conseguir trabajo o hacerse millonario, conquistar a una persona, ganar
dinero en un casino, tener una vida matrimonial feliz o superar una tragedia), no son de utilidad. De
acuerdo con este punto de vista, solo cuando las teorías explican cómo vivir mejor deben tomarse en
cuenta seriamente. Al respecto, cabe señalar que en ocasiones las teorías se relacionan con cuestiones
cotidianas mediante los estudios que sirvieron para establecerlas, desarrollarlas y perfeccionarlas. Por
ejemplo, la satisfacción en el matrimonio puede ser explicada por la concurrencia de varias teorías e
investigaciones: teoría de la atribución, teoría de la reducción de la incertidumbre, teoría del intercam-
bio de afecto y otras relativas a las relaciones interpersonales (Celenk y van de Vijver, 2013 y Baxter y
Braithwaite, 2008), así como por distintos modelos y estudios empíricos.
También hay quienes creen que la teoría representa simples ideas para las cuales no se han creado
procedimientos empíricos relevantes con el fin de medirlas o recolectar datos sobre ellas. Esta concep-
ción confiere a la teoría cierta cualidad mística. Desde esta perspectiva, la información que se obtiene
de la realidad sobre una proposición teórica sirve únicamente para ser refutada, porque no captura
toda la esencia o el “corazón” u otra cualidad no mensurable del fenómeno que se investiga (Black y
Champion, 1976). Una vez que “un fenómeno es mensurable, observable o se puede recolectar infor-
mación sobre él, deja de ser importante desde el punto de vista teórico”. Para los que están de acuerdo
con este enfoque, en apariencia lo teórico es lo que no se puede medir, que escapa al escrutinio empí-
rico. En consecuencia, no importa cuánta investigación se lleve a cabo, ésta siempre resulta “teórica-
mente irrelevante” o, al menos, de trascendencia secundaria. Estas interpretaciones, a nuestro juicio
erróneas, han provocado controversias y conducido a la investigación por diferentes caminos.
Algunos científicos del comportamiento humano identifican cualquier clase de conceptualización
con teoría. Conceptos como nacionalismo, cultura, medios de comunicación colectiva, opinión públi-
ca, cambio climático, etc., cuando se definen y utilizan para interpretar materiales de investigación, se
equiparan con la teoría social (Sjoberg y Nett, 1980). Así, se habla de teoría de la opinión pública,
teoría de la información, teoría de la socialización, entre otras.
Otro uso del término teoría es el de pensamiento de algún autor; se identifica la teoría con los
textos de autores clásicos como Karl Marx, Max Weber, Émile Durkheim, Burrhus Frederic Skinner,
Albert Einstein, Sigmund Freud y Stephen Hawking. Tales personajes pudieron haber propuesto una
teoría, pero no todo su pensamiento lo es. Considerarlo así implicaría igualar el concepto “teoría” con
“historia de las ideas” (Sjoberg y Nett, 1980). Como parte de esta noción de teoría, algunos utilizan el
término como sinónimo de “escuela de pensamiento”.
Asimismo, hay quienes la conciben como esquema conceptual (Ferman y Levin, 1979). En tal
sentido, la teoría se considera un conjunto de conceptos relacionados que representan la naturaleza de
una realidad. Por ejemplo, en psicología social, los esquemas de la figura 3.1, que relacionan varios
conceptos, se suponen como representaciones teóricas motivacionales de la agresión.
Como cualquier tipo de esquemas, los modelos conceptuales que representan teorías no guardan
toda la riqueza que estas poseen. Los esquemas de la figura 3.1, si bien relacionan conceptos —incluso
secuencialmente— y proporcionan un panorama de las razones por las cuales surge la agresión, no
especifican cómo se relacionan todos los conceptos entre sí, pues solo se establece que cada concepto
tiene un efecto sobre otro. Por ejemplo, el tercer esquema (teoría del aprendizaje social) no nos indica
si las experiencias negativas o aversivas y las inducciones del estímulo están relacionadas entre sí; tam-
poco se menciona cómo se provoca la reacción final; se sabe que depende de la excitación emocional
y de las consecuencias anticipadas, pero no se concreta qué tipo de consecuencias está asociado con la
dependencia o con la agresión, la resolución constructiva del problema, etc.; tampoco se precisa si la
cantidad de experiencias negativas es directamente proporcional a la excitación emocional. Así, el
esquema es tan solo una guía para comprender la agresión, aunque no ofrece todos los elementos para
entenderla a fondo.
Lo mismo sucede con los otros esquemas que, aunque son más sencillos, solo relacionan concep-
tos. El segundo, por ejemplo, no señala si a mayor frustración corresponde mayor impulso agresivo; o
a mayor frustración, menor impulso agresivo. En efecto, en este caso, ya sea por nuestra lógica o por-
que estamos familiarizados con el fenómeno, sabemos que lo primero es lo que ocurre normalmente
3

  Tabla 3.1  Esquematización de análisis motivacionales alternativos de la agresión3

Teoría del instinto

• Instinto agresivo • Conducta agresiva

Teoría del impulso

• Frustración Impulso agresivo • Conducta agresiva
Teoría del aprendizaje social
• Dependencia
• Ejecución
• Experiencias de
aversión
Excitación • Privación y
emocional resignación
• Agresión

• Psicomatización
• Autoanestesia con
• Inducción del
Consecuencias drogas y alcohol
estímulo anticipadas • Resolución
constructiva del
problema

(a mayor agresión, corresponde mayor impulso agresivo y mayor probabilidad de que se presente una
conducta agresiva más intensa). Pero esto se debe a nuestro conocimiento obtenido de otras fuentes,
no únicamente al esquema.

La definición científica
Por último, otros investigadores conceptúan la teoría como explicación final o conocimiento integral
que nos ayuda a comprender fenómenos, situaciones, eventos y contextos (Babbie, 2012). Según esta
acepción, la teoría consiste en un conjunto de proposiciones vinculadas lógicamente, capaces de expli-
car por qué y cómo ocurre un fenómeno, es decir, proporcionar un sentido de entendimiento de este.
El significado de teoría que ha sido adoptado en el presente libro desde su primera edición ha sido
precisamente este último, el cual se encuentra manifiesto, en mayor o menor grado, en otros autores,
por ejemplo:
Una teoría es un conjunto de proposiciones vinculadas sistemáticamente que especifican relacio-
nes causales entre variables (The SAGE Glossary of the Social and Behavioral Sciences, 2009m, Kerlinger
y Lee, 2002 y Black y Champion, 1976).
• Las teorías no solo consisten en esquemas o tipologías conceptuales, sino que contienen proposi-
ciones semejantes a leyes que vinculan dos o más conceptos o variables simultáneamente. Más
aún, estas proposiciones deben estar interrelacionadas entre sí (Maxwell y Mittapalli, 2008, y
Blalock, 1985).
• Una explicación unificada y sistemática respecto de un fenómeno (Creswell, 2013a, y Schwandt,
2007).
Un último comentario sobre las teorías como forma de consumar una explicación es que pueden
acompañarse de esquemas, diagramas o modelos gráficos, los cuales son utilizados por muchos autores
porque resultan convenientes para fines didácticos y para ilustrar los conceptos teóricos más importan-
tes. El hecho de que un esquema conceptual no especifique varios aspectos de la teoría a la que hace
referencia, y que no sea una explicación completa del fenómeno, no significa que carezca de utilidad.
Simplemente se menciona que es uno de los significados que se le ha dado al término “teoría”. Muchos
esquemas conceptuales suelen ser acompañados por explicaciones adicionales que ayudan a compren-
3
Extraído de Bandura (1978, p. 17). Vigencia consultada en Bandura, Ross y Ross (2013).
4       Capítulo 3  PERSPECTIVA TEÓRICA: COMENTARIOS ADICIONALES

der un fenómeno; tal es el caso de la teoría del aprendizaje social y la agresión (Bandura, 1977 y 1978).
Con frecuencia, en la investigación cualitativa se produce “teoría fundamentada” que explica un
fenómeno en un contexto específico (local) y es generada por datos narrativos (The SAGE Glossary of
the Social and Behavioral Sciences, 2009n y Teddlie y Tashakkori, 2009). Esta cuestión se explica en el
capítulo 15 del texto impreso.

¿Cuáles son las funciones de la teoría o para qué es útil? 
La función más importante de una teoría es explicar: decir por qué, cómo y cuándo ocurre un fenó-
meno. Por ejemplo, una teoría de la personalidad autoritaria debe explicarnos, entre otras cuestiones,
en qué consiste este tipo de personalidad, cómo surge y por qué una persona imperiosa se comporta
de cierta manera ante determinadas situaciones.
Una segunda función consiste en sistematizar o dar orden al conocimiento sobre un fenómeno,
planteamiento o realidad, conocimiento que en muchas ocasiones es disperso y no se encuentra orga-
nizado.
Otra función, muy asociada con la de explicar, es la de predecir. Es decir, hacer inferencias a futu-
ro sobre cómo se va a manifestar u ocurrir un fenómeno dadas ciertas condiciones. Por ejemplo, una
teoría adecuada de la toma de decisiones de los votantes debe indicar cuáles son los factores que afec-
tan al voto y, con base en información válida y confiable respecto de dichos factores, en relación con
un contexto determinado de votación, predeciría qué candidato triunfará en esta. Así, la teoría propor-
ciona conocimiento de los elementos que están relacionados con el fenómeno sobre el cual se habrá de
efectuar la predicción. Si hubiera una teoría precisa sobre los temblores, se sabría con exactitud qué
factores provocan los sismos y cuándo es probable que ocurran. Por lo tanto, en el caso de que alguien
familiarizado con la teoría observara que estos factores se presentan y los midiera con exactitud, podría
predecir la ocurrencia de este fenómeno, así como el momento en que sucedería. Con frecuencia, para
la explicar y predecir ciertos fenómenos, se requiere de la concurrencia de varias teorías, una para cada
aspecto del hecho (Neuman, 2009, y Yurén Camarena, 2000). Hay fenómenos que, por su compleji-
dad, requieren de varias teorías para predecirse: la órbita de una nave espacial, la productividad de un
individuo (donde requeriríamos teorías de la motivación, la satisfacción laboral, el desarrollo de habi-
lidades, el desempeño y otras), el grado de satisfacción de los cónyuges en una relación marital, el
origen de la vida, el calentamiento global, la extinción de los dinosaurios, la resistencia estructural de
los edificios en zonas sísmicas, etc. Sin embargo, es indudable que una teoría incrementa el conoci-
miento que tenemos sobre un fenómeno o realidad.

¿Todas las teorías son igualmente útiles o algunas son mejores que
otras?
Todas las teorías construidas mediante investigaciones adecuadas aportan conocimiento y, en ocasio-
nes, enfocan los fenómenos que estudian desde ángulos diferentes (Littlejohn y Foss, 2011), pero
algunas se encuentran más desarrolladas que otras y cumplen mejor con sus funciones. Para decidir el
valor de una teoría, se cuenta con varios criterios, principalmente:4
1. Capacidad de descripción, explicación y predicción.
2. Consistencia lógica.
3. Perspectiva.
4. Innovación‐inventiva (fructificación heurística).
5. Sencillez (parsimonia).

4
Con aportaciones de Babbie (2012), Kerlinger y Lee (2002) y Ferman y Levin (1979).
5

Capacidad de descripción, explicación y predicción
Una teoría debe ser capaz de describir, explicar y predecir el fenómeno o los fenómenos a que hace
referencia.
Describir implica varias cuestiones: definir el fenómeno, sus características y componentes, así
como delimitar las condiciones y los contextos en que se presenta, y las distintas maneras en que llega
a manifestarse. Describir también implica claridad conceptual.
Explicar tiene dos significados importantes. En primer término, implica poseer una forma de
entender las causas del fenómeno. En segundo término, se refiere a “la prueba empírica” de las propo-
siciones de la teoría. Si estas se encuentran apoyadas por los resultados, “la teoría subyacente debe
supuestamente explicar parte de los datos”. Pero si las proposiciones no son confirmadas por la reali-
dad, la teoría no se considera como una “explicación efectiva” (Ferman y Levin, 1979).
La predicción está asociada con este segundo significado de explicación, que depende de la evi-
dencia empírica de las proposiciones de la teoría. Si estas poseen un considerable apoyo empírico (es
decir, han demostrado que ocurren una y otra vez, como lo explica la teoría) es de esperarse que en lo
sucesivo vuelvan a manifestarse del mismo modo (como lo predice la teoría). Así, la teoría de la rela-
ción entre las características del trabajo y la motivación intrínseca explica que “a mayor variedad en el
trabajo, habrá mayor motivación intrínseca hacia este”. Entonces debe ser posible pronosticar, al
menos parcialmente, el nivel de motivación intrínseca al observar el nivel de variedad en el trabajo.
Cuanta más evidencia empírica (datos) apoye a la teoría, mejor podrá esta describir, explicar y predecir
el fenómeno o los fenómenos estudiados por ella (Maxwell y Mittapalli, 2008).

Congruencia lógica
Una teoría tiene que ser lógicamente consistente, es decir, las proposiciones que la integran deben estar
interrelacionadas (no puede contener proposiciones sobre fenómenos que no estén vinculados entre
sí), ser mutuamente excluyentes (no puede haber repetición o duplicación), y no caer en contradiccio-
nes internas o incoherencias (White y McBurney, 2012, y Black y Champion, 1976).

Perspectiva
Este vocablo se refiere al nivel de generalidad de la teoría (Maxwell y Mittapalli, 2008 y Ferman y
Levin, 1979). Una teoría posee más perspectiva mientras mayor cantidad de fenómenos explique y
más aplicaciones admita. Hay teorías que abarcan diversas manifestaciones de un fenómeno; por ejem-
plo, una teoría de la motivación que pretenda describir y explicar qué es y cómo surge la motivación
en general. Hay otras que abarcan sólo ciertas manifestaciones del fenómeno; por ejemplo, una teoría
de la motivación que intente describir y explicar qué es la motivación en el trabajo, cómo se origina y
qué la afecta.

Innovación‐inventiva (fructificación heurística)
Es “la capacidad que tiene una teoría de generar nuevas interrogantes y descubrimientos” (Ferman y
Levin, 1979, p. 34). Las teorías que originan, en mayor medida, la búsqueda de nuevos conocimientos
son las que permiten que una ciencia avance.

Sencillez (parsimonia)
Es mejor que una teoría sea sencilla; esto no es un requisito, sino una cualidad deseable. Sin duda,
las teorías que pueden explicar uno o varios fenómenos en u nas cuantas proposiciones, sin omitir
ningún aspecto, son más útiles que las que necesitan un gran número de proposiciones para ello.
Desde luego, la sencillez no significa superficialidad.
6       Capítulo 3  PERSPECTIVA TEÓRICA: COMENTARIOS ADICIONALES

Revisión de la literatura: ampliación de conceptos
En este apartado se expanden algunos conceptos relativos a la revisión de la literatura.

Tipos de fuentes en la detección de la literatura y otros documentos
Tal como se comentó en el capítulo 4 del libro impreso, la finalidad de revisar la literatura es obtener
y examinar las fuentes primarias o referencias relevantes para nuestro estudio de acuerdo con el plan-
teamiento del problema. Podemos llegar a estas directamente o a través de fuentes intermedias. Se
distinguen tres tipos básicos de fuentes de información para llevar a cabo la revisión de la literatura:

1. Fuentes primarias
Constituyen el objeto de la investigación bibliográfica o revisión de la literatura y proporcionan datos
de primera mano, pues se trata de documentos que incluyen los resulta-
Fuentes primarias  Proporcionan datos de dos de los estudios correspondientes. Ejemplos de ellas son: libros, anto-
primera mano, pues se trata de docu- logías, artículos de publicaciones periódicas, monografías, tesis y
mentos que contienen los resultados de
disertaciones, documentos oficiales, reportes de asociaciones, trabajos
estudios, como libros, antologías, artículos,
monografías, tesis y disertaciones, docu- presentados en conferencias o seminarios, artículos periodísticos, testi-
mentos oficiales, etcétera. monios de expertos, documentales, videograbaciones en diferentes for-
matos, foros, páginas y sitios en internet, etc. En el apéndice 1, incluido
también en el centro de recursos en línea, se ofrece una lista de las publi-
caciones periódicas más importantes en el campo de las ciencias sociales y otras disciplinas, que con-
tienen un tipo muy significativo de fuentes primarias: los artículos científicos.
Desde hace algunas décadas podemos tener acceso a tales publicaciones mediante internet.
Asimismo, es fácil conseguir de manera instantánea o en tiempos relativamente breves la mayoría de
las obras (artículos, libros, etc.) que se encuentran en diversos formatos, como PDF, .LIT, HTML,
etc., en las propias revistas o editoriales (como es el caso de McGraw‐Hill: www.mcgraw‐hill‐educa-
cion.com) y las “librerías electrónicas”. Incluso, ordenar de manera previa referencias que van a publi-
carse en el futuro cercano (por ejemplo, Amazon, Google Books, The Internet Book Shop, etc.).
También se han puesto de moda los dispositivos para comprar, bajar y leer tanto libros como
artículos en formato digital (por ejemplo: Kindle, de Amazon, iLiad, de iRex, Reader, de Sony,
HanLin, STAReBOOK, Bookeen Cybook y eSlick). Además, diversas obras tienen su formato elec-
trónico, como en el caso de esta obra (la cual puede adquirir en formato electrónico en www.mcgraw-
hill-educacion.com

2. Fuentes secundarias
Fuentes secundarias  Son listas, com-
Son listas, compilaciones y resúmenes de referencias o fuentes primarias
pilaciones y resúmenes de referencias o publicadas en un área de conocimiento en particular. Es decir, reproce-
fuentes primarias publicadas en un área de san información de primera mano. Comentan brevemente artículos,
conocimiento en particular, en las cuales selibros, tesis, disertaciones y otros documentos (publicados básicamente
comenta sobre artículos, libros, tesis, diserta-
ciones y otros documentos especializados.
en inglés, aunque también se incluyen referencias en otros idiomas);
algunos ejemplos son: Academic Search Premier y Fuente Académica de
EBSCO, la Review of Educational Research, Sage Journals, Latindex,
REDALyC, SciELO, PubMed y el Annual Review of Psychology. Estas herramientas pueden encon-
trarse en internet. La mayoría de las fuentes secundarias incluyen los datos de las referencias y un
breve resumen de cada una de ellas. A continuación se reproduce un ejemplo de algunas referencias de
un índice hipotético (fuente secundaria) en el área de la investigación multivariada de la conducta
humana.
7

Ejemplo
De un índice de referencias
Beh, E. J. y Lombardo, R. (2014). Correspondence analysis: Theory, practice and new strategies. Ho-
boken, NJ, EE. UU.: Wiley.
Esta obra revisa los enfoques convencionales del análisis de correspondencia, así como los nuevos avances
que se han logrado en la última década. Discute cuestiones teóricas y prácticas de este método multivariado.
Asimismo, examina las adaptaciones necesarias para que se pueda utilizar el análisis de correspondencia. El
texto proporciona a los estudiantes e investigadores una relación integral entre la asociación de medidas, la
representación gráfica de correlaciones, el ordenamiento de las variables categóricas y las cuestiones inferen-
ciales. Los autores presentan una descripción teórica completa del análisis de correspondencia no simétrico.

De un índice de referencias
Beh, E. J. y Lombardo, R. (2014). Correspondence analysis: Theory, practice and new strategies. Ho-
boken, NJ, EE. UU.: Wiley.

Esta obra revisa los enfoques convencionales del análisis de correspondencia, así como los nuevos
avances que se han logrado en la última década. Discute cuestiones teóricas y prácticas de este método
multivariado. Asimismo, examina las adaptaciones necesarias para que se pueda utilizar el análisis de
correspondencia. El texto proporciona a los estudiantes e investigadores una relación integral entre la
asociación de medidas, la representación gráfica de correlaciones, el ordenamiento de las variables
categóricas y las cuestiones inferenciales. Los autores presentan una descripción teórica completa del
análisis de correspondencia no simétrico.

Freedman, D. A. y Berk, R. A. (2008). Weighting regressions by propensity scores. Evaluation Review,
volume 32, number 4, pp. 392‐409.

Artículo sobre el modelo de regresión que analiza si es o no conveniente ponderar las puntuacio-
nes de propensión en las regresiones causales, a fin de reducir sesgos potenciales. Asimismo, comenta
la importancia de tener un modelo completo que se haya comprendido adecuadamente y se especifi-
que con toda claridad.

Kerlinger, F. N. y Lee, H. B. (2002). Investigación del comportamiento: Métodos de investigación en
ciencias sociales (4a. ed.). México, D. F., México: McGraw‐Hill Interamericana.

Libro que presenta distintos aspectos de la investigación, tales como elaboración de hipótesis,
definición de variables, algunos conceptos estadísticos fundamentales, análisis de varianza, diseños de
investigación, investigación experimental y de campo, encuestas, medición por medio de diversos mé-
todos, regresión múltiple, análisis de factores y uso de la computadora. Es un libro “clásico” sumamente
difundido para utilizarse en cursos intermedios y avanzados.

Kerlinger, F. N. y Pedhazur, E. J. (1997). Multiple regression in behavioral research (3a. ed). Nueva York,
NY, EE. UU.: Holt, Rinehart & Winston.

Texto fundamental para el análisis de la regresión, el análisis univariado y multivariado de varian-
za, la regresión múltiple, el análisis discriminante, la correlación canónica, el análisis “path” y otros
métodos multivariados. Explica la naturaleza, el cálculo y las aplicaciones de cada método con detalle.

Krippendorff, K. (1980). Clustering. En P.R. Monge y J.N. Cappella (eds.), Multivariate techniques in hu-
man communication research (pp. 259‐308). Nueva York, NY, EE. UU.: Academic Press.

Capítulo que desarrolla la técnica estadística para extraer tipologías, conocida como “agrupamien-
to” (clustering), la cual consiste en reunir objetos o variables que comparten cualidades observadas
o dividirlas en clases mutuamente excluyentes, cuyos lazos reflejan diferencias entre las cualidades
observadas.
8       Capítulo 3  PERSPECTIVA TEÓRICA: COMENTARIOS ADICIONALES

En otras fuentes de este tipo no siempre aparecen las referencias comentadas, sino solo las citas o
datos. Asimismo, algunas fuentes secundarias incluyen el título y los autores, y la posibilidad de acce-
der vía electrónica al resumen (esto es gratuito) o a la referencia completa (en ocasiones con algún
costo para tener entrada a esta y poder descargarla y almacenarla en nuestro disco duro u otro dispo-
sitivo, otras de manera gratuita). Hoy en día, la mayoría de las instituciones de educación superior
ofrece a sus alumnos acceso a fuentes secundarias y primarias como parte de sus servicios regulares. En
su caso, consulte con su profesor o profesora de investigación o centro de cómputo al respecto.
Los resultados de la búsqueda de referencias en fuentes secundarias se ejemplifica a continuación
con SAGE Journals Online (efectuada el 19 de octubre del 2013, abarcando de 2010 a octubre de
2013 y usando los términos: “diabetes”, “hypertension” y “elder”) y Medline Plus en español (misma
fecha, periodo abierto y con: “diabetes, hipertensión, adultos mayores”).
Ejemplo
Parciales de dos índices de referencias (acceso eléctrico a las fuentes primarias)
SAGE Journals On Line

MedlinePlus en español

Por otra parte, la mayoría de estas fuentes se encuentran en inglés (con excepciones como Redalyc,
Latindex, Medline en español y Fuente Académica Premier). Las referencias se presentan y ubican
como resultado de la búsqueda o consulta hecha de acuerdo con los términos de referencia usados y
según la clasificación que se utilice para ordenarlas (por relevancia, alfabéticamente por autor, tema,
cronológicamente, área de conocimiento, etc.). Debe recalcarse que este tipo de fuentes contiene índi-
9

ces y sumarios no sólo de libros y revistas, sino también de otros materiales, como películas en cual-
quier formato, grabaciones, ponencias en congresos y seminarios, páginas web, entre otros. En el
apéndice 2 del centro de recursos (Principales bancos/servicios de obtención de fuentes/bases de datos/
páginas web para consulta de referencias bibliográficas), se presentan listas de algunas de las principa-
les fuentes secundarias que se utilizan comúnmente en la investigación en diversos campos. La lista
crece de manera considerable con el avance y la globalización del conocimiento. En cada ciencia o
disciplina se cuenta con cientos de ellas y sería poco práctico numerarlas en estas líneas.

2. Fuentes terciarias o generales
Estas fuentes están conformadas por documentos o espacios en internet donde se encuentran registra-
das las referencias a otros documentos de características diversas y que compendian títulos de revistas
y otras publicaciones periódicas, así como nombres de boletines, conferencias y simposios, sitios web,
empresas, asociaciones industriales y de diversos servicios (por ejemplo, directorios de empresas que se
dedican a cuestiones de recursos humanos, mercadotecnia y publicidad, opinión pública, ingeniería
ambiental, etc.); títulos de reportes con información gubernamental; catálogos de libros básicos que
contienen referencias y datos bibliográficos y nombres de instituciones nacionales e internacionales al
servicio de la investigación. Son útiles para detectar fuentes no documentales tales como organizacio-
nes que realizan o financian estudios, miembros de asociaciones científicas (quienes pueden dar aseso-
ría), instituciones de educación superior, agencias informativas y dependencias del gobierno que
efectúan investigaciones.

Diferencia entre fuentes secundarias y terciarias 
La diferencia estriba en que una fuente secundaria compendia fuentes de primera mano y una fuente
terciaria reúne fuentes de segunda mano. Una fuente secundaria agrupa referencias directas (por ejem-
plo, artículos de satisfacción laboral: “Expanding the literature on job satisfaction in corrections: A
national study of jail employees”, de Jeanne B. Stinchcomb y Leslie A. Leip. Fuente: Criminal Justice
and Behavior, noviembre de 2013; vol. 40, número 11, pp. 1209-1227; “Exploring the determinants
of job satisfaction of civil servants in Beijing, China”, de Xingkun Yang y Weijie Wang. Fuente: Public
Personnel Management, doi: 0091026013502169, publicado en línea en octubre de 2013 y por
publicarse en la revista, etc.) En cambio, una fuente terciaria agrupa compendios de fuentes secunda-
rias; por ejemplo, revistas que contienen artículos de satisfacción laboral, como Journal of Organizational
Behavior, Contaduría y Administración de la UNAM, Investigación Administrativa del IPN, entre
otras. Los catálogos temáticos (PsycINFO, ERIC: The Education Resources Information Center, etc.),
directorios y guías de índices suelen servir como fuentes terciarias para llegar a las primarias. Sin
embargo, su uso debe ser con enfoque y guía, pues de lo contrario pasaríamos muchas horas sin encon-
trar fuentes primarias o referencias que nos sean útiles. Un ejemplo de fuente terciaria sería un direc-
torio con datos de empresas industriales de un país o directorios de medios escritos (datos de
periódicos, revistas y otro tipo de publicaciones), un catálogo de revistas periódicas (como, en el caso
de México, el que elabora el Instituto Nacional de Estadística, Geografía e Informática, INEGI) o el
Eurostat, que incluye listas de fuentes estadísticas europeas e internacionales.

El marco teórico y, consecuentemente, la revisión de la literatura,
deben tener dirección y progresión
La dirección es un factor necesario para elegir fuentes primarias apropiadas. Esto implica demostrar la
forma en que otros investigadores han utilizado el conocimiento disponible para refinar sus problemas
de investigación y cómo sus preguntas, hipótesis y resultados han evolucionado este conocimiento.
Asimismo, en el marco teórico debe resultar evidente la forma en que tales investigadores utilizaron la
literatura para establecer sus conclusiones y responder a las preguntas de sus estudios.
El marco teórico se desarrolla para documentar cómo nuestra investigación agrega valor a la lite-
10       Capítulo 3  PERSPECTIVA TEÓRICA: COMENTARIOS ADICIONALES

ratura y/o conocimiento existentes (progresión). Si nuestro estudio solo duplica lo que ya se sabe, no
agrega ningún valor.
Recordemos que debemos sistematizar las referencias por título, autor, temas y subtemas, palabras
claves u otro criterio lógico (o una organización cruzada que considere varios criterios). También lo es
buscar fuentes primarias recientes o clásicas, pero relevantes en la historia del análisis del problema de
nuestra investigación.

Otro ejemplo de qué hacer cuando “no existe literatura”
Incluso planteamientos novedosos o que han recibido poca atención en el pasado comparten alguna
similitud con aquellos que sí han sido estudiados, por lo cual sus referencias pueden sernos útiles (este
caso solo ocurre cuando verdaderamente existen pocas fuentes primarias vinculadas a nuestro plantea-
miento). Veamos un ejemplo.3
A finales de la década de 1980, si nuestro planteamiento se hubiera referido a la indiferencia de
los jóvenes para evitar tener relaciones sexuales o tomar precauciones mediante diversas técnicas nove-
dosas para la época (desinterés que provoca embarazos no deseados), al momento de iniciar la investi-
gación nos hubiéramos percatado de que muchas de esas técnicas no se conocían (algunas no se habían
inventado o su creación era reciente) y se habían efectuado muy pocos estudios sobre este tema. No se
disponía de literatura sobre el planteamiento concreto, pero sí podríamos haber encontrado referen-
cias abundantes sobre tópicos vinculados, los cuales hubieran proporcionado dirección a la investiga-
ción. Entre tales temas (con fuentes primarias para la revisión de la literatura) ubicaríamos los
siguientes:
• Uso de los anticonceptivos tradicionales.
• Tasas de éxito de los anticonceptivos.
• Actitudes respecto de la utilización de tales anticonceptivos.
• Temores de los jóvenes para utilizarlos.
• Valores que evitan tener relaciones sexuales prematrimoniales.
• Obstáculos para utilizar los servicios de salud (públicos y privados) para prevenir los embarazos.
• Recompensas y castigos sociales para las jóvenes embarazadas.
• Niveles de información sobre las consecuencias del embarazo antes del matrimonio.
Y otras más. Respecto de cada problema, casi siempre hay literatura disponible.

Operadores del sistema booleano
Ya dijimos que las palabras o descriptores sirven para limitar o ampliar el universo de referencias que
se solicita. Se usan conjuntamente con tres preposiciones (denominadas operadores del sistema boo-
leano): and (en español “y”), or (en español “o”) y and not (en español “y no”). Con los descriptores y
las preposiciones estableceremos los límites de la consulta al banco o la base de datos bibliográficos.
Para comprender lo que tratamos de explicar, tomemos primero un ejemplo ficticio relacionado
con una supuesta base de datos.
Supongamos que queremos analizar la música del grupo de rock The Beatles y que acudimos a la
base de datos ROCKERS para hacer nuestra revisión de la literatura. Consultamos el manual o diccio-
nario (thesaurus) de ROCKERS, buscamos por orden alfabético las palabras que nos lleven a obtener
una lista de referencias pertinentes para nuestro tema a investigar o simplemente elegimos los descrip-
tores apropiados (la música del grupo The Beatles). Obviamente elegimos el término “Beatles”. Si
seleccionáramos las palabras “Rolling Stones”, “Coldplay” o “Madonna”, no nos servirían. Por lo
tanto, solicitamos una lista de referencias con la palabra elegida (“Beatles”); así obtendremos todas las
referencias contenidas en ROCKERS que hablen o que estén relacionadas con The Beatles, incluso
sobre la niñez de sus integrantes, la historia de sus familiares, sus gustos, la trágica muerte de John
Lennon o George Harrison y muchos otros aspectos, todo lo cual se representa en la figura 3.2.
3
Adaptado de Yedigis y Weinbach (2005). 
11

  Figura 3.2  Universo de referencias en la búsqueda del ejemplo.

Pero si nos interesan solo los contenidos de sus canciones, debemos elegir, además, otras palabras
o descriptores para delimitar nuestro universo de referencias; por ejemplo: “SONGS” (canciones) y
conectarlos con “AND”. Entonces nuestro universo de referencias sería la intersección entre “Beatles”
y “songs” (que se muestra en el espacio coloreado). Solo se recuperan los registros que contienen todos
los términos incluidos en la búsqueda y las referencias que comprenden las dos palabras, lo cual se
muestra en la figura 3.3.

AND Songs

and Songs

  Figura 3.3  Intersección de la búsqueda en el ejemplo.

Si agregáramos el término “CONTENT” (contenido), nuestros descriptores serían “Beatles”,
“songs” y “content”, los cuales se utilizarían de diferente modo según las preposiciones que escojamos
para vincularlos.
Si incluimos todos los términos entrecomillados (“BEATLES SONGS CONTENT”), nuestra
lista producto estaría constituida por todas las referencias a The Beatles vinculadas con el contenido de
sus canciones. Lo mismo ocurriría si los relacionamos con la preposición AND (BEATLES AND
SONGS AND CONTENT). La figura 3.4 refleja lo anterior.
12       Capítulo 3  PERSPECTIVA TEÓRICA: COMENTARIOS ADICIONALES

Beatles Songs Content
and and

Beatles Songs

Content

  Figura 3.4  Búsqueda en el ejemplo con tres descriptores.

“Beatles” es un universo de referencias que contiene todo lo escrito o grabado física y electróni
camente sobre ellos. “Songs” es un universo que incluye todo lo que se relacione con las canciones de
The Beatles, Maroon 5, Wagner, Mozart, Joan Manuel Serrat, Michael Jackson, Juanes, Vivaldi, Los
Tigres del Norte, Pitbull, Joaquín Sabina, Plácido Domingo, Pink Floyd, U2, Shakira y todos los
compositores e intérpretes de cualquier género en la historia de la música; pero a nosotros en este caso
sólo nos interesan los contenidos (CONTENT) de las canciones (SONGS) de The Beatles (BEATLES).
Insistimos en que la lista de referencias a obtener se limitaría a investigaciones sobre el contenido
de las canciones de The Beatles; nada más. La lista sería resultado de la intersección de los tres descrip-
tores.
El uso de la preposición “OR” (“o”) es menos frecuente y tiene un efecto de expansión del univer-
so de referencias (BEATLES OR SONGS). La lista a obtener son todas las referencias sobre The Beatles
y sobre canciones en general (de The Beatles y de todos los demás grupos e intérpretes en la historia
musical). Veámoslo gráficamente en la figura 3.5.

  Figura 3.5  Ampliación de la búsqueda del ejemplo por el uso de la preposición "or"..
13

El uso de la preposición “AND NOT” (“y no”) produce el efecto de excluir las referencias del
universo de uno de los descriptores (BEATLES AND NOT SONGS). La lista que obtendremos
incluirá todas las referencias sobre The Beatles, excepto las relacionadas con sus canciones (vea figura
3.6).

Beatles Songs

and not

Beatles Songs

  Figura 3.6  Delimitación de la búsqueda con la preposición "and not".

Thesaurus
La mayoría de las bases de datos tienen un thesaurus o manual con su correspondiente vocabulario,
por lo que es necesario aclarar que este vocabulario contiene un número limitado de palabras o des-
criptores. Si no encontramos alguna palabra, es posible recurrir a un sinónimo o a un término relacio-
nado. El caso es que las palabras o descriptores reflejen el planteamiento del problema de investigación.
Hemos de decir que hoy en día algunas bases de datos aceptan casi cualquier término.

¿Qué nos proporciona la base de datos? La lista de referencias
Como ya sabemos, el producto de nuestra búsqueda en internet vía las fuentes secundarias es la lista
de las referencias o fuentes primarias. La joven Mariana (del ejemplo sobre el noviazgo que se presentó
en el capítulo 4 del libro) realizó el 19 de octubre del 2013 una búsqueda de artículos en revistas aca-
démicas en varias bases de datos, tarea que enfocó paulatinamente: primero usó descriptores generales
y específicos en fuentes iberoamericanas, y encontró pocas referencias; entonces, acudió a bases de
referencias en inglés (ERIC, PsychoINFO, Sage Journals, etc.), con términos como “romantic”
(romántico), “love” (amor), “interpersonal” (interpersonal) y “relationships” (relaciones). Por ejemplo,
en ERIC (Education Resources Information Center), sin límites temporales o de fechas:
14       Capítulo 3  PERSPECTIVA TEÓRICA: COMENTARIOS ADICIONALES

Como puede verse, obtuvo 772 referencias. En SAGE Journals, con los mismos términos y limi-
tándose al periodo comprendido entre 2010 y octubre de 2013 localizó 898 fuentes primarias. Luego
agregó “similarity” (similitud), para precisar, con lo cual la lista incluyó 329.
Posteriormente, el 21 de octubre efectuó una búsqueda en EBSCOhost Research Databases,
usando Academic Search Premier (opción disponible en diversas instituciones de educación superior)
y con iguales palabras claves. Luego incorporó el thesaurus para realizar una búsqueda más específica,
y detectó 12 referencias en inglés y cuatro en español. Por lo regular, en esta fuente hay mayores filtros
que en otras, por lo cual el número resultante es menor, pero las referencias están sumamente vincu-
ladas a los términos utilizados. Así, de todas las fuentes primarias eligió las 18 que le parecieron más
pertinentes (pudo bajar sin costo 12, compró tres y buscó el resto en bibliotecas, otros sitios de inter-
net, etcétera).
La lista inicial de Mariana en SAGE Journals es:
15

He aquí el principio de la lista de Mariana en Academic Search Premier (en inglés):

Términos de búsqueda

Título de
referencia

Resumen

Artículo completo

Y en español:

Términos de búsqueda

Números de referencia
Título de referencia

Artículo completo
16       Capítulo 3  PERSPECTIVA TEÓRICA: COMENTARIOS ADICIONALES

Resumen del proceso de búsqueda de referencias manuales y en
internet
El proceso de búsqueda de información se resume gráficamente en la figura 3.7, etapa por etapa, y
corresponde a cualquier estudio, cuantitativo, cualitativo o mixto.

Identificar términos o Seleccionar una base


palabras claves: pueden de referenciars apropiada
derivarse del planteamiento (las principales bases se
o de un título preliminar del presentan en el apéndice
trabajo o investigación dos de esta página web)

Recomendaciones:

Recomendaciones:
Ÿ Utilice palabras que En “search” (búsqueda) o
los autores suelan utilizar “advanced search”
Ÿ Localice artículos, libros,
Ÿ Busque términos en (búsqueda avanzada),
anuarios y guías (handbooks)
los thesaurus o catálogos introducir los términos y
Ÿ Para la selección de referencias
de palabras de las bases las preposiciones
tome en cuenta actualidad,
de referencias booleanas, de acuerdo
calidad y similitud con el propio
con el propósito de
planteamiento
búsqueda


Ÿ Obtener una lista de Si fotocopia, respete
referencias vinculadas con el las leyes de
planteamiento derechos de autor
Ÿ Revisarlas
Ÿ Elegir las más adecuadas
(primero unas cuantas para
elaborar el mapa o índice del
marco teórico, una vez desarrol-
lado el bosquejo, seleccionar las
demás referencias

  Figura 3.7  Proceso de búsqueda de referencia.

Recopilación de información de las referencias
¿Qué información o contenido se extrae de las referencias? La respuesta es variable: a veces es una idea;
otras, una cifra, un resultado o múltiples comentarios. Veamos algunos casos de fichas bibliográficas:

Una idea extraída de una referencia 
Alshouibi1, E. N., Kaye, E. K., Cabral, H. J., Leone, C. W. y Garcia, R. I. (2013). Vitamin D and
periodontal health in older men. Journal of Dental Research, 92 (8), pp. 689-693. doi:
10.1177/0022034513495239.
La vitamina D es un mediador antiinflamatorio que posee beneficios potenciales para la salud
física y bucal. En un estudio longitudinal con 562 veteranos mayores estadounidenses que duró 12
años, se encontró una relación entre la ingesta de vitamina D y su estado de salud periodontal.

Una cifra extraída de una referencia 
Rodríguez, A., De la Puente, J., y Alum, A. (2009). Diagnóstico y abordaje del riesgo cardiovascular
en la diabetes tipo 2. Actualización en Medicina de Familia, 5 (1), 4‐10.
Según los datos publicados por la Federación Internacional de Diabetes (IDF), el número de
personas que presentan diabetes en 2007 es de aproximadamente 246 millones. Se prevé que en 2025
este número llegue a 380 millones (p. 4).
17

Una idea extraída de la referencia más la opinión del investigador sobre
esta idea o alguno de sus aspectos
Neisser, U. (1979). The concept of intelligence. En R. J. Stennberg y D. K. Detterman (Eds.), Human
intelligence: Perspectives on its theory and measurement (pp. 179‐189). Norwood, NJ, EE. UU.:
Ablex Publishing Corporation.
Idea
La inteligencia en sí no existe, excepto como retrato de un prototipo, pero el concepto de persona
inteligente está basado en hechos, por ejemplo, en características humanas genuinamente correlacio-
nadas. La similitud de un individuo con el prototipo puede medirse, aunque tan sólo de manera par-
cial. No todos los atributos relevantes proporcionan por sí mismos una medición estandarizada. Tal
medición parcial tiende a crear su propio prototipo y categoría.
Opinión
En este sentido, una alternativa de la psicometría es no pretender medir “la inteligencia” como tal, ni
hacer comparaciones entre individuos en cuanto a este prototipo general (que es ambiguo y varía de
acuerdo con las diferentes perspectivas existentes para su estudio). En cambio, tal vez resultaría conve-
niente medir las características humanas que algunos consideran como componentes de la inteligencia
(fluidez verbal, orientación espacial) y realizar comparaciones entre individuos en cada una de esas
características en particular. Así, por ejemplo, podríamos hablar de que una persona posee mayor
fluidez verbal que otra, pero no diríamos necesariamente que es más inteligente.

Análisis de una idea extraída de una referencia 
Ejemplo 1
Bahar, E. (2008). Intelligence: An analysis of the American experience from the perspective of Critical
Theory. Educational Sciences: Theory & Practice, 8 (1), 79‐87.
Actualmente, en Estados Unidos y otros países, las puntuaciones respecto del IQ (coeficiente de
inteligencia) constituyen el principal factor que se toma en cuenta para que los estudiantes accedan a
programas para el desarrollo de sus talentos. Sin embargo, el entendimiento general de la “inteligen-
cia” parece orientarse a su definición psicométrica, la cual contempla solo las inteligencias verbal,
lógica y matemática. Por ello resulta indispensable volver a examinar tal definición, típica de las cultu-
ras occidentales, y considerar a los demás tipos de inteligencia (como la emocional, musical y atlética),
así como a otras culturas.
Ejemplo 2
Freedman, J. L. (1988). Social psychology (6a. ed.). Englewood Cliffs, NJ, EE. UU.: Prentice‐Hall.
Descubrir similitudes con alguien produce mayor atracción hacia esa persona. Sin embargo, la teoría
del balance sugiere que lo opuesto también ocurre; cuando alguien nos resulta atractivo, esperamos
concordar con esa persona en aspectos de los cuales no hemos hablado aún con ella.
Es decir, las variables atracción y similitud están correlacionadas. La similitud incrementa la posi-
bilidad de atracción y viceversa. Cuando a una persona la percibimos atractiva, buscamos las cuestio-
nes que tiene en común con nosotros y les damos una valencia más elevada a estas, para tratar de
minimizar los aspectos en los que diferimos.

Varias ideas y datos extraídos de una referencia
Paniagua, M. L. (1980). Grado de aplicación y mercado de trabajo de la mercadotecnia en México.
México, DF, México: Instituto Politécnico Nacional, Centro de Investigación en Ciencias
Administrativas de la Sección de Graduados de la Escuela Superior de Comercio y Administración.
En un estudio que incluyó a 124 empresas de las ciudades de México, Guadalajara, Monterrey,
San Luis Potosí, Chihuahua, Veracruz y Saltillo (66% ubicadas en la ciudad de México, 11% en
Guadalajara, 8% en Monterrey y 15% en las demás) se encontró, entre otros aspectos, lo siguiente:
18       Capítulo 3  PERSPECTIVA TEÓRICA: COMENTARIOS ADICIONALES

1. Sesenta y cuatro por ciento de las empresas no tienen planes futuros de mercadotecnia.
2. Las empresas más antiguas son las que aplican en mayor medida la mercadotecnia (hay una rela-
ción entre la fecha de constitución de la empresa y el grado de aplicación de tal disciplina).
3. A mayor tamaño de las empresas, se incrementa el grado en que aplican la mercadotecnia (corre-
lación = 0.40, p < 0.001).
4. Cuanto mayor sea el tamaño de las empresas, más altos serán los salarios que ofrezcan al personal
que trabaja en el área de mercadotecnia.
5. Las empresas de mayor tamaño presentan más variedad de profesiones entre su personal del área
de mercadotecnia.
6. A mayor tamaño de la empresa, existen más puestos en el área de mercadotecnia.

Reproducción textual de una o varias partes de la referencia
Hernández-Sampieri, R. (2012). Medios de comunicación en las organizaciones. En C. Fernández, La
comunicación en las organizaciones (pp. 238-261). México, D. F., México: Trillas.
“Con frecuencia, los altos directivos se impacientan al introducir nuevas tecnologías, incluso
algunos sufren lo que se denomina ‘fiebre tecnológica’ y no pocas veces cometen errores como: ignorar
las necesidades y sentimientos de los empleados que utilizarán la tecnología” (p. 259).

Resumen de una referencia 
Muñoz, J., Hernández-Sampieri, R., López, L. y Méndez, S. (en prensa). Exploración de los valores en
el medio laboral mexicano. Humanitas.4
La investigación se centró en comenzar una exploración de los valores predominantes en las orga-
nizaciones de la sociedad mexicana de acuerdo con el modelo de Schwartz y determinar su jerarquía,
bajo la premisa de que los valores son un elemento clave para entender la cultura organizacional. Se
aplicó el cuestionario Portrait Value Questionnaire (PVQ, Cuestionario que retrata los valores), ver-
sión en español de Luis Arciniega, a una muestra de 536 empleados de dos empresas, una comercial y
otra industrial, que generó datos satisfactorios en cuanto a confiabilidad y validez del instrumento.
Los resultados señalan un paralelismo entre los puntajes de las tipologías estudiadas en las dos
empresas, con una intensidad mayor en la empresa comercial. Sobresalen los valores de benevolencia,
autodirección, universalismo y seguridad. Se confirma totalmente la polaridad del modelo en el eje
autotrascendencia–autoengrandecimiento, y parcialmente en el eje apertura al cambio–conservación.
Queda pendiente para estudios posteriores determinar las causas de la baja valoración que los emplea-
dos dan al hedonismo, estimulación y autoridad (poder).

Resultado
Abdel‐Khalek, A. M. (2006). Measuring happiness with a single‐item scale. Social Behavior and
Personality, 34 (2), 139‐15.
Cuando se examinó la exactitud de medir la felicidad con un solo ítem (en general, ¿se siente usted
feliz?) en una escala de 11 puntos (cero a diez), se obtuvo una estabilidad temporal de 0.86. Las corre-
laciones entre el reactivo y el inventario sobre la felicidad de Oxford (OHI) y la escala de satisfacción
con la vida resultaron altamente positivas, lo cual denota una buena validez concurrente, explicada
porque el ítem logró una fuerte y positiva asociación con el optimismo, la esperanza, la autoestima, el
afecto y la extroversión, así como con las autoevaluaciones de la salud física y mental.
Para estimar la validez concurrente del reactivo, la muestra fue de 1 412 individuos.

4
En prensa, implica que fue aceptada su publicación para 2014.
19

Conclusión
Ramírez Carrasco, E. (2011). Estimación de masa en sistemas de control ambiental en aeronaves
durante la fase de diseño conceptual. Linköping, Östergötland, Suecia: Linköping University. Versión
del reporte especialmente preparado para la 6a. edición del libro Metodología de la investigación de
R. Hernández-Sampieri, C. Fernández y P. Baptista (2010). México, D.F., México: McGraw-Hill
Interamericana Editores.
Con base en el método desarrollado en esta investigación, se logró crear una interfaz con el uso de
M.S Excel que ayuda a predecir la masa del Sistema de Control Ambiental (ECS) en aeronaves comer-
ciales con una mayor precisión de la que brindan los métodos existentes.

Resumen de referencia completa
La siguiente es una manera de resumir una referencia completa que incluye:
1. Cita o datos bibliográficos.
2. Problema de investigación e hipótesis.
3. Participantes (muestra).
4. Procedimiento(s) de la investigación (diseño y forma de recolección de datos).
5. Resultados.
6. Discusión o conclusiones.

A continuación se muestra un par de ejemplos de ello.
Ejemplo 1
Spurgeon, P., Hicks, C. y Terry, R. (1983). A preliminary investigation into sex differences in reported
friendship determinants among a group of early adolescents. The British Journal of Social Psychology,
22 (1), 63‐64.
Problema: determinar si hay diferentes tipos globales de relación amistosa entre géneros y dentro
de cada género, así como los determinantes de dichos tipos globales.
Participantes: 26 adolescentes de 11 a 12 años de edad (15 de género femenino y 11 de género
masculino) que cursan el último año de escuela básica (middle school).
Procedimientos: los individuos contestaron un cuestionario para avalar un rango de determinan-
tes de la amistad; el cuestionario estuvo basado en descubrimientos de investigación sobre las razones
más importantes subyacentes en la formación y el mantenimiento de la amistad. Se incluyeron pre-
guntas cerradas (con escala de cinco puntos) concernientes a razones ambientales, sociológicas y de
personalidad, así como preguntas abiertas acerca de la naturaleza de la amistad y la relación amistosa.
Asimismo, se les pidió que calificaran a su mejor amigo o amiga en cada pregunta, y a su segundo y
tercer mejores amigo o amiga.
Resultados: en el caso de las mujeres, las razones para vincularse con su mejor amiga son cualita-
tivamente diferentes de las razones para vincularse con su segunda o tercera mejores amigas. Los
aspectos más importantes para la mejor amistad fueron, en orden: “jugar juntas”, “sentarse juntas” y
tener “la misma actitud positiva” hacia la escuela. Menos importante resultó “vivir cerca”. Respecto de
la segunda y tercera mejores amigas, los aspectos más relevantes fueron similares en ambos casos (por
ejemplo, “actitud positiva” hacia la escuela, “agradar a la maestra y sentarse juntas”). En cambio, “visi-
tar el hogar de la otra persona y viceversa” resulta menos importante.
En contraste, el orden de aspectos importantes de la amistad entre los jóvenes es idéntico entre los
tres niveles (mejor amigo, segundo y tercer lugares). Los aspectos más destacados fueron: “actitud
negativa” hacia la escuela y “jugar y sentarse juntos”. “Visitar el hogar del otro y viceversa” fue menos
importante. Desde un punto de vista global, las percepciones de ambos géneros en relación con los
determinantes importantes de la amistad son muy similares (r = 0.82, p = 0.01). Las respuestas a las
preguntas abiertas se clasificaron como situacionales, contractuales o psicológicamente internas. Los
resultados demostraron un paso a través de las fases de la amistad. De las relaciones amistosas de las
20       Capítulo 3  PERSPECTIVA TEÓRICA: COMENTARIOS ADICIONALES

jóvenes, 97% están basadas en razones psicológicas internas, mientras que para los jóvenes se distribu-
yen entre razones psicológicas internas (54%) y contractuales (45%).
Conclusiones: esta investigación inicial revela que, para ambos géneros, los aspectos más impor-
tantes de la amistad adolescente son similares, pero existen diferencias en la variación de niveles de
amistad que pueden reflejar preferencias por actividades distintas o tasas de maduración entre los dos
géneros.
Ejemplo 2
De la Ossa, S., Martínez, Y., Herazo, E. y Campo, A. (2009). Estudio de la consistencia interna y
estructura factorial de tres versiones de la escala de Zung para ansiedad. Colombia Médica, 40 (1),
78‐84.
Antecedentes: la escala de Zung para ansiedad se ha usado en varias investigaciones en Colombia.
Sin embargo, no se ha informado sobre la consistencia interna y la estructura de factores en estudian-
tes universitarios.
Objetivo: estimar la consistencia interna y la estructura factorial de tres versiones de la escala de
Zung para ansiedad en estudiantes de una universidad privada de Cartagena, Colombia.
Método: 221 estudiantes de medicina y psicología completaron la versión de 20 puntos de la
escala de Zung para ansiedad. La media de edad fue 20.5 (DE = 2.6), 64.4% eran mujeres y 55.3%
estudiaban medicina. Se calculó el alfa de Cronbach y se realizó un análisis de factores exploratorio
para las tres versiones.
Resultados: la escala de 20 puntos mostró un coeficiente de alfa de Cronbach de 0.77 y tres fac-
tores principales responsables de 40.1% de la varianza total. La versión de 10 puntos presentó una
consistencia interna de 0.83 y una estructura bidimensional que explicaba 54% de la varianza. La
versión de cinco puntos mostró una consistencia interna de 0.74 y una estructura unidimensional que
daba cuenta de 49.5% de la varianza.
Discusión: las versiones de 10 y cinco puntos de la escala de Zung para ansiedad presentan mejor
comportamiento psicométrico que la versión original de 20 puntos. Se necesita estimar el comporta-
miento psicométrico de estas versiones frente a un criterio de referencia.

Otra manera de recopilar y organizar la información de las fuentes
primarias o referencias bibliográficas
Otra forma de extraer información de las referencias para el marco teórico, más resumida, la sugieren
Savin-Baden y Major (2013, p. 125), la cual se muestra en la tabla 3.1, con adaptaciones de acuerdo
al proceso de investigación.
  Tabla 3.1  Extracción de información de las referencias

Contenido a incluir Artículo 1 (datos Artículo 2 (datos Libro (datos...) Ponencia Capítulo de Referencia...
por rubro completos de la completos...) en congreso libro (datos...)
referencia) (datos...)

Tema o tópico
Enfoque
Objetivos
Ideas
Preguntas de inves-
tigación
Hipótesis
Variables (conceptos)
Definiciones concep-
tuales de variables
Definiciones opera-
cionales de variables
21

Diseño
Muestra (población/
unidad/participan-
tes)
Instrumentos de
recolección
Análisis de los datos
Validez/confiabili-
dad/rigor
Principales resultados

Datos que apoyan la
magnitud de la pro-
blemática (estadís-
ticas , importancia,
etcétera)

Desde luego, no todos los rubros se aplican a todos los tipos de referencia (por ejemplo, diseño,
muestra, instrumentos, análisis y rigor no se aplican a ensayos; o bien, habrá capítulos de libros a los
cuales tampoco correspondan). En investigaciones sencillas, es muy probable que con una tabla o
matriz sea suficiente, aunque ocupe varias páginas; sin embargo, en investigaciones con un marco
teórico más elaborado, puede requerirse una tabla para cada apartado.
Asimismo, también es posible elaborar una matriz con los tipos de información que se trataron
previamente, como puede apreciarse en la tabla 3.2.
  Tabla 3.2  Extracción de información de las referencias con otros conceptos.

Contenido a incluir Artículo 1 Artículo 2 Libro
por rubro

Ideas
Cifra
Idea + opinión
Resultado
Resumen
Definiciones opera-
cionales de variables

Comentarios sobre la primera vez que se efectúe una búsqueda
Como se mencionó en el capítulo 4 de la obra impresa, en la web se incluyen documentos que no son
útiles para revisar la literatura si pretendemos contar con un trabajo digno y serio, ya sea porque no
tienen fundamentos, sus fuentes no resultan confiables o contienen información insustancial o no
corroborada. Por ello, debemos acudir a los bancos de referencias de asociaciones e instituciones aca-
démicas o profesionales, los que contienen artículos arbitrados o indexados que poseen respaldo cien-
tífico.
Desde luego, podemos comenzar con los disparadores generales de búsqueda:
http://www.altavista.com /
http://www.ask.com
http://www.bing.com
http://www.google.com
http://www.hotbot.com
http://www.dogpile.com
http://www.yahoo.com
22       Capítulo 3  PERSPECTIVA TEÓRICA: COMENTARIOS ADICIONALES

http://go.com
http://webcrawler.com
http://www.about.com/espanol/
http://www.lycos.com
http://www.answers.com
http://ipl.org
http://www.proquestk12.com/

También podemos utilizar los canales de televisión en internet: Discovery, History, NATGEO,
etc.
Para libros podemos recurrir a: Amazon (http://www.amazon.com/) y SearcheBOOKS (http://
www.searchebooks.com/).
Sin embargo, se deben utilizar palabras claves precisas y abrir solo sitios con respaldo académico,
científico o profesional. Recordemos que el dominio .com indica que se trata de uno comercial y es
mejor abrir sitios con los dominios: .org, .gov, .net y .edu, aunque siempre es necesario verificar que el
documento o sitio tenga un verdadero soporte. Por ejemplo, si colocamos solo la palabra “depresión”
en un disparador, varias de las primeras páginas serán anuncios de “métodos para superarla”, medica-
mentos y consejos, aunque también encontraremos definiciones de Wikipedia, algún libro muy fun-
damental y explicaciones de MedlinePlus, pero pocos artículos de revistas o reportes de investigación
cuya naturaleza sea empírica. Ello nos lleva a señalar que en parte la utilidad de una fuente depende
de la asignación del profesor o los propósitos de ella. Por ejemplo, diversos artículos de Wikipedia
cuentan con un sustento fundamentado en referencias producto de estudios y pueden ser útiles para
un trabajo dentro de alguna asignatura (pero no debemos basarnos exclusivamente en ellos, porque
simplemente nos ayudan a entender conceptos), y resultan pobres para una tesis o, al menos, insufi-
cientes. Lester y Lester (2013) recomiendan que cuando se considera la pertinencia de una fuente,
documento o sitio en internet, se debe:
1. Acudir a sitios que contengan los dominios: .org (organizaciones profesionales, sociales, educati-
vas o empresas), .gov (organizaciones gubernamentales) .net (genérico, usarlo con precaución al
igual que .com), .edu. (educación, instituciones educativas) y .mil (militar), según campo de bús-
queda.
2. Determinar si el autor del documento tiene una afiliación institucional seria (o su correo lo indi-
que). Si esta no existe, será necesario buscar en cualquier disparador si se trata de un académico,
profesional o científico con experticia y conocimientos.
3. Asegurarnos que el documento cite referencias confiables.
4. Distinguir sitios con respaldo profesional, académico o científico de páginas personales, de infor-
mación general, de negocios y comerciales.
Como auxilio a los requisitos anteriores, recuerde que los elementos de lectura de una dirección
en línea son:
1. Protocolo (http://): transmite la información.
2. El servidor (www) (World Wide Web): red global de internet.
3. El dominio: nombre de la organización y su sector. Por ejemplo:
- Universidad de Celaya: udec.edu (educación).
- Universidad César Vallejo: ucvlima.edu.
4. País o si es un sitio global (abreviado):

- Universidad de Celaya: udec.edu.mx/ (México).
- Universidad César Vallejo: ucv.edu.pe/ (Perú)
- Oxford University: http://www.ox.ac.uk/ (United Kingdom, Reino Unido)
- Universidad del Sur de California: http://www.usc.edu/ (global)
23

Finalmente, algunos “metamotores de búsqueda” (que agrupan a diversos motores de búsqueda
simultáneamente como Yahoo o Google) son:
http://www.dogpile.com
http://www.metacrawler.com
http://www.surfwax.com
http://www.mamma.com

Enciclopedias
Además de todos los recursos anteriores (libros, artículos de revistas científicas, ponencias, etc.) existe
uno adicional que resulta muy útil para buscar autores, términos, teorías, definiciones de variables y
resultados de estudios sobre estas: las enciclopedias sobre campos específicos del conocimiento.5
Existe tan grande variedad de ellas que sería imposible mencionarlas en unas cuantas páginas, pero
incluimos algunas a manera de ejemplo:
Encyclopedia of architecture: Design, engineering & construction (v. 1‐5) (arquitectura e ingenierías).
Encyclopedia of behavior modification and cognitive behavior therapy (psicología de la
conducta). Encyclopedia of children, adolescents, and the media (medios de comunica-
ción).
Encyclopedia of community (sociología y demografía).
Encyclopedia of counseling (psicología y trabajo social).
Encyclopedia of disability (ciencias de la salud y psicología).
Encyclopedia of educational psychology (psicología y educación).
Encyclopedia of global health (ciencias de la salud). Encyclopedia of global warming and climate
change (ciencias físicas, ambientales y sociales).
Encyclopedia of health and behavior (ciencias de la salud y psicología).
Encyclopedia of human development (psicología y ramas afines).
Encyclopedia of industrial and organizational psychology (psicología y administración de recursos
humanos).
Encyclopedia of interpersonal violence (psicología). Encyclopedia of leadership (administración y psi-
cología). Encyclopedia of multicultural psychology (psicología).
Encyclopedia of obesity (ciencias de la salud). Encyclopedia of psychology and law (psicología y leyes).
Encyclopedia of social psychology (psicología social). Encyclopedia of epidemiology (ciencias de la
salud). Encyclopedia of evaluation (ciencias sociales y administrativas).
Encyclopedia of measurement and statistics (ciencias sociales, administrativas, ingenierías).
Encyclopedia of social science research methods (ciencias sociales y administrativas).
Encyclopedia of stem cell research (ciencias de la salud y biológicas).
Encyclopedia of survey research methods (todas las ciencias, enfocado en en-
cuestas).
Encyclopedia of social problems (ciencias sociales). Encyclopedia of social theory (ciencias sociales).
ENGnetBASE: Engineering handbooks online (ingenierías).
McGraw‐Hill concise encyclopedia of engineering (ingenierías).
MechanicalEngineeringnetBASE (ingenierías).
The Sage encyclopedia of qualitative research methods (todos los campos, desde luego, desde el enfo-
que cualitativo).
The SAGE Handbook of healthcare (ciencias de la salud).
Además, se puede acceder a otras de SAGE citadas a lo largo de la obra impresa de esta sexta edi-
ción.
5 No nos referimos a las tradicionales enciclopedias en línea (que también son útiles y deben usarse y recomendarse) como la Enciclopedia
Britannica, Enciclopedia Columbia, Encarta, Encyclopedia.com, Wikipedia, Encyclopedia Smithsonian y otras similares, sino a enciclopedias más
dirigidas a determinadas áreas del conocimiento.
24       Capítulo 3  PERSPECTIVA TEÓRICA: COMENTARIOS ADICIONALES

Desafortunadamente, estas herramientas tienen un costo que a veces resulta elevado, sobre todo
para los estudiantes o profesores, circunstancia que se reduce en el caso de las instituciones educativas.
Por otra parte, todas ellas se localizan a través de su nombre vía un navegador en internet (Google,
Yahoo, etc.). La mayoría se actualiza periódicamente.

Ejemplo adicional de índice de marco teórico
Referencia: Gueguen, N., Jacob, C. y Lamy, L. (2010). Love is in the air: Effects of songs with roman-
tic lyrics on compliance with a courtship request. Psychology of music, 38 (3), 303-307. DOI:
10.1177/0305735609360428
Enfoque: cuantitativo.
Pregunta de investigación: ¿La exposición a canciones con letras románticas afecta la respuesta al cor-
tejo?
Objetivo: Determinar si la exposición a canciones con letras románticas afecta la respuesta al cortejo.
Justificación abreviada: de acuerdo con North y Hargreaves (2008) la música y su letra tienen
capacidad para influir en el comportamiento de las personas. En un reciente experimento dirigido por
Jacob, Gueguen, Boulbry y Selmi (2009) se descubrió que los hombres que durante su estancia en
tiendas florales escuchaban música romántica gastaban más dinero en la compra de arreglos florales
que aquellos que no se veían expuestos a este tipo de música. La importancia de la presente investiga-
ción radica en comprobar que el contenido multimedia puede afectar de manera más específica que lo
que hasta este momento se consideraban tan solo como comportamientos agresivos o prosociales.
Índice principal del marco teórico:
1. Introducción.
2. Efectos que provocan los medios audiovisuales en
3. el comportamiento humano.
4. Estudios antecedentes.
5. Modelo de exposición general.
6. Modelo de aprendizaje general.
7. Investigaciones que demuestran el efecto de la exposición a canciones con letras románticas en el
cortejo romántico.
capítulo

4 Estudios de caso

HACIA UNA DEFINICIÓN DEL ESTUDIO DE CASO
En el capítulo 7 de Metodología de la investigación, 6ª edición, se comentó que el estudio de caso
se podría definir como una investigación en la cual mediante los procesos cuantitativo, cualita-
tivo y/o mixto se analiza profundamente y de manera integral una unidad para responder al
planteamiento del problema, probar hipótesis y desarrollar teoría (Hernández-Sampieri y
Mendoza, 2008).
Otras definiciones se presentan en la tabla 4.1
  Tabla 4.1 Definiciones del estudio de caso.
Autor y/o referencia Definición
U.S. General Accounting Office, 1990 (en Método para aprender respecto de una instancia compleja,
Mertens, 2010) basado en su entendimiento comprehensivo como un “todo”
y su contexto, mediante datos e información obtenidos por
descripciones y análisis extensivos.
Creswell et al. (2007) Análisis profundo de un caso y su contexto, con fines de enten-
der su evolución o desarrollo e ilustrar una teoría.
Blatter (2008) Aproximación investigativa en la cual una o unas cuantas instan-
cias o unidades de un fenómeno son estudiadas en profundidad.
Wiersma y Jurs (2008) Examen detallado de “algo”: un evento específico, una organiza-
ción, un sistema educativo, por ejemplo.
Grinnell, Williams y Unrau (2009) Examen intensivo de una unidad de análisis.
The SAGE Glossary of the Social and Beha- Estudio en profundidad de uno o más unidades o sistemas iden-
vioral Sciences (2009r) tificados y delimitados
Merriam (2009) Descripción y análisis intensivos y holísticos de una sola instan-
cia, fenómeno o unidad.
Mertens (2010) Investigación sobre un individuo, grupo, organización, comuni-
dad o sociedad, que es visto y analizado como una entidad.
Thomas (2011b) y Elger (2009) Análisis de personas, eventos, decisiones, periodos, proyectos,
políticas, instituciones u otros sistemas que son estudiados
holísticamente por uno o más métodos. El caso que es objeto de
la indagación será una instancia de una clase de fenómenos que
proporciona un marco analítico dentro del cual se lleva a cabo el
estudio. Dentro de este, el caso contribuye a iluminar y explicar
el fenómeno (su clase o a este).
Yin (2013) y Hijmans y Wester (2009) Indagación empírica en profundidad sobre un fenómeno contex-
tualizado en el mundo real, particularmente cuando los límites
entre el fenómeno y su contexto no son evidentes.
2       Capítulo 4  Estidos de caso

De las definiciones anteriores podemos concluir que el estudio de caso se centra en la descripción y
el examen o análisis en profundidad de una o varias unidades y su contexto de manera sistémica y holís-
tica.
Harvard Business School (1997) lo considera un método y lo utiliza desde 1908 para evaluar unida-
des organizacionales.
Varios autores, como Grinnell, Williams y Unrau (2009), Hernández-Sampieri y Mendoza (2008) y
Stake (2006), opinan que más que un método es un diseño y una muestra, es decir, sostienen que los
estudios de caso utilizan o pueden incluir diversos métodos. Al respecto, su importancia —más que dis-
cutir sobre si es un método, un diseño o una muestra— reside en su uso, por lo cual dejamos que el lector
forme su propia concepción sobre el estudio de caso.
Blatter (2008), Stake (2006) y Hammersley (2003) reconocen que es complejo y problemático inten-
tar asociar el estudio de caso con una forma específica de investigación, debido a que se ha utilizado tanto
en el enfoque experimental como en otras aproximaciones cuantitativas y en la investigación cualitativa.
Para resolver el asunto, utilizan el criterio de que el estudio de caso no está definido por un método espe-
cífico, sino por su objeto de análisis. Entre más concreto y único sea este, y constituya un sistema propio,
con mayor razón podemos denominarlo estudio de caso.
Yin (2013 y 2011) compara a los estudios de caso con otros diseños de investigación, en términos de
preguntas de investigación y control de eventos. El contraste de esta comparación se muestra en la tabla 4.2.

  Tabla 4.2  Comparación de los estudios de caso y otros diseños.

Estrategia o diseño Esencia de las preguntas de ¿Requiere control de eventos?
investigación
Experimento ¿Cómo?, ¿cuánto?, ¿por qué? Sí

Encuestas (surveys) ¿Quién?, ¿qué?, ¿dónde?, ¿cuánto? No

Estudios históricos ¿Cómo?, ¿dónde?, ¿por qué? No

Análisis de archivos ¿Quién?, ¿qué?, ¿dónde?, ¿cuánto? No

Estudios de caso ¿Cómo? y ¿por qué? En ocasiones sí y en otras no

Diversos autores señalan que los diferentes diseños se superponen y que los estudios de caso siguen el
proceso de investigación (de la idea a la presentación de resultados) y utilizan fuentes múltiples de datos
y análisis, lo que significa que su naturaleza es empírica (Yin, 2013, Sekaran y Bougie, 2013, Green, 2011
y Aaltio y Heilmann, 2009).

FUNCIONES DE LOS ESTUDIOS DE CASO
Seguramente el lector se cuestionará cuál es la utilidad de los estudios casos, ¿para qué sirven?
Como cualquier otro diseño o método, los estudios de caso permiten analizar una gran variedad de
fenómenos, desde situaciones o eventos inusuales hasta interacciones complejas (Timmons y Cairns,
2009) y responder a diversos planteamientos de problemas de investigación.
Green (2011), Robson (2011), Mertler y Charles (2010), así como Armenian (2009), identifican
algunas funciones o propósitos de los estudios de caso:
1. Generar descripciones vívidas de individuos o fenómenos.
2. Identificar patrones de un fenómeno en su ambiente natural.
3. Explicar las causas y cómo ocurren fenómenos, identificando sus causas.
4. Proveer datos para evaluar procesos, programas, individuos o ambientes.
5. Ilustrar descubrimientos.
6. Resolver problemáticas sociales, industriales, administrativas, económicas, políticas y de otro tipo.
Metodología de la investigación 3

Por su parte, Yin (2013), Hernández-Sampieri y Mendoza (2012), además de Xiao (2009a), consi-
deran que los estudios de caso son útiles para refinar, confirmar y/o extender la teoría, y producir conoci-
miento y validar resultados obtenidos por otros diseños (complementación). Sobre el primer punto
regresaremos más adelante.
Asimismo, Starke y Strohschneider (2009) señalan que ofrecen varios beneficios, entre los que se
destacan que proporcionan una base de datos enriquecedora e información completa sobre el fenómeno
o unidad considerada y revelan diferencias entre expresiones de dicho fenómeno o los casos analizados.
Thomas (2010) indica que el estudio de caso cuando es implementado con respeto al proceso de investi-
gación, ejemplifica el conocimiento o la teoría a través de sustraer manifestaciones reveladoras.
Con frecuencia, el valor del estudio de caso reside en su oportunidad, ya que posibilita analizar uni-
dades a las cuales es difícil tener acceso mediante otro diseño. Imaginemos investigaciones sobre fenóme-
nos que no ocurren “todos los días” o que resultan de acceso difícil, tal como lo sería una supernova, un
asesino serial, una catástrofe natural, una devaluación o un presidente de una nación. Es lo revelador del
caso lo que lo hace un método invaluable.

CARACTERÍSTICAS DE LOS ESTUDIOS DE CASO
Los estudios de caso han sido ampliamente usados por investigadores y profesionales durante los últimos
siglos. Sigmund Freud los implementó para generar su teoría psicoanalítica, Charles Darwin a fin de
analizar ciertas especies y Frédéric LePlay (1806-1882), sociólogo francés, los llevó a cabo con el propósi-
to de investigar familias de la clase trabajadora y así entender cómo operaba cada unidad familiar y de ello
obtener conclusiones acerca de cómo funcionan las familias dentro de la sociedad. Bronislaw Malinowski
y la Escuela de Chicago del enfoque cualitativo los utilizaron de manera considerable. Asimismo, se apli-
can a todas las disciplinas o ciencias. Por ejemplo, la investigación clásica de Graham Allison y Philip
Zelikow sobre la crisis de los misiles en Cuba (1962) y que estuvo a poco de generar una guerra entre la
entonces Unión Soviética y Estados Unidos, se basó en un estudio de caso.
Algunas de sus principales características son:
1. Constituyen métodos o diseños flexibles, ya que el investigador puede utilizar múltiples herramientas
para capturar y analizar los datos que le permitan comprender las peculiaridades del fenómeno o
problema bajo indagación y conocer sus causas (Yin, 2011, Bell, 2010, The SAGE Glossary of the
Social and Behavioral Sciences, 2009r y Timmons y Cairns, 2009).
2. El investigador y el objeto de investigación interactúan constantemente entre sí (Aaltio y Heilmann,
2009).
3. El objeto de estudio o caso es examinado de manera sistémica, global y holística (Xiao, 2009a).
4. El investigador casi siempre trata de identificar patrones (Green, 2011).
5. Se realizan en ambientes naturales (Yin, 2013 y Moore, 2009).
6. Son de naturaleza empírica, por lo cual los datos recolectados deben ser “ricos y profundos” (Sekaran
y Bougie, 2013, y Mertler y Charles, 2010).
7. Son completamente contextuales, es decir, se analizan tanto el caso como su contexto, pues ambos
son igualmente importantes (Hernández-Sampieri y Mendoza, 2012 y Stake, 2006).
8. Utilizan la triangulación de fuentes de datos como eje del análisis (Green, 2011).
9. Se fundamentan en la premisa de que un examen en profundidad de un caso y su contexto puede
generar información significativa sobre otros casos similares (The SAGE Glossary of the Social and
Behavioral Sciences, 2009ñ).
10. Incluyen todas las perspectivas posibles de los participantes (Raufflet, 2009).

DEFINICIÓN DE CASO
Hemos hablado de los estudios de caso, pero… ¿qué se considera un caso o cómo se define en el marco
de este diseño o método?
4       Capítulo 4  Estidos de caso

Un caso es una unidad o entidad sistémica identificada en sus límites y características y ubicada en
relación a su contexto (Elger, 2009 y Stake, 2006) y que es el principal objeto o sujeto de estudio (Bell,
2010). En otras palabras: el caso es la unidad de análisis.
De acuerdo con Yin (2013 y 2011), Hernández-Sampieri y Mendoza (2012), Azapagic y Perdan
(2011), Green (2011), Xiao (2009a), The SAGE Glossary of the Social and Behavioral Sciences (2009r),
Stein, Rocco y Goldenetz (2001) y King, Keohane y Verba (1994), un caso puede ser una persona (un
líder histórico, un directivo, un profesor, un ama de casa, un empresario, un experto en un área —inge-
niería aeronáutica, medicina interna, psicoanálisis….—, etc.), un grupo (familia, equipo que rediseña un
proceso industrial, equipo de cirugía, etc.), una colectividad (una colonia, una cultura corporativa, un
salón de clases grande, el departamento de una empresa, etc.), un programa o proyecto (para construir un
hospital oncológico, de calidad total, para innovar un proceso de manufactura, de vacunación, etc.), una
política (educativa, social, económica, etc.), una organización (fábrica, empresa, institución de educación,
hospital, etc.), un proceso (mercadológico, arquitectónico, quirúrgico, de diseño industrial, etc.), una
decisión (en cualquier ámbito), un tratamiento o intervención (psicológica, médica, veterinaria, de aseso-
ría industrial, etc.), un fenómeno o evento (meteorológico, biológico, histórico, de masas, una catástrofe
natural, el cambio climático en una región, una guerra, etc.), un animal o especie, una ley o reglamento,
una construcción (pirámide, conjunto de vestigios arqueológicos, un edificio moderno, etc.), un ritual, un
producto (de consumo, de manufactura, etc.), una ocupación, una cuestión o asunto intangible (una
declaración, un argumento, etc.) y en fin, otros elementos diversos.
Es decir, el caso debe cumplir la condición de considerarse sistémica y holísticamente, así como en
relación con su contexto y no agregarse a otras unidades para realizar los análisis (el análisis no es agregado
ni aditivo como en otros diseños o métodos pues, por ejemplo, no se promedian las unidades). Desde
luego, pueden compararse casos (como en el diseño de casos múltiples que se revisará más adelante), pero
cada uno es visto como una entidad completa. En términos de The SAGE Glossary of the Social and
Behavioral Sciences (2009r), en el estudio de caso cuando se examinan diversas unidades, los datos se ana-
lizan primero dentro de cada caso y posteriormente se establecen las comparaciones entre los casos.
La selección del caso es el elemento central de este método o diseño y por ello debe ser muy cuidado-
sa. El investigador tiene que informar los criterios y el proceso que se usaron para determinar el caso o
casos que se estudiarán. Desde luego, tal selección depende principalmente del planteamiento del proble-
ma y del alcance de la investigación: exploratorio, descriptivo o explicativo (Azapagic y Perdan, 2011,
Bleijenbergh, 2009 y Xiao, 2009).
El caso se considera en sus dimensiones espacial y temporal. Asimismo, los límites o fronteras se
determinan mediante la teoría que guía el estudio, el planteamiento y el sentido común (Elger, 2009).

COMPONENTES Y FASES DEL ESTUDIO DE CASO
Si integramos los elementos de Yin (2013 y 2011), Robson (2011), Hak y Dul (2009), Hernández-
Sampieri y Mendoza (2008), Price (2008a) y Stake (2006), podemos decir que el estudio de caso está
conformado por los siguientes componentes:
• Planteamiento del problema.
• Proposiciones o hipótesis.
• Unidad o unidades de análisis (caso o casos).
• Contexto del caso o casos.
• Fuentes de información e instrumentos de recolección de los datos.
• Lógica que vincula los datos con preguntas y proposiciones.
• Análisis de toda la información.
• Criterios para interpretar los datos y efectuar inferencias.
• Reporte del caso (resultados).
Respecto de la secuencia general del estudio de caso, al revisar la literatura más citada en ciencias de
la salud, ciencias sociales y administrativas e ingenierías, encontramos varios procesos. Azapagic y Perdan
Metodología de la investigación 5

(2011), Xiao (2009), Aaltio y Heilmann (2009), Davis (2009) y Dul y Hak (2008) consideran el siguien-
te:
1. Planteamiento del problema.
2. Definir el caso
3. Seleccionar el caso y el sitio o contexto.
4. Construir el marco teórico base del estudio.
5. Recolectar los datos o evidencia necesaria.
6. Construir una base de datos para poder adicionar, cruzar y comparar información proveniente de
distintas fuentes.
7. Procesar y analizar los datos (la base de datos).
8. Reportar resultados.

Por su parte, Harvard Business School (1997) establece las siguientes fases para el estudio de caso en
organizaciones (ver figura 4.1).

  Figura 4.1  Fases para el estudio de caso organizacional según Harvard Business School y Design
Management Institute.1

Investigación de ante- Solicitar permiso de los gate-
cedentes y su contexto: keepers de la empresa
Identificar el caso (un éxito, • Leer tanto como sea (directivos, líderes de los traba-
pero también puede ser un posible sobre la compañía, jadores, representantes legales,
fracaso, un asunto complejo, producto, negocio, etcétera) y obtenerlo
típico o extremo). mercado o tópico.
• Ubicar, definir y contex-
tualizar el caso.

Trabajo de campo: Involucrar a la compañía o institución (el caso mismo o cuya
participación es decisiva en él, como lo sería un mercado o
•Entrevistas con los individuos producto):
participantes en el caso (de todos • Obtener documentos de la empresa o institución, o del caso
los niveles) (reportes anuales, reportes de investigaciones de mercado,
• Visitas a la planta, oficinas o sitios boletines, folletos, revistas internas, artículos en los medios de
donde ocurrió el caso (para comunicación, entre otros)
entender cuestiones como la • Recolectar información sobre los individuos que participan o
tecnología, los procesos de participaron en el caso (ejecutivos, diseñadores, asesores,
producción, organización y etcétera)
trabajo; el ambiente de la compa- •Recolectar información sobre el contexto (por ejemplo, com-
ñía, entre otras). En las visitas se petidores, legistalación, datos históricos de la evoluación de un
realiza entrevistas, observación mercado y otros)
sistemática, recolección de más
documentos específicos, con la
inclusión de materiales audiovisu-
Análisis de los datos (de acuerdo con el tipo de datos e
ales, etcétera)
información recolectada)
• Elaborar notas de campo
(recuérdese las notas del proceso
cualitativo)

Es importante enfocar el caso en Elaboración del reporte de caso:
aspectos relevantes y centrales. • Narración (descripciones)
• Tablas, figuras, material de apoyo

1 Este proceso se adaptó de la fuente original y resulta más bien propio para estudios de caso de empresas, industrias, mercados, negocios
o productos.
6       Capítulo 4  Estidos de caso

El proceso de la figura 4.1 puede adaptarse a muy diversos fenómenos o situaciones. Por ejemplo,
Price (2008a) propone estudios de caso para que se analice cómo las familias con hijos que tienen enfer-
medades crónicas y dependen de equipos para usos médicos (como los aparatos de hemodiálisis) aprendan
a cuidarlos y vincularse con ellos. En este ejemplo, el caso en cuestión es la familia (incluido, por supues-
to, el o la infante), mientras que el contexto es la enfermedad crónica y la dependencia del equipo.
En estas investigaciones se selecciona el caso (familia), se revisan los antecedentes y su contexto (his-
toria de la enfermedad y la dependencia del aparato). Por su parte, los gatekeepers son los familiares y el
personal médico, quienes deben involucrarse en el estudio (son participantes todos ellos). La información
se recolecta mediante diversos métodos:
• Documentos y diarios (apuntes médicos, régimen médico o patrones estándares de atención y regis-
tros médicos; asimismo, se puede solicitar a los participantes que lleven un diario o bitácora de sus
experiencias, por escrito o mediante grabaciones de audio).
• Entrevistas (al niño o niña, familiares, médicos, enfermeras, personal de apoyo, etcétera).
• Observación (desde una inspección visual del hogar, hasta las consultas médicas, interacciones entre
miembros de la familia, etcétera).
• Artefactos físicos (por ejemplo, elementos de autoayuda para enfrentar el padecimiento y usar los
equipos, como manuales, instructivos o videos educativos y de entrenamiento. Incluso, el investiga-
dor puede examinar la maquinaria y cualquier manual de instrucciones para poder apreciar la com-
plejidad que enfrentan los niños y sus familias).
• Las piezas de comunicación que consultan los participantes sobre la enfermedad y la situación en
general (anuncios en los medios de comunicación colectiva, libros, folletos, etcétera).
Así, se va efectuando el trabajo de campo, se realizan diversos análisis y se reporta el caso.
Como podemos ver, en los estudios de caso es recomendable agregar diversas técnicas para recabar
información, inclusive encuestas o grupos de enfoque, esquema que resulta compatible con un proceso
cuantitativo, cualitativo o mixto.
Yin (2013 y 2011), Green (2011), The SAGE Glossary of the Social and Behavioral Sciences (2009r) y
Aaltio y Heilmann (2009) consideran que las principales herramientas de recolección de los datos son las
siguientes: observaciones directas, entrevistas, registros de archivos, documentos y artefactos. Casi siempre
se utilizan al menos dos técnicas y múltiples fuentes. Se recaba evidencia hasta responder a las preguntas
de investigación.
Otro esquema para un estudio de caso es el de Hernández-Sampieri y Mendoza (2008), el cual se
muestra en la figura 4.2.
En este proceso, Stake (2006) recomienda recolectar datos e información sobre:
• La naturaleza del caso.
• Antecedentes históricos (por ejemplo: clínicos en una enfermedad física o psicológica, historial de
ventas en una cuestión empresarial, rendimiento en una maquinaria, índices de desempeño en un
proceso industrial, etcétera).
• Ambiente físico.
• Contexto o contextos pertinentes (económico, político, legal, social, estético, etcétera).
• Otros casos a través de los cuales el de interés se puede conocer más ampliamente.
• Informantes potenciales.
Asimismo, sugiere establecer una agenda de recolección de datos.

TIPOLOGÍAS EN RELACIÓN CON EL ESTUDIO DE CASOS
En la literatura sobre estudios de caso podemos encontrar diversas clasificaciones, las cuales se mencionan
a continuación.
Metodología de la investigación 7

  Figura 4.2  Esquemas para el estudio de casos.

! Analizar el casod e manera exploratoria:
descripción inicial del caso,+5+(#"1)*)-)"1)+(6(
sus antecedentes y contexto
* "1)/1 7 !

Formular el planteamiento del problema con el caso: objetivos, preguntas
de estudio, justificación y explicación del motivo o razones por las cuales se
eligió

Elaborar un primer inventario del tipo de información que se desea
recolectar

Preparar el estudio de caso: información completa que se requiere del caso,
tipo de datos que son necesarios y métodos para obtenerlos

Obtener la información inicial y analizarla

Recolectar información adicional

Analizar información adicional

Desarrollar alternativas o cursos de acción, si es el objetivo

Presentar el reporte con recomendaciones y su justificación

Por su finalidad
Grandy (2009a) y Stake (2006) identifican tres diferentes tipos de estudios de caso: intrínsecos, instrumen-
tales y colectivos. Veamos cada uno.
El propósito de los primeros no es construir una teoría, sino que el caso mismo resulte de interés.
Frecuentemente son de naturaleza exploratoria y el investigador es guiado por el deseo de analizar el caso
en sí más que producir teoría, pretender alguna clase de generalización o representar a otros casos. En
términos de Grandy (2009b), explorar es la pretensión en el estudio de caso intrínseco y regularmente el
deseo o intención es conocer más respecto de la singularidad de éste.
Los estudios de casos instrumentales se examinan para proveer de insumos de conocimiento a algún
tema o problema de investigación, construir y/o perfeccionar una teoría o aprender a trabajar con otros
casos similares. El caso por sí mismo es menos importante que el entendimiento que genera. La diferen-
cia entre el caso intrínseco y el instrumental no radica en la unidad de análisis sino en la finalidad del
estudio.
Los casos colectivos involucran varios estudios de casos instrumentales (Grandy 2009a) que sirven para
construir un cuerpo teórico (sumar hallazgos, encontrar elementos comunes y diferencias, así como acu-
mular información). Stake (2006) comenta que en ocasiones un estudio de caso puede ser tanto intrínse-
co como instrumental porque sirve a ambos propósitos, lo que dificulta categorizarlo.
Un ejemplo de caso intrínseco nos lo proporcionan Stephen Connolly y Sorrel Penn-Edwards (citado
por Grandy, 2009b), el cual se relacionaba al Programa de Educación de Valores (VEP, por sus siglas en
8       Capítulo 4  Estidos de caso

inglés) del Departamento de Educación, Ciencia y Capacitación (DECT) de Australia. El interés prima-
rio radicaba en el caso en sí y los investigadores se centraron en la operación y desempeño del programa
durante cuatro años. Su estudio es de naturaleza exploratoria y se enfocó en descubrir las particularidades
de la comprensión de los docentes sobre el VEP, su identificación con el programa y aceptación. Los
resultados les sirvieron para entender el funcionamiento de este emprendimiento, así como la inversión
financiera y de tiempo que requiere un esfuerzo de esta magnitud. No intentaban teorizar ni generalizar.
Por su parte, Stein, Rocco y Goldenetz (2001) implementaron un estudio de caso instrumental para
explorar la forma en que las políticas de recursos humanos relativas a los trabajadores adultos mayores
deben ser modificadas para que coincidan con los cambios demográficos. A través de su investigación
sometieron a prueba una teoría en un sitio real. Adoptaron la teoría de Doering sobre permanencia, reti-
ro y regreso al trabajo para explicar los temas que emergieron de sus datos. Así, eligieron como caso a una
gran universidad del medio oeste de Estados Unidos para explorar cómo la institución se está adaptando
al “envejecimiento” de la fuerza laboral, ya sean empleados mayores de 55 años que permanecen en sus
puestos o regresan a integrarse a la organización, y la experiencia subjetiva de ser un trabajador “más viejo”
en el ámbito universitario. El sitio en sí no orientó su indagación, sino que constituyó una herramienta
para comprender mejor dicha experiencia. Usaron la triangulación para garantizar una descripción com-
pleta y profunda del fenómeno y aumentar la confiabilidad de sus resultados. Además, examinaron docu-
mentos de la institución vinculados con el planteamiento (por ejemplo, políticas, comunicados de prensa
y cobertura de los medios) y estadísticas de la base de datos de empleo del departamento de recursos
humanos. Asimismo, realizaron entrevistas estructuradas con 12 trabajadores universitarios mayores de
55 años. Stein, Rocco y Goldenetz no tenían la intención de generalizar. Sin embargo, su investigación
sugiere pautas para la futura exploración de cuestiones específicas de recursos humanos relativas al enve-
jecimiento de los trabajadores (por ejemplo, estrategias para proporcionar mejores consejos a los emplea-
dos de mayor edad y redefiniciones de los acuerdos laborales para el personal de la tercera edad).

Por el número de casos o unidades de análisis
Aaltio y Heilmann (2009), The SAGE Glossary of the Social and Behavioral Sciences (2009o) y Stake
(2006), ofrecen otra tipología de los estudios de casos que se relaciona con el número de unidades o enti-
dades a considerar:
1. Un solo caso o unidad de análisis.
2. Múltiples unidades de análisis o casos (en primera instancia, evaluar cada uno por sí mismo holística
o integralmente, para después establecer tendencias y comunalidades).
3. Múltiples casos “cruzados”, “anidados” o “entrelazados” (la diferencia con la clase anterior es que
desde el inicio se pretende revisar comparativamente los casos entre sí para tratar de detectar simili-
tudes y diferencias). De acuerdo con Burns (2009), Campbell (2009) y Miles y Huberman (2002),
se pueden contrastar los casos de manera holística o eligiendo ciertas dimensiones o variables, pero
siempre se analizan sistémicamente.
A su vez, Yin (2013 y 2011), Goddard (2009) y Chmiliar (2009) establecen una clasificación de los
estudios de caso, para lo cual toman en cuenta dos factores: número de casos y clase de unidad de análisis.
En cuanto al número de casos la tipología considera un caso o varios casos (regularmente de dos a diez).
Por lo que respecta a la unidad de análisis, estos autores los subdividen en casos con unidad holística (todo
el caso tomado como una sola unidad de análisis) y casos con unidades incrustadas (varias unidades de
análisis dentro del caso). Los tipos de casos resultantes de esta clasificación cruzada son diseños de inves-
tigación del método de caso o pueden ser concebidos como diseños específicos del estudio de caso (en
concordancia con otros autores) y se muestran gráficamente en la figura 4.3.

Diseños de un solo caso
En los estudios de caso holísticos, el caso debe ser crítico y revelador, esto es, generado para confirmar,
desafiar o extender una teoría o hipótesis. Asimismo, pueden documentar una situación o evento único y
Metodología de la investigación 9

  Figura 4.3 Diseños del estudio de caso de acuerdo con Robert Yin.

Diseños de un solo caso Diseños de múltiples casos

Contexto
Contexto Contexto
Contexto

Holístico Caso
Caso Caso
(se estudia
la unidad de
análisis
completa)
Contexto Contexto
Contexto

Caso Caso

Contexto Contexto Contexto

Caso Caso Caso
(UA1) (UA1)
Incrustado Unidad de
(UA2) (UA2)
(múltiples análisis 1
unidades de incrustada (UA1)
análisis)
Contexto Contexto
Unidad de
análisis 2 Caso Caso
incrustada (UA2)
(UA1) (UA1)
(UA2) (UA2)

extremo (un individuo con una enfermedad extraña, un producto cuyas ventas se incrementan de manera
estratosférica en un periodo relativamente corto, digamos, un año; un sistema social que se transforma
radicalmente, una invasión bélica sorpresiva, un fenómeno climático que provoca daños inimaginables
—como la confluencia de los ciclones Ingrid y Manuel en México en 2013 o el terremoto de Chile en
2010—, un proceso de producción de acero completamente innovador, entre otros). El caso debe ser
evaluado de manera completa y profunda, de acuerdo con el planteamiento del problema. Por ejemplo,
una institución educativa con un crecimiento vertiginoso, que pasó de 90 a 1 500 alumnos en sólo cinco
años, que transitó de ser una organización con estándares académicos bajos y una imagen sumamente
negativa en la localidad, a constituirse en una institución con estándares elevados y una imagen por com-
pleto favorable. El análisis debe abarcar diversos rubros, tales como sus antecedentes, el clima y la cultura
organizacional, los sistemas y programas de mejora, el estilo administrativo, la productividad, la estructu-
ra funcional, etc. Lo importante es descubrir las razones de tal éxito.
Por su parte, en los estudios de caso con unidades incrustadas, la “gran unidad” es segmentada en
varias unidades (o subunidades), de las cuales se seleccionan algunas (por importancia, representatividad
analítica, acceso o muestreo teórico) para ser analizadas con amplitud y profundidad. Por ejemplo,
Hernández-Sampieri, Méndez y Cuevas (2008) evaluaron el caso de una administración municipal en lo
referente a la calidad en la atención directa a los ciudadanos (áreas que tienen contacto con estos). De
todos los departamentos, seleccionaron organismo municipal de agua potable, obras públicas (recepción
10       Capítulo 4  Estidos de caso

de quejas y solicitudes para la construcción de obras en el municipio), receptoría de pagos (por servicios
recibidos, como trámites de licencias, expedición de documentos, etc.), receptoría de trámites empresaria-
les (para abrir negocios, refrendar permisos, etc.), registro civil (matrimonios, registro de nacimientos,
etc.), oficina del alcalde, y finalmente, la dirección de policía (recepción de denuncias sobre delitos, infor-
mación de detenciones, entre otras).
El riesgo de los estudios con unidades incrustadas es que el investigador “pierda de vista” la naturale-
za entera del caso al enfocarse en una problemática más local (o departamental, como en el ejemplo). Sin
embargo, de cualquier manera siempre debemos tener en mente toda la unidad de análisis, el caso com-
pleto.
En la página web el lector podrá encontrar un ejemplo de estudio de un único caso instrumental de
una empresa fabricante de calzado exitosa: Análisis de las mejores prácticas empresariales en las áreas de
administración, mercadotecnia, manufactura y desarrollo organizacional: un estudio de caso (Arredondo,
Hernández-Sampieri y Méndez, 2013)

Diseños de múltiples casos
En estos diseños, el proceso que se utiliza para cada caso se “repite” en los demás. La revisión de los casos
es similar (se consideran holísticamente o se eligen las mismas variables o aspectos, al igual que los instru-
mentos para recolectar los datos y el proceso en general, aunque puede haber variantes) (Gondo, Amis y
Vardaman, 2009, Burns, 2009, Campbell, 2009 y Miles y Huberman, 2002). Por ejemplo, varios hospi-
tales, escuelas, pacientes, procesos de manufactura, etc., con características equivalentes. De acuerdo con
Yin (2013), son diseños más “robustos” y poseen mayor validez. A veces se eligen casos significativos, lo
que en términos prácticos resulta muy difícil, ya que encontrar varios casos que compartan similitudes es
complicado. Es importante remarcar que cada caso debe servir a un propósito específico dentro del alcan-
ce total.
Asimismo, es necesario insistir que el conocimiento generado por los diversos casos no es aditivo (los
casos no son como entrevistados en una encuesta o survey). En este sentido, la lógica de replicar casos es
muy parecida a la de los experimentos. Reproducimos algunos casos con condiciones similares y otros se
replican modificando ciertos elementos. Por ejemplo, un par de hospitales que muestran ciertos indicado-
res y características similares (número de camas, personal, especialidades, estilo administrativo, antigüe-
dad u otras características); luego, un hospital con menos camas y una nómina más pequeña;
posteriormente, un hospital equivalente a los dos primeros, pero con estilo administrativo o antigüedad
diferente; más adelante, un hospital especializado en cierto tipo de servicios, etcétera.
Cada caso se selecciona cuidadosamente, de tal modo que se analice el planteamiento del problema,
que una vez más, actúa como la guía durante toda la investigación. Si se aplica para obtener casos simila-
res, es importante y necesario desarrollar un marco teórico, el cual nos debe señalar qué variables resulta
lógico que se presenten en los casos (lógica cuantitativa, estandarización). De cualquier forma, cada caso
es un “todo”, una entidad por sí misma. Tanto la recolección de los datos como el análisis tienen como
uno de sus objetivos explicar consistencias e inconsistencias entre casos. El nivel de análisis es simultánea-
mente individual (caso por caso) y colectivo.
Por ejemplo, Ferlie, Fitzgerald, Wood y Hawkins (2005) llevaron a cabo un estudio de múlti-
ples casos en dos unidades de atención médica en el Reino Unido (parte del Sistema Nacional de
Salud), una primaria y otra intensiva. El objetivo central era comprender cómo se desarrollaban y
difundían ocho innovaciones (casos) seleccionadas por muestreo guiado por propósito (básicamen-
te, que se fundamentaran en evidencia científica) y la influencia que ejercía la participación en ello
de diferentes clases de profesiones, entre otras cuestiones. La investigación implicó tres años de
seguimiento, y la recolección de datos fue realizada por medio de entrevistas semiestructuradas,
reuniones y revisión de reportes formales e informales.
¿Cuántos casos deben incluirse en un diseño múltiple? En primer término, la lógica de mues-
treo cuantitativo no opera (Price, 2008b). Entre más casos, es posible desarrollar un mayor sentido
de entendimiento en relación con el planteamiento del problema; sin embargo, el número de casos
más bien depende de los recursos económicos y el tiempo a disposición del investigador. El ideal es
Metodología de la investigación 11

muy parecido al análisis cualitativo, cuando respondamos a la(s) pregunta(s) de investigación. A
veces, intentamos comparar casos extremos (por ejemplo, una escuela donde hay una elevada vio-
lencia entre los estudiantes y una escuela sin violencia; o un producto exitoso, digamos un deter-
minado refresco de limón, con un producto del mismo sabor que ha fracasado).
En los casos múltiples, además de intentar descubrir patrones, también queremos profundizar en el
plano individual, por lo que, como hemos señalado, la revisión de todos debe ser exhaustiva. Pero cada
caso implica un enorme esfuerzo no exclusivamente en el proceso indagatorio, sino en el de gestión.
Recomendamos a los estudiantes que realizan por primera vez un estudio de caso que comiencen por una
sola unidad de análisis. Después, pueden ampliarse a más casos. Ciertamente observar casos similares o
diferentes ayuda a enriquecer el conocimiento de un problema de investigación, pero no resulta sencillo.
Además, insistimos, el interés fundamental de un caso es intrínseco; la comparación con otros es conve-
niente, pero se encuentra supeditada a lo primero.
El proceso de un diseño de casos múltiples se presenta en la figura 4.4.
  Figura 4.4 Secuencia de un diseño de casos múltiples.2

CONCEPTUALIZACIÓN RECOLECCIÓN METAINFERENCIAS
Y DISEÑO Y ANÁLISIS Y DISCUSIÓN

Establecer
Planteamiento Conducir el Elaborar conclusiones entre
del problema estudio del reporte del casos
primer caso primer caso

Modificar
Seleccionar teoría
Conducir el Elaborar
casos
estudio del reporte del
segundo segundo
Desarrollo caso caso Establecer
del marco implicaciones
teórico Generación de
los instrumentos
para recolectar Conducir
Elaborar Elaborar el reporte
datos estudios de
reportes final que incluye el
casos
individuales análisis entre
remanentes
de cada caso casos

Cuando vamos a estudiar varios casos secuencialmente, Yin (2011) y Stake (2006) recomiendan
que el primero se considere como una especie de “caso piloto”, esto es, que nos resulte útil para per-
feccionar los instrumentos de recolección de datos.
Respecto de los múltiples casos cruzados o entrelazados, en los cuales el investigador desde el inicio pre-
tende revisar comparativamente los casos entre sí, buscando similitudes y diferencias, su diseño se podría
esquematizar como lo sugieren Hernández-Sampieri y Mendoza (2008) (figura 4.5).
En ciencias de la salud, Joerg y Bigby (2007) comentan que los estudios de caso de un solo paciente
generalmente incluyen varios reportes del sujeto, mientras que los casos en serie (múltiples) implican
colecciones de información de dos o más pacientes.
Creswell (2013a y 2013b), Yin (2013), Mertens (2010) y Stake (2006), consideran que en un estudio
de caso con una unidad o múltiples unidades debe haber triangulación de fuentes de datos y es necesario
utilizar diferentes herramientas tanto cuantitativas como cualitativas, como ya hemos visto. Además, es
necesario generar una base de datos para fines de auditoría de los datos y confirmación.
Un ejemplo de un estudio de casos múltiples puede encontrarse en la investigación de Molla S.

2 Extraído de Hernández-Sampieri y Mendoza (2008).
12       Capítulo 4  Estidos de caso

  Figura 4.5 Diseños de múltiples casos entrelazados.

Similitudes Similitudes
y diferencias y diferencias
Caso 1 Caso 2 Caso k

Similitudes
y diferencias

Discusión (similitudes
y diferencias,
patrones)

Elaborar reporte del estudio
comparativo

Donaldson sobre la calidad del servicio médico en Estados Unidos. Los resultados se basan en un examen
intensivo de 45 instituciones, una de las cuales se localiza en Canadá y otra en el Reino Unido. Se realiza-
ron entrevistas en diversos tipos de unidades de siete ciudades: centros de atención primaria y hospitales
especializados, así como clínicas familiares. La muestra incluyó a unos 270 000 pacientes y 15 equipos de
médicos. Se recolectaron datos de 14 variables que fueron identificadas y refinadas como altamente signi-
ficativas para la calidad de la atención, mediante el análisis entre casos. Al final, emergieron ocho temas
claves. Como parte de los resultados, se hicieron generalizaciones acerca de cómo funciona el sistema de
salud estadounidense y los factores que inciden en la innovación y la excelencia médicas. Asimismo, se
presentaron sugerencias para optimizar la formación de los profesionales de la salud y la formulación de
políticas sanitarias nacionales (Kohn, Corrigan y Donaldson, 2000).

Por el tipo de datos recolectados
Los estudios de caso también pueden subdividirse, dependiendo de la clase de datos que recolecten, en:
cuantitativos, cualitativos y mixtos (Creswell, 2013a y 2013b, Hernández-Sampieri y Mendoza, 2012, y
The SAGE Glossary of the Social and Behavioral Sciences, 2009q). Esta clasificación se comprenderá si pre-
viamente se revisaron todos los capítulos del libro impreso, puesto que en los primeros se aplica el proce-
so cuantitativo al estudio de una unidad; en los segundos, el proceso cualitativo; y en los terceros, cualquier
modalidad mixta.

Cuantitativos
En los estudios de caso cuantitativos se utilizan herramientas estandarizadas como pruebas, cuestionarios,
escalas, observación estructurada, aparatos y dispositivos, indicadores medibles y análisis de contenido
con categorías preestablecidas. A su vez, se subdividen en experimentales cronológicos (a través del tiem-
po) y no experimentales (transversales y longitudinales). En los primeros, que denominaremos —de
acuerdo con León y Montero (2003)— como experimentales de caso único, se aplica un tratamiento y se
efectúan diversas mediciones para analizar la evolución o consecuencia de este (Dugard, File y Todman,
2011 y Grinnell, Williams y Unrau, 2009). De hecho, la validez de las inferencias se establece al efectuar
varias mediciones repetidas a través de las fases del experimento con una n = 1, antes y después del estí-
mulo (Mertens, 2010).
Metodología de la investigación 13

Se utilizan comúnmente con variables que permanecen en la persona participante o fenómeno (caso)
por largos periodos y se ha establecido que no cambian con el mero paso del tiempo (Mertens, 2010). La
hipótesis sostiene que el tratamiento las modificará.
Consideremos el siguiente ejemplo. Un neurólogo dedicado a auxiliar a pacientes que han sufrido
lesiones cerebrales traumáticas. Estos frecuentemente tienen problemas específicos individuales que
requieren conocimientos, experiencia, imaginación y creatividad para sugerirles un tratamiento que les
pueda ayudar, especialmente en casos difíciles o complejos. Supongamos que el médico, basado en su
experticia y una extensa revisión de la literatura, así como en la consulta a otros expertos, decide imple-
mentar un nuevo procedimiento, pero es importante que la intervención la desarrolle con oportunidad y
bajo el esquema experimental. Si hay progreso tiene que asegurarse de que fue el procedimiento lo que
logró la mejora y no otras cuestiones (y evitar que en su entusiasmo de “hacer la diferencia” vea cambios
que realmente no lo son). Este diseño experimental (n =1), puede arrojar información prometedora pero
requiere de estudios posteriores de carácter confirmatorio (Dugard, File y Todman, 2011).
Robson (2011) y León y Montero (2003) se cuestionan: ¿hay realmente un experimento con una sola
persona? La respuesta proporcionada por ellos es que debe comprobarse: a) covariación entre la variable
independiente (estímulo) y la(s) dependiente(s), b) la aplicación de la independiente debe anteceder a la
medición de la dependiente y c) otras variables, diferentes de la independiente, tienen que descartarse
como posibles explicaciones de los cambios observados en las dependientes.
De acuerdo con Mertens (2010), el tratamiento debe aplicarse a varias personas para comenzar a
pensar en generalizaciones y evaluar el efecto en distintos tipos de individuos. En este sentido, los proce-
dimientos para el estímulo se deben estandarizar y describir en detalle, además de que deben implemen-
tarse de forma cuidadosa. Asimismo, resulta importante que la medición de la variable dependiente se
encuentre plenamente fundamentada y documentada.
El asunto de la generalización es debatible, pero en la historia experimental los diseños de caso único
(de cierta manera una forma de preexperimentos) han contribuido al desarrollo del conocimiento en
diversos campos. Sobre el tema de la generalización en los estudios de caso en general, volveremos más
adelante.
Veamos algunos de estos diseños, conforme a la simbología de Mertens (2010), así como de Williams,
Grinnell y Unrau (2005) y León y Montero (2003).

Diseños experimentales (n = 1) AB
Este diseño es el más sencillo y abarca dos etapas: la fase A, en la cual no hay tratamiento [en términos de
León y Montero (2003), se establece la “línea base” o tendencia], y la fase B, en la que se administra un
tratamiento y se mide(n) la(s) variable(s) dependiente(s) durante la terapia. Así, el diseño “AB es un plan
en el que primero se establece la línea base —sin tratamiento— y una vez estabilizada se produce la inter-
vención y la medida de la nueva serie” (León y Montero, 2003, p. 313).
Por ejemplo, una madre que ha perdido el “sentido de vida” por el fallecimiento de un hijo. Con el
fin de lograr que esta mujer recupere dicho sentido, se plantea un estímulo: sesiones terapéuticas con un
psiquiatra experto en el manejo de “duelos emocionales” y psicología transpersonal; sin embargo, antes de
aplicarse el tratamiento experimental, se establece la línea base (se mide su sentido de vida en por lo menos
dos ocasiones, para verificar el nivel de la participante en la variable). Una vez que se evaluó su condición
con toda precisión, se administra el estímulo (sesiones, digamos durante 12 semanas) para posteriormen-
te volver a valorar el sentido de vida y analizar su evolución.
Otro ejemplo podría ser el de un tratamiento para reducir la dependencia o adicción hacia el con-
sumo de alguna droga ilegal y dañina o estupefaciente (como la cocaína). Primero, se estima el grado en
que el participante realmente es adicto. En segundo término, se administra el tratamiento. Finalmente,
se vuelve a medir para examinar el puntaje-ganancia (aumento o disminución propuesta hipotéticamen-
te en la variable dependiente, según sea el caso). Este diseño podría representarse como se muestra en la
figura 4.6.
14       Capítulo 4  Estidos de caso

  Figura 4.6 Diseño AB del estudio de caso experimental.

70

60
Nivel del sentido de
vida (medición en la 50 2
variable dependiente)
40
Escala de 10 a 70
30 2 2
X
20
(inicio)

10 2 2 2

Primera Segunda Tercera Primera Segunda Tercera
medición medición medición medición medición medición
posterior al posterior posterior
inicio y
durante el
tratamiento

2 = Medición Semanas (12)

= Línea base X = Tratamiento Tendencia posterior =

En la notación tradicional que se muestra en el capítulo siete del libro, el diseño se representaría así:
01 02 03 04 05 06 (en un periodo de 12 semanas)

X continúa implementándose

El estímulo puede implicar días, meses o aun años (método educativo, terapia física de rehabilitación,
proceso de mejora continua, innovación específica en manufactura, etc.). Cabe señalar que no es un dise-
ño donde primero se administren prepruebas, luego se implemente el estímulo, se suspenda este, y final-
mente se apliquen pospruebas, sino que las mediciones se realizan durante la administración del
tratamiento (simultáneamente). De este modo, se monitorea el funcionamiento del estímulo. Es decir, el
esquema no sería así:
01 02 03 04 05 06 (no es antes y después, sino antes y durante)

X ya está suspendida cuando se
administraron las prospruebas

Desde luego, el diseño puede extenderse a una tercera etapa sin tratamiento (ABA).
En estos diseños AB se pueden producir diferentes esquemas de resultados, lo cual podemos apreciar
en las gráficas de la figura 4.7.

Diseños experimentales (n = 1) ABAB
Se trata de una extensión del diseño anterior: primero se establece la “línea base” o tendencia, pero no hay
tratamiento o intervención (etapa A); luego, se implementa la fase B, en la que se administra un trata-
miento y se mide. Posteriormente, se retira el tratamiento y se continúa con la evaluación (otra vez A).
Finalmente, se vuelve a introducir el tratamiento y se mantiene el monitoreo (otra vez B).
Metodología de la investigación 15

  Figura 4.7 Esquemas de resultados en el diseño AB.
!
Incremento durante Decremento durante
la intervención la intervención

X X

X X X X X
X X X X X

Diagnóstico o Mediciones Diagnóstico o Mediciones
mediciones durante la mediciones durante la
previas intervención previas intervención

Mantenimiento durante Altibajos durante la
la intervención (sin intervención (no hay una
cambios) tendencia definida)

X X

X X X X X
X X X X X

Diagnóstico o Mediciones Diagnóstico o Mediciones
mediciones durante la mediciones durante la
previas intervención previas intervención

Lo importante de este diseño es mantener el seguimiento de la evolución de la(s) variable(s)
dependiente(s) durante las fases (medición constante).
Un reto de este diseño es que pudieran afectar todas las fuentes de invalidación interna señaladas por
Campbell y Stanley (1966) y que se revisaron brevemente en el capítulo siete del libro impreso, pero que se
amplían en el próximo capítulo de esta página web: “Diseños experimentales: segunda parte”, principalmen-
te la historia; además de que es factible que actúen otras explicaciones rivales (por ejemplo, el terapeuta que
conduzca las sesiones puede establecer una comunicación con la participante que no necesariamente ocurriría
con otras personas de un modo similar). El desafío es posible afrontarlo a través de diversas acciones (algunas
de ellas serán consideradas más adelante), pero la principal, sin lugar a dudas, consiste en que el investigador
tiene que mantenerse “muy cerca” del desarrollo del experimento (pendiente de sucesos externos y de cam-
bios, además de aplicar varias mediciones y recolectar datos cualitativos complementarios, producto —por
ejemplo— de entrevistas y observación). La esencia de un diseño ABAB se presenta en la figura 4.8.
En el siguiente capítulo, el 5, del centro de recursos en línea, se muestran los diseños experimentales
cronológicos que tienen esquemas similares, pero se trata de grupos, en tanto que las pospruebas se admi-
nistran después de la aplicación del estímulo o tratamiento, no durante su implementación.
Asimismo, podemos tener diseños BAB (intervención o estímulo, retirada y reintroducción), que se
usan cuando alguna persona requiere urgentemente un tratamiento (por ejemplo, un adicto que necesita
atención de emergencia).
También existen diseños más complejos ABABA. Tal sería la situación si estamos experimentando
con un proceso de capacitación o un método para que un individuo deje de fumar:

Sin tratamiento Con tratamiento Sin tratamiento Con tratamiento Sin tratamiento

A B A B A
16       Capítulo 4  Estidos de caso

  Figura 4.8 Diseño ABAB.

A B A B
Variable
dependiente Establecer línea Introducción del Retirada del Reintroducción
base o tendencia tratamiento, tratamiento, del tratamiento,
(nivel de la estímulo o estímulo o estímulo o inter-
dependiente) intervención intervención vención

Medición continua de la variable dependiente

Periodo
Los estudios de caso transversales implican recolectar datos cuantitativos sobre la unidad en un
momento único y no se manipula una intervención o tratamiento (Xiao, 2009a). En síntesis, son una
especie de estudios no experimentales, cuyo alcance puede ser descriptivo, correlacional o explicativo, pero
toman en cuenta una sola entidad de análisis, por ejemplo, diagnosticar el estado de salud física de una
persona y las causas a través de distintas pruebas en diferentes cuestiones (funcionamiento pulmonar,
resistencia, presión arterial, nivel de ácido úrico, plaquetas, etc.) o analizar la conveniencia de invertir en
un país a la luz del análisis de sus sistemas económico, social, político, jurídico, educativo, etcétera).
Debemos considerar también los estudios de caso longitudinales, en los cuales podemos reconstruir el
caso a través del tiempo (Aaltio y Heilmann, 2009). La modalidad mínima implica dos puntos en el
tiempo, por ejemplo, antes y después de un evento o incidente crítico (McDonald, 2009). Tal sería el caso
de una empresa antes y después de una reingeniería o reestructura, un paciente previa y posteriormente a
un infarto o la eficiencia de un proceso industrial antes y después de la introducción de una nueva maqui-
naria. Estos diseños resultan muy apropiados para medir y analizar cambios.
La validez de los estudios de caso de corte cuantitativo (experimentales o no experimentales) requiere
una serie de tácticas:
• La planeación debe ser muy cuidadosa, es decir, desde antes de la implementación debe definirse
cómo se va a validar la información y establecer la confiabilidad (Bell, 2010).
• La documentación de la evidencia debe ser sistemática, completa y ofrecer detalles específicos del
desarrollo de la investigación.
• Es necesario utilizar fuentes múltiples de datos e información.
• Se requiere establecer la cadena de evidencia sobre la causalidad. Esto significa que un investigador
externo debe monitorear la derivación de cualquier evidencia, desde el planteamiento hasta el repor-
te de resultados.
• Si involucra individuos, grupos u organizaciones, resulta indispensable verificar los resultados con los
participantes (un elemento que se utiliza en las investigaciones cualitativas -chequeo con miembros-,
puede aplicarse a los casos cuantitativos).
• Elaborar predicciones sobre resultados, basadas en la teoría y al final comprobar que estas se hayan
cumplido, lo que ayuda a soportar el caso (Yin, 2013). Si cuando contrastamos los resultados con la
teoría y las hipótesis o proposiciones encontramos diferencias, debemos revisar y ajustar las hipótesis
y replicar nuevamente el caso, hasta que logremos responder al planteamiento del problema.
• Evaluar cuidadosamente cómo los detalles del caso explican los resultados.
• Recordemos que los experimentos y estudios de caso confían más bien en una generalización analítica,
mientras que las investigaciones no experimentales confían en una generalización estadística (The
SAGE Glossary of the Social and Behavioral Sciences, 2009r).
• Los procedimientos utilizados deben documentarse en cada estudio de caso (todo el proceso)
(Thomas, 2011).
• La base de datos debe ser accesible para que otros investigadores puedan establecer la validez y con-
fiabilidad de los procedimientos (fines de auditoría). Yin (2013), Gerring (2007) y Hancock y
Metodología de la investigación 17

Algozzine (2006) sugieren que la base de datos debe contener los materiales tabulados (matrices de
datos), los documentos centrales (con permiso de la persona que constituye el caso o los líderes de la
organización o comunidad involucrada), así como los esquemas y procedimientos de análisis.
Los análisis estadísticos del estudio de caso dependen del planteamiento del problema, las hipótesis
(si se establecieron), el diseño específico y el tipo de datos recolectados. Al igual que en otras clases de
investigación, el análisis consiste en examinar, categorizar, tabular, probar y evaluar la evidencia obtenida,
para valorar las proposiciones iniciales del estudio (planteamiento). Asimismo, es necesario idear una
estrategia analítica general, que incluya la definición de prioridades respecto de lo que vamos a analizar y
las razones de ello.
Yin (2011), Burns (2009), Campbell (2009) y Mills, Durepos y Wiebe (2009) proponen que la estra-
tegia de análisis debe: 1) confiar en la teoría, 2) organizar y efectuar el análisis sobre la base de las propo-
siciones (hipótesis) o por las preguntas de investigación (una por una o vinculándolas), 3) reflexionar y
evaluar explicaciones rivales (nuestras hipótesis o proposiciones frente a otras) y 4) desarrollar cuidadosa-
mente la descripción del caso y su contexto. Tal descripción puede ser cronológica (por ejemplo, de una
empresa exitosa, por las etapas que atravesó) o por subunidades del caso (como serían las áreas de una
empresa o sistemas del cuerpo humano).
A veces, las explicaciones rivales surgen durante la recolección de los datos. Por ejemplo, podemos
realizar un estudio de caso en una empresa (digamos, del clima organizacional).3 Tal variable es propia del
estudio de caso4 porque el clima de cada organización es único, esto es, no existen dos empresas con la
misma historia, liderazgo, estructura, entorno, procesos y productos (es decir, que en todo sean iguales).
Dicho diagnóstico puede reflejar un clima organizacional elevado (en cuanto a moral, motivación, orgu-
llo, etc.). En este caso, la explicación podría ser que es una compañía con un liderazgo positivo, cuyo
personal se involucra en su trabajo, donde la comunicación fluye honesta y abiertamente, se facilita la
cooperación, el rumbo de la empresa se ha expuesto a los empleados y las decisiones les han sido explica-
das. Sin embargo, debemos descartar otras explicaciones rivales como:

• Explicación rival 1: efecto Hawthorne (el clima organizacional es elevado simplemente porque se está
llevando a cabo un diagnóstico y el personal ha desarrollado expectativas altas sobre cambios favora-
bles que resulten de él).
• Explicación rival 2: se realizó recientemente un ajuste salarial favorable.
• Explicación rival 3: en el país o región fue elegido como presidente o gobernador una persona muy
estimada por los trabajadores, lo cual generó un efecto de entusiasmo social generalizado.
• Otras razones.
Por ello, las fuentes de datos deben ser variadas y los rubros amplios, profundos y completos; además,
la información del contexto resulta fundamental.
Asimismo, Price (2008b) sugiere que en los estudios de caso de esta naturaleza se establezcan los
límites entre el caso en sí y su entorno.

Cualitativos
En los estudios cualitativos de caso, el ambiente o contexto está constituido por el mismo caso y su entor-
no, pues los límites entre uno y otro son más difíciles de establecer. Asimismo, no se utilizan herramientas
estandarizadas ni se establecen categorías a priori. Al igual que otros diseños cualitativos, la materia prima
de los datos la constituyen las narrativas verbales, escritas y audiovisuales, incluyendo artefactos (Flick,
2013, Creswell, 2013b, Hernández-Sampieri y Mendoza, 2012 y Norlyk y Harder, 2010). El proceso es

3 Un estudio de caso de esta naturaleza requeriría no solo de un diagnóstico del clima organizacional, sino de un análisis profundo de sus causas
y efectos.
4 Salvo que realicemos una validación de un instrumento de medición, como el ejemplo de Hernández-Sampieri (2005) que requiere varias empre-
sas e instituciones; o bien que pretendamos vincular el clima con otras variables en diferentes organizaciones.
18       Capítulo 4  Estidos de caso

el mismo que en otras investigaciones cualitativas (inmersión inicial para que el investigador evalúe si el
caso a considerar reúne las condiciones que requiere, inmersión final, recolección de datos, análisis, etc.).
Gran parte de los estudios de caso de este tipo tienen como objetivo documentar una experiencia o even-
to en profundidad o entender un fenómeno desde la perspectiva de quienes lo vivieron. El estudio de caso
cualitativo no persigue ninguna clase de generalización. La transferencia es muy difícil de alcanzar, es
decir, regularmente se requieren varios estudios de caso (como en el descubrimiento de las tumbas de
faraones egipcios de la antigüedad, se establecieron cuestiones comunes una vez que se consideraron varios
casos).
En el capítulo 15 del libro se mencionó que el diseño de estudio de caso bajo la óptica cualitativa se
iba a ampliar en la página web. Es tiempo de responder a esta promesa.
Este diseño es muy apropiado para planteamientos descriptivos, cuyas preguntas de investigación se
establecen para desarrollar un entendimiento profundo de cómo diferentes casos proporcionan informa-
ción sobre un problema o ayudan a comprender una unidad relevante (Creswell et al., 2007). La informa-
ción que se obtiene generalmente está constituida por descripciones de casos vinculados a la pregunta de
investigación y datos completos de un caso significativo e ilustrador así como por categorías vinculadas
con los casos. Asimismo, Creswell (2013b) señala que esta estrategia de indagación sirve para analizar
procesos y diversidades, sobre todo perspectivas en relación con el caso y su contexto.
En el citado capítulo se incluyó una tabla comparativa de las características de los principales diseños
cualitativos (15.2), a la cual habría que agregarle la siguiente columna referente a los estudios cualitativos
de caso (tabla 4. 3).
  Tabla 4.3 Características del estudio de caso cualitativo.
Característica Estudios de caso cualitativos
Tipo de problema de investigación más Cuando se encuentra un caso enmarcado por el tiempo y el espacio que
apropiado para ser abordado por el diseño. puede informar sobre un problema.
Disciplinas en las cuales se cuenta con más Psicología, derecho, ciencias de la salud ciencias administrativas (negocios)
antecedentes. e ingeniería.
Unidades comunes de análisis. Evento, proceso, programa, actividad, organización, un individuo.
Instrumentos de recolección de los datos Entrevistas, observaciones, documentos, artefactos.
más usados.
Estrategias de análisis de los datos. Descripción del caso y su contexto, categorías del caso o entre casos.
Producto (en el reporte). Descripción de un caso o varios y explicación de las causas que lo(s)
produjeron(s) y el fenómeno o planteamiento estudiado.

Estos diseños pueden parecer similares a los narrativos, sobre todo cuando se estudia a un único
individuo, pero tienen diferencias. En los estudios cualitativos de caso interesa una o varias unidades
seleccionadas en relación con su contexto y al problema de investigación. Las investigaciones narrativas se
enfocan en los individuos y sus historias respecto del planteamiento (Creswell et al., 2007). Por otro lado,
en el estudio de caso la descripción y presentación puede ser o no cronológica, mientras que en los diseños
narrativos siempre debe existir una cronología de hechos. En la recolección de datos dentro de los estudios
de caso se utilizan regularmente múltiples instrumentos, mientras que en los diseños narrativos se recaban
historias individuales.

Los estudios de caso de corte cualitativo son diseños en los cuales el investigador explora un sistema
especificado (un caso) o múltiples sistemas definidos (casos) a través de la recopilación detallada
de datos y en profundidad, utilizando múltiples fuentes de información (por ejemplo, observaciones,
entrevistas, material audiovisual y documentos e informes) y reporta una descripción de los casos y
las categorías vinculadas al planteamiento que emergieron al analizarlos.

Un ejemplo de estudio de caso cualitativo sería una investigación que pretenda analizar a un asesino
en serie (sus motivaciones para cometer los crímenes, sus experiencias derivadas de ellos, su modo de
Metodología de la investigación 19

operar, los patrones que ligan a los asesinatos entre sí, la forma en que elige a sus víctimas, su estado de
salud mental, sus antecedentes, el contexto de sus actos, etc.). Una vez más, el estudio no parte de hipó-
tesis ni de concepciones preestablecidas, sino que las categorías y entendimiento se generan conforme se
recolectan y analizan los datos. Además, cada asesino vive condiciones distintas y posee una historia de
vida diferente, por lo que su evaluación es única (a pesar de que comparta algunos rasgos o forma de
operación con otros). Asimismo, se podría implementar este diseño para analizar juicios, debates políti-
cos, casos clínicos, etcétera.
Para establecer la dependencia (confiabilidad) y credibilidad del caso cualitativo es conveniente:
• Documentar la evidencia de manera sistemática y completa, así como ofrecer detalles específicos del
desarrollo de la investigación.
• Utilizar fuentes múltiples de datos e información.
• Realizar triangulación de datos y entre investigadores.
• Establecer la cadena de evidencia sobre la cronología y vínculos entre categorías.
• Verificar con la persona o personas pertinentes los resultados (chequeo con participantes y observa-
dores).
• Evaluar meticulosamente cómo los detalles del caso explican los resultados (categorías y teoría emer-
gente).
• Documentar los procedimientos utilizados.
• La base de datos debe ser accesible para que otros investigadores puedan establecer la confiabilidad de
los procedimientos (fines de auditoría), y debe contener los documentos centrales (con permiso de la
persona que constituye el caso o los líderes de la organización o comunidad involucrada), las notas de
campo, materiales narrativos (ejemplo, transcripciones de entrevistas), así como los esquemas y pro-
cedimientos de análisis.
Otros aspectos que se deben considerar son la “autenticidad” y la “autoridad” (Hammersley, 2003).
Frecuentemente, los estudios de caso de corte cualitativo se dirigen sobre la base de que pueden capturar
el carácter único de una persona, situación, grupo, etc., sin que importe la generalización. El objetivo es
representar al caso de manera auténtica, en sus “propios términos” y con la autoridad que es otorgada por
quienes son parte del caso.
Creswell et al. (2007) consideran que los estudios de caso cualitativos pueden tener diversas variacio-
nes dependiendo del tamaño del caso: un individuo, varios individuos, un grupo, una comunidad, un
programa, una actividad. Asimismo, se adhieren a la tipología por intento ya revisada: intrínseco, instru-
mental y colectivo.
En el instrumental cualitativo, el investigador plantea un problema y selecciona un caso para ilustrar-
lo. En el colectivo o de múltiple casos, también se indaga un problema pero se eligen varios casos para
describirlo, analizarlo e ilustrarlo. El investigador puede seleccionar diversos casos (por ejemplo, progra-
mas) en distintos lugares o contextos, o bien, múltiples casos (programas) dentro de un único sitio o
ambiente. A menudo se escogen distintos casos para mostrar diferentes perspectivas sobre el planteamien-
to. Una vez más, se utiliza la lógica de la réplica (se repiten los procedimientos en distintos casos conside-
rados) (Yin, 2011).
Un tipo de estudios de caso cualitativos muy socorridos son los etnográficos. Pueden enfocarse en una
cultura en particular y su efecto en un proceso, grupo, evento o individuo (Creswell, 2005). En algunas
ocasiones se centran en patrones culturales y en otras, en los procesos de interacción. Desde luego, impli-
can una exploración completa de la cultura analizada (caso) y una recolección intensiva de datos sobre los
elementos culturales. Se consideran los símbolos, ritos, mitos, lenguaje, costumbres, valores, relaciones,
etc., a la vez que se utiliza toda la gama de herramientas cualitativas para recabar datos.
El mismo Creswell los subdivide en:
a) Casos culturales inusuales, extremos o extraños. Por ejemplo, la investigación de una cultura indígena
completamente alejada de los patrones urbanos y las costumbres occidentales actuales (que practique
su propia religión, tenga un bajo contacto con los medios de comunicación colectiva, se encuentre
geográficamente distante, etc.) o el de la cultura de un grupo terrorista.
20       Capítulo 4  Estidos de caso

b) Casos culturales ilustrativos. Son aquellos que pretenden mostrar un caso típico de una cultura. Por
ejemplo, un grupo representativo de la cultura de los niños abandonados de la calle de cualquier gran
urbe latinoamericana, que deben trabajar para sobrevivir.
c) Casos que se presentan en diferentes culturas (implica considerar varios de ellos, es de orden colecti-
vo). Por ejemplo, analizar diversas culturas organizacionales sexistas (que discriminan a las mujeres y
les impiden el acceso a altos puestos de la empresa).
En los estudios de caso cualitativos la selección de la(s) unidad(es) de análisis muchas veces se enfoca,
como ocurre con otros diseños cualitativos, en casos típicos, diversos, extremos, desviados, influyentes,
muy similares o completamente distintos, de acuerdo con el planteamiento del problema (Seawright y
Gerring, 2008).
Una estrategia analítica muy común consiste en identificar categorías en cada caso vinculadas al plan-
teamiento y luego buscar cuáles son comunes y construir de este modo teoría fundamentada (mezcla de
diseños). Asimismo, como resultado de los análisis se pretende lograr una interpretación más amplia de lo
que hemos aprendido mediante el examen de los casos. El investigador interpreta el significado del caso y
las lecciones asimiladas.

Mixtos
Para diversos autores, una gran cantidad de estudios de caso son mixtos porque recolectan, analizan e
integran datos cuantitativos y cualitativos provenientes de diversas fuentes (Creswell, 2013a, Hernández-
Sampieri y Mendoza, 2012, Green, 2011, Davis, 2009 y Harder, 2009).
Imaginemos casos como los que se mencionaron en el capítulo 17 del texto impreso: un diagnóstico
clínico médico o psicológico (en el cual al menos se integra evidencia proveniente de una entrevista cua-
litativa con información de los expedientes del paciente y el análisis cuantitativo de indicadores producto
de pruebas de laboratorio y mediciones como la presión arterial, el peso y la estatura), una investigación
de las causas de un accidente aéreo específico o la indagación en una escena de un crimen para evaluar lo
sucedido.
En este sentido y de acuerdo con Hernández-Sampieri y Mendoza (2008), un estudio de caso puede
seguir cualquiera de las series de los diseños mixtos:

1) Secuencial
En esta sucesión puede haber al menos tres variantes que sugieren los autores mencionados: a) un solo
caso (que en una primera etapa se aborde cuantitativamente y en una segunda cualitativamente o vicever-
sa); b) dos casos similares (un primer caso enfocado cuantitativamente y un segundo caso estudiado bajo
la óptica cualitativa o viceversa, pero siguiendo una secuencia, ya sea que los resultados de ambos casos se
manejen de manera relativamente independiente para después realizar metainferencias, o bien, que los
resultados del primer caso sirvan para desarrollar la estrategia de investigación del segundo caso); y c)
múltiples casos similares (unos investigados cuantitativamente y otros cualitativamente, ya sea que los
resultados de los casos se interpreten primero por separado y luego se efectúen metainferencias, o bien,
que los resultados de algunos casos sirvan como base para la estrategia de indagación de los otros casos).
Desde luego, como mencionan Hernández-Sampieri y Mendoza (2008), es necesario establecer la simili-
tud de los casos con bastante precisión.

2) Concurrente o simultánea
Aquí también pueden presentarse al menos tres opciones: a) un solo caso, en el cual una parte de él sea
abordada cuantitativamente y otra cualitativamente; b) dos casos similares, uno enfocado cuantitativa-
mente y el otro cualitativamente; y c) múltiples casos, unos estudiados cuantitativamente y otros cualita-
tivamente. En las dos últimas situaciones se llevan a cabo inferencias por caso y metainferencias que
abarcan los distintos casos (Hernández-Sampieri y Mendoza, 2008).
Metodología de la investigación 21

3) Anidada
En esta modalidad existen las siguientes posibilidades: a) un caso con varias unidades dentro de él y que
algunas sean abordadas cuantitativamente y otras cualitativamente, pero cada una de ellas sea tratada sis-
témicamente (como casos incrustados), por ejemplo, una empresa y sus áreas funcionales; y b) multini-
veles: cierto nivel del caso sea analizado cuantitativamente o cualitativamente, y otros niveles con la otra
aproximación.

4) Integración completa
Se trata de estudios con uno o más casos, en los cuales desde el inicio se tiene una perspectiva mixta, es
decir, se incorporan ambos enfoques en todo el proceso de indagación, obviamente recolectando y anali-
zando datos cuantitativos y cualitativos, así como mixtos (Hernández-Sampieri y Mendoza, 2008).
Herrera (2004) realizó un estudio de caso mixto. La unidad fue la misma autora (se autoanalizó).
Veamos el ejemplo con un poco de mayor profundidad y sin entrar en demasiados tecnicismos, a fin de
evitar el agobio a estudiantes que están fuera de campos médicos, psicológicos y químicos.
Ella era una paciente con 31 años de evolución con una enfermedad crónica multisistémica (lupus
eritematoso sistémico). Había sido tratada desde pequeña de muchas formas (entre las cuales se encontra-
ban la mayoría de las desarrolladas por la “medicina tradicional”). El pronóstico de diferentes especialistas
era contundente: Norma Herrera moriría en poco tiempo (cuestión de semanas o meses). Ante ello, deci-
dió abandonar todo tratamiento y suspender la medicación indicada. Se inscribe en una maestría en
desarrollo humano. Al principio de sus cursos la enfermedad siguió su evolución natural. Sin embargo,
comienza a trabajar diversas áreas de sí misma, como el manejo de sentimientos, emociones y actitudes;
la aceptación de su enfermedad (que no la resignación), el sentido de vida, la autoestima, la espiritualidad
(su relación con Dios en general), etc. Asimismo, trabaja la psicología transpersonal, la psicoterapia cen-
trada en la persona y la gestalt, la logoterapia y la terapia de reconstrucción personal. Es decir, se concen-
tra en su desarrollo integral como ser humano. De pronto, ocurre una remisión y reversión de la
enfermedad (esto es, desaparece el cuadro central). Lo anterior, a un año de haber iniciado la maestría.
Ella se cuestiona: ¿qué sucedió? y plantea un estudio de caso.
Afortunadamente, Norma Herrera (experta en estudios de química aplicada a la medicina), había
construido una base de datos con su historial clínico (entre otros rubros: origen de la enfermedad, etiolo-
gía, pronóstico, síntomas y tratamientos). Poseía mediciones de elementos tales como:5
• Hemoglobina (Hb).
• Valores de células blancas (leucocitos).6
• Valores de creatinina sérica.
• Valores de depuración de creatinina
• Urea (valores de proteínas en primera micción –matutina– y en orina de 24 horas).
• Indicadores de funcionamiento renal.
• Valores de complemento hemolítico, fracciones 3 y 4 (C3 y C4).
• Anticuerpos antinucleares y patrón de inmunofluorescencia.
Asimismo, documentó desde el inicio su proceso personal de desarrollo (anotaciones y bitácora), lo
cual incluía reflexiones sobre la aceptación de la enfermedad, la adquisición de un elevado sentido de vida,
una sólida autoestima y una sensación de crecimiento; la evolución de sus sentimientos, emociones y
experiencias en general; su acercamiento con un Ser supremo y otras cuestiones similares.
Sus explicaciones rivales eran:

5 El ejemplo está sumamente simplificado, por lo cual presentamos una disculpa a los médicos y les sugerimos que lean el estudio completo
referido en la bibliografía del libro. Asimismo, más que presentar y discutir los resultados o generar una polémica, el interés se centra en analizar
el método que utilizó Herrera (2004) como una muestra de estudio de caso mixto
6 La literatura marca que el lupus cursa con leucopenia, situación que expone al organismo a ser susceptible de sufrir infecciones constantes
(Herrera, 2004).
22       Capítulo 4  Estidos de caso

E1: “La enfermedad no era tan crítica, tal como se había documentado, pues hoy se conocen más
tipos de lupus”.
E2: “La remisión fue espontánea, natural; nada tuvo que ver el trabajo con su persona”.
Al concluir la maestría, la remisión era patente. Su estudio de caso incluyó análisis cuantitativo (de
las mediciones sobre su enfermedad a través del tiempo), análisis cualitativo (del trabajo consigo misma
efectuado durante la maestría que abarcó terapia individual y grupal), análisis mixto (relacionando
momentos y logros personales con las mediciones).
Entre sus conclusiones se destacan las siguientes:
• Tratar al paciente de manera integral y considerar a la enfermedad en retrospectiva, es decir, lo que se
encuentra detrás del síntoma (psiconeuroimunoendocrinología y desarrollo humano) es un comienzo
positivo para recuperar la salud en ciertas enfermedades, como el lupus.
• Al ser humano, bajo sistemas tradicionales, se le trata de forma separada, como si estuviese fracciona-
do, es decir, si existe una enfermedad inmune, endocrina, psíquica, neurológica; se le atiende en el
área específica y se olvida el resto. El desarrollo humano pugna por ver y considerar al individuo de
manera holística.
• El sentido de vida, la autoestima, creer en un Dios, la unión con uno mismo y la espiritualidad pue-
den ayudar notablemente a que esta clase de enfermedades se combata.
• La influencia de actitudes y pensamientos positivos sobre la enfermedad, si se procesan a nivel de
sistema nervioso, pueden influir en los sistemas inmune, endocrino y psíquico.
En pocas palabras, “más que enfermedades, hay enfermos y contextos de cómo se presentan las
primeras en los segundos” (doctor Roberto Hernández Galicia).
Bien dice el refrán popular: “Una golondrina no hace un verano”, pero el estudio de caso de
Herrera (2004) demuestra la importancia del sistema inmunológico individual ante la enfermedad.
Cabe señalar que, durante el periodo comprendido entre 2004 y principios de 2009, Norma
Herrera ha tratado exitosamente cuatro casos de niñas con más de una década padeciendo lupus con
el mismo cuadro que ella tuvo; además, en Costa Rica, en la provincia de Alajuela (Ciudad Quesada),
un caso similar de una mujer adulta joven (15 años de sufrir la enfermedad) entró a una fase de remi-
sión, al trabajar en el sentido de vida y otras áreas humanas.
Un segundo ejemplo de estudio de caso mixto, ahora conducido bajo la modalidad anidada, es el
ejemplo ya mencionado de carácter instrumental de una exitosa fábrica de calzado: Análisis de las
mejores prácticas empresariales en las áreas de administración, mercadotecnia, manufactura y desarrollo
organizacional: un estudio de caso (Arredondo, Hernández-Sampieri y Méndez, 2013), que puede
consultarse o descargarse en esta misma página web de la obra. En él se utilizó una medición percep-
tual del clima organizacional entre el nivel de empleados, un análisis cuantitativo que abarcó las áreas
de personal, producción e innovación utilizando el instrumento PDG Manufacturier de 2010, indi-
cadores estadísticos de ventas y manufactura, la aplicación del Modelo Europeo de Excelencia
Empresarial por puntaje (EFQM) en los ámbitos de la empresa donde se encontraron coincidencias
con esta herramienta, entrevistas cualitativas con el dueño de la empresa y todo el nivel gerencial, así
como con los líderes de las instituciones más importantes del sector calzado y de atención y promo-
ción empresarial en la provincia en cuestión y otra adjunta geográficamente (Secretaría de Economía
Delegación Guanajuato, Cámara de la Industria del Calzado del Estado de Guanajuato, Coordinadora
de Fomento al Comercio Exterior, Cámara de la Industria del Calzado del Estado de Jalisco), y con
una empresa considerada como competencia de la empresa analizada.
Otro ejemplo de estudio de caso mixto sería uno en el cual se pretendiera comprender los factores que
inciden en la productividad de un proceso industrial o de manufactura en una empresa. El planteamiento
debería centrarse en las variables y elementos que pueden alterarlo y que son las causas de la productividad
del objeto de estudio. Obviamente, a esta debemos cuantificarla a través de indicadores apropiados, pero
también tenemos que medir la productividad en cada fase (en el presente e históricamente, analizando
reportes y documentos previos), así como realizar observaciones sistemáticas de todo el proceso (incluso
por actividad), efectuar grupos de enfoque y/o entrevistas con actores claves involucrados en el proceso
Metodología de la investigación 23

(por ejemplo, un grupo con los supervisores y entrevistas con operarios). El estudio debería incluir datos
cuantitativos y cualitativos. Al final, el reporte de resultados incluirá una descripción detallada del proce-
so, un análisis de los determinantes o causas de la productividad, problemas potenciales, elementos a
mejorar y sugerencias.

Por su temporalidad
Esta tipología ya ha sido contemplada en los estudios de caso cuantitativos, por lo que basta decir que la
clasificación (que se aplicaría a cuantitativos, cualitativos y mixtos), se resume en: a) temporales (duración
no prolongada, regularmente un año o menos) y b) longitudinales o evolutivos (más de un año y varias
etapas de recolección de los datos o mediciones).

Por su alcance
Esta tipología ha sido considerada por diversos autores [por ejemplo: Yin (2013), Woiceshyn (2009),
Tobin (2009) y Eisenhardt (2007)]. Antes de continuar la lectura, recomendamos al lector revisar el capí-
tulo cinco de Definición del alcance de la investigación. De acuerdo con ella, los estudios de caso se subdi-
viden en exploratorios, descriptivos y explicativos.
Los estudios de caso exploratorios y descriptivos narran una historia (lo que aconteció y cómo suce-
dió), pero no precisan la causalidad (por qué ocurrió) (Woiceshyn, 2009). Simplemente incluyen una
cronología de los hechos o eventos. Por ejemplo, un estudio exploratorio clínico puede revelar que un
paciente tiene antecedentes familiares con enfermedades cardiacas (digamos, su padre), es un individuo
básicamente sedentario y consume una dieta alta en grasas, y sufrió un ataque al corazón. Un estudio de
caso descriptivo puede narrar la historia de un negocio que ha experimentado una caída de ventas y
ganancias, así como señalar que sus empleados están desmotivados y la dirección ha reducido la inversión
en investigación y desarrollo. En ambos casos no se tiene certeza de las causas precisas del infarto o de la
disminución y cuánto contribuyó cada una. Se intuyen, pero no hay demostración de causalidad, mien-
tras que en los estudios de caso explicativos se presentan con detalle.
Los estudios de caso exploratorios se caracterizan por la falta de investigación previa detallada y la
ausencia de proposiciones e hipótesis (Streb, 2009 y Eisenhardt, 2007). Además, uno de sus objetivos es
precisamente identificar hipótesis que puedan someterse a prueba en investigaciones subsecuentes. Son un
paso preliminar para formular preguntas de investigación más refinadas.
Los estudios de caso explicativos comienzan con la descripción del problema de investigación o fenó-
meno. No se pueden señalar las causas de algo, ya sea un infarto, la baja productividad de un proceso o la
disminución de ventas de una empresa hasta que se describe, es decir, después de que podamos exponer
cómo se manifiesta y qué secuencia de eventos lo precede. Desde luego, una secuencia temporal de even-
tos no es un indicador suficiente de las relaciones de causa y efecto; para descubrirlas, el investigador debe
profundizar su análisis.

Clasificación de estudios de caso clínicos (en medicina, enfermería,
psicología y ciencias de la salud en general)
Dugard, File y Todman (2011), basados en el modelo de R. R. Robey para el proceso de investigación
clínica (Robey, 2004), el cual consta de cinco fases con distintos propósitos, sugieren los diseños de estu-
dios de caso que se presentan en la tabla 4.4.

  Figura 4.8 Tipos de estudios de caso en la investigación clínica, por propósito, de acuerdo al modelo de Robey.7

Fase Propósito Estudio de caso (diseño)
I Identificar un efecto terapéutico y estimar su magnitud. Exploratorio cualitativo de un caso o unos cuantos
casos.

7 Hernández-Sampieri y Mendoza (2012), quienes lo adaptaron de Dugard, File y Todman (2011).
24       Capítulo 4  Estidos de caso

Fase Propósito Estudio de caso (diseño)
II Explorar las dimensiones del efecto terapéutico y prepa- Experimento con un solo caso o unos cuantos casos
rar una intervención o ensayo clínico. y estudios para establecer confiabilidad y validez.
III Determinar la eficacia, eficiencia y/o efecto de una Experimento o ensayo controlado aleatorio (ECA, o
intervención o ensayo clínico (incluyendo medicamentos RTC por sus siglas en inglés).
y toda clase de tratamientos). Réplicas de casos independientes pero en condicio-
nes de máximo control.
IV Probar la eficacia, eficiencia y/o efecto de un trata- Experimentos con un caso o casos múltiples y expe-
miento en una población definida y variantes de los rimentos de campo.
protocolos. Estudios de caso no
experimentales y
longitudinales o de
seguimiento pero en
condiciones de máximo control.

V Conocer quién se beneficia con el tratamiento, en qué Estudios de caso múltiples de la eficiencia en
condiciones y a qué costo. costos.

Desde luego, en todos estos diseños se debe observar la ética de la investigación, que se explica en el
capítulo dos de esta misma página web. Además, dada la cantidad de variables y características individua-
les que intervienen en la investigación clínica, es importante replicar casos y administrar los tratamientos
en distintas circunstancias.
Los estudios de casos clínicos han sido empleados por décadas en la medicina y las demás ciencias de
la salud (Kazdin, 2010). Un ejemplo histórico es el estudio en los años cincuenta del paciente “H. M.”,
en el cual se experimentó la resección bilateral de la porción media del lóbulo temporal en función de la
memoria. Los resultados dieron pie a diversas publicaciones sobre la epilepsia, la memoria y la función del
lóbulo temporal (Paslawski, 2009).
Un ejemplo de un estudio de casos múltiples podría ser analizar los efectos de tratar con insulina la
diabetes mellitus tipo 1 en diversos pacientes. Sin embargo, al implementar investigaciones de esta natu-
raleza, sobra decir que debe ser observado el máximo rigor (Joerg y Bigby, 2007).

GENERALIZACIÓN
El tema de la generalización de los resultados del estudio de caso es un asunto sumamente debatido y debe
abordare desde diferentes ópticas.
La mayoría de los autores es contundente: los resultados de los estudios de caso no pueden generali-
zarse desde un sentido estadístico o probabilístico (Yin, 2011 y Mills y Durepos, 2012). Asimismo, esta
cuestión ha sido discutida ampliamente en el capítulo relativo al muestreo en la obra impresa de
Metodología de la investigación, 6ª edición.
Sin embargo, hay otra clase de generalización que es posible utilizar mediante los estudios de caso: la
generalización analítica o naturalista (Yin, 2013 y The SAGE Glossary of the Social and Behavioral
Sciences, 2009r), es decir, efectuar generalizaciones a casos o situaciones similares. Además, puede operar
la transferencia ya considerada en la parte cualitativa de dicho libro.
Los estudios de caso pueden ayudar o contribuir, tanto en las cien-
Estudios de caso Con frecuencia se
cias físicas o naturales como en las sociales a establecer regularidades y
utilizan como pilotos de investigaciones patrones, anomalías y excepciones (Thomas, 2011a). Apoyan la generali-
más amplias. zación, pero sus conclusiones no son definitivas. En este sentido, su papel
es complementario a otros diseños. Como apunta Eidlin (2009), frecuen-
temente los estudios de casos se implementan por la singularidad de la
unidad de análisis y con propósitos descriptivos, mientras que en otras ocasiones son el inicio o la base
para posteriores indagaciones que establezcan la generalización o la extrapolación a una población o uni-
verso. Ahora bien, el investigador no puede simplemente asumir que un caso es típico, debe demostralo
Metodología de la investigación 25

(Eidlin, 2009). Desde luego, como señala Paslawski (2009), el tamaño de muestra en un estudio de un
caso por definición es extremadamente limitado (n=1), lo cual implica una debilidad desde el paradigma
positivista o empirista, pero cuando se compilan varios estudios de caso con factores comunes y resultados
similares, se comienza la tarea de generalización, más aún si las unidades son heterogéneas. La extrapola-
ción se realiza, al igual que en los experimentos, después de múltiples réplicas de casos representativos y
análogos, además de que se encuentren patrones constantes con claridad. Sin embargo, recordemos que el
estudio de caso es sumamente contextual (Mills y Durepos, 2012). Como dice Roberto Hernández
Sampieri: “conocimiento por acumulación de evidencias”.
Bell (2010) comenta que la transferencia o generalización analítica dependen del nivel se semejanza
del caso con otros de su tipo y prefiere utilizar el término “relacionabilidad” (relación con otros casos) en
lugar de generalización.

ROL DE LA TEORÍA EN LOS ESTUDIOS DE CASO
En los estudios de caso como en cualquier tipo de diseño o método se realiza una intensiva revisión de la
literatura y se desarrolla un marco teórico apropiado. De acuerdo con Hernández-Sampieri y Mendoza
(2012), la teoría:
1. Es útil para especificar qué se va a explorar.
2. Ayuda a definir la naturaleza del caso a estudiar y su contexto.
3. Orienta las descripciones y resultados obtenidos.
Algunos autores consideran que el estudio de casos sirve para construir y probar teoría con ciertas
estrategias analíticas (por ejemplo: Hak y Dul, 2009, Starke y Strohschneider, 2009, Dul y Hak, 2008,
Eisenhardt y Graebner, 2007, y Eisenhardt, 1989). Pero, dada la naturaleza introductoria de este capítu-
lo, no se profundizará en esta polémica. A quien se interese por ella le recomendamos consultar las fuentes
citadas en este mismo párrafo. Simplemente mencionaremos el proceso, de acuerdo con Hak y Dul
(2009):
Paso 1: formular la proposición teórica que será sometida a prueba. En los estudios de caso es una afirma-
ción sobre las características de los casos individuales. Una proposición respecto de una condi-
ción necesaria es un ejemplo: “X es necesaria para Y”.
Paso 2: seleccionar un caso apropiado de acuerdo con el marco teórico y el planteamiento. Los criterios
para la elección del caso pueden diferir si se enfoca más bien desde la variable independiente o
la independiente. En el diseño centrado en la variable independiente, se selecciona un caso en
el que está presente Y —dependiente— (y un patrón esperado se formula sobre el valor de la
variable independiente X). En el diseño enfocado en la variable dependiente se escoge un caso
en el cual X está ausente (y un patrón esperado se formula sobre la variable dependiente Y).
Paso 3: especificar la hipótesis del caso (debe formularse como un patrón esperado). En el caso en el cual
el resultado Y está presente, el patrón esperado es “X está presente”. En el caso en que la con-
dición es que X está ausente, el patrón esperado es “Y está ausente”
Paso 4: medir las variables relevantes de manera confiable y válida. En el ejemplo, la medida implica
determinar si X está presente o ausente, o bien, si Y se encuentra presente o ausente. El resul-
tado de esta medición es el patrón observado.
Paso 5: probar la hipótesis. La prueba consiste en comparar el patrón observado con el patrón esperado.
En el ejemplo actual, la prueba consiste en determinar si X está presente (en el diseño de la
variable independiente) o si está ausente Y (en el diseño de la variable dependiente).
Paso 6: establecer el resultado de la prueba. El resultado es una confirmación o no de la hipótesis. En el
ejemplo, la hipótesis será rechazada si X está ausente (en el diseño de la variable independiente)
o si Y está presente (en el diseño de la variable dependiente).
Paso 7: formular las implicaciones del resultado de la prueba de la teoría. Las conclusiones acerca de la
robustez de una afirmación teórica no pueden establecerse sobre la base de una sola prueba,
sino sólo después de una serie de pruebas. Por lo tanto, discutir las implicaciones de un resul-
26       Capítulo 4  Estidos de caso

tado de la prueba implica siempre compararlo con los resultados de pruebas anteriores en una
serie de réplicas.
En el estudio de caso, el investigador puede obtener una imagen detallada de procesos individuales y
revelar diferencias entre varios casos. Si se agregan más unidades o casos es factible lograr una compren-
sión más profunda de los acontecimientos, fenómeno o planteamiento del problema y perfeccionar el
marco conceptual hasta que casos adicionales ya no añadan información novedosa o distinta (“satura-
ción”) (Starke y Strohschneider, 2009).
En lo particular, un caso crítico puede ser utilizado para confirmar, desafiar o ampliar una teoría
existente a través de probar proposiciones relacionadas o sugiriendo explicaciones alternativas. Los casos
extremos pueden constituir instancias para documentar y analizar un fenómeno por su singularidad u
ocurrencia poco frecuente (Xiao, 2009a).

REPORTE DE LOS ESTUDIOS DE CASO
Yin (2013) establece diferentes formatos para elaborar el reporte de resultados de los estudios de caso:
1. Analítico lineal. Este formato es como el de cualquier reporte de resultados (tema cubierto en los
capítulos 11 y 16 del libro impreso) y tal vez sea el más común, por lo que no entraremos en detalles.
El índice de un reporte de este tipo sería:
• Introducción.
• Planteamiento del caso y el problema de investigación.
• Revisión de la literatura.
• Método.
• Resultados.
• Discusión.
Tomando como referencias a Sekaran y Bougie (2013), Hernández-Sampieri y Mendoza (2008) y
Budgell (2008), otra estructura lineal para presentar un estudio de caso sería:
• Resumen: preámbulo (dos oraciones que enuncien el caso y contexto), presentación del caso en
unas pocas líneas, manejo del caso y principales resultados en unas cuantas oraciones y discusión
(principales resultados e inferencias, también en pocas sentencias).
• Introducción: prefacio para colocar el estudio en su contexto (histórico, geográfico, social, de disci-
plina o campo profesional, etc.), presentación muy breve de casos similares, retos y limitaciones del
estudio (obviamente centrándose en el caso), procedimientos centrales y utilidad que tiene revisar
el caso para el lector.
• Revisión de la literatura.
• Presentación del caso: contexto completo del caso, su abordaje (cuantitativo, cualitativo, mixto;
transversal o longitudinal; número de casos y diseño específico), unidades o participantes, procedi-
mientos, tiempos (duración del proyecto en general y por etapa) y resultados.
• Discusión: explicaciones, inferencias, metainferencias, conclusiones, alcances y limitaciones, reco-
mendaciones, lecciones aprendidas y planes de trabajo para resolver problemas e implementar solu-
ciones y líneas de acción futura sobre casos similares, así como recomendaciones en aspectos de
investigación (método y análisis).
• Reconocimientos.
• Referencias.
• Anexos.
Sin embargo, algunos autores prefieren invertir parte del orden y comenzar con la introducción y el
planteamiento, es decir, pasan de inmediato a los resultados y la discusión, y dejan para el final tanto
la revisión de la literatura como el método.
2. Estructuras comparativas. Los mismos datos son presentados mediante diferentes modelos conceptua-
les. Desde luego, deben existir al menos dos modelos para utilizar este formato. El fin de este tipo de
Metodología de la investigación 27

reporte es evaluar el grado en que los resultados del caso embonan en cada modelo. Si suponemos que
el estudio de caso es una evaluación del clima organizacional, los resultados podrían explicarse por
dos modelos: el de Hernández-Sampieri (2005) y el de Parker et al. (2003).8 Entonces, se comparan
tales resultados frente a ambos modelos. En la medida que encajen con estos y se presente congruen-
cia entre los modelos, se considerarán con mayor validez.
El estudio de caso operaría de la siguiente manera:
a) El investigador considera las variables o conceptos que presenta cada modelo.
b) Recolecta datos sobre tales variables o conceptos (de los dos modelos) y los analiza.
c) Presenta los resultados de acuerdo con cada modelo.
d) Idealmente, los resultados de ambos modelos deben ser consistentes.
3. Cronológico. Cuando se opta por este formato, la presentación de resultados se realiza por fases del
estudio de caso. Por ejemplo, si evaluamos a una comunidad indígena mediante un método cualita-
tivo, podemos presentar los resultados por etapas:
• Inmersión en el caso y contexto.
• Recolección inicial de los datos: primeras entrevistas.
• Resultados preliminares: observación y entrevistas a líderes.
• Resultados definitivos: observación, recolección de materiales y entrevistas con los pobladores.
• Discusión.
4.Construcción de teoría. Un formato donde el caso se presenta de tal forma que cada parte (hipótesis,
conceptos, etc.) del reporte revela un aspecto de la teoría.
5. Sin estructura. Cuando no hay un orden, hay quienes escriben el reporte conforme avanza el estudio
de caso, aunque siempre hay narrativa (Creswell et al., 2007).
En cualquier situación es importante que el caso se redacte y presente adecuadamente.

RECOMENDACIONES PARA LOS ESTUDIOS DE CASO
Yin (2013 y 2011), Farquhar (2012), Green (2011), Thomas (2011b), Elger (2009), Aaltio y Heilmann
(2009) y Hernández-Sampieri y Mendoza (2008) hacen algunas recomendaciones para los estudios de
caso, entre las que se destacan las siguientes:
• El caso debe ser significativo y de interés para un grupo, una comunidad y/o una sociedad.
• El caso tiene que ser una instancia de una clase de fenómenos que proporcione un marco analítico
para que el estudio sea implementado y los resultados iluminen el planteamiento, el conocimiento y
la teoría.
• El caso es estudiado holísticamente, por lo que no debe restringirse a ciertas áreas o algunos cuantos
lugares o personas.
• Se recaba la mayor evidencia posible y frecuentemente se triangulan datos y fuentes.
• Se considera que el caso puede concluirse cuando se responde de manera satisfactoria al planteamien-
to del problema.
• El caso debe ser analizado desde diferentes perspectivas (por ejemplo, si es una organización, el abor-
daje debe incluir a la alta dirección o gerencia, las diferentes áreas, el sindicato y los trabajadores, los
clientes y proveedores y demás participantes).
• El caso tiene que estar contextualizado y es necesario definir con la máxima claridad posible los lími-
tes entre el contexto y el caso (si no los hay, explicarlo).
• El estudio debe ser conducido con una enorme sensibilidad, ya que normalmente tratamos con situa-
ciones humanas complejas. Respeto, humildad, interés genuino y humanidad en fuertes dosis.
• Es necesario estar preparado para manejar grandes volúmenes de datos en múltiples formas.

8 Este modelo se aborda en el capítulo siete de la parte impresa de esta edición.
28       Capítulo 4  Estidos de caso

• Antes de iniciar el estudio debe charlarse con todos los participantes, demostrarles la utilidad del
estudio para ellos y para un campo científico determinado. Es indispensable asegurar el anonimato.

EJEMPLOS DE ESTUDIOS DE CASO EN DIFERENTES CAMPOS O
PROFESIONES
Veamos de manera breve diversos ejemplos de estudio de caso en distintas disciplinas y posibles aplicacio-
nes.

Ciencias administrativas
En el campo de los negocios y las ciencias administrativas en general, los estudios de caso han sido suma-
mente utilizados para analizar los factores críticos de éxito de una organización. Con frecuencia se usan
para investigar temáticas que es muy difícil indagar con técnicas cuantitativas (Eriksson y Kovalainen,
2009).
Por ejemplo, Eriksson, Fowler, Whipp y Rasanen (1996) efectuaron estudios longitudinales de casos
en Gran Bretaña y Finlandia para analizar comparativamente cómo el manejo de la mezcla de producto
afecta el desarrollo de los negocios en empresas de confitería.
Centonze (2010), con base en el modelo de clúster de Porter, condujo un típico estudio de caso para
analizar las fortalezas y debilidades de la zona del valle del río Hudson para transitar de una región de
agroturismo hacia una vinícola. La investigación incluyó cuestiones como la competitividad y el grado en
que estaban listos los agricultores para enfrentar los desafíos que representa tal cambio en la vocación
productiva de la región.
Por su parte, Vuori y Kingsley (1999) realizaron estudios de casos con la finalidad de contrastar las
culturas organizacionales de hospitales públicos y privados, así como los servicios de salud.
Puente y Cervilla (2007) analizaron las prácticas de la gerencia de relaciones con el cliente (CRM) y
el estado de su adopción en cinco casos de empresas grandes que operaban en el mercado venezolano.
Utilizaron como técnica de recolección de datos las entrevistas estructuradas, las cuales administraron a
gerentes de las organizaciones involucradas. Se evaluaron las prácticas seguidas por las empresas para la
adopción, implantación y uso del CRM.
Entre las lecciones aprendidas por las empresas mediante la adopción, implantación y uso de
la gerencia de relaciones con el cliente, se destaca el reconocimiento del fracaso al tratar de
emprender proyectos de alcance amplio, y, como consecuencia, la necesidad de cubrir los dife-
rentes niveles de CRM por etapas, de acuerdo con las prioridades de la organización. Todos los
gerentes entrevistados consideraron que el desarrollo de una estrategia de CRM fue una decisión
acertada, aunque, en general, aún era pronto para evaluar el efecto en las ventajas competitivas
de la empresa (Puente y Cervilla, 2007, p. 1).
Un área donde se implementan estudios de casos con regularidad es el turismo. Xiao y Smith (2006)
llevaron a cabo un análisis de contenido de 76 estudios de caso publicados en revistas académicas de turis-
mo en el periodo comprendido entre 2000 y 2004, y encontraron que abarcan muy diversas temáticas,
entre ellas: planeación y desarrollo de centros turísticos, determinación de ciclos de vida de áreas turísti-
cas, medición de la satisfacción de los visitantes de centros turísticos, evaluación de programas de relacio-
nes con los clientes y mercadológicos, análisis integral de centros de turismo religioso, culinario, de
negocios, de vida salvaje y ecoturismo; valoración de la imagen de destinos turísticos, exploración del
impacto ambiental de complejos turísticos, operación de empresas turísticas, etc.
La conocida serie de televisión “Gigantes de la industria” (The men who built America) de History
Channel (David, 2012), presenta estudios de caso de connotados empresarios norteamericanos que cons-
truyeron enormes consorcios: Cornelius Vanderbilt (ferrocarriles), John D. Rockefeller (petróleo), Andrew
Carnegie (acero), J. P. Morgan (electricidad y finanzas) y Henry Ford (automóviles).
Metodología de la investigación 29

Piekkari, Welch y Paavilainen (2009) hicieron un análisis de 157 estudios de caso publicados en
cuatro reconocidas revistas académicas sobre negocios internacionales, realizados entre 1975 y 2005,
lo que nos da una idea de que es un diseño sumamente recurrente en las ciencias administrativas.

Ciencias de la conducta
Por lo regular, los estudios de caso psicológicos se centran en individuos, particularmente aquellos que
muestran trastornos de conducta. Sus puntos focales incluyen la descripción y el análisis de factores con-
textuales, estructuras personales y sociales y los procesos, para lograr una comprensión más completa y
profunda de los fenómenos (Starke y Strohschneider, 2009).
Riccardi, Timpano y Schmidt (2010) efectuaron un estudio de caso para investigar por qué un indi-
viduo varón de 39 años con trastorno obsesivo-compulsivo se resistía al tratamiento indicado y cómo una
intervención podía aumentar la adhesión a la terapia recomendada. Esta consistía en entrevistas y asesoría
emocional para aumentar el apego al tratamiento, así como ejercicios de exposición. Durante el estudio
se midieron las conductas compulsivas y al final se demostró que las técnicas habían funcionado positiva-
mente en la variable dependiente.
Wilson, Tolputt, Howe y Kemp (2010) presentan un estudio de caso del asesino serial Trevor Joseph
Hardy, quien privó de la vida a tres jóvenes en Manchester, Inglaterra, entre 1974 y 1976, y que en la
actualidad es uno de los presos con mayor antigüedad en Gran Bretaña. Los autores no solo consideraron
el caso, sino que también analizaron por qué este homicida ha desaparecido de la conciencia popular y
académica, para lo cual entrevistaron a los periodistas que cubrieron los asesinatos.
Billette, Guay y Marchand (2008) llevaron a cabo un estudio de caso para aumentar la eficacia de la
terapia cognitiva-conductual en víctimas de agresión sexual que presentan trastorno de estrés postraumá-
tico (PTSD) que, además, también “atrapa” al cónyuge. La terapia hizo hincapié en el apoyo del esposo y
la reducción del impacto psicológico en la relación de pareja. Tres víctimas participaron en el estudio y se
estableció la línea base previa a la administración del estímulo (terapia). Después de tres meses, ninguna
de las participantes presentó un diagnóstico de PTSD y todas reportaron una mejoría significativa en la
satisfacción respecto al soporte recibido de su cónyuge.
Pyke y Adams (2010) exploraron mediante estudios de caso cualitativos la relación matrimonial entre
varones adultos mayores (35 a 64 años) y sus esposas más jóvenes (10 a 17 años de diferencia), con la
finalidad de examinar la naturaleza y características del vínculo, los lazos de poder o dominación y los
roles desempeñados. Basándose en la teoría de los recursos y las perspectivas del poder marital, analizaron
las historias de vida, los entendimientos psicosociales y los acuerdos cotidianos de ocho parejas. Entre
algunos hallazgos descubrieron que los hombres tienden a ser el elemento dominante en la relación, pero
quienes estuvieron casados anteriormente con otra persona, tienden a compartir más en su matrimonio
con la mujer joven.

Ciencias de la salud
Los estudios de casos clínicos y epidemiológicos resultan muy frecuentes en todas las ciencias de la salud.
Como ya se mencionó, son útiles para evaluar integralmente tratamientos y medicación, así como para
mejorar las técnicas de diagnóstico. Se considera todo el contexto del paciente. Por ejemplo, Edwards,
McCarthy y Konishi (2010) analizaron, entre otros, el caso de una mujer japonesa de 88 años hospitali-
zada con anemia, edema en una pierna y ascitis. La paciente vivía sola y su único familiar era su hija, quien
habitaba en la misma ciudad. La anemia se debió a sangrado estomacal (seis meses ante su nivel de hemog-
lobina era de 12 y cuando se efectuó el estudio era de 4). Ella se negó al tratamiento recomendado por el
internista debido a su edad y a que consideraba a la cámara gástrica como “aterradora”. Los autores ana-
lizaron qué posición debía tomar el galeno ante tal negativa y cómo manejar el caso desde un punto de
vista médico y ético.
Mediante estudios de casos múltiples cruzados, Senn, Rolfe y Julious (2010) evaluaron la respuesta
individual a tratamientos y a la medicación hecha “a la medida” para intentar “aislar” el componente de
variación correspondiente a la interacción paciente-tratamiento.
30       Capítulo 4  Estidos de caso

Por su parte, Halterman, Conn, Hernández y Tanski (2010), condujeron entre padres de familia de
niños urbanos (con asma y sin asma) un estudio controlado de casos múltiples, cuyo objetivo era describir
y comparar sus conocimientos, actitudes y prácticas domésticas con respecto a la exposición al humo de
segunda mano (humo de tabaco ambiental o ETS) por parte de los infantes. Asimismo, se hicieron con-
trastes por nivel socioeconómico, ya que los investigadores partieron de la base de que los niños más
pobres muestran mayores índices de asma y se encuentran más expuestos al ETS. Los resultados sugirieron
que los padres cuyos hijos tienen asma son más conscientes de los daños del humo del tabaco, pero toda-
vía hay lagunas y varios niños siguen expuestos a este contaminante.

Educación
En el campo educativo, los estudios de caso son muy socorridos, entre otros planteamientos, para probar
métodos de enseñanza, documentar prácticas que mejoran el desempeño escolar, evaluar políticas educa-
tivas y diagnosticar el aprendizaje individual y colectivo (Timmons y Cairns, 2009).
Lance (2010) implementó un estudio de caso en dos escuelas primarias étnicamente diversas de
Inglaterra, ambas con reconocimiento local y nacional por su participación en proyectos de prácticas
educativas innovadoras. El trabajo documenta el impacto de la teoría de la eficacia y la mejora continuas
en las escuelas e identificó como factores críticos de éxito el enfoque ético del liderazgo, el compromiso de
los directivos y su respeto a los alumnos y padres de familia, así como la importancia que se le atribuyó a
ampliar y diversificar las experiencias de aprendizaje.
Neumann y Rodwell (2009) realizaron en Australia un estudio con múltiples casos para comparar a
los alumnos de doctorado de “medio tiempo” con aquellos dedicados a sus estudios “tiempo completo” en
términos del desempeño escolar, la satisfacción respecto de su vida académica y la eficiencia terminal
(conclusión de sus estudios).
Ng y Nicholas (2010) efectuaron un estudio de casos múltiples con un grupo de diez estudiantes de
14 años que participaron en un proyecto con actividades extracurriculares en línea, durante seis meses.
Los jóvenes se encontraban en el Reino Unido, Malasia y Australia. En lugar de utilizar un enfoque en
línea tradicional, estructurado y estandarizado para todos los alumnos, implementaron una aproximación
pedagógica progresista centrada en el individuo, personalizada y abierta. Entre algunas de las variables
dependientes se encontraban el aprovechamiento y la motivación para participar en proyectos de apren-
dizaje en línea. Asimismo, se exploró la naturaleza de las interacciones en un ambiente de aprendizaje
virtual. Desde luego, se demostró la eficacia del enfoque innovador.
McFadden, Taylor, Campbell y McQuilkin (2012) desarrollaron un estudio de casos múltiples para
evaluar la precisión de las bases de datos o referencias y la sensibilidad ante temas sobre la resiliencia y la
labor de los trabajadores sociales. Los casos fueron: Applied Social Sciences Index and Abstracts, Social
Services Abstracts, Social Sciences Citation Index (SSCI), PsycINFO, Cumulative Index to Nursing,
Allied Health (CINAHL), Google Scholar y Medline.

Otros campos
Los estudios de caso son aplicados en otros campos del conocimiento. Por ejemplo, Lima y Legey (2010)
investigaron mediante un estudio de caso el problema de la contaminación de la bahía Guanabara, un
estuario ubicado en Río de Janeiro, Brasil, que sirve como cuenca hidrográfica con más de 11 millones de
personas. Mediante el enfoque sistémico midieron el nivel de demanda bioquímica de oxígeno (DBO) y
examinaron las causas de la polución. Finalmente, propusieron soluciones que implican implementar
políticas públicas para atender la restauración de la calidad del agua en la bahía y una estructura eficiente
capaz de proporcionar servicios sanitarios a todos los ciudadanos y mitigar los problemas de contamina-
ción, así como otras cuestiones técnicas específicas.
Carcaño, Martínez y González (2009) efectuaron un estudio de caso para analizar las principales
causas de las demoras en un proyecto de construcción desarrollado en la costa del mar Caribe de México
(un edificio de apartamentos en condominio ubicado en la zona turística de Playa del Carmen, a aproxi-
madamente 70 kilómetros de Cancún). Los resultados sirven para analizar esta problemática en la región,
Metodología de la investigación 31

la cual ha experimentado un auge en la construcción en las últimas décadas.
Gómez, Chávez y Briceño (2009) realizaron un estudio de caso prospectivo para evaluar un programa
de recambio de artefactos que combustionan a leña por tecnologías más eficientes, el cual pretende lograr
30% de reducción de emisiones.
La empresa Calizas Industriales del Carmen (CALICA) ejecutó un estudio de caso a finales de 1988,
con el propósito de analizar la resistencia estructural de un puerto en construcción con un avance aproxi-
mado del 80% ante el embate del huracán Gilberto en el mes de septiembre de dicho año (categoría
cinco, la más elevada, con vientos máximos de 296 km/h y una presión mínima de 888 hectopascales).
Cabe señalar que la estructura resistió totalmente, lo cual llamó la atención de los constructores por lo que
se hizo la investigación a fondo. Tal resistencia se debió entre otras cuestiones al diseño y los materiales
usados en la construcción (CALICA, 1998).
Otros ejemplos de estudio de caso que podrían implementarse son:
• Análisis de las causas del colapso o derrumbe de una construcción (como las Torres Gemelas del
World Trade Center, después de los atentados con aviones comerciales el 11 de septiembre del 2001).
• Determinación de las causas de un accidente aéreo o el hundimiento de un transatlántico (como el
Titanic —1912—o el Costa Concordia —2012—).
• Evaluación del desempeño de un nuevo equipo industrial o la implementación de mejoras en un
proceso de calidad.
• Análisis de las causas de la disminución de la recaudación fiscal de un país en un año determinado.
• Investigación del comportamiento migratorio de una manada de animales.
• Indagación de las causas y el contexto del trágico deceso del Rey del Pop, Michael Jackson. El análisis
de su legado musical y artístico podría constituir otro estudio de caso.
• Valuación de un hotel para una operación de compraventa, utilizando un modelo de flujos de caja
descontados, con especial atención en la prima de riesgo. Es un estudio realizado por Stambler (2011)
sobre un hotel en China.
• Caracterización de varias mujeres directoras de grandes empresas (factores de éxito y obstáculos)
(casos múltiples).
• Evaluación del desempeño de un deportista de alto rendimiento (Sebastian Vettel en automovilismo,
Mariano Rivera en béisbol o Tony Romo —Dallas— en fútbol americano; o casos múltiples: Lionel
Messi, Claudio Pizarro, Alexis Sánchez, Patrick Pemberton, Oribe Peralta, Luis Tejada, Luis Suárez y
Pablo Escobar Olivetti, en fútbol soccer).
• Examen de la calidad del servicio del área de urgencias de un hospital.
• Análisis de las propiedades y características de un determinado cuásar o quásar.
• Exploración del significado e implicaciones para el estudio de la cultura Moche del notable descubri-
miento de las tumbas reales del Señor de Sipán, en Chiclayo, Perú (estudios de caso realizados por el
célebre arqueólogo Walter Alva y su brillante equipo).

  Figura 4.9 Tumbas reales
del señor de Sipán.
capítulo

5 Diseños experimentales. Segunda parte

INTRODUCCIÓN
El presente capítulo amplía algunos conceptos vertidos en el capítulo 7 de Metodología de la investigación, 6ª edición, en par-
ticular, los referidos a las fuentes de invalidación interna, la necesidad de varios grupos de comparación, la equivalencia de los
grupos experimentales y la técnica de emparejamiento, así como el diseño experimental de Solomon. Asimismo, se revisan
otros diseños experimentales: las series cronológicas múltiples y los factoriales. Finalmente, se comentan los diseños cuasiex-
perimentales.

FUENTES DE INVALIDACIÓN INTERNA (AMPLIACIÓN Y EJEMPLIFICACIÓN)
En el libro impreso se describieron estas fuentes y se recomienda eliminarlas mediante el control, lo que The SAGE Glossary
of the Social and Behavioral Sciences (2009p) y León y Montero (2003) denominan “descartar causas alternativas o extrañas”.
A continuación se amplían y ejemplifican.

1. Historia. Estas fuentes constituyen acontecimientos que ocurren durante el desarrollo del experimento, que pueden afec-
tar a la variable dependiente y llegan a confundir los resultados. Por ejemplo, durante un experimento para analizar el
efecto que tienen distintas formas de realimentación en el trabajo sobre la motivación (vía el supervisor “cara a cara” y
por escrito), se consideran dos grupos de obreros: a uno le aumentan el salario o se le felicita por su desempeño laboral
mientras se lleva a cabo el experimento y al otro grupo, no. Las diferencias en la variable dependiente pueden atribuirse
a la manipulación de la independiente o a un acontecimiento que sucedió durante el experimento. Supongamos que
experimentamos la mejora de procesos industriales y el estímulo es la introducción de un sistema ISO de calidad, pero
en una sola planta, no en la otra. Para tener certeza respecto de los resultados debemos evitar que en ambas ocurra algo
que altere significativamente tal mejora y que sea independiente del estímulo. O bien, imaginemos que en un experimen-
to donde se prueba la eficacia de un medicamento y se tienen grupos pequeños (digamos de cuatro personas cada uno),
al grupo experimental se les administra el medicamento y al grupo de control, no. Sin embargo, no sabemos que dos
miembros de este último se automedican en secreto, lo cual invalida los resultados del experimento.
2. Maduración. Son procesos internos que afectan a los participantes que operan como consecuencia del tiempo y afectan
los resultados del experimento, tales como cansancio, hambre, aburrimiento, envejecimiento y cuestiones similares. Si a
un grupo de niños se le expone a un nuevo método de aprendizaje por dos años, los resultados pueden estar influidos
simplemente por la maduración de los infantes durante el tiempo que duró el experimento. En un experimento quizá los
sujetos pueden cansarse y sus respuestas serán afectadas por ello. Si tenemos dos grupos y la condición experimental del
primero implica mucho más tiempo que la del segundo, puede alterar esta fuente.
Lo mismo sucede cuando experimentamos con medicamentos, intervenciones o tratamientos médicos
2       Capítulo 5  Diseños experimentales. Segunda parte

o psicológicos. En estos casos, el factor tiempo tiene que ser idéntico entre los grupos
participantes, al igual que cuando experimentamos con sustancias o elementos como el
fuego.
3. Inestabilidad del instrumento de medición. En este caso, la poca o nula confiabilidad de las mediciones
provoca desconfianza en las puntuaciones obtenidas, es decir, no sabemos si las deducciones son certeras
porque el instrumento a veces da unos resultados y luego, otros. Este inconveniente se evita mediante el
diseño de instrumentos válidos y confiables (vea el capítulo 9 del libro: “Recolección de los datos cuanti-
tativos”).
4. Inestabilidad del ambiente experimental. Tal como se mencionó en el capítulo 7 del texto impreso, las
condiciones o componentes del ambiente o entorno del experimento pueden ser desiguales para los
grupos participantes. Imaginemos que dos grupos son sometidos a un mismo experimento sobre
memorización y, al sortearlos, a uno le corresponde realizarlo en un aula cerca de donde se efectúa una
remodelación del edificio y al otro, en un recinto donde priva el silencio. Si el experimento requiriera
de una elevada concentración de los individuos que participan en él, la concentración de un grupo
podría ser diferente de la del otro (a causa del ruido, del tránsito de personas, etc.), lo que afectará la
interpretación de los resultados. Tal vez las diferencias entre los grupos se deban a variaciones en la
concentración y no a la variable independiente, o es posible que esta sí ejerza algún efecto, pero no
podemos estar seguros de ello. No tenemos confianza en los resultados. En experimentos en ciencias
naturales es claro que cuestiones como la temperatura ambiental deben estar perfectamente controla-
das. Asimismo, en experimentos médicos el entorno debe ser similar para todos.
5. Administración de pruebas. Se refiere al efecto que puede tener la aplicación de una prueba sobre las
puntuaciones de pruebas subsecuentes. Por ejemplo, si en un experimento sobre prejuicio a un grupo
se le aplica una prueba para detectar su nivel de prejuicio, y luego se le expone a un estímulo experi-
mental (que supuestamente debe reducir el prejuicio), y después se mide nuevamente el prejuicio para
evaluar si disminuyó o no, puede ocurrir que las puntuaciones de prejuicio de la segunda medición
(después del estímulo) sean influidas por la aplicación de la primera prueba (antes del estímulo). Es
decir, la administración de la primera medición puede sensibilizar a los participantes del experimento
y, cuando responden a la segunda prueba, sus respuestas podrían estar afectadas por esa sensibiliza-
ción. Si disminuye el prejuicio y no hay control, no sabremos cuánto se debió al estímulo experimen-
tal o a la variable independiente y cuánto a dicha sensibilización.
6. Instrumentación. En este caso se hace referencia a cambios en los instrumentos de medición o en los
observadores, modificaciones que pueden producir variaciones en los resultados. Si la prueba del
grupo experimental es diferente a la del grupo de control u otro grupo experimental, puede ser a
causa de la instrumentación. Por ejemplo, si queremos ver el efecto de dos métodos de enseñanza,
sometemos a cada grupo a un método diferente y después aplicamos un examen de conocimientos
para ver la eficacia de cada método y comparar los resultados. Si los exámenes no fueran equivalentes
podría presentarse esta fuente. Imaginemos que el examen de un grupo es más fácil que el del otro.
En este caso, ¿cómo podremos estar seguros de que las diferencias entre las puntuaciones de los exá-
menes se deben al estímulo (método de enseñanza) y no a que las mediciones son distintas? Esta
incertidumbre se repite en el caso de un experimento para probar la eficacia de dos medicamentos que
reducen la hipertensión. El procedimiento y no sólo el aparato para medir la presión arterial debe ser
el mismo (incluyendo número de mediciones, tiempo entre ellas, posición de los pacientes, etcétera).
7. Regresión estadística. Esta fuente se presenta si seleccionamos participantes sobre la base de puntuacio-
nes extremas. Cuando las variables que nos interesan se miden por primera vez, se encuentran en
valores muy altos o bajos, pero después tienden a regresar a su estado normal, y en una segunda
medición se obtienen valores no extremos; la comparación entre las dos mediciones indica un cam-
bio, pero en realidad lo que ocurre es que la primera medición la realizamos cuando la condición de
la variable era extrema. En términos de Campbell y Stanley (1966), se trata de un efecto provocado
por la tendencia que muestran los participantes seleccionados sobre la base de puntuaciones extremas
a regresar en pruebas posteriores a un promedio en la variable en la que fueron medidos.
3

Por ejemplo, si pretendemos evaluar el efecto del liderazgo autocrático de un profesor en la ansie-
dad de los alumnos y primero aplicamos al grupo una prueba de ansiedad, para posteriormente
exponerlo a otro profesor dictatorial y volvemos a medir su ansiedad, los participantes se encontrarán
muy ansiosos durante la aplicación de la primera prueba (porque tienen un examen difícil al día
siguiente); podría ocurrir que se observara que están “menos ansiosos” después de recibir la manipu-
lación, es decir, aparentemente el profesor autocrático redujo la ansiedad. Pero en realidad lo que
sucedió fue que durante la segunda prueba estaban “retornando” a su nivel normal de ansiedad. Otro
caso sería el de una medición de la presión arterial en la preprueba, después de que las personas tuvie-
ron que subir escaleras prolongadas o desplazarse rápidamente para que se les hiciera el examen res-
pectivo u otras mediciones cuando estaban en ayunas.
La regresión estadística representa el hecho de que puntuaciones extremas en una distribución
particular tenderán a desplazarse (esto es, regresar) hacia el promedio de la distribución en función de
mediciones repetidas (Christensen, 2006). Entre una primera y una segunda mediciones, las puntua-
ciones más altas tienden a bajar y las más bajas a aumentar. En ocasiones, este fenómeno de regresión
se presenta porque ambas mediciones no están adecuadamente correlacionadas.
8. Selección. Esta fuente puede presentarse cuando se eligen para integrar los grupos del experimento a
personas no equiparables. Es decir, si no se escogen participantes equivalentes, la selección resulta
tendenciosa. Por ejemplo, en un experimento sobre métodos educativos, si en un grupo se incluyen
a los estudiantes más inteligentes y estudiosos, y en el otro a los estudiantes menos inteligentes y
abúlicos, las diferencias entre los grupos se deberán a una selección sesgada, aparte del tratamiento
experimental o variable independiente. Lo mismo sucede con ciertos experimentos médicos: imagi-
nemos que al probar un tratamiento un grupo está conformado básicamente por individuos jóvenes
y sanos, y el otro, por personas significativamente mayores. En experimentos con materiales someti-
dos a distintas condiciones, dichos materiales deben ser completamente equivalentes.
9. Mortalidad experimental. Esta situación se refiere a las diferencias entre las pérdidas de participantes
que sufren los grupos que se comparan. Si un grupo pierde 25% de sus miembros y el otro grupo sólo
2%, los resultados serán influidos por ello, además de por el tratamiento experimental. La pérdida de
participantes puede deberse a diversas razones, por ejemplo, desmoralización, fatiga ante el trata-
miento o desesperación por no ver progreso (Grinnell et al., 2009), por lo que algunos autores la
incluyen como una fuente de invalidación interna por sí misma (Hulley, Cummings, Browner, Grady
y Newman, 2013). Imaginemos un experimento que utiliza como estímulo un programa de televi-
sión antisocial que ha sido visto por una tercera parte del grupo al que se le expondrá, mientras que
al otro grupo se le expone a un programa prosocial que nadie ha visto. Condiciones agresivas, dolo-
rosas, de cansancio, etc., pueden provocar mortalidad diferencial entre los grupos, la cual puede
ocurrir no sólo por el experimento en sí, sino por el tipo de personas que componen cada grupo o por
factores externos al experimento. En experimentos médicos, esta posibilidad es una amenaza ante la
cual el investigador debe estar muy pendiente.
10. Interacción entre selección y maduración. En este caso se trata de un efecto de maduración desigual en
los grupos del experimento, debido a algún factor de selección, el cual puede dar origen a diferentes
tasas de maduración o cambio autónomo entre grupos. Por ejemplo, si un grupo está compuesto por
personas que acostumbran alimentarse a cierta hora (12:00 p.m.) y el otro, por personas que se ali-
mentan a otra hora (3:00 p.m.), y el experimento se lleva a cabo de 11:00 a.m. a 2:30 p.m., la selec-
ción tendenciosa puede provocar un efecto de maduración distinto en los dos grupos: hambre. Este
sesgo se puede presentar si en una convención de una empresa multinacional experimentamos con
ejecutivas de distintos países latinoamericanos (cuyos horarios de alimentación son muy distintos), y
no tomamos en cuenta la interacción que puede producirse entre la selección y la maduración.
11. Difusión de tratamientos experimentales. En este caso, los participantes de los grupos experimentales y
de control intercambian información sobre la naturaleza del experimento, en particular respecto del
estímulo, lo cual podría “nublar” los efectos de este. Por ejemplo, si ambos grupos saben que uno de
ellos recibe dinero por participar y el otro no, los integrantes de este último podrían protestar y per-
4       Capítulo 5  Diseños experimentales. Segunda parte

turbar a toda la muestra, lo cual afectaría al experimento. Si en el caso de Naves y Poplawsky (1984),
los estudiantes hubieran comentado a los demás participantes que se les “aparecía” un deficiente
mental, los siguientes individuos no actuarían con naturalidad y el experimento resultaría un fracaso.
Esta fuente resulta un riesgo cuando los grupos del experimento mantienen cercanía o contacto, pero
se puede evitar si se eligen participantes que pertenezcan a diferentes ámbitos, pero equivalentes (en
el ejemplo, estudiantes de diferentes carreras y semestres). Cuando se sospeche que los tratamientos
se difunden, conviene entrevistar a los participantes para evaluar el grado de comunicación entre
grupos y sus consecuencias.
12. Actuaciones anormales del grupo de control. Consiste en que si el grupo testigo conoce su condición y
se esfuerza en un grado superlativo por obtener puntuaciones más favorables en la variable depen-
diente. Por ejemplo, en un experimento para probar un nuevo método educativo, los participantes
del grupo que no aprende por medio de este enfoque innovador, al deducir que se espera de ellos que
obtengan las puntuaciones más bajas, se esfuerzan más de lo normal y obtienen calificaciones eleva-
das. O bien, pacientes del grupo de control que al saber que no reciben el estímulo, cuiden mucho
más su alimentación, se automediquen, hagan más ejercicio, etcétera.
13. Compensación. Los beneficios de un experimento pueden ser desiguales o inequitativos para los grupos,
lo que puede provocar que el grupo de control lo resienta y esto afecte los resultados (Creswell, 2013a).
Por ejemplo, si el grupo experimental recibe una terapia o tratamiento médico y el de control, no, los
miembros de este último pueden sentirse devaluados o desmoralizados, situación particularmente crítica
cuando a un grupo se le otorgan estímulos económicos y al otro, no, como ya se señaló. Por ejemplo, en
un experimento para analizar si un equipo de trabajo incrementa significativamente su productividad y
calidad cuando se le asigna una nueva maquinaria, para lo cual se comparan sus resultados con los de otra
cuadrilla que aún trabaja con el equipo antiguo, podría presentarse la compensación o una actuación
anormal de cualquiera de los grupos.
14. Otras interacciones. Es posible que se presenten diversos efectos provocados por la interacción de las
fuentes de invalidación interna. La selección puede interactuar con la mortalidad experimental, la
historia con la maduración, la maduración con la inestabilidad, etc. También pueden operar simul-
táneamente varias de estas fuentes y la validez interna se deteriora aún más. Cada vez que hay mayor
presencia de tales amenazas, crece la incertidumbre con respecto a las causas que produjeron cambios
en las variables dependientes. Si no hubo cambios, no podemos saber si se debió a que una o más
fuentes contrarrestaron los posibles efectos del tratamiento. Por ejemplo, un método de enseñanza
exitoso se utilizó con los participantes menos motivados y el menos exitoso con los más motivados,
lo cual provocó que se compensaran ambos factores. De este modo, no sabremos cómo interpretar
los resultados.

Los sujetos participantes y el experimentador como fuentes de invalidación
interna
Otra razón que atenta contra la interpretación correcta y certera de los resultados de un experimento en
el que se involucran personas, es el comportamiento de estas. Es posible que ellas ingresen al experimen-
to con ciertas actitudes, expectativas y prejuicios que alteren su comportamiento durante el estudio, por
ejemplo, no colaborar y actuar negativamente, hasta el punto de llegar a ser hostiles. Este posible compor-
tamiento debe tenerse presente antes y durante la investigación. Es necesario evaluar qué participantes
pueden arruinar el experimento y descartarlos, o procurar que en todos los grupos haya personas con
actitudes positivas y negativas (si todos los que tienen actitudes negativas integran un grupo, la validez
interna estaría en problemas). Recordemos que los individuos que intervienen en un experimento, de una
manera u otra, tienen motivos para participar y su conducta muchas veces puede afectar la calidad de las
interpretaciones.
Además, el mismo experimentador no es un observador pasivo que no interactúa, sino un sujeto
activo que puede influir en los resultados del estudio (Christensen, 2006). El investigador tiene una serie
de motivos que lo impulsan a realizar su experimento, pues con los resultados que este genere puede pro-
5

bar sus hipótesis. Ello, conscientemente o no, puede conducirlo a afectar el comportamiento de los sujetos
en dirección de su hipótesis. Por ejemplo, dar explicaciones más completas a uno de los grupos. Hay que
evitar todas estas posibles desviaciones. Por ello, en ciertos casos quien trate con los participantes no debe
ser el experimentador, sino alguien que no conozca la hipótesis, las condiciones experimentales ni los
propósitos del estudio, sino que sólo reciba instrucciones precisas sobre lo que debe hacer y cómo desem-
peñarse. En ciencias exactas, a pesar de que se experimenta con sustancias o fuerzas, el investigador que
manipula las condiciones también debe estar consciente de su rol.
Quienes participan en el experimento tampoco deben conocer las hipótesis ni las condiciones experi-
mentales; incluso, con frecuencia es necesario distraerlos de los verdaderos propósitos del estudio, aunque
al finalizar se les deba dar una explicación completa de la investigación. Cuando, por ejemplo, se analizan
los efectos de ciertos medicamentos, los investigadores hacen creer a un grupo que se le está administran-
do una medicina cuando en realidad no es así, sino que se le proporciona píldoras de azúcar. Este “truco”
evita la influencia que la expectativa de recibir medicamento pudiera tener en la variable dependiente. A
esta sustancia que no tiene efectos se le denomina “placebo”. Con métodos de instrucción, por ejemplo,
ocurre que el grupo que se expondrá al método innovador es influido por el simple hecho de decirle que
se trata de un nuevo método. Lo mismo con pruebas de sabor de un producto alimenticio, programas de
televisión, experiencias motivacionales, diseños arquitectónicos, sistema de calidad en las empresas, etc.
Por tanto, estos aspectos deben tomarse muy en cuenta.

VARIOS GRUPOS DE COMPARACIÓN
En el capítulo siete del texto impreso y en líneas anteriores, se hace hincapié en que para lograr la validez
interna y el control en un experimento es necesario que se aplique, por lo menos, a dos grupos compara-
bles. En primer término, porque si se trabaja con un solo grupo no es posible saber con certeza si influye-
ron las fuentes de invalidación interna o no. Por ejemplo, mediante un experimento intentamos probar la
hipótesis que sostiene que “a mayor información psicológica sobre una clase social, menor prejuicio hacia
ella”. Si decidimos trabajar con un solo grupo, se debería exponerlo a un programa de sensibilización
donde se proporcione información sobre la manera en que vive dicha clase, sus angustias y problemas,
necesidades, sentimientos, aportaciones a la sociedad, etc., para luego observar el nivel de prejuicio (el
programa debe incluir charlas de expertos, películas y testimonios grabados, lecturas, etc.). Este experi-

Momento 1 (X) Momento 2 (O)
G Exposición al programa Observación del nivel de prejuicio
de sensibilización

mento se esquematizaría así:
Todo en un único grupo. ¿Qué sucede si se observa un bajo nivel de prejuicio en el grupo?
¿Podemos deducir con absoluta certeza que se debió al estímulo? Desde luego que no. Es posible que
ese bajo nivel se deba al programa de sensibilización, que es la forma de manipular la variable indepen-
diente “información psicológica sobre una clase social”, pero también a que los participantes tenían un
bajo nivel de prejuicio antes del experimento y, en realidad, el programa no afectó. Además, no lo
podemos saber porque no hay una medición del nivel de prejuicio al inicio del experimento (antes de
la presentación del estímulo experimental); es decir, no existe punto de comparación. Pero, aunque
hubiera ese punto de contraste inicial, con un solo grupo no podríamos estar seguros de cuál fue la
causa del nivel de prejuicio. Supongamos que este nivel de prejuicio antes del estímulo o tratamiento
era alto, y después del estímulo, bajo. Quizás el tratamiento sea la causa del cambio, pero tal vez tam-
bién ocurrió lo siguiente:
1. Que la primera prueba de prejuicio sensibilizara a los sujetos participantes y que influyera en sus
respuestas en la segunda prueba. De este modo, las personas crearon conciencia de lo negativo de
ser prejuiciosas cuando respondieron a la medición previa (administración de prueba).
6       Capítulo 5  Diseños experimentales. Segunda parte

2. Que los individuos seleccionados se agotaran durante el experimento y sus respuestas a la segunda
prueba fueran “a la ligera” (maduración).
3. Que los sujetos prejuiciosos o parte importante de ellos hubiera abandonado el experimento (mor-
talidad experimental).
También podrían existir otras razones. Además, si no se hubiera observado un cambio en el nivel de
prejuicio entre la primera prueba (antes del programa) y la segunda (después del programa), se podría
asumir que la exposición al programa no tiene efectos, aunque también podría suceder que el grupo selec-
cionado es muy prejuicioso y tal vez el programa sí tiene efectos en personas con niveles comunes de
prejuicio. Asimismo, si el cambio es negativo (mayor nivel de prejuicio en la segunda medición que en la
primera), se podría suponer que el programa incrementa el prejuicio, pero supongamos que haya ocurrido
un suceso durante el experimento que generó momentáneamente prejuicios hacia esa clase social (una
violación en la localidad a cargo de un individuo de esta), pero después los participantes “regresaron” a su
nivel de prejuicio normal (regresión). Incluso podría haber otras explicaciones.
Con un solo grupo no estaríamos seguros de que los resultados se debieran al estímulo experimental
o a otras razones. Siempre quedará la duda. Los “experimentos” con un grupo se basan en sospechas o en
lo que “aparentemente es”, pero carecen de fundamentos científicos. Cuando se trabaja con un solo grupo
se corre el riesgo de seleccionar sujetos atípicos (los más inteligentes al experimentar con métodos de
enseñanza, los trabajadores más motivados cuando se aplican programas de incentivos, los consumidores
más críticos, las parejas de novios más integradas, etc.) y de que intervengan la historia, la maduración y
demás fuentes de invalidación interna, sin que el experimentador se percate de ello.
Por todas estas razones, el investigador debe tener al menos un punto de comparación: dos grupos,
uno al que se le administra el estímulo y otro que no lo reciba (el grupo de control). Tal como se men-
cionó al hablar de manipulación, a veces se debe trabajar con varios grupos cuando se desea averiguar el
efecto de distintos niveles o modalidades de la variable independiente.

EQUIVALENCIA DE LOS GRUPOS EN EXPERIMENTOS
Para tener control no basta con dos o más grupos, sino que estos deben ser similares en todo, menos en la
manipulación de la o las variables independientes. El control implica que todo permanece constante,
salvo tal intervención. Si entre los grupos que conforman el experimento todo es similar o equivalente,
excepto la manipulación de la variable independiente, las diferencias entre ellos pueden atribuirse a esta y
no a otros factores (entre los cuales están las fuentes de invalidación interna).
Imaginemos que deseamos indagar si una serie de programas educativos de televisión para niños
genera mayor aprendizaje que un método tradicional. Un grupo recibe la enseñanza a través de los pro-
gramas, otro la recibe por medio de instrucción oral tradicional, mientras que un tercero dedica ese mis-
mo tiempo a jugar libremente en el salón de clases. Supongamos que los niños que aprendieron mediante
los programas obtienen las mejores calificaciones en una prueba de conocimientos relativa a los conteni-
dos enseñados, los que recibieron el método tradicional obtienen calificaciones mucho más bajas, y los
que jugaron obtienen puntuaciones de cero o cercanas a este valor. En forma aparente, los programas son
un mejor vehículo de enseñanza que la instrucción oral. Pero si los grupos no son equivalentes, no pode-
mos confiar en que las diferencias se deban realmente a la manipulación de la variable independiente
(programas televisivos-instrucción oral) y no a otras causas, o a la combinación de ambas. Por ejemplo, a
los niños más inteligentes, estudiosos y con mayor empeño se les asignó al grupo que fue instruido por
televisión, o simplemente su promedio de inteligencia y aprovechamiento era el más elevado; o la instruc-
tora del método tradicional no poseía buen desempeño, o los niños expuestos a este último método reci-
bieron mayor carga de trabajo y tenían exámenes los días en que se desarrolló el experimento, etc. ¿Cuánto
se debió al método y cuánto a otros factores? Para el investigador la respuesta a esta pregunta se convierte
en un enigma: no hay control.
Si experimentáramos con métodos de motivación para trabajadores, y un grupo estuviera conforma-
do por los que laboran en el turno matutino, y el otro por los empleados del turno vespertino, ¿quién nos
7

asegura que antes de iniciar el experimento ambos tipos de trabajadores están igualmente motivados?
Puede haber discrepancias en la motivación inicial porque los supervisores de distintos turnos motivan de
diferente manera y grado, o tal vez los del turno vespertino preferirían trabajar en la mañana o se les pagan
menos horas extras, etc. Si no están igualmente motivados, podría ocurrir que el estímulo aplicado a los
del turno de la mañana aparentara ser el más eficaz, cuando en realidad no es así.
Veamos un ejemplo que nos ilustrará el efecto tan negativo que puede generar la inequivalencia de los
grupos sobre los resultados de un experimento. ¿Qué investigador probaría el efecto de diferentes métodos
para sensibilizar a las personas respecto de lo terrible que puede ser el terrorismo si un grupo está consti-
tuido por miembros de Al-Qaeda y el otro por familiares de las víctimas de los atentados en Londres, en
julio de 2005?
Los grupos deben ser equivalentes cuando se inicia y durante todo el desarrollo del experimento,
menos en lo que respecta a la variable independiente. Asimismo, los instrumentos de medición deben ser
iguales y aplicados de la misma manera.

Equivalencia inicial
Este requisito implica que los grupos son similares entre sí en el momento de iniciarse el experimento. Si
este versa sobre los métodos educativos, los grupos deben ser equiparables en cuanto a número de perso-
nas, inteligencia, aprovechamiento, disciplina, memoria, género, edad, nivel socioeconómico, motiva-
ción, nutrición, conocimientos previos, estado de salud física y mental, interés por los contenidos,
extraversión, etc. Si inicialmente no son equiparables, digamos en cuanto a motivación o conocimientos
previos, las diferencias entre los grupos —en cualquier variable dependiente— no podrían atribuirse con
certeza a la manipulación de la variable independiente.
Equivalencia inicial  Implica que los La equivalencia inicial no se refiere a equivalencias indivi-
grupos son similares entre sí en el duales, porque todos diferimos de manera natural en muchos
momento de iniciarse el experimento. aspectos, sino a la equivalencia entre grupos. Si trabajamos con dos
grupos, es indudable que habrá, por ejemplo, personas muy inteli-
gentes en uno de ellos, pero también debe haberlas en el otro. Si en
uno hay mujeres, en el otro debe haberlas en la misma proporción. Y así con todas las variables que pue-
dan afectar a la o las variables dependientes, además de la variable independiente. Para hablar de experi-
mentos válidos no pueden existir diferencias significativas entre los grupos.

Equivalencia durante el experimento
Durante el estudio, los grupos deben mantener la equivalencia inicial en los aspectos concernientes al
desarrollo experimental, excepto en la manipulación de la variable independiente: mismas instrucciones
(salvo variaciones que sean parte de esa manipulación), personas con las que tratan los participantes y
maneras de recibirlos, lugares con características semejantes (iguales objetos en los cuartos, clima, ventila-
ción, sonido ambiental, etc.), igual duración del experimento, así como del momento y, en fin, todo lo
que sea parte del estudio. Cuanto mayor sea la equivalencia, durante su desarrollo, habrá mayor control y
posibilidad de que, si observamos o no efectos, estemos seguros de que verdaderamente los hubo o no.
Cuando trabajamos simultáneamente con varios grupos, es difícil que las personas que dan las ins-
trucciones y vigilan el desarrollo de los grupos sean las mismas. En este caso debe buscarse que su tono de
voz, apariencia, edad, género y otras características capaces de afectar los resultados sean iguales o simila-
res, y mediante entrenamiento debe estandarizarse su proceder. Algunas veces se dispone de menos cuar-
tos o lugares que de grupos. En consecuencia, la asignación de los grupos a los cuartos y horarios se
realiza al azar, pero se debe procurar que los procedimientos se apliquen, dentro de lo posible, en horarios
coincidentes. Otras veces, los participantes reciben los estímulos individualmente y su exposición no
puede ser simultánea. Se deben sortear de manera que en un día (por la mañana) personas de todos los
grupos participen en el experimento, lo mismo por la tarde y durante el tiempo que sea necesario (los días
que dure el experimento).
8       Capítulo 5  Diseños experimentales. Segunda parte

Recordatorio: ¿cómo se logra la equivalencia inicial? Asignación al azar
Como se comentó en el capítulo 7 de la obra impresa, el método más exacto para lograr la equivalencia
inicial es la asignación aleatoria o al azar de los participantes a los grupos del experimento (en inglés,
randomization). La asignación al azar nos asegura probabilísticamente que dos o más grupos son equiva-
lentes entre sí (Kirk, 2012; Knapp, 2008; Pettygrove, 2007 y Peng, 2003). Esta técnica de control tiene
como propósito dar al investigador la seguridad de que variables extrañas, conocidas o desconocidas, no
afectarán de manera sistemática los resultados del estudio (Christensen, 2006). Esta técnica, que fue dise-
ñada por Sir Ronald A. Fisher, en la década de 1940, ha demostrado durante años que funciona para hacer
equivalentes a grupos de participantes. Como mencionan Cochran y Cox (1992), la asignación aleatoria
es en cierta forma análoga a un seguro, por el hecho de que es una precaución contra interferencias que
pueden o no ocurrir, y ser o no importante si suceden. Por lo general, es aconsejable tomarse el trabajo de
distribuir aleatoriamente, aun cuando no se espere que haya un sesgo importante si se opta por otro enfo-
que.
Si la única diferencia que distingue al grupo experimental y al de control es la variable independiente,
las diferencias entre ellos pueden atribuirse a esta última. Pero si hay otras diferencias, no podríamos hacer
tal afirmación.

EJEMPLO DE EQUIVALENCIA INICIAL DE LOS GRUPOS EN EXPERIMENTOS
En el capítulo 7 del libro impreso se señaló que en un experimento, los grupos de comparación deben
poseer equivalencia inicial.5 A continuación ejemplificamos esta noción.
Si suponemos que todas las variables (V) pudieran medirse de uno a 10, la equivalencia entre grupos
se debería conceptualizar tal como en la tabla 5.l.

  Tabla 5.1  Esquema para ilustrar la equivalencia inicial de los grupos.
Al inicio del experimento
Grupo 1 Grupo 2

V1 = 8 V1 = 7.9
V2 = 4 V2 = 4.1
V3 = 6 V3 = 6
V4 = 7.2 V4 = 7.4
V5 = 10 V5 = 9.9
20 mujeres, 21 hombres 19 mujeres, 22 hombres
Promedio de edad = 25 años, 6 meses Promedio de edad = 25 años, 4 meses
V6 = 2 V6 = 2
Vk = K Vk = K
V = una variable (V1 = variable 1, V2 = variable 2...)

Veamos en la tabla 5.2 un ejemplo de equivalencia entre dos grupos respecto de ciertos rasgos físicos
para ilustrar el concepto.

1
En experimentos en ciencias biológicas, obviamente los ejemplares de los grupos que se contrastan también deben ser similares, y en experi-
mentos con materiales, sustancias, fuerzas y objetos en ciencias físicas, por ejemplo, ocurre lo mismo (incluso idénticos, por ello les denominamos
“ciencias exactas”). La equivalencia inicial es una condición de la experimentación.
9

  Tabla 5.2  Ejemplo de dos grupos equivalentes.

Grupo 1 Grupo 2

10 hombres de tez morena y ojos cafés 10 hombres de tez morena y ojos cafés
5 hombres de tez morena y ojos negros 4 hombres de tez morena y ojos negros
equivalencia
11 hombres de tez clara y ojos cafés 12 hombres de tez clara y ojos cafés

=
5 hombres de tez clara y ojos verdes 5 hombres de tez clara y ojos verdes
10 mujeres de pelo rubio y tez muy clara 10 mujeres de pelo rubio y tez muy clara
8 mujeres de pelo castaño claro y tez clara 9 mujeres de pelo castaño claro y tez clara
5 hombres de pelo castaño oscuro y tez clara 3 hombres de pelo castaño oscuro y tez
clara

En la tabla 5.3 se presenta un ejemplo de dos grupos que interculturalmente no son equivalentes.

  Tabla 5.3  Ejemplo de dos grupos no equivalentes.

Grupo 1 Grupo 2
3 venezolanos 1 venezolano
6 colombianos 3 brasileñas
5 mexicanos 2 mexicanos


6 estadounidenses 1 estadounidense
4 ingleses 28 franceses
7 bolivianos 10 ingleses
3 italianos 4 rusos
5 israelitas 2 alemanes
4 afganos 5 suizos
3 cubanos 2 nicaragüenses
12 españoles

Desde luego, es prácticamente imposible alcanzar la equivalencia perfecta o ideal con seres humanos
o animales, pero no deben permitirse diferencias iniciales significativas entre los grupos.

EJEMPLO DE LA TÉCNICA DE EMPAREJAMIENTO EN EXPERIMENTOS
A fin de explicar aún más lo que se expuso en el capítulo 7 del libro sobre el emparejamiento, a continua-
ción presentamos un ejemplo con dos grupos.
Suponga que se tienen 16 personas para un experimento sobre desempeño académico (recuerde la
sugerencia de tener 15 o más en cada grupo; aquí se incluyen 16 solo para abreviar el caso), divididas en
un grupo al cual se le otorgará una beca de 50% para sus estudios universitarios, y un grupo de control al
que no se le concederá beneficio económico alguno. La variable dependiente sería el desempeño académi-
co, medido por el promedio de sus calificaciones en todas las asignaturas. Los estudiantes se ordenarían
de la siguiente manera:
10       Capítulo 5  Diseños experimentales. Segunda parte

Participante Coeficiente de Participante Coeficiente de
inteligencia (ci) inteligencia
(ci)
01 129 09 110
02 127 10 110
03 119 11 108
04 119 12 107
05 117 13 106
06 116 14 105
07 114 15 104
08 113 16 102

Se procede entonces a empatar gradualmente a dos grupos en la variable deseada, en este caso, inteli-
gencia:

Sujeto 01 (CI = 129) Sujeto 02 (CI = 127)

Grupo 1 Grupo 2

Sujeto 03 (CI = 119) Sujeto 04 (CI = 119)

Grupo 1 Grupo 2

Hasta ahora, el grupo 1 lleva dos puntos más que el grupo 2 (grupo 1 = 248, grupo 2 = 246), por
lo cual es necesario compensarlo.
 
Sujeto  05  (CI  =  117)   Sujeto  06  (CI  =  116)  

Grupo   Grupo  2  
1  

Sujeto  07  (CI  =  114)   Sujeto  08  (CI  =  113)  

Grupo   Grupo  2  
1  
11

Hasta aquí se ha conservado el balance entre los grupos (grupo
1 = 477 y grupo 2 = 477).

Sujeto 09 (CI = 110) Sujeto 10 (CI = 110)

Grupo 1 Grupo 2

Sujeto 11 (CI = 108) Sujeto 12 (CI = 107)

Grupo 1 Grupo 2

Sujeto 13 (CI = 106) Sujeto 14 (CI = 105)

Grupo 1 Grupo 2

Sujeto 15 (CI = 104) Sujeto 16 (CI = 102)

Grupo 1 Grupo 2

De esta forma, los grupos quedarían emparejados en inteligencia.

Grupo 1 Grupo 2

Sujeto   CI Sujeto   CI

S01 129 S02 127

S03 119 S04 119

S06 116 S05 117

S08 113 S07 114

S09 110 S10 110

S11 108 S12 107

S13 106 S14 105

S16 102 S15 104

Promedio = 112.87 Promedio = 112.87
12       Capítulo 5  Diseños experimentales. Segunda parte

Ambos grupos son equivalentes en cuanto a la variable deseada. Este procedimiento puede exten-
derse a más de dos grupos (si se trata de tres, en lugar de parejas se iguala por tercias, con cuatro grupos
por cuartetos, etcétera).
Respecto del emparejamiento debemos recordar lo que señalamos en el texto impreso: la asigna-
ción al azar es el mejor método para hacer equivalentes los grupos (más preciso y confiable). El empa-
rejamiento no la sustituye por completo, pues llega a suprimir o eliminar el posible efecto de la
variable apareada, pero nunca nos asegura que otras variables (no apareadas) no puedan afectar los
resultados del experimento. En cambio, la asignación aleatoria garantiza que otras variables (además
de la o las variables independientes de interés para el investigador) no afecten las dependientes ni con-
fundan al experimentador. Como comentan The SAGE Glossary of the Social and Behavioral Sciences
(2009s), Knapp (2008) y Nunnally y Bernstein (1994), lo bueno de la asignación al azar de los parti-
cipantes o casos a los grupos de un diseño experimental es que el procedimiento asegura absolutamen-
te que, en promedio, los grupos no diferirán (antes de que participen en los tratamientos
experimentales) en ninguna característica más de lo que pudiera esperarse por pura casualidad.

DISEÑO DE CUATRO GRUPOS DE SOLOMON: AMPLIACIÓN
Para iniciar, recordemos al lector que este diseño es una mezcla de dos diseños: 1) diseño con posprue-
ba únicamente y grupo de control y 2) diseño de preprueba-posprueba con grupo de control. La suma
de estos dos diseños origina cuatro grupos: dos experimentales y dos de control, pero mientras los
primeros reciben el mismo tratamiento experimental, los segundos no reciben ningún tratamiento.
Sólo a uno de los grupos experimentales y a uno de los grupos de control se les administra la preprue-
ba; a los cuatro grupos se les aplica la posprueba. Todos los participantes son asignados al azar.
Tengamos en mente que el diseño se diagrama así:

RG 0 X 0
1 1 2

RG 0 — 0
2 3 4

RG — X 0
3 5

RG — — 0
4 6

El diseño original incluye sólo cuatro grupos y un tratamiento experimental. Los efectos se deter-
minan comparando las cuatro pospruebas. Los grupos uno y tres son experimentales, y los grupos dos
y cuatro son de control.
La ventaja de este diseño es que el experimentador tiene la posibilidad de verificar los posibles
efectos de la preprueba sobre la posprueba, puesto que a unos grupos se les administra un test previo
y a otros no. Es posible que la preprueba afecte la posprueba o que aquélla interactúe con el tratamien-
to experimental. Por ejemplo, con promedios de una variable determinada podría encontrarse lo que
muestra la tabla 5.4.

  Tabla 5.4  Ejemplo de efecto de preprueba en el diseño de Solomon.

RG 01 = 8.0 X 02 = 14.0
RG 03 = 8.1 — 04 = 11.0
RG — X 05 = 11.0
RG — — 06 = 8.0
13

Teóricamente, 02 debería ser igual a 05, porque ambos grupos recibieron el mismo tratamiento; asi-
mismo, 04 y 06 deberían tener el mismo valor, porque ninguno recibió estímulo experimental. Pero 02 ≠
05 y 04 ≠ 06. Entonces, ¿cuál es la única diferencia entre 02 y 05, y entre 04 y 06? La respuesta es la
preprueba. Las diferencias pueden atribuirse a un efecto de la preprueba (la preprueba impacta, aproxima-
damente, tres puntos, y el tratamiento experimental también tres puntos, poco más o menos). Veámoslo
de manera esquemática:

Ganancia con preprueba y tratamiento = 6

Ganancia con preprueba y sin tratamiento = 2.9 (casi 3).

Debido a que, al inicio, la técnica de distribución aleatoria atribuye equivalencia a los grupos, supues-
tamente el promedio de la preprueba hubiera sido para todos cerca de ocho, si se hubiera aplicado a los
cuatro grupos. La “supuesta ganancia” (supuesta porque no hubo preprueba) del tercer grupo, con trata-
miento y sin preprueba, es de tres. Y la “supuesta ganancia” (supuesta porque tampoco hubo preprueba)
del cuarto grupo es nula o inexistente (cero).
Estas conclusiones indican que cuando hay preprueba y estímulo se obtiene la máxima puntuación
de 14, si sólo hay preprueba o estímulo la puntuación es de 11, y cuando no hay preprueba ni estímulo
es de ocho (calificación que todos deben tener inicialmente por efecto de la asignación al azar). También
podría ocurrir un resultado como el de la tabla 5.5.

  Tabla 5.5  Ejemplo del efecto de interacción entre la preprueba y el
estímulo en el diseño de Solomon.

RG 01 = 7.9 X 02 = 14.0
RG 03 = 8.0 — 04 = 8.1
RG — X 05 = 11.0
RG — — 06 = 7.9

En este caso, la preprueba no afecta (vea la comparación entre 03 y 04), pero el estímulo sí lo hace
(compare 05 con 06); sin embargo, cuando el estímulo o tratamiento se junta con la preprueba se
observa un efecto importante (compare 01 con 02), un efecto de interacción entre el tratamiento y la
preprueba.
El diseño de Solomon controla todas las fuentes de invalidación interna por las mismas razones que
fueron explicadas en diseños “puros” del texto impreso. La administración de pruebas se somete a un
análisis minucioso.

FUENTES DE INVALIDACIÓN EXTERNA A DETALLE
En el texto impreso se dijo que se ampliarían las fuentes de invalidación externa en el centro de
recursos en línea, por lo que aquí se hace.

1. Efecto reactivo o de interacción de las pruebas
Este efecto se presenta cuando la preprueba aumenta o disminuye la sensibilidad o la calidad de
la reacción de los participantes a la variable experimental, lo cual contribuye a que los resultados obte-
nidos para una población con preprueba no puedan generalizarse a quienes forman parte de esa pobla-
ción sin preprueba. Babbie (2012) utiliza un excelente ejemplo de esta influencia: en un experimento
diseñado para analizar si una película disminuye el prejuicio racial, la preprueba podría sensibilizar al
14       Capítulo 5  Diseños experimentales. Segunda parte

grupo experimental y la película podría lograr un efecto mayor del que tendría si no se aplicara la
preprueba (por ejemplo, si se pasara la película en un cine o en la televisión).

2. Efecto de interacción entre los errores de selección y el tratamiento
experimental
Este factor impone que se elijan personas con una o varias características que permitan que el trata-
miento experimental produzca un efecto, el cual no se lograría si las personas no tuvieran esas peculia-
ridades. Por ejemplo, si seleccionamos trabajadores muy motivados para un experimento sobre
productividad, podría ocurrir que el tratamiento sólo tuviera efecto en este tipo de trabajadores y no
en otros (solo funciona con individuos sumamente motivados). Ello se resolvería con una muestra
representativa de todos los trabajadores o mediante la introducción de un diseño factorial y que una
de las variables fuera el grado de motivación (vea más adelante diseños factoriales).
En ocasiones, este factor se presenta cuando se reclutan voluntarios para la realización de algunos
experimentos.

3. Efectos reactivos de los tratamientos experimentales
La “artificialidad” de las condiciones puede hacer que el contexto experimental resulte atípico respecto
de la manera en que se aplica regularmente el tratamiento (Campbell, 1975). Por ejemplo, a causa de
la presencia de observadores y equipo, los participantes cambian su conducta normal en la variable
dependiente medida, la cual no se alteraría en una situación común donde se aplicara el tratamiento.
Por ello, el experimentador tiene que ingeniárselas para hacer que los sujetos se olviden de que están
en un experimento y no se sientan observados. A esta fuente también se le conoce como “efecto
Hawthorne”, por una serie de experimentos muy famosos desarrollados entre 1924 y 1927, en una
planta del mismo nombre de la Western Electric Company, en la cual, al variarse la intensidad de la
iluminación se observaban incrementos de la productividad de los trabajadores, tanto al aumentarla
como al disminuirla. Por lo tanto, se concluyó que los cambios en la productividad se debían a que los
participantes se sentían observados (Ballantyne, 2000).

4. Interferencia de tratamientos múltiples
En este caso se aplican varios tratamientos a un grupo experimental para conocer sus efectos por sepa-
rado y en conjunto (por ejemplo, enseñarle a niños hábitos higiénicos con un video, más una diná-
mica que implique juegos, más un libro explicativo); incluso, si los tratamientos no son de efecto
reversible, es decir, si no es posible eliminar sus efectos, las conclusiones solo podrán hacerse extensivas
a los infantes que experimenten la misma secuencia de tratamientos, sean múltiples o repetitivos (vea
en páginas subsecuentes los diseños con diversos tratamientos).

5. Imposibilidad de replicar los tratamientos
Cuando los tratamientos son tan complejos que no pueden replicarse en situaciones no experimenta-
les, es difícil generalizar sus efectos.

6. Descripciones insuficientes del tratamiento experimental
En ocasiones, el tratamiento o los tratamientos experimentales no se describen con suficiente detalle
en el reporte del estudio, por lo que si otro investigador desea reproducirlos, le resultará muy difícil o
imposible hacerlo (Mertens, 2010). Por ejemplo, señalamientos tales como “la intervención funcionó”
no nos dice nada, por lo cual se debe especificar en qué consistió tal intervención. Las instrucciones
deben incluirse, y la minuciosidad con que se comuniquen es un elemento importante.
15

7. Efectos de novedad e interrupción
Un nuevo tratamiento puede tener resultados positivos simplemente por ser percibido como novedo-
so, o bien, lo contrario: tener un efecto negativo porque interrumpe las actividades normales de los
participantes. En este caso, es recomendable inducir a los sujetos paulatinamente al tratamiento (no
de manera intempestiva) y esperar a que asimilen los cambios que este naturalmente provoca (Gerber
y Green, 2012 y Mertens, 2010).

8. El experimentador
A quien también consideramos una fuente de invalidación interna, pues puede generar alteraciones o
cambios que no se presentan en situaciones no experimentales. Es decir, que el tratamiento solo tenga
efecto con la intervención del experimentador.

9. Interacción entre la historia o el lugar y los efectos del tratamiento
experimental
Un experimento conducido en un contexto en particular (tiempo y lugar), en ocasiones no puede ser
duplicado (Mertens, 2010). Por ejemplo, un estudio que se efectúe en una empresa en el momento en
que se reestructuran departamentos (donde algunos quizá se mantengan, otros se reduzcan y hasta
algunos desaparezcan). O bien, un experimento en una escuela secundaria que se lleva a cabo al tiem-
po que su equipo de futbol obtiene un campeonato nacional.
Asimismo, en ocasiones los resultados de un experimento no pueden generalizarse a otros lugares
o ambientes. Si se realiza una investigación en una escuela pública recientemente inaugurada, que
cuenta con los máximos avances tecnológicos y educativos, ¿podemos extrapolar los resultados a todas
las escuelas públicas de la localidad? A veces, el efecto del tratamiento lo tenemos que analizar en dis-
tintos lugares y tiempos (Creswell, 2013a).

10. Mediciones de la variable dependiente
Puede suceder que un instrumento no registre cambios en la variable dependiente (ejemplo: cuestio-
nario) y otro, sí (observación). Si en un experimento se utiliza un instrumento para recolectar datos, y
de este modo sus resultados puedan compararse, otros estudios deberán evaluar la variable dependien-
te con el mismo instrumento o uno equivalente (lo mismo en situaciones no experimentales).

DISEÑOS EXPERIMENTALES DE SERIES CRONOLÓGICAS MÚLTIPLES
Cuando el experimentador se interesa en analizar los efectos en el mediano o largo plazos, porque supo-
ne que la influencia de la variable independiente sobre la dependiente tarda en manifestarse, por
ejemplo, en programas de difusión de innovaciones, tratamientos médicos, métodos educativos, pro-
cesos industriales, introducción de tecnologías o estrategias psicoterapéuticas, es conveniente que adop-
te diseños con varias pospruebas. A estos diseños se les conoce como series cronológicas experimentales. En
realidad, el término serie cronológica se aplica a cualquier diseño que permita efectuar varias observa-
ciones o mediciones sobre una variable a través del tiempo, sea o
Series cronológicas Diseños que, a no experimental, sólo que en este caso se les llama experimen-
través del tiempo, efectúan diversas
observaciones o mediciones sobre una
tales porque reúnen los requisitos para serlo.
variable. Estos diseños operan con dos o más grupos y los partici-
pantes o casos son asignados al azar a ellos. Sin embargo, debi-
do a que transcurre mucho más tiempo entre el inicio y la
terminación del experimento, el investigador debe tener cuidado de que no ocurra algo que afecte de
manera distinta a los grupos (con excepción de la manipulación de la variable independiente). Lo
mismo sucede cuando el estímulo se aplica durante mucho tiempo (por ejemplo, programas motiva-
16       Capítulo 5  Diseños experimentales. Segunda parte

cionales para trabajadores que duran semanas), pues con el paso del tiempo es más difícil mantener la
equivalencia inicial de los grupos.
Un ejemplo del proceso de diagramación de las series cronológicas experimentales se muestra en
la tabla 5. 6.

  Tabla 5.6  Ejemplos de experimentos de series cronológicas.

Serie cronológica sin preprueba, con varias pospruebas y grupo de control
RG1 X1 01 02 03
RG2 X2 04 05 06
RG3 X3 07 08 09
RG4  010
0 11
012
Serie cronológica con preprueba, con varias pospruebas y grupo de control
RG1 01 X1 02 003 004
RG2 05 X2 06 007 008
RG3 09  0 10
0 11
012
Serie cronológica basada en el diseño de cuatro grupos de Solomon
RG1 01 X 02 03
RG2 04  05 06
RG3  X 07 08
RG4   09 010

Las pospruebas pueden ser tantas como se requiera y sea posible aplicar.
Asimismo, en otras ocasiones se desea analizar la evolución de los grupos antes y después del tra-
tamiento experimental. En esta situación pueden incluirse varias prepruebas y pospruebas, en cuyo
caso se tendrían esquemas como el siguiente:

R G1 01 02 03 X1 0 0 0

R G2 04 05 06 X2 0 0 0

R G3 07 08 09  0 0 0

Ejemplo
Diseño experimental de serie cronológica
Un consultor en cuestiones organizacionales estudia el efecto sobre la dedicación al trabajo que tiene la difusión de una
serie de valores, que la directiva de una corporación considera deben ser implantados en la empresa.
Pregunta de investigación: ”Cuanto más conozca el personal de una corporación los valores de esta (definidos por su
directiva), ¿mostrará mayor dedicación al trabajo?
Hipótesis de investigación: “El mayor conocimiento de los valores corporativos genera mayor dedicación al trabajo”.
Hipótesis estadística: rxy > 0
El consultor selecciona a 99 personas de la corporación, de todos los niveles jerárquicos, y los asigna al azar a tres grupos:
1) Uno participa en una reunión de dos horas en donde se le presentan ampliamente los valores corporativos con
aplicaciones a situaciones específicas de trabajo; posteriormente sus miembros reciben un folleto con explicaciones
adicionales.
2) Otro asiste a una sesión breve donde se proporciona un folleto sobre los valores corporativos (no hay explicación
verbal ni discusión o sesión de preguntas y respuestas).
17

3) El tercer grupo asiste a una sesión donde se trata algún aspecto no relacionado con el trabajo o la organización
(digamos, un tema de interés general).

Antes de administrar los tratamientos a todos los participantes, se les aplica tres mediciones de la dedicación al tra-
bajo. Asimismo, después de los tratamientos, también se les aplica tres mediciones de la misma variable (al corto,
mediano y largo plazos). El diseño se debería diagramar como se muestra en la figura 5.1.
Recuerde que se pretende medir la dedicación al trabajo. Cada grupo estaría integrado por 33 personas.

  Figura 5.1  Diseño del ejemplo de serie cronológica sobre la dedicación al trabajo de tres grupos.

Una ventaja del diseño consiste en que es posible evaluar la evolución comparativa de los grupos. Por
ejemplo, si se encontraran los siguientes resultados con una escala (hipotética) de dedicación al trabajo,
con valores de 0 a 25:

R G1 11 11 11.2 X1 16 18 21

R G2 10.8 11 10.9 X2 15 14 11.8

R G3 11.1 10.9 11.3  11 10.8 11.4

Podemos observar que X1 tiene un efecto que aumenta con el paso del tiempo y X2 produce
un efecto en el corto plazo, pero tiende a desvanecerse con el paso del tiempo. Esto podría graficarse
del siguiente modo:
18       Capítulo 5  Diseños experimentales. Segunda parte

Nivel de la variable dependiente
(declinación en el trabajo)

09 08 07 X1 04 05 06

Tratamiento uno

 
19

 

En los diseños experimentales de series cronológicas se realiza este tipo de gráficas, las cuales enri-
quecen la interpretación de la evolución de los grupos. Algunas de las diversas configuraciones que se
presentan se muestran en las figuras 5.2, 5.3 y 5.4.
En este caso, debe observarse que no sea algún suceso ajeno el que provoque el efecto, en lugar de
la manipulación de la variable independiente. Podría ocurrir que:

  Figura 5.2  Ejemplo de un suceso ajeno a X que provoca el efecto.
Escala de la variable dependiente

Suceso que es
independiente a X

01 02 03 04 05 06 07 08
20       Capítulo 5  Diseños experimentales. Segunda parte

  Figura 5.3  Ejemplo de un efecto que perdura.

01 02 03 X 04 05 06 07
01

  Figura 5.4  Ejemplo de ausencia de efecto por el tratamiento.
Escala de la variable dependiente

01 02 03 04 X 05 06 07
21

Este diagrama se podría comparar con el del grupo de control o demás grupos para analizar lo que
ocurre. Quizá se deba a que no se obtuvo una equivalencia real de los grupos al inicio del experimento.
Se podrían elaborar tantos diagramas o gráficas como grupos, o bien podrían agruparse los efectos
provocados en los distintos grupos en una sola gráfica (varios diagramas en esta), como se observa en la
figura 5.5.
Desde luego, si se mide más de una variable dependiente, en el primer caso se tendrá un diagrama
para cada grupo por cada variable dependiente, mientras que en el segundo, un diagrama por cada varia-
ble dependiente.

  Figura 5.5  Ejemplo de gráficas de series cronológicas.

!
22       Capítulo 5  Diseños experimentales. Segunda parte

Ejemplo
Si el tratamiento es un programa motivacional y las variables dependientes son la motivación intrínseca, la productividad
y la calidad de la producción (con dos grupos experimentales y uno de control), se presentarían las opciones que se
muestran en las figuras 5.6 y 5.7.

  Figura 5.6  Ejemplo de varios diagramas para cada variable dependiente.
23

  Figura 5.7  Ejemplo de un solo diagrama por variable dependiente.

En estos diseños de series cronológicas se controlan todas las fuentes de invalidación interna,
siempre y cuando se lleve a cabo un seguimiento minucioso de los grupos, para asegurarse de que la única
diferencia entre ellos sea la manipulación de la variable independiente. En algunos casos, la repetición
de las mediciones influye sobre la variable dependiente (administración de pruebas múltiples), sobre
todo en las pruebas donde el individuo participa activamente y sabe que está respondiendo a una
medición (cuestionarios, entrevistas, tests estandarizados, aparatos o equipos, etc.), no tanto así en las
medidas en las que el participante es más pasivo y no se encuentra consciente de qué se le mide (por
ejemplo, la observación). De cualquier manera, en caso de que exista dicha influencia, se presentará de
forma similar en todos los grupos (porque son equivalentes y el número de pruebas aplicadas es el
mismo).
Para estos diseños se suelen utilizar diversas técnicas estadísticas complejas, lo cual depende del nivel
de medición de las variables y del tipo de análisis e interpretación que se desee realizar, como análisis
de regresión múltiple o análisis de cambio y series de tiempo. Se recomiendan las siguientes fuentes
para conocer tales análisis: sugerimos a Shmueli (2012), Cryer y Chan (2009); Hawkins (2008); Box,

Jenkins y Reinsel (2008); Kollo y von Rosen (2005), y Kerlinger y Pedhazur (1997).
24       Capítulo 5  Diseños experimentales. Segunda parte

Diseños de series cronológicas con repetición del estímulo
Con cierta frecuencia, el investigador anticipa que el tratamiento o estímulo experimental no tiene
efecto o este es mínimo si se aplica una sola vez, tal como sería hacer ejercicio físico un solo día (no se
esperaría un cambio en la musculatura) o consumir vitaminas por una vez. También, en otras situacio-
nes el investigador quiere conocer el efecto sobre las variables dependientes en cada ocasión que se
aplica el estímulo experimental.
Por ejemplo, en técnicas de condicionamiento es común preguntarse cuántas veces se debe aplicar
el reforzamiento a una conducta para condicionar la respuesta a un estímulo. En estos casos es posible
repetir el tratamiento experimental y administrar una posprueba después de cada aplicación, para
evaluar su efecto.
Los participantes se asignan al azar a los distintos grupos y a cada uno se le administra varias veces
el tratamiento experimental que le corresponde. Algunos de estos diseños diagramados se muestran en
la tabla 5. 7.

  Tabla 5.7  Ejemplo de diseños cronológicos con repetición del estímulo.

El mismo tratamiento se aplica dos veces al grupo experimental:
R G1 01 X1 02 X1 03
R G2 04  05  06
Cada tratamiento se aplica cuatro veces al grupo respectivo:
R G1 01 X1 02 X1 03 X1 04 X1 005
R G2 06 X2 07 X2 08 X2 09 X2 010
R G3 011 X3 012 X3 013 X3 014 X3 015
R G4 016  017  018  019  020

En algunos casos se podría prescindir de las pruebas, y el experimentador, por alguna justificación teórica o em-
pírica, podría aplicar pospruebas a intervalos sistemáticos diferentes.
R G1 X1 01 X1 X1 X1 02 X1 X1 X1 03
R G2 X2 04 X2 X2 X2 05 X2 X2 X2 06
R G3  07    08    09
O bien, aplicar las pospruebas a intervalos irregulares (por alguna determinada razón):
R G1 X1 X1 01 X1 02 X1 X1 X1 003 X1 004
R G2 X2 X2 05 X2 06 X2 X2 X2 007 X2 008
R G3   09  010    011  012

Un ejemplo de estos diseños sería el caso de un publicista que pretende analizar los efectos de un
comercial televisivo en la preferencia del producto anunciado, en comparación con otras marcas, y postu-
la la hipótesis de que una sola exposición al comercial no surtirá efecto alguno. Asimismo, son herramien-
tas comunes para probar la eficacia de medicamentos o tratamientos psicológicos.
Las pruebas estadísticas usuales para validar estos diseños son las mismas que para las series cronoló-
gicas múltiples.

Diseños con tratamientos múltiples
A veces, el investigador desea analizar el efecto de la aplicación de los distintos tratamientos experimenta-
les a todos los grupos o participantes. En estos casos es posible utilizar los diseños con tratamientos múl-
tiples. La aplicación de tratamientos puede ser individual o grupal y asumir distintas configuraciones:
25

a) Varios grupos. En este caso se trabaja con varios grupos a los cuales se asignan los sujetos o parti-
cipantes al azar. A cada grupo se le aplican todos los tratamientos, cuya secuencia puede o no ser
la misma para todos los grupos y es posible administrar una o más pospruebas (posteriores a cada
tratamiento experimental). Dos posibles diagramas de estos diseños son los de la tabla 5.

  Tabla 5.8  Diseños con tratamientos múltiples, varios grupos.

Misma secuencia para los grupos Secuencia diferente
R G1 X1 01 X2 02 X3 03 R G1 X1 01 X2 02 X3 03
R G2 X1 04 X2 05 X3 06 R G2 X2 04 X3 05 X1 06
R G3 X1 07 X2 08 X3 09 R G3 X3 07 X2 08 X1 09

Consecuencia diferente. El experimentador debe tener cuidado cuando interpreta las segundas
pospruebas y mediciones subsecuentes, ya que puede existir una influencia diferente en los grupos
provocada por las distintas secuencias de los tratamientos. En realidad, durante el experimento es
muy probable que haya diferencias entre grupos, e incluso que al finalizar el experimento los
resultados se deban, en buena medida, a la secuencia con que fueron administrados los tratamien-
tos.
Los diseños experimentales con tratamientos múltiples y secuencia diferente
en los grupos, así como los dos casos que vamos a ver a continuación, llegan a tener distintos
efectos que deben analizarse con minuciosidad. Algunos tratamientos tienen efectos reversibles;
en este caso no hay interferencia entre tratamientos, a la vez que las pospruebas son influidas solo
por el tratamiento inmediato anterior (por ejemplo 03, del diseño con secuencia diferente, se vería
afectada por X3, pero no por X2 o X1), lo cual facilita la interpretación. Sin embargo, a menudo los
efectos no son reversibles, sino aditivos o interactivos; esto es, los resultados de una posprueba
pueden ser influidos no sólo por el tratamiento inmediatamente anterior, sino por los que antece-
dieron a este, y no es fácil saber cuánto se debió a X1, cuánto a X2 o Xk. Para ello, en el análisis debe
incluirse la secuencia como factor.
b) Un solo grupo. En situaciones en las que el experimento cuenta con un número reducido de par-
ticipantes, es posible realizar un diseño con tratamientos múltiples y un solo grupo. No hay asig-
nación al azar puesto que se tiene a un único grupo. La equivalencia se obtiene puesto que no hay
nada más similar a un grupo que este mismo. El grupo hace las veces de “grupos experimentales”
y de “control”. Este diseño se diagrama así:

G único   X1   01   X2   02   —   03   X3   04   —   05   Xk   0k…

Cuando se considere conveniente, se utiliza como grupo de control, por ejemplo, antes de 03
y 05. Sin embargo, tal diseño está limitado a que los efectos de los tratamientos múltiples sean
reversibles; de lo contrario no es un diseño experimental, sino cuasiexperimental. Si en estos dise-
ños se introduce sistemáticamente y como variable independiente la secuencia de administración
de los tratamientos, se convierten en factoriales (que se verá a continuación).
Con el fin de comprobar si las secuencias se relacionan con características de los grupos, algu-
nos autores consideran que es útil introducir sistemáticamente otros elementos a los diseños, tales
como presencia-ausencia de la preprueba (por ejemplo, el diseño de cuatro grupos de Solomon,
que se vio en el capítulo siete del texto impreso), así como secuencias diferentes de tratamientos
en varios grupos. Por ejemplo, se podría tener un diseño así:

Niños de 8º año, G1 X1 01 X2 02
G2 X2 03 X1 04
26       Capítulo 5  Diseños experimentales. Segunda parte

Niños de 6º año, G3 X1 05 X2 06
G4 X2 07 X1 08
Niños de 4º año, G5 X1 09 X2 010
G6 X2 011 X1 012
O un número de pospruebas diferentes en los grupos. Por ejemplo, con un diseño como el siguiente,
se tienen diseños factoriales:

R G1 X1 01 02
R G2 X1 03
R G3 X2 04 05
R G4 X2 06
R G5  07 08
R G6  09
En realidad, estos autores tienen razón, porque se manipulan como si fueran una variable indepen-
diente. Sin embargo, la experiencia ha demostrado a algunos profesores que los alumnos que ven por
primera vez el tema suelen desconcertarse si se analizan como diseños factoriales, a menos que estos se
expliquen primero.
Las pruebas estadísticas que se utilizan en estos diseños son las mismas que se emplean para las series
cronológicas y los diseños con repetición del estímulo.
Hasta aquí se han revisado diseños experimentales que manipulan una sola variable independiente
(los tratamientos representan niveles de presencia o modalidades de manipulación de esta; X1, X2, X3,
Xk son variaciones de la misma variable independiente); sin embargo, como ya se señaló en la obra impre-
sa, normalmente se miden diversas variables dependientes para optimizar el costo e incrementar el cono-
cimiento, lo cual permite analizar los efectos de la variable independiente sobre cada dependiente. Por
ejemplo, en un experimento con métodos educativos, en lugar de medir nada más el aprendizaje, es
posible medir también la motivación del alumno, su integración al grupo, etc., lo cual se debería realizar
en la preprueba y la posprueba. O bien, cuando se experimenta con un medicamento (digamos para con-
trolar la hipertensión), se incluyen diversas variables dependientes, como el nivel de presión arterial, glu-
cosa, peso, etc. Cuando se introduce como estímulo una nueva tecnología en una línea de producción, se
consideran distintas variables dependientes tales como productividad, tiempo de procesamiento, paráme-
tros de calidad, etcétera.
Asimismo, por lo regular se incluyen mediciones para verificar qué tanto funcionó la manipulación
(verificaciones de la manipulación).

DISEÑOS FACTORIALES
Los diseños factoriales manipulan dos o más variables independientes e incluyen dos o más niveles o modalidades
de presencia en cada una de ellas para analizar su efecto sobre una o más variables dependientes. Este enfoque
se utiliza muy a menudo en la investigación del comportamiento, las ciencias de la salud y las diferentes
ramas de la ingeniería. La construcción básica de un diseño factorial consiste en que todos los niveles de
cada variable independiente sean tomados en combinación con todos los niveles de las otras variables
independientes (Patience, 2013, The SAGE Glossary of the Social and Behavioral Sciences, 2009t y
Cramer, 2003).
27

Diseño factorial 2 X 2
El diseño factorial más simple manipula (hace variar) dos variables, cada una con dos niveles. A este dise-
ño se le conoce como “diseño factorial 2 × 2”, en donde el número de dígitos indica el número de variables
independientes:

2 × 2
Un dígito Número de grupos
(primera variable resultantes o del
independiente) experimento.

El valor numérico de cada dígito indica el número de niveles o modalidades de la variable inde-
pendiente en cuestión. En este caso es 2, lo cual quiere decir que cada una de las variables tiene dos
niveles. Como mencionan Wiersma y Jurs (2008), no es necesario que los valores numéricos sean los
mismos para todas las variables independientes. En teoría, puede haber cualquier número de variables
independientes con cualquier número de niveles cada una. Por ejemplo, el diseño factorial 2 × 2 × 3
indica que hay tres variables independientes, la primera y la segunda con dos niveles, mientras que la
tercera tiene tres niveles. El diseño factorial 4 × 5 × 2 × 3 indica una variable independiente con cuatro
niveles, otra con cinco, otra más con dos y una última con tres.
Un ejemplo de un diseño factorial 2 × 2 sería que las variables independientes fueran “método de
enseñanza” y “género”, y la variable dependiente el “aprovechamiento escolar”. La primera tiene dos
variantes: “método de enseñanza presencial” y “método de enseñanza en línea”. La segunda, con las
modalidades “masculina” y “femenina”. Otro ejemplo estaría constituido por las variables indepen-
dientes “administración del medicamento” (con los niveles: suministro y placebo) y “condición de
fumador” (fumador-no fumador), y la variable dependiente “control de la hipertensión arterial”.
Un diseño factorial 2 × 3 × 4 (tres variables independientes) podría incluir: “tipo de medica-
mento” (medicamento A-medicamento B), “dosis diaria” (30 mg, 50 mg y 90mg) y “edad” (menos de
30 años, 31-40 años, 41-50 años, más de 50 años). La variable dependiente podría ser “disminución
de síntomas de la enfermedad” (Kamala y Wright, 2008).
El ejemplo de Pérez, Arango y Agudelo (2009) que se presenta en varios capítulos del libro impre-
so constituyó un diseño factorial 2 × 2 × 2 × 2, es decir, cuatro variables independientes, cada una
con dos niveles o modalidades: “experiencia del operario” (menos de cinco años/más de cinco años),
“tipo de dobladora” (hidráulica electrónica/que conduce por aire), “clase de material utilizado” (acero
laminado en frío o cold roll/acero galvanizado) y “grosor” (0.8 mm/ 1 mm). Las variables dependien-
tes fueron dos: “longitud” y “ángulo de doblado de las piezas de metal producidas”.
También podríamos considerar un diseño 3 × 4 que experimentara la “resistencia al fuego”
(variable dependiente), así como tres tipos de materiales (variable independiente 1) y cuatro clases de
grosor (variable independiente 2).

Otros diseños factoriales
El número de grupos o condiciones que se forman en un diseño factorial es igual a todas las posibles
combinaciones que surgen cuando se cruzan los niveles de una variable independiente con los niveles
de las otras variables del mismo tipo. Así, en un diseño 2 × 2 tendremos cuatro grupos (2 por 2 = 4);
en un diseño 3 × 2 resultarán seis grupos, y en un diseño 3 × 3 × 3, 27 grupos. Debe observarse que el
resultado de la multiplicación es el número de grupos resultante. En estos diseños, el número de gru-
pos aumenta con rapidez a la par con el incremento del número de variables independientes o niveles
(exponencialmente). Veámoslo:
28       Capítulo 5  Diseños experimentales. Segunda parte

22 =4

23 =6

33 =9
Número de grupos resul-
34 = 12 tantes o del experimento

322 = 12

334 = 36

Ello se debe a que los niveles tienen que tomarse en cuenta respecto de todas sus posibles combina-
ciones.
Cheng (2014) y Wiersma y Jurs (2008) señalan que en los diseños factoriales, al menos una de las
variables independientes debe ser propiamente experimental; las demás pueden ser variables orgánicas o
cuya variación no es provocada para fines del experimento, introducidas en el diseño con fines de control
[por ejemplo, género, edad, año, escolaridad, inteligencia en intervalos, etcétera. En el estudio de Pérez et
al. (2009), tal fue el caso de la experiencia del operario].

  Figura 5.8  Un diseño factorial 2 X 2.

Diseño 2 × 2

Variable independiente A
Variable independiente B

A1 A2

B1 A1B1 A2B1

B2 A1B2 A2B2

Con objeto de simplificar la forma en que se diagraman los diseños factoriales, acudiremos a la sim-
bología que comúnmente se utiliza.2 Para designar a las variables independientes se usan letras (A, B, C,…
K) y para los niveles, números (1, 2, 3,… K); las combinaciones de letras y números que aparecen en las
casillas (o celdas) representan las mezclas de niveles de las variables independientes. Cada celda es un
grupo o condición. En la figura 5.8 se diagrama un diseño factorial 2 × 2. Otro ejemplo sería un diseño
factorial 2 × 4 × 3 (figura 5.9).

5 Por ejemplo Wiersma y jurs (2008), Ramsey (2006) y Christensen (2006).
29

  Figura 5.9 Diseño 2 X 4 X 3.

A
A1 A2
C C1 C2 C3 C1 C2 C3
B1 A1B1C1 A1B1C2 A1B1C3 A2B1C1 A2B1C2 A2B1C3
B B A1B2C1 A1B2C2 A1B2C3 A2B2C1 A2B2C2 A2B2C3
2

B3 A1B3C1 A1B3C2 A1B3C3 A2B3C1 A2B3C2 A2B3C3
B4 A1B4C1 A1B4C2 A1B4C3 A2B4C1 A2B4C2 A2B4C3

En la figura 5.9 se puede observar que todas las posibles combinaciones de los niveles entre A, B y C
están presentes; además, ninguna es exactamente igual a la otra. Cada combinación representa una celda
o un grupo. Si las tres variables se manipulan deliberadamente (recordemos que al menos una debe serlo
para que hablemos de experimento), los participantes tienen que asignarse al azar a todas las celdas o
grupos. Si dos variables se manipulan intencionalmente (por ejemplo, B y C), los sujetos de cada nivel de
la variable restante (A) serán asignados aleatoriamente a las casillas que les correspondan. Veámoslo con
un ejemplo. Si A = género (A1, masculino; A2, femenino), B = violencia televisada (B4, elevada; B3,
mediana; B2, baja; y B1, nula) y C = orientación paternal sobre el programa visto (C1, por parte de ambos
padres; C2, del padre; y C3, de la madre). Si hay 120 niños y 120 niñas, los niños (A1) se asignarían al
azar a las celdas donde A1 está presente (10 niños en cada celda), y las niñas (A2) a las 12 casillas restantes
(donde A2 está presente, 10 niñas por celda). Si una sola variable es la que se manipula deliberadamente
(por ejemplo, C), los participantes de los niveles combinados de las otras dos variables se asignan al azar a
los niveles de aquella (C1, C2 y C3 en el ejemplo). Los sujetos A1 B1 serían asignados aleatoriamente a
C1, C2 y C3, igual los sujetos A1 B2, A1 B3, etcétera.
Cuando los diseños son factoriales es posible agregar un grupo de control o varios (que no se expon-
gan a la variable o las variables manipuladas deliberadamente, figura 5.10).

  Figura 5.10 Diseño factorial con grupo de control.
Diseño 2 × 2

A1 A2

B1 A1B1 A2B1

B2 A1B2 A2B2

Control

Utilidad de los diseños factoriales
Los diseños factoriales son sumamente útiles porque permiten al investigador evaluar los efectos de cada
variable independiente sobre la dependiente por separado, así como los efectos de las variables indepen-
dientes de manera conjunta. Por medio de estos diseños se observan los efectos de interacción entre las
variables independientes.
En términos de Wiersma y Jurs (2008), la interacción es un efecto producido sobre la variable depen-
diente, de tal manera que el efecto de una variable independiente no permanece constante en los niveles
30       Capítulo 5  Diseños experimentales. Segunda parte

de la otra u otras independientes. El efecto de interacción está presente si el efecto conjunto de las varia-
bles independientes no es igual a sus efectos por separado (aditivos). Ello significa que el efecto de una
variable independiente por sí mismo no es igual que cuando se toma en combinación con los niveles de
otra variable independiente. Por ejemplo, si el alto contenido de violencia televisada afecta sólo cuando
hay orientación sobre el programa por parte de la madre, pero no cuando dicha orientación está a cargo
del padre o de ambos.
Así, hay dos tipos de efectos que es posible evaluar en los diseños factoriales: los efectos de cada variable
independiente (llamados efectos principales) y los efectos de interacción entre dos o más variables indepen-
dientes (si se consideran cuatro variables, por ejemplo, pueden interactuar dos entre sí y otras dos entre sí,
o pueden interactuar tres o las cuatro variables independientes). Los diseños factoriales responden a
estructuras entre variables que se esquematizan en la siguiente forma:
  Figura 5.11  Ejemplo de estructura de un diseño factorial.

Variables Variables
independientes dependientes

X
W

• Y

K
Asimismo, se analizan el efecto de X sobre Y (X à Y), de W sobre Y (W à Y) y el de …K sobre
Y (K àY); el efecto conjunto de X y W sobre Y es
   
X    
.     Y    
.    
W    
y el efecto conjunto de X y …K sobre Y

X
• Y

K

Por su parte, el de W y …K sobre Y sería

W
• Y

K
31

Finalmente, el efecto conjunto de todas las variables independientes sobre Y (tres variables) es el
siguiente:
 
X  
 
W  
.   Y  
.  
 
K  

Ejemplo
Supongamos una investigación cuya hipótesis se puede resumir así: "A mayor exposición por parte de jóvenes univer-
sitarios a videos musicales con alto contenido sexual, habrá una mayor predisposición para establecer contacto hetero-
sexual”.
Posteriormente se diseña un experimento para someterla a prueba. La variable independiente es la expo-
sición a contenidos sexuales (por medio de la televisión) y la dependiente es la predisposición para establecer
contacto sexual (relaciones sexuales). Se decide agregar otra variable independiente: género. En consecuencia, se
ha elaborado un diseño factorial con dos variables independientes. La exposición tendría tres niveles: a) contenido
sexual elevado y manifiesto, b) contenido sexual moderado y c) contenido “romántico”.
En consecuencia, cada video que se elabore tendrá tres versiones: la música es la misma, los modelos, la
duración, la historia y el contexto también. La única diferencia es el tratamiento sexual de los contenidos verbales
y no verbales. El género implicaría dos niveles: masculino y femenino.
El esquema del diseño se indica en la figura 5.12.

  Figura 5.12  Diseño factorial 2 x 3 (correspondiente al ejemplo).

Exposición al contenido sexual

Elevada Moderada Mínima
Género

Masculino

Femenino

Christensen (2006) desarrolla una excelente explicación de los efectos principales e interactivos en los
diseños factoriales, la cual sirve de base para la exposición de dichos efectos que se presenta a continua-
ción.
Supongamos que, una vez que los grupos se han expuesto a los videos, se les aplica una posprueba que
mide su predisposición para establecer contacto sexual y se obtiene el promedio de cada grupo (asimismo,
pensemos que los resultados que lleguen a obtenerse en esta prueba oscilaran entre 0 y 30, donde un valor
mayor indica una más alta predisposición). Analizamos varias configuraciones posibles de resultados
(figura 5.13).
32       Capítulo 5  Diseños experimentales. Segunda parte

  Figura 5.13  Diagramas del ejemplo de diseño factorial).

Si hay diferencias significativas entre los
Marginal promedios de los marginales, hubo efecto
de la variable “horizontal” (en el ejemplo,
el género).
Marginal

Marginal Marginal Marginal

Si hay diferencias significativas entre los
promedios de los marginales, hubo efecto
de la variable “vertical” (en el ejemplo,
exposición al contenido sexual).
Interpretación de efectos

Promedios 25 15 7 15.7
de margi-
25 15 7 15.7 No efecto
nales
25 15 7
Efecto

A B

Elevada Moderada Mínima Elevada Moderada Mínima

Masculino Masculino
25 15 7 18 18 18

Femenino Femenino
25 15 7 8 8 8

La variable exposición tiene efecto; la variable género La variable exposición no tiene efecto; la variable
no tiene efecto. No hay efecto de interacción. género tiene efecto. No hay efecto de interacción.

C D

Elevada Moderada Mínima Elevada Moderada Mínima

Masculino Masculino
26 18 10 23 18 13

Femenino Femenino
10 18 25.9 18 13 8

Ninguna de las variables tiene efecto por sí misma, Las variables tienen efecto, pero no hay efecto de
pero hay un efecto de interacción. interacción.
33

  Figura 5.13  Diagramas del ejemplo de diseño factorial) (continuación).
E B

Elevada Moderada Mínima Elevada Moderada Mínima

Masculino Masculino
29 23 12 18 18 18

Femenino Femenino
20 12 12 8 8 8

Las dos variables tienen efecto y hay efecto de
No hay ningún tipo de efecto.
interacción.

Interpretación y posibles configuraciones
En la configuración A, no hay diferencias por género (cada casilla en cada nivel de género es igual a la del
otro nivel). En cambio, sí las hay entre los niveles de exposición en ambos géneros. Los efectos principales
(es decir, los de cada variable por separado) se observan comparando los promedios de los marginales de
los niveles de cada variable (vea la interpretación de efectos de la figura 5.13, primera parte).
En la configuración B, no hay diferencias por exposición, pero sí por género (el marginal masculino
es mayor).
En la configuración C, las diferencias entre las celdas se explican porque las dos variables interactúan
(cuando el género es masculino y la exposición elevada, y cuando el género es femenino y la exposición
mínima, se obtiene un valor alto; cuando el género es masculino y la exposición mínima, y cuando el
género es femenino y la exposición elevada, se obtiene otro valor bajo; finalmente, cuando ambos géneros
se exponen moderadamente se obtiene un valor distinto de las demás celdas). El máximo efecto se encuen-
tra en “masculino” y “elevada” y “femenino” y “mínima” (26 y 25.9). No se registran efectos principales.
En la configuración D, hay cambios verticales y horizontales provocados por efectos principales, pero no
efecto de interacción (ambas variables tienen efecto por sí mismas, únicamente).
En la configuración E, hay efectos principales (cada variable por sí misma afecta significativamente) y
también efecto de interacción (este se alcanza si la diferencia entre las medias de los niveles de variación de
una variable independiente cambian en función de los niveles de variación de la otra variable indepen-
diente, como también ocurrió en la configuración C).
En la configuración F, las diferencias entre todas las celdas es prácticamente nula: no hay ninguna
clase de efecto.

Métodos estadísticos de los diseños factoriales
Los métodos estadísticos más usuales que se aplican a estos diseños son el análisis de varianza factorial
(ANOVA) y el análisis de covarianza (ANCOVA), con la variable dependiente medida en intervalos, y la
Chi cuadrada para múltiples grupos, con esa variable medida nominalmente.
Por último, a estos diseños se les pueden agregar más variables dependientes (tener dos o más) y se
convierten en diseños multivariados experimentales que utilizan como método estadístico el análisis mul-
tivariado de varianza (MANOVA).
34       Capítulo 5  Diseños experimentales. Segunda parte

¿QUÉ OTROS EXPERIMENTOS EXISTEN? CUASIEXPERIMENTOS
Ya se comentó en el capítulo 7 del libro que los diseños cuasiexperimentales también manipulan delibe-
radamente una o más variables independientes para observar su efecto y relación con una o varias depen-
dientes, sólo que trabajan con “grupos intactos”, formados por motivos ajenos al experimento: cuando se
opta por los diseños cuasiexperimentales los participantes no se asignan al azar a los grupos ni se emparejan,
sino que dichos grupos se integran antes del experimento (Thyer, 2012 y Stone-Romero, 2006). En nues-
tro ejemplo, los grupos del experimento son cuatro de diferentes áreas de una empresa que estaban con-
formados con anterioridad al experimento (las razones por las que cada participante se integró a cada área
no se relacionan con la realización del experimento). Veámoslo gráficamente:

(50 empleados del departamento de
Grupo A Ø Grupo experimental con X1
producción)

(26 empleados de la gerencia de
Grupo B Ø Grupo experimental con X2
recursos humanos)
(37 empleados de la gerencia de
Grupo C Ø Grupo experimental con X3
administración y finanzas)

(29 empleados del departamento de
Grupo D Ø Grupo de control
aseguramiento de la calidad)

De igual manera, pueden ser pacientes de dos hospitales, uno el grupo experimental y el otro el
de control; o bien, tres líneas de producción integradas por distintos colaboradores.

Problema de los diseños cuasiexperimentales
Estos diseños se utilizan cuando no es posible asignar en forma aleatoria los participantes a los grupos
que recibirán los tratamientos experimentales. La falta de aleatorización introduce posibles problemas
de validez interna y externa. Como comenta Weiss (1990, p. 89):
[…] estos diseños deben luchar con la selección como fuente posible de interpretación
equivocada, lo mismo que con la interacción de la selección y otros factores; así como, posi-
blemente, con los efectos de la regresión.
Asimismo, diversos elementos pudieron operar en la formación de los grupos (que no están
bajo el control del investigador), los cuales impiden afirmar que sean representativos de poblaciones
más amplias (Holmes, 2013). De este modo, dado que su validez es menor que la de los experimentos
“puros”, reciben el nombre de cuasiexperimentos.
A causa de los problemas potenciales de validez interna, cuando opta por un diseño el investiga-
dor debe intentar establecer la semejanza entre los grupos, lo cual requiere considerar las características
o variables que estén relacionadas con las variables estudiadas (Babbie, 2014 y Wiersma y Jurs, 2008).
Por ejemplo, si grupos intactos de trabajadores se involucran en un experimento sobre motivación o
la introducción de ciertas normas de calidad, el turno probablemente tenga que ser introducido como
una constante (grupos intactos, que sean todos del mismo turno) o como otra variable independiente
(de control). Además, el investigador debe recabar evidencia de que los grupos son equiparables en
salario, productividad, competencia, antigüedad en la organización y, en general, en todo lo que gene-
re diferencias significativas entre ellos. Cuanta mayor información se obtenga sobre los grupos, mayo-
res bases se tendrán para establecer su semejanza. En algunos casos se debe observar si la proporción
de mujeres y hombres en los grupos es semejante, si la edad promedio es similar, si los grupos no
fueron constituidos con base en un criterio que pudiera afectar (por ejemplo, formación de los salones
por inteligencia) y si a los grupos en el pasado no les ha ocurrido algo que llegara a influir en los resul-
tados. Además, como mencionan Campbell y Stanley (1966, p. 70):
35

…precisamente porque hay falta de control experimental total, es imprescindible que el
investigador conozca a fondo cuáles son las variables particulares que su diseño específico no
controla. Así, estará más pendiente de su posible influencia y tendrá mejores elementos para
evaluarla.
La ausencia de asignación al azar obliga al investigador a poner especial atención cuando interpreta
los resultados para no caer en conclusiones erróneas. Las limitaciones deben identificarse con claridad, la
equivalencia de los grupos debe discutirse y la posibilidad de generalizar los resultados, así como la repre-
sentatividad, deben argumentarse sobre una base lógica (Thyer, 2012, Wiersma y Jurs, 2008 y Reichardt,
2004).
Los cuasiexperimentos difieren de los
Cuasiexperimento  Experimento en el que los experimentos “puros” en la equivalencia inicial
sujetos no se asignan al azar a los grupos ni se de los grupos (los primeros trabajan con grupos
emparejan, porque tales grupos ya existían. La intactos y los segundos utilizan un método para
variable exposición no tiene efecto; la variable
género tiene efecto. No hay efecto de interac- hacer equivalentes a los grupos). Sin embargo,
ción. esto no quiere decir que sea imposible realizar
un cuasiexperimento en el cual las variables rele-
vantes para el estudio sean equiparables. Si así
fuera, los cuasiexperimentos ya se hubieran desechado como diseños de investigación. Más bien quiere
decir que, en algunos casos, los grupos pueden diferir significativamente o no ser equiparables; de este
modo, el investigador debe analizar si los grupos son o no comparables desde el inicio. En caso negativo,
el investigador no debe realizar la investigación con fines explicativos, esto es, limitarla a propósitos des-
criptivos y/o correlacionales.
Una recomendación útil para consolidar la validez interna de esta clase de diseños experimentales es
asignar al azar los tratamientos o estímulos.

Tipos de diseños cuasiexperimentales
Con excepción de la diferencia que acabamos de mencionar, los cuasiexperimentos son muy parecidos a
los experimentos “puros”. Por lo tanto, podemos decir que hay tantos diseños cuasiexperimentales como
experimentales “puros”, sólo que no se recurre a la asignación al azar ni al emparejamiento. Por lo demás
son iguales, pues la interpretación es similar, las comparaciones y los análisis estadísticos son los mismos
(salvo que a veces se consideran las pruebas para datos no correlacionados y relaciones no lineales). Es por
ello que nos limitaremos a ver sólo algunos de los diseños cuasiexperimentales (el resto puede ser dedu-
cido de sus correspondientes diseños experimentales “puros”, con solo quitarles la “R” de asignación al
azar) y se comentarán brevemente porque se insiste en que las comparaciones, interpretaciones y los
análisis son prácticamente equiparables.6  Consideramos que no sería adecuado volver a explicar dichas
comparaciones, interpretaciones y análisis.
Diseño con posprueba únicamente y grupos intactos. Este primer diseño utiliza dos grupos, pero solo
1.
uno recibe el tratamiento experimental. Los grupos son comparados en la posprueba para analizar si
el tratamiento experimental tuvo un efecto sobre la variable dependiente (01 con 02). El diseño
puede diagramarse del siguiente modo, en el cual, tal como se ve, no hay asignación al azar ni empa-
rejamiento:
G1 X 01
G2 — 02
Observe que si los grupos no son equiparables entre sí, las diferencias entre las pospruebas de
ambos grupos se deben atribuir a la variable independiente o a otras razones, pero lo peor es que el
investigador quizá no se dé cuenta de ello. Por ejemplo, supongamos que se lleva a cabo un cuasiex-
perimento para analizar el efecto de la realimentación que los médicos dan a sus pacientes (respecto
6 Si al lector le surge alguna duda respecto de qué comparaciones, interpretaciones y análisis pueden llevarse a cabo en un diseño cuasiexpe-
rimental, le recomendamos que revise el diseño experimental “puro” correspondiente. Vale recordar que la diferencia es que en el cuasiexperi-
mental no hay aleatorización y los grupos pueden estar no correlacionados.
36       Capítulo 5  Diseños experimentales. Segunda parte

de su conducta en el tratamiento prescrito) sobre la obediencia o apego al tratamiento. En este caso
se podría partir de la siguiente hipótesis: “Los pacientes que reciban mayor realimentación de parte
de sus médicos, acerca de cómo se comportan en el tratamiento prescrito, se apegarán más a este”. Es
decir, los médicos que informen más a sus pacientes sobre su observancia del tratamiento prescrito
propiciarán en estos un mayor deseo de continuar con la terapia. La cuestión es motivar al paciente.
Entonces, el investigador toma dos grupos de pacientes. Uno de ellos recibe realimentación sobre su
conducta en el tratamiento prescrito y el otro, no. Posteriormente se evalúa en qué medida se apega
cada grupo, en lo sucesivo, al tratamiento. Supongamos que obtenemos el siguiente resultado: 01 >
02 (el grupo experimental se apega más); entonces, deducimos que la hipótesis fue confirmada. Pero,
para estar seguros de ello, debemos analizar con mucho cuidado que sea posible comparar a los gru-
pos.
Imaginemos que el grupo experimental estaba formado por pacientes que asisten a un hospital
donde con frecuencia se imparten pláticas motivadoras para que los enfermos sigan los tratamientos
prescritos, mientras que el grupo de control estaba integrado por personas que asisten a un hospital
donde no se le asigna importancia a ello. ¿A qué razón se le podrían atribuir con certeza los resultados?
¿A la manipulación de la variable independiente, a que los grupos de pacientes provienen de diferen-
tes hospitales, a ambos factores, a la sensibilización previa o a algún otro? Como los grupos no son
razonablemente equiparables, no tendríamos la certeza de cuál fue la causa o qué tanto contribuyeron
los diversos factores involucrados. En casos como este podemos decir que existe un problema de vali-
dez interna.
También podría ser que el grupo experimental estuviera compuesto por pacientes que, desde
antes del experimento, tuvieran una motivación elevada para apegarse a tratamientos médicos; o tal
vez hayan operado otras causas que provocaran diferencias iniciales entre los grupos. Por ello, es
importante que los grupos sean inicialmente comparables y que durante el experimento no ocurra
algo que los haga diferentes, con excepción de la presencia-ausencia del tratamiento experimental
(por ejemplo, misma enfermedad y tratamiento, hospital, médico que los atiende, instrucciones y
lugar, equivalencia como grupos en género, edad, avance de la enfermedad, etc.; nada más imagine-
mos que el grupo experimental, en promedio, está “más enfermo” que el de control, y los pacientes lo
saben; también llega a suceder que los más enfermos se apeguen más al tratamiento). El criterio de los
experimentos “puros” de mantener la igualdad de los grupos (salvo la manipulación de la variable
independiente) se aplica por igual a los cuasiexperimentos.
Puede extenderse el diseño para incluir más de dos grupos. Se tienen así diferentes tratamientos
experimentales o niveles de manipulación. Su formato general sería:

G1 X1 01
G2 X2 02
G3 X3 03
• • •

• • •

Gk Xk 0k
Gk=1  0k=1
37

El último grupo es de control.
Un ejemplo de este diseño serían cuatro grupos escolares de un mismo semestre y carrera (licen-
ciatura) en una universidad, como grupos del cuasiexperimento. Veámoslo esquemáticamente en la
tabla 5.9.
  Figura 5.9  Diagrama de un ejemplo del diseño cuasiexperimental con posprueba únicamente.

Universidad del Centro
Escuela de Psicología
Tercer semestre
Grupo X1 01

Grupo X2 02

Grupo X3 03

Grupo — 04

Recuerde que los grupos son intactos (no se generan) y ya se habían constituido por motivos
diferentes al cuasiexperimento (en este caso, la elección de estudiar una carrera y la asignación de
alumnos a los grupos por parte de la escuela de psicología). Los tratamientos experimentales
podrían ser métodos educativos.
Otro ejemplo sería tener tres plantas de manufactura y dos sistemas de calidad o normas ISO
experimentales (la tercera planta constituiría el grupo testigo).
Peña, Hancock y Merola (2009) efectuaron un cuasiexperimento que demostró que los indi-
viduos que utilizan avatares de color negro desarrollan intenciones más agresivas y menor cohesión
grupal que quienes usan avatares de color blanco.7 El estudio apoya el efecto de proteus, el cual
indica que en un ambiente virtual el tipo de vestimenta y caracterización del avatar puede tener
efectos en la activación de pensamientos negativos (como la agresión) y la inhibición de pensa-
mientos prosociales (por ejemplo, cohesión y afiliación). Incluso estos efectos podrían tener impli-
caciones para quienes en la vida real desempeñan papeles mediatizados por un ambiente virtual,
como los pilotos de aviones de guerra.
2. Diseño con prueba-posprueba y grupos intactos (uno de ellos de control). Este diseño es similar al que
incluye posprueba únicamente y grupos intactos, sólo que en este caso a los grupos se les adminis-
tra una preprueba, la cual puede servir para verificar la equivalencia inicial entre ellos (si son
equiparables no debe haber diferencias significativas entre las prepruebas de los grupos). Su esque-
ma más sencillo sería el siguiente:
G1 01 X 02
G2 03 — 04
Este enfoque puede extenderse a más de dos grupos (niveles o modalidades de manipulación
de la variable independiente), lo cual se esquematizaría así:

G 1 01 X1 02

G 2 03 X2 04

G 3 05 X3 06

• • • •

• • • •

Gk 02k–1 Xk 02k
Gk+1 02k+1 — 02(k+1)
7 Recordemos una vez más que en este contexto un avatar es un personaje o representación de un usuario para participar en un juego o tarea.
38       Capítulo 5  Diseños experimentales. Segunda parte

Las posibles comparaciones entre las mediciones de la variable dependiente y las
interpretaciones son las mismas que en el diseño experimental de preprueba-posprueba
con grupo de control, solo que, en este segundo diseño cuasiexperimental, los grupos son
intactos y en la interpretación de resultados debemos tomarlo en cuenta. Recuerde todo lo
que se ha dicho de la probable no equivalencia de los grupos. Este aspecto se aplica a todos
los diseños cuasiexperimentales.
3. Diseños cuasiexperimentales de series cronológicas
En ocasiones el investigador pretende analizar efectos a mediano y largo plazos o los efectos de la
administración del tratamiento experimental varias veces, pero no cuenta con la posibilidad de asignar
de manera aleatoria los casos, sujetos o participantes a los grupos del experimento. En estas condicio-
nes, pueden utilizarse los diseños cuasiexperimentales, salvo que los grupos son intactos. En ambas
situaciones se aplican mediciones repetidas de la variable dependiente y se inserta el tratamiento
experimental entre dos de esas mediciones en, al menos, un grupo, mientras que al otro grupo no se
le aplica ningún tratamiento en el periodo de “experimentación”. Sin embargo, desde la perspectiva
de la literatura clásica sobre experimentos (vea Campbell y Stanley, 1966) se reconoce como cuasiex-
perimento a un diseño que no tiene grupo de control, tema que trataremos a continuación.
Domina (2009) implementó un diseño de esta naturaleza para evaluar la eficacia de los programas de
asesoría, vinculación y orientación a alumnos que transitan de la educación media a la educación
superior. El grupo experimental estuvo constituido por alumnos de escuelas que participaron en
algún programa de este tipo y el grupo de control por estudiantes de instituciones que no contaban
con un esfuerzo similar. El efecto se midió durante su desempeño en la universidad. Obviamente, no
había posibilidad de asignación aleatoria. Al final, se eligieron casos similares en cada condición, una
especie de “emparejamiento”.

Series cronológicas de un solo grupo

G 01 02 03 X 04 05 06

A un único grupo se le administran varias prepruebas, después se le aplica el tratamiento experimental y
finalmente varias pospruebas. El diseño se diagrama así:
El número de mediciones está sujeto a las necesidades específicas de la investigación que
realizamos. Idealmente, puede convertirse en una serie cronológica con varios grupos (tema
que se revisa más adelante).
Un ejemplo muy difundido de este diseño lo constituyó la evaluación de un programa que tenía por
objeto disminuir la velocidad en carreteras del estado de Connecticut, Estados Unidos (Campbell,
1975). Los investigadores recolectaron informes y datos de accidentes de tránsito correspondientes a
varios años anteriores y ulteriores a la implantación del programa. Descubrieron que después del progra-
ma el número de accidentes disminuyó. Sin embargo, como las distintas mediciones habían mostrado
una pauta ascendente y descendente inestable durante varios años, no se podía tener la certeza de que el
programa hubiese sido la razón del descenso del número de accidentes (Weiss, 1990). En consecuencia,
fue necesario comparar las estadísticas de Connecticut con las de otros cuatro estados vecinos en los que
no se habían efectuado los cambios en los reglamentos de tránsito propuestos por el programa del men-
cionado estado. Dichas entidades actuaron como grupos de control. Finalmente, se observó que en los
otros estados no se había registrado una disminución equivalente del número de accidentes. Las compa-
raciones dieron pie para concluir que el programa había generados los efectos deseados (Campbell, 1975
y Glass, 1968).
39

  Figura 5.14  Ejemplo de un cuasiexperimento en su primera etapa.

  G   X  
Accidentes   Accidentes   Accidentes   Accidentes   Accidentes   Accidentes   Accidentes   Accidentes  
1951   1952   1953   1954   1955   1956   1957   1958  
1952  

Estado  de   Programa  para  
Connecticut   disminuir  accidentes  

En su primera etapa, esta investigación cuasiexperimental utilizó las series cronológicas de un solo
grupo (figura 5.14).
Otro ejemplo de este diseño sería medir las ventas de un producto durante varios meses, introdu-
cir una campaña publicitaria para ese producto y, después, medir durante meses el nivel de ventas.
Además, de nuevo, en una situación ideal, los grupos testigos podrían ser otros productos de la com-
petencia sin campañas similares.
Estos diseños suelen utilizarse cuando se introducen innovaciones tecnológicas en empresas, pro-
bar resistencia y durabilidad de procesos de construcción, etc. También podrían emplearse para eva-
luar el efecto de reformas hacendarias, políticas públicas, medidas epidemiológicas (como una
campaña de vacunación) o programas sociales.
Las series cronológicas de un solo grupo llegan a producir diversos patrones de resultados. A

  Figura 5.15  Ejemplos de resultados en series cronológicas de un solo grupo.
40       Capítulo 5  Diseños experimentales. Segunda parte

manera de ejemplo podríamos tener los patrones que se muestran en la figura 5.15 (algunos de los cuales
fueron expuestos en las series cronológicas experimentales).
En las series cronológicas de un único grupo debe tomarse muy en cuenta que no se tiene punto
de comparación (grupo de control); por lo tanto, la interpretación del patrón de la variable dependiente
(o patrones de las variables dependientes) tiene que ser muy cuidadosa, y debe analizarse si no han actua-
do o interactuado otras posibles causas, además del tratamiento experimental o variable independiente. La
historia y el hecho de que el grupo sea atípico son riesgos que se afrontan cuando se emplea este diseño,
al igual que la instrumentación. Normalmente, este diseño cuasiexperimental se utiliza con propósitos
correlacionales y no explicativos.

Series cronológicas cuasiexperimentales con múltiples grupos
Estos diseños pueden adoptar la estructura de las series cronológicas experimentales, con la diferencia de
que en estas últimas la asignación de los individuos a los grupos es aleatoria, mientras que en las cuasiex-

  Tabla 5.10  Ejemplos de diseños cuasiexperimentales con series cronológicas.

Sin prepruebas y grupo de control

G1 O1 O2 O3 X O4 O5 O6
G2 O7 O8 O9 — O10 O11 O12

perimentales tenemos grupos intactos. Por lo tanto, ocurrirían las mismas variaciones8 que se muestran
en la tabla 5. 10.

G O O X O O X O O O X O O O
1 1 2 1 3 4 1 5 6 7 1 8 9 10

G O11 O — O O — O O O — O O O
2 12 13 14 15 16 17 18 19 20

5 Recomendamos al lector que revise los apartados relativos a las series cronológicas experimentales antes de leer este apartado. En ellos podrá
notar que los diseños son los mismos, salvo que en los esquemas y diagramas de las series experimentales aparece el símbolo “R” de asignación
al azar. Por lo tanto, aquí se omiten explicaciones, interpretaciones y ejemplos; de lo contrario, pecaríamos de redundantes. Solo nos limitaremos
a esquematizar los diseños, sin explicaciones, porque lo que puede decirse es lo mismo que lo que dijimos en las series cronológicas experimen-
tales. Desde luego, debe resaltarse que en las series cuasiexperimentales los grupos son intactos y es necesario asegurar que los grupos sean
equiparables.
G2 X2 O4 O5 O6

G3 X3 O7 O8 O9

G4 — O10 O11 O12
41

Con prepruebas y grupo de control
G 0 X 0 X 0 X 0 X 0 0
1 1 1 2 1 3 1 4 1 5 6

G 0 X 0 X 0 X 0 X 0 0
2 7 2 8 2 9 2 10 2 11 12

G 0 — 0 — 0 — 0 — 0 0
3 13 14 15 16 17 18

Series cronológicas cuasiexperimentales con repetición de estímulo
Estas series también son similares a sus correspondientes experimentales, pero con grupos intactos. Así,
tendríamos los siguientes diagramas para ilustrarlas:

Series cronológicas cuasiexperimentales con tratamientos múltiples
Al igual que en los casos anteriores, estas series son similares a sus correspondientes experimentales, sólo
que con grupos intactos. Por lo tanto, tendríamos diagramas como estos:

G1 X1 01 02 X2 03 04 X3 05 06 07
G2 X2 08 09 X1 010 011 X3 012 013 014
G3 X3 015 016 X2 017 018 X1 019 020 021
G4 X2 022 023 X3 024 025 X1 026 027 028
G5 X1 029 030 X3 031 032 X2 033 034 035
G6 X3 036 037 X1 038 039 X2 040 041 042

TIPOS DE VARIABLES EN EXPERIMENTOS Y CUASIEXPERIMENTOS
Como complemento de lo que se menciona en el libro sobre variables y experimentos, solo queremos
ahondar un poco sobre los tipos de variables en los diseños experimentales y cuasiexperimentales. Los
principales tipos de variables son:
1. Independiente: tratamiento experimental que provoca efectos (causa). Resulta la variable manipula-
da.
2. Dependiente: efecto o consecuencia (provocado/a por el tratamiento o variable independiente). Es
la variable medida.
3. Interviniente: moderador de la relación causal entre la variable independiente y dependiente. Si no
se conoce su efecto o no se controla, el experimento puede invalidarse.
4. Explicaciones rivales o fuentes de invalidación interna (pueden ser variables independientes o inter-
vinientes): su influencia debe conocerse o controlarse pues, de no ser así, el experimento puede
invalidarse. Asimismo, es factible que se combine con otras variables para afectar a la dependiente.
5. Variable de control: influye en la dependiente, pero es neutralizada por el diseño o por los procedi-
mientos estadísticos.
La diferencia entre la variable de control e interviniente reside en que en la primera se neutralizan
  Figura 5.16  Diferencia entre variables interviniente y de control.
Variable de control: tipo de
escuela (pública-privada)

Variable independiente:
método educativo Variable dependiente:
(tradicional-moderno): dos aprendizaje de estadística
grupos experimentales

Variable interviniente: horas
de estudio
42       Capítulo 5  Diseños experimentales. Segunda parte

sus efectos, y en la segunda estos se conocen (Creswell, 2013a y Clark y Shadish, 2007). Un ejemplo sería
el que se muestra en la figura 5.16.
La variable independiente se manipula (a un grupo se le expone a un método, al otro a un método
distinto). El tipo de escuela se controla asignando a los dos grupos (en la misma proporción) alumnos de
escuelas públicas y privadas por igual (la composición de cada uno sería: 50% de estudiantes de institu-
ciones públicas y 50% de escuelas privadas). Los efectos de la variable interviniente se conocen cuando se
mide el número de horas dedicadas al estudio (con su introducción al análisis). La variable dependiente
se mide. Los análisis estadísticos ayudan a esclarecer las relaciones entre todas las variables.
Otros ejemplos podrían ser:
• Variable independiente: tipo de maquinaria (A y B).
• Variable dependiente: productividad (número de piezas producidas en un cierto periodo).
• Variable de control: capacitación del equipo de trabajo (número de horas y cursos).
• Variable interviniente: experiencia del equipo de trabajo (años).
• Variable independiente: tipo de tratamiento médico (A y B).
• Variable dependiente: presión arterial.
• Variable de control: género.
• Variable interviniente: nivel de ejercitación (horas y tipo).

Nota final: Los pasos de un diseño cuasiexperimental son los mismos que los de uno experimental.

DISEÑOS NO EXPERIMENTALES CAUSALES
En el capítulo 7 de Metodología de la investigación se señaló que, en ocasiones, en los diseños no experi-
mentales causales se reconstruyen las relaciones a partir de la(s) variable(s) dependiente(s), en otras a
partir de la(s) independiente(s) y en otras más sobre la base de variabilidad amplia de las independientes
y dependientes (Maggetti, Gilardi y Radaelli, 2013 y León y Montero, 2003). Al primer caso se le cono-
ce como retrospectivo, al segundo como prospectivo y al tercero como causalidad múltiple. Veámoslos
más a detalle.
Supongamos que mi interés es analizar las causas por las cuales algunos clientes, y otros no, han uti-
lizado el crédito que les fue otorgado por una cadena de tiendas departamentales. En este caso, la variable
dependiente tiene dos niveles: a) clientes que sí han utilizado su crédito y b) clientes que no lo han hecho.
Empleamos la base de datos de los clientes y los agrupamos en el nivel que les corresponde. Luego, les

  Figura 5.17  Ejemplo de una reconstrucción causal retrospectiva.

5.17
43

preguntamos a quienes sí han empleado el crédito los motivos que tuvieron para ello; del mismo modo, a
quienes no lo han hecho, les preguntamos las razones por las que no lo han utilizado. Así determinamos
las causas que nos importan. El estudio podría diagramarse tal como se muestra en la figura 5.17. El estu-
dio causal se desarrolla en un momento particular y único.
Veamos ahora una investigación causal prospectiva: imaginemos que deseamos indagar si la variable
antigüedad provoca o no mayor lealtad a la empresa y por qué. Como primer paso, dividimos a los
empleados con relación a la variable independiente: a) muy alta antigüedad (25 o más años en la organi-
  Figura 5.18  Ejemplo de una reconstrucción causal prospectiva.

zación), b) alta antigüedad (16 a 24 años), c) mediana antigüedad (9 a 15 años), d) baja antigüedad
5.18
(cuatro a ocho años), e) muy baja antigüedad (uno a tres años) y f ) ingreso reciente (un año o menos).
Posteriormente, medimos los niveles de lealtad y cuestionamos a los empleados sobre cómo la antigüe-
dad ha generado o no mayor lealtad. De esta forma determinamos los efectos de interés (figura 5.18.)
En los diseños donde se reconstruyen las relaciones sobre la base de variabilidad amplia de las
independientes y dependientes no se parte de una variable en especial ni de grupos, sino que se evalúa
la estructura causal completa (las relaciones en su conjunto. Vea la figura 5.19).
Todos los estudios transeccionales causales nos brindan la oportunidad de predecir el comporta-
miento de una o más variables a partir de otras, una vez que se establece la causalidad. A estas últimas

  Figura 5.19  Modelo mediatizador del clima organizacional.

5.19
44       Capítulo 5  Diseños experimentales. Segunda parte

se les denomina variables predictoras. Tales diseños requieren de análisis multivariados, que se men-
cionan en el capítulo 8 de este centro de recursos: Análisis estadístico: segunda parte. En la figura 5.19
simplemente incluimos un ejemplo de una estructura causal compleja. Lo importante es que se com-
prenda cómo en ocasiones se analizan múltiples variables y secuencias causales.
En el caso del modelo de la figura 5.19, las percepciones sobre las variables o dimensiones del
clima organizacional (trabajo, papel que se desempeña, líder o superior, grupo de trabajo y elementos
de la organización) influyen en la motivación y el desempeño, pero con la mediación de las actitudes
hacia el trabajo (satisfacción en el trabajo, involucramiento en el trabajo y el compromiso con la
empresa o institución). Es decir, hay dos niveles de variables intervinientes: las del clima y las actitudes
hacia el trabajo. El modelo se fundamenta en Parker et al. (2003) y Hernández-Sampieri (2005). Las
percepciones psicológicas del clima son las variables predictoras iniciales.
45
capítulo

6 Encuestas (surveys)

DEFINICIÓN DE ENCUESTA O SURVEY
La investigación por encuestas es una de las opciones más socorridas en las diferentes ciencias sociales, ambientales y de la
salud, aunque también la utilizan otras disciplinas más exactas, debido a su flexibilidad y a que puede responder a una amplia
gama de preguntas de estudio, desde el “qué” y “quién”, hasta el “cómo” y “por qué”.
Las encuestas recolectan sistemáticamente datos de numerosos individuos para entender a la población o universo al que
representan (McLaren, 2014, Nardi, 2013, Julien, 2008 y McMurtry, 2005).
Creswell (20013a) considera la encuesta como un diseño que provee un plan para efectuar una descripción numérica de
tendencias, actitudes u opiniones de una población mediante el estudio de una muestra de ella.
Por su parte, Fink (2008) las define como métodos de recolección de información que se usan para describir, comparar
o explicar conocimientos, sentimientos, valores, preferencias y conductas.
Es decir, en la literatura clásica sobre metodología de la investigación, la encuesta se considera como una técnica cuanti-
tativa para recabar, mediante preguntas, datos de un grupo seleccionado de personas; sin embargo, más recientemente algunos
autores consideran que también a través de ella pueden recolectarse datos cualitativos o mixtos (por ejemplo, cuantificados)
(The SAGE Glossary of the Social and Behavioral Sciences, 2009v y Julien, 2008). En realidad, las encuestas son diseños no
experimentales que la mayoría de las veces resultan transversales, aunque si se repiten periódicamente desarrollan un formato
longitudinal, e implican preguntar a los individuos sobre cuestiones específicas y obtener sus respuestas (Henry, 2004). Su
alcance puede ser descriptivo o correlacional-causal:
1. Descriptivo. Se pretende caracterizar a una población o contexto geográfico en función de las variables seleccionadas
(Bowers, 2008). Además, las encuestas descriptivas pueden ser útiles para:
• Elaborar un perfil más o menos exacto del fenómeno, variables o planteamiento de interés.
• Mostrar las facetas o dimensiones de un fenómeno, sistema, proceso o mecanismo.
• Crear tipologías o categorías.
• Clarificar secuencias o conjuntos de etapas.
• Documentar información que confirme o contradiga datos previos sobre un fenómeno o planteamiento.
2. Correlacional-causal. Cuando se busca caracterizar relaciones entre variables en una población o contexto geográfico.
También para:
• Encontrar información que estimule nuevas explicaciones.
• Determinar la validez de un principio.
• Vincular diferentes asuntos, tópicos o cuestiones en un ámbito o una proposición.
• Confirmar o construir teoría e hipótesis generadas por medio de otros diseños.
• Extender teoría e hipótesis a nuevas áreas de conocimiento o campos.
2       Capítulo 6  Definición de encuesta o survey.

Incluso, cuando realiza una encuesta el investigador podría tener en mente ambos alcances.
Como ya se mencionó, las encuestas pueden ser utilizadas para recabar datos sobre diversas cuestio-
nes, como preferencias, actitudes, opiniones, creencias, motivaciones, conocimientos, emociones, condi-
ciones de vida, etc. (Coughlan, Cronin y Ryan, 2009 y Henry, 2004), pero también se han utilizado para
analizar a los animales (Ballou, 2008). Por ejemplo, censos del estado de una población animal para tomar
medidas de preservación (búfalos, ballenas, tigres, osos polares, etcétera.).
Por lo general, su método de recolección de los datos lo constituye el cuestionario o guía de entrevis-
ta (Garson, 2012, The SAGE Glossary of the Social and Behavioral Sciences, 2009u y Henry, 2004),
aunque pueden utilizarse otras técnicas como la observación sistemática (Julien, 2008).
Recordemos que el cuestionario consiste en un conjunto de preguntas respecto de una o más varia-
bles que se desean medir y puede aplicarse de diferentes formas: autoadministrado de manera individual,
autoadministrado en grupos pequeños o medianos, autoadministrado que se envía por correo tradicional,
electrónico o mensajería, por entrevista telefónica o mediante entrevista personal o que se inserta en una
página web (en sus distintas modalidades) para que lo responda quien lo desee. Este tema se amplía en el
capítulo 7, “Recolección de los datos cuantitativos. Segunda parte”, de este centro de recursos en línea.
Asimismo, las encuestas se efectúan en una muestra del universo (con excepción de los censos), que
puede ser probabilística o no probabilística. La opción más conveniente es la primera si se pretenden
generalizar estadísticamente los resultados de la muestra a la población (McLaren, 2014 y Creswell,
2013a).
De acuerdo con The Psychology Research Handbook (2006) y Henry (2004), tres cuestiones son esen-
ciales para llevar a cabo una encuesta de calidad: a) una adecuada formulación de preguntas estructuradas
y sus opciones de respuesta, b) un cuidadoso control en la recolección de los datos y c) recoger datos de
una muestra grande, representativa, dispersa y cuidadosamente seleccionada.
La encuesta es un diseño investigativo de relativamente bajo costo y que se implementa de manera
más o menos rápida. El proceso es similar a cualquier otro tipo de estudio cuantitativo, cuyas etapas gene-
rales se presentan en la figura 6.1, las cuales ya fueron comentadas en el texto impreso, pero debemos
puntualizar algunos elementos.
En primer término, es necesario identificar con precisión al usuario o usuarios de la encuesta. A veces
el usuario resulta ser el mismo investigador, pero con frecuencia se trata de un candidato a un puesto de
elección popular y su equipo de la campaña política; o bien, un grupo de directivos de una empresa; o tal
vez, los editores de un diario o periódico de amplia circulación o una página web, funcionarios que toman
decisiones sobre políticas públicas, los habitantes de una colonia o la opinión pública de un sistema social.
Tal identificación implica obtener un perfil de los usuarios: ¿quiénes son? (edad, género, nivel educativo
y socioeconómico, conocimientos en materia de investigación, afiliación política, intereses y otras cuestio-
nes que pudieran vincularse a la investigación),12 así como sus requerimientos: ¿qué necesidades de infor-
mación tienen?, ¿cuáles son sus expectativas respecto de la encuesta?, ¿qué tipo de decisiones tomarán
sobre la base de los resultados de la encuesta?, ¿de qué manera utilizarán los resultados?, ¿cómo va a ser
clasificada la información?, ¿qué datos generales y específicos demandan?, ¿en qué formatos desean que se
les proporcione la información?, etc. Las respuestas a estas y otras preguntas ayudarán a que el investiga-
dor y los usuarios, conjuntamente, planteen de una manera más adecuada su problema de estudio y
definan los tópicos que pretenden incluir en la encuesta.
Los tópicos son ubicados como variables. En ocasiones, un tópico es una variable y, en otras, está
conformado por diversas variables. Recordemos que cada variable debe ser definida conceptual y opera-
cionalmente. Todas las precisiones se realizan “mano a mano” con los usuarios (ya sea interactivamente o
mediante el desarrollo de las respectivas propuestas y con la obtención de realimentación por su parte).
En la siguiente etapa se acuerdan decisiones con los usuarios sobre tareas con las cuales el lector esta-
rá familiarizado; esta fase resulta clara para quien haya leído los capítulos 7, 8 y 9 del libro (que se refieren

12 A veces, asuntos aparentemente triviales resultan importantes. En una ocasión se presentaron los resultados
de una encuesta electoral a un candidato al gobierno de una provincia que era daltónico (los colores utilizados
en las gráficas no fueron lo suficientemente contrastantes y el usuario se sintió agredido). Igualmente, pueden
molestarse los usuarios si se les muestran estadísticas que no comprenden.
3

  Figura 6.1  Proceso de una encuesta o survey.

Identificar con Especificar con los Planteamiento del
precisión a los usuarios el tipo de problema
usuarios de la información que se (conjuntamente con
encuesta requiere los usuarios)

Definir cómo será Establecer quiénes serán Determinar los tópicos
administrado el entrevistados (unidad o y/o las variables que van
cuestionario unidades de análisis y a medirse
muestreo, con inclusión del
tamaño o n)

Integrar al equipo que Determinar qué recursos
Establecer si se usa un
llevará a cabo la son necesarios para
instrumento existente o si se
encuesta conducir la encuesta
genera uno nuevo

Llevar a cabo la
Construir el instrumento Determinar la forma en que
prueba piloto y
los datos e información de la
ajustar cuestionario y
encuesta van a ser analiza-
procedimientos
dos y reportados

Recolectar datos Revisar resultados con el
Analizar datos equipo de investigación

Elaborar reporte de
resultados de la encuesta
al diseño, la muestra, el cuestionario y su contexto de administración). Asimismo, se integra el equipo
que colaborará con el investigador en la implementación de la encuesta (esta decisión casi siempre
recae en el investigador). Tal grupo abarca a los coinvestigadores (si se requieren), supervisores de
campo (que guían a los encuestadores, además de monitorear y revisar su trabajo), los propios encues-
tadores y personal auxiliar (que pueden ser especialistas en análisis estadístico, computación y diseño
4       Capítulo 6  Definición de encuesta o survey.

gráfico), aunque sabemos que estos equipos suelen ser más pequeños en los ambientes académicos latinoa-
mericanos (incluso los jóvenes estudiantes suelen hacer tareas de investigador, encuestador, analista y
diseñador). El equipo debe encontrarse compenetrado con el estudio y motivado por su trabajo.
Por otra parte, nunca debemos olvidar la importancia de la capacitación del grupo en sus funciones
y todo lo que se explicó en el libro.
Respecto del tipo de preguntas en una encuesta, Henry (2004) distingue dos clases fundamentales: a)
ítems fácticos o conductuales y b) reactivos actitudinales o de opinión. Los primeros pueden ser verifica-
dos externamente o por medio de otro indicador, mientras que los segundos se relacionan con estados
subjetivos y solo pueden ser examinados por la consistencia de las respuestas (indicadores de validez y
confiabilidad). Cada tipo tiene su propia manera de obtener respuestas más precisas (Fowler, 2002). En
los ítems conductuales es mejor tener un punto de contraste o validación. Por ejemplo, si preguntamos
sobre qué tanto una persona practica un deporte, debemos cuestionarlo sobre el lugar donde lo practica y
sobre ciertos comportamientos típicos de un deportista, a fin de verificar veracidad de las respuestas. Si se
efectúan preguntas sobre el estado de salud a un paciente, las respuestas se vinculan con análisis clínicos
de laboratorio. Además, cuando se habla de comportamientos pasados, es mejor efectuar preguntas que se
refieran al periodo más reciente posible y evitar el pasado remoto. Recordemos que es importante tomar
en cuenta preguntas que hayan integrado encuestas previas y que hayan funcionado. Una vez más, la
revisión de la literatura resulta crucial.
Además, es importante considerar los costos que se desembolsarán con motivo de la realización de la
encuesta, principalmente pagos u honorarios del equipo humano, viáticos, impresión y reproducción de
cuestionarios, envío de cartas, cuestionarios y otros documentos, o llamadas telefónicas, recursos de cóm-
puto (adquisición de programas, ingreso y procesamiento de datos) y los costos de elaboración del repor-
te, así como de las presentaciones respectivas.
El resto de los pasos de la implementación de la encuesta resultan conocidos si se revisó la parte
impresa de la presente obra: decidir si empleamos un cuestionario desarrollado previamente, adaptamos
uno o generamos un nuevo instrumento; de este modo, construir los ítems o preguntas y sus formatos de
respuesta, elaborar la introducción e instrucciones, diseñar el cuestionario, efectuar la prueba o pruebas
piloto (que abarca también los tiempos de respuesta al instrumento) y diseñar la versión final.
Además, se programa el trabajo (con labores y movimientos en un calendario, aunque sea general,
como en la figura 6.2). Asimismo, se recolectan y analizan los datos. Durante esta parte es muy recomen-
dable que el investigador y su equipo se reúnan frecuentemente para llevar a cabo la evaluación de los
avances, problemas, respuestas de los encuestados y la evolución general del estudio. También, antes de
preparar el reporte de resultados conviene reunirse con el grupo de colaboradores para conocer las inter-
pretaciones de todos, sus opiniones (particularmente de quienes trabajaron con los entrevistados) y pro-
ducir realimentación. Por lo general, se obtiene información más amplia y profunda sobre las respuestas
de los participantes. De igual manera, después de que hayamos elaborado el reporte es útil organizar una
sesión para verificar una vez más su contenido.
  Figura 6.2  Ejemplo de calendario o cronograma de trabajo (general y sencillo).

Semana
1 2 3 4 5 6 7 8 9
A
B
C
D F
E
F F
G
H
5

• Capacitación de encuestadores
• Desarrollo de la primera versión del cuestionario
• Prueba piloto • Evaluación de la prueba piloto
• Construcción de la versión definitiva del
• Recolección de los datos
cuestionario

• Análisis de los datos • Elaboración de los reportes de investigación

Por lo regular, los resultados se exponen por medio de una presentación audiovisual y la entrega del
informe escrito en dos versiones: ejecutiva (breve) y técnica (larga).
Con la finalidad de que los estudiantes que nunca hayan participado en una encuesta se familiaricen
un poco más con el trabajo de campo, incluimos al final de este capítulo un ejemplo de un documento
que suele entregárseles a los encuestadores con recomendaciones (tips) para que desarrollen sus labores.
En la actualidad, en Iberoamérica crece el número de encuestas que se aplican, lo cual en parte se debe
a que son citadas cotidianamente en los medios de comunicación colectiva. Las encuestas telefónicas son
muy socorridas, debido a su utilidad cuando los encuestados potenciales se encuentran dispersos geográ-
ficamente. Algunos ejemplos de encuestas serían los siguientes:

Integración de la tecnología en salones de clase
Judge (2001) estudió el estatus de la integración de la tecnología computacional en los salones de clase de
educación especial en el nivel preescolar. Su cuestionario incluyó como variables centrales: a) selección de
programas de computación (software), b) uso e integración de la tecnología computacional en la enseñan-
za y c) actitudes de los profesores hacia dicha tecnología (fundamentalmente disposición a utilizarla y
soporte). Su muestra objetivo estaba constituida por maestros de educación especial del nivel preescolar
del estado de Tennessee, Estados Unidos (el procedimiento de muestreo fue el sistemático).
Conformó la muestra mediante el directorio de escuelas públicas del Departamento de Educación
Estatal. Identificó a 225 docentes, a quienes les envió por correo un paquete con el cuestionario integrado
por 30 ítems y la carta explicativa de la encuesta. Le fueron devueltos 106 (47%), de los cuales solo 91
(40.4%) estaban correctamente contestados. Luego, procedió a su análisis y reporte.

Censos económicos en México
Desde 1930, y cada cinco años, el Instituto Nacional de Estadística, Geografía e Informática (INEGI)
realiza los censos económicos, en los cuales pretende incluir a todo el universo de las unidades económicas
que componen el sector productivo del país (urbanas y rurales), es decir, no se muestrea.
El objetivo es obtener información estadística básica actualizada y fidedigna sobre todos los estableci-
mientos productores de bienes, comercializadores de mercancías y prestadores de servicios, para generar
indicadores económicos de México a un gran nivel de detalle geográfico, sectorial y temático (Instituto
Nacional de Estadística, Geografía e Informática, 2014a).12 Los datos son útiles para diversas cuestiones,
tales como planear las políticas económicas del sector público y alimentar al Sistema de Cuentas Nacionales
de México en la elaboración de la Matriz de Insumo-Producto. Los empresarios pueden efectuar análisis
para conocer las condiciones del mercado interno en el que compiten, mientras que los académicos tienen
una base para contrastar la información del aparato productivo nacional, estatal y regional (INEGI,
2014a).
Mediante cada censo se registran las características de tales unidades (una parte fundamental de las
cuales son las empresas formalmente constituidas). La información se levanta o recaba mediante un con-
junto de cuestionarios diseñados específicamente para recopilar los datos de cada establecimiento (según
la actividad que desarrolle).
Los rubros (variables) principales que abarcan los cuestionarios generales (de todas las unidades eco-
nómicas) son:
12 Para 2014 el universo estimado fue de 5.7 millones de unidades económicas (INEGI, 2014b).
6       Capítulo 6  Definición de encuesta o survey.

• Datos de identificación y ubicación. • Gastos
• Categoría jurídica • Ingresos
• Tipo o forma de organización de la unidad eco- • Valor de la producción
nómica
• Periodo de operaciones • Activos fijos
• Clasificación económica • Crédito y cuentas bancarias
• Personal ocupado • Existencias
• Remuneraciones • Tecnologías de la información utilizadas

Además, se pretende conocer las características particulares de cada sector económico obtenidas por
cuestionarios complementarios (INEGI, 2014b), como por ejemplo:
• Manufacturas: materias primas y auxiliares consumidas, productos producidos, maquila de exporta-
ción.
• Comercio: identificación de clientes y proveedores.
• Minería: reservas mineras.

Barómetro en España
En España, el Centro de Investigaciones Sociológicas (CIS), efectúa mensualmente
—desde 1979, con excepción del mes de agosto— una encuesta nacional denominada Barómetro (cuyo
muestreo se comentó en el capítulo 8 del libro impreso). Su objetivo es medir
…el estado de la opinión pública española en relación con la situación política y económica
del país y sus perspectivas de evolución. Asimismo, en cada barómetro se abordan temas referidos
a aquellas cuestiones que destacan en la actualidad social, económica y política del momento
(Centro de Investigaciones Sociológicas, 2005).
Desde 1998 los resultados se incluyen en su página web. Las muestras oscilan entre 2 400 y 2 700
casos. Los tópicos que pueden ser incluidos son básicamente los siguientes (macrovariables):

• Política (incluyendo tendencias de • Deporte y ocio
votación)
• Temas internacionales • Ciencia y tecnología
• Economía • Educación
• Trabajo • Sanidad
• Población • Justicia
• Medio ambiente • Vida cotidiana
• Comunicación • Valores y actitudes
• Cultura • Conflictos y problemas sociales

Es importante recalcar que el cuestionario puede variar en ciertas preguntas.
Veamos el caso del Barómetro correspondiente a octubre de 2013.12
n = 2 485 entrevistas, puntos de muestreo: 241 municipios y 50 provincias.
El universo está constituido por población española de ambos géneros de 18 años y más. Los cuestio-
narios se aplicaron mediante entrevista personal en los domicilios.
Procedimiento de muestreo: polietápico, estratificado por conglomerados, con selección de las uni-
3 Estudio CIS no. 3.001, Barómetro de octubre (Centro de Investigaciones Sociológicas, 2013).
7

dades primarias de muestreo (municipios) y de las unidades secundarias (secciones) de forma aleatoria
proporcional, y de las unidades últimas (individuos) por rutas aleatorias y cuotas de género y edad. Los
estratos se formaron por el cruce de las 17 comunidades autónomas con el tamaño de hábitat, dividi-
do en siete categorías: menor o igual a 2 000 habitantes, de 2 001 a 10 000, de 10 001 a 50 000, de
50 001 a 100 000, de 100 001 a 400 000, de 400 001 a un millón y más de un millón de habitantes.
Error muestral: para un nivel de confianza de 95.5% (dos sigmas), y P = Q, el error real es de
±2.0% para el conjunto de la muestra y en el supuesto de muestreo aleatorio simple.

Fecha de realización: del 1 al 10 de octubre de 2013.

Se hicieron preguntas como:12
1. Refiriéndonos a la situación económica general de España, ¿cómo la calificaría usted: muy buena,
buena, regular, mala o muy mala?
Los resultados se muestran en la tabla 6.1.
  Tabla 6.1  Percepción de la situación económica en España.5

% (n)
Muy buena 0.0 (1)
Buena 0.7 (18)
Regular 10.4 (258)
Mala 35.8 (889)
Muy mala 52.6 (1308)
No supo 0.3 (8)
No contestó 0.1 (3)
TOTAL 100.0 (2 485)

2. ¿Cree usted que la situación económica actual del país es mejor, igual o peor que hace un año?
3. Y, ¿cree usted que dentro de un año la situación económica del país será mejor, igual o peor que
ahora?
4. Y refiriéndonos ahora a la situación política general de España, ¿cómo la calificaría: muy buena,
buena, regular, mala o muy mala?
5. ¿Y cree usted que la situación política actual del país es mejor, igual o peor que hace un año?
6. Y, ¿cree usted que dentro de un año la situación política del país será mejor, igual o peor que aho-
ra?
¿Cuál es, a su juicio, el principal problema que existe actualmente en España? ¿Cuál considera el
segundo? ¿Y el tercero? Los principales resultados se presentan en la tabla 6.2.
7. ¿Podría decirme qué importancia tienen en su vida los siguientes aspectos? Aquí tengo una tarjeta
con una escala que va del 0 al 10, en la que 0 significa “nada importante” y 10 “muy importante”.
¿Dónde se colocaría usted en ella?

• La familia • El trabajo
• Los amigos • La religión
• El tiempo libre • Las asociaciones, clubes y otras actividades
asociativas
4 Se mencionan solamente algunas con el número correspondiente en el cuestionario del barómetro de octubre de 2013.
5 Estos datos pueden contrastarse con otros barómetros para tener encuestas integradas en un diseño longitudinal (si el cuestionario y la
muestra es similar entre los puntos de comparación). Por ejemplo, en septiembre de 2005 las percepciones de los españoles eran muy dis-
tintas. Las respuestas a esta pregunta tuvieron los siguientes resultados: muy buena (0.6%), buena (21.8%), regular (51.3%), mala (19.5%),
muy mala (5.2%), no supieron (1.2%) y no contestaron (0.4%) (Centro de Investigaciones Sociológicas, 2005).
8       Capítulo 6  Definición de encuesta o survey.

  Tabla 6.2  Problemas percibidos en España.6

Problemas %

El paro 53.0

Los problemas de índole económica 32.7

La corrupción y el fraude 31.7

Los políticos en general, los partidos políticos y la política 28.6

La sanidad 13.4

La educación 9.1

Los problemas de índole social 7.4

Los recortes 5.1

• La política

42 . Actualmente, entre todos los miembros del hogar (incluida la persona entrevistada) y por todos
los conceptos, ¿de cuántos ingresos disponen por término medio en su hogar al mes, después de la
deducción de impuestos (o sea, ingresos netos)? No le pido que me indique la cantidad exacta, sino
que me señale en esta tarjeta en qué tramo de la escala están comprendidos los ingresos de su hogar.
• No tiene(n) ingresos de ningún tipo • De 1 801 a 2 400 euros
• Menos o igual a 300 euros • De 2 401 a 3 000 euros
• De 301 a 600 euros • De 3 001 a 4 500 euros
• De 601 a 900 euros • De 4 501 a 6 000 euros
• De 901 a 1 200 euros • Más de 6 000 euros
• De 1 201 a 1 800 euros

En total, 47 preguntas base y otras derivadas de ellas.
Los barómetros son un ejemplo de que los resultados de las encuestas suelen variar con el paso del
tiempo o producto de sucesos del entorno físico, social, económico o político.

Encuestas de tendencias electorales y conocimiento de precandidatos
La empresa Comunicometría, S. C., ha realizado diversas encuestas de tendencias electorales en munici-
pios de diferentes países latinoamericanos, que son clásicas y muy socorridas en todo el mundo.
Los principales objetivos de estas encuestas son:
• Comprender el estado de las tendencias electorales y preferencias políticas en el municipio.
• Evaluar ante la opinión pública la imagen de los partidos políticos en el municipio.
• Explorar el conocimiento y la percepción por parte de la ciudadanía sobre los candidatos a la alcaldía.
• Conocer las intenciones de voto para presidente municipal por partido y candidato.
Entre las preguntas que se incluyen en el cuestionario base de tales encuestas tenemos como ejemplo:
1. ¿Pertenece o está afiliado a algún partido político? ¿A cuál? En caso de que pertenezca a algún partido:
¿desde hace cuántos años? En caso de no pertenencia: si usted tuviera que pertenecer a algún partido
político, ¿cuál sería?
2. ¿Me podría indicar en qué fecha son las próximas elecciones para alcalde aquí en… (municipio)?

6 Se trata de una tabla de respuestas múltiples, por lo cual la suma de porcentajes no es 100%. Se menciona el porcentaje agregado de mención
como primero, segundo y tercer problemas. Se incluyeron solo los problemas con menciones mayores a 5%.
9

3. En las próximas elecciones para alcalde, ¿por qué partido piensa usted votar? (se entrega una tar-
jeta simulando una boleta electoral, si la legislación vigente lo permite).
4. ¿Cuál es la razón principal por la que piensa votar por ese partido?
5. En las próximas elecciones para alcalde, ¿por qué partido o partidos nunca votaría?
6. ¿Cuál es la razón principal por la que nunca votaría por ese o esos partidos?
7. Le voy a mencionar algunos nombres de políticos y le pediría que en cada caso me dijera si sabe
usted: ¿quién es? (cuando sí lo identifican, se pregunta si saben a qué partido pertenece y se soli-
cita su evaluación mediante una escala de Likert o de 0 a 10, así como los motivos que generaron
tal evaluación). Se pueden agregar fotografías de políticos.
8. En las próximas elecciones para alcalde, ¿por cuál de los siguientes candidatos piensa usted votar?
(se entrega una tarjeta que simula una boleta electoral, si la legislación vigente lo permite).
9. Y, ¿por cuál o cuáles candidatos nunca votaría?, ¿por qué?
10. ¿Qué partido considera usted que ha contribuido más a solucionar los siguientes problemas en
este municipio? (se va preguntando respecto de los principales problemas detectados, por ejem-
plo: desempleo, inseguridad en las calles, inseguridad en el hogar, escasez de agua, etcétera).
11. De los siguientes candidatos a la Alcaldía y de acuerdo con su opinión, ¿quién es más honesto?,
¿le da mayor confianza?, etc. (previo sondeo de atributos deseables en el municipio).
12. ¿Sabe usted quién es el actual alcalde de …?
13. ¿Me podría indicar si sabe a qué partido pertenece?
14. ¿Qué tan favorable o desfavorable es su opinión acerca del actual alcalde… (nombre)?

Y así otras preguntas.
Veamos un par de resultados (de los diversos generados) de dos encuestas.
El primero corresponde a una encuesta realizada en Naucalpan, Estado de México, en mayo de
2005. Se efectuó un total de 500 entrevistas en el hogar (en ese año, la población del municipio, o N,
era prácticamente de 900 000 habitantes).7

  Figura 6.3  Intenciones de voto por partido.8

40
37.90
35

30

25 24.00

20
17.6
15
10.90
10
5.30
5 3.60
0 0.70
0

7 Fuente: Instituto de Información e Investigación Geográfica, Estadística y Catastral del Gobierno del Estado de México (dato de 2000). Disponible
el 3 de abril de 2005, en: http://www.edomexico.ob.mx/r_edomex/regiones.asp
8 Se omiten nombres de partidos porque simplemente intentamos mostrar el tipo de información producto de la encuesta
10       Capítulo 6  Definición de encuesta o survey.

El segundo corresponde a una encuesta que se llevó a cabo en Tepic, Nayarit, México, en 2008 (n =
800 entrevistas).

  Figura 6.4  Conocimiento de la fecha de las próximas elecciones para presidente municipal de Tepic.

Cabe destacar que esta clase de encuestas ha perdido credibilidad en distintas naciones debido a que
algunas de ellas han producido datos significativamente distintos de los resultados definitivos de la elec-
ción correspondiente, lo cual no se debe a que las encuestas sean un método inadecuado, sino a que su
implementación ha sido deficiente (muestras no representativas, recolección apresurada de los datos, falta
de supervisión de encuestadores) o a que han obedecido a intereses no éticos (falsificación de datos, defor-
mación de resultados para agradar al usuario, muestras intencionalmente sesgadas). Muchos políticos se
niegan a aceptar la realidad cuando les es desfavorable.
Entre las encuestas electorales se destacan las denominadas “de salida”, en las cuales se pregunta a los
sujetos por su voto en una determinada elección. Obviamente, se interroga a las personas inmediatamen-
te después de que emitieron su sufragio (por qué candidato/partido votaron y razones de su preferencia).
Estas encuestas requieren un muestreo que sea representativo no solo del universo de votantes, sino de
cada distrito y/o sección electoral.

Otros ejemplos
En 2005, The National Opinion Research Center (NORC), de la Universidad de Chicago (2005), con el
patrocinio de la Fundación de Poesía de Chicago, realizó una encuesta nacional telefónica en Estados
Unidos (n = 1 000 casos). La finalidad del estudio fue determinar dónde se encuentra la poesía en la cul-
tura estadounidense, por medio de una medición de actitudes respecto de ella y preguntas a los partici-
pantes sobre cuánta poesía leían, cuáles eran sus autores favoritos, etcétera.
Raw, Regan, Rigotti y McNeill (2009) efectuaron una encuesta en 36 países sobre los servicios para
tratar la dependencia del tabaco. El objetivo fue describir tales servicios y discutir los resultados en el
contexto del artículo 14 del Convenio Marco para el Control del Tabaco (CMCT) de la Organización
Mundial de la Salud (OMS), publicado en 2003. La encuesta se fundamentó en un cuestionario de 10
ítems que se envió por medio del correo electrónico y que preguntaba sobre las políticas y prácticas de
tratamiento contra el tabaquismo en la salud pública. Entre los diversos resultados, cabe destacar que
menos de la mitad de los países cuentan con una política oficial escrita (44%).
Por su parte, Yang et al. (2008) investigaron la influencia del incremento salarial sobre la satisfacción
laboral entre jóvenes oficiales de la Armada China. Para ello, aplicaron un cuestionario antes y después de un
aumento económico, cuyos resultados indicaron que este generó –de manera significativa– una mayor satis-
facción laboral. La medición de este experimento se implementó mediante dos encuestas.
El diario The Star-Ledger (1991) llevó a cabo en New Jersey una encuesta con 800 adultos para eva-
luar si las personas tenían armas en sus hogares y el uso que les daban, si planeaban comprar un arma, si
habían poseído armas, si estaban inscritos en The National Rifle Association, etcétera.
11

En 2010, la Secretaría de Desarrollo Turístico del Gobierno de Guanajuato y la Universidad de
Celaya implementaron una encuesta cuyo propósito fue conocer el perfil del visitante al estado de
Guanajuato (México) y su grado de satisfacción con la experiencia turística y la atención recibida. Se
entrevistó a una muestra de 636 visitantes a los principales destinos turísticos de dicho estado (Guanajuato,
San Miguel de Allende, León, Celaya, Salamanca, Dolores e Irapuato).12 Los participantes debían ser
mayores de 18 años que hubieran tenido contacto con los servicios del destino por al menos tres horas,
además de no tener residencia en el estado (hubo personas que acudían por toda clase de turismo: de
negocios, ecológico, histórico, simple diversión, etc.). Una encuesta se realizó en verano y otra en invier-
no (diciembre), que son las épocas más concurridas por los turistas.
Entre otras variables, además de las demográficas (género, edad, escolaridad, ingresos, etc.), se con-
sideraron las siguientes: procedencia, si viajaban solos o acompañados (y con quiénes: número y natura-
leza —amigos, familiares, pareja, compañeros de trabajo, etc.—), motivo del viaje, tipo de viajero,
estadía y hospedaje, medio de transporte, visitas anteriores, comparación de la actual visita con previas,
lugares visitados anteriormente, si viajaban en paquete o tour o no, gastos por rubro —desde el lugar de
origen hasta el destino, en el destino y de regreso/en hotel o lugar de llegada, comidas, compras, etc.—,
satisfacción general y de aspectos específicos —transporte, hospedaje, establecimientos para alimentos y
bebidas, tiendas, museos, etc.—, nivel de satisfacción respecto de visitas previas, comparación con otros
destinos, exposición a publicidad y promociones del destino y descripción de la experiencia (cualitativa)
(Secretaría de Desarrollo Turístico de Guanajuato y Universidad de Celaya, 2010).
La Organización Mundial del Turismo (OMT, 2013) realiza periódicamente el Barómetro OMT
del turismo mundial, que integra diversas encuestas y mecanismos de obtención de información (cons-
tituye un censo de todos los viajeros a los países que conforman dicho organismo). Entre algunas varia-
bles que se miden se encuentran:
1. Llegadas de turistas internacionales (por regiones y subregiones), como por ejemplo “América” en
general y América del Norte, El Caribe, América Central y América del Sur en específico, además
por país (de los integrantes de la OMT). Asimismo, datos anuales y mensuales por cohortes (2000,
2005, 2010, 2011, 2012 y 2013). También por nivel de desarrollo económico (economías avanzadas
y economías emergentes). Incluso, se compara la evolución de esta variable a través de las cohortes.
2. Ingresos (en dólares, euros y moneda local, precios constantes) por región, subregión y país en 2009,
2010, 2011 y 2012.
3. Gastos (bajo los mismos términos que las llegadas y los ingresos).
4. Tendencias de viajes de pasajeros por transporte aéreo, región de destino por región de origen.
5. Previsiones del producto interno bruto (PIB) y desempleo por región y país (para fines de planea-
ción).
Otro caso lo constituyen las famosas encuestas de empleo de medios de comunicación masiva, que
son muy socorridas (por ejemplo, aquellas para conocer el uso de la televisión: canales, horarios y pro-
gramas preferidos, entre semana y en fin de semana; tiempo de exposición a la televisión, condiciones de
exposición —solos, en pareja, en familia—, etc.). En ocasiones, estas encuestas combinan dos herra-
mientas de medición: cuestionario y aparato que registra cuando se prende y apaga la televisión, canales
sintonizados, cambios de canal y otras cuestiones. Algunos ejemplos clásicos en cuestiones noticiosas son
las encuestas del New York Times, la de CBS News y la de ABC News/Washington Post (Ballou, 2008).
Los gobiernos aplican diversas encuestas para conocer y supervisar ciertos temas como el empleo (en
Estados Unidos las lleva a cabo el Bureau of Labor Statistics).
Las empresas utilizan las encuestas para conocer evaluaciones de los clientes respecto del servicio
que ofrecen, detectar preferencias de consumidores, etc. No hay límites.
Asimismo, las encuestas han sido una herramienta para revisar asuntos y hechos históricos. En 2013,
la famosa agencia Gallup realizó una encuesta nacional en Estados Unidos sobre el asesinato de John F.
9 Este tamaño de muestra representó un nivel de confianza de 95% y un margen de error de ±3.9 % estatal.
12       Capítulo 6  Definición de encuesta o survey.

Kennedy, en el marco del 50º aniversario de este trágico evento. Sesenta y uno por ciento de los par-
ticipantes consideró que su muerte no fue orquestada por un solo hombre, Lee Harvey Oswald, sino
que fue producto de una conspiración entre varios actores (en noviembre de 1963, 52% de los entre-
vistados por Gallup en una encuesta similar creían que el presidente había sido víctima de una cons-
piración. Este número aumentó en la encuesta de 1976 a 81%). Por otro lado, 71% de los
estadounidenses no creen en la versión oficial inicial (Gallup, 2014, Ievoli, 2013 y ADNPolítico,
2013).
Además, 74% de los estadounidenses encuestados consideró que Kennedy es el presidente más
sobresaliente que ha tenido el país desde la Segunda Guerra Mundial, frente a 3% que cree que tuvo
una actuación pobre en la Casa Blanca (Gallup, 2014).
También se han llevado a cabo encuestas sobre temas de entrenamiento. Por ejemplo, Fox Sports
Latinoamérica ha hecho encuestas vía internet (a veces mediante twitter) sobre quién va a ser campeón
en determinadas ligas de futbol (México, Argentina, Chile, etc.), quién es el mejor futbolista y asuntos
afines.
Incluso se han usado para evaluar sitios de internet y páginas web (Boslaugh, 2008).
Por último, cabe señalar que las encuestas por medio de internet han crecido y tienen una tasa de
respuesta que va en aumento. Lo recomendable es utilizar al menos dos medios (por ejemplo, entre-
vista personal e internet, correo tradicional e internet, etc.) (Sala y Lynn, 2009 y McMorris et al.,
2009). Este tema se ampliará en el siguiente capítulo de este centro de recursos en línea: “Recolección
de los datos cuantitativos: segunda parte”.

Encuestas de salud
De manera continua se hacen encuestas epidemiológicas a fin de describir la ocurrencia de una enfer-
medad o una epidemia (en este último caso resulta vital saber la velocidad con que se propaga y por
qué medio, así como su grado de mortalidad, etcétera).12
En Colombia, cada cinco años se desarrolla la Encuesta Nacional de Demografía y Salud, que
entre otros tópicos incluye el de salud sexual y reproductiva en mujeres y adolescentes (Profamilia,
2009).
En Estados Unidos se efectúa una “familia” de ocho encuestas denominada Encuesta Nacional de
la Atención a la Salud, auspiciada por el Centro Nacional para Estadísticas de Salud (NCHS, por sus
siglas en inglés). Cada una recaba datos y registros de proveedores o establecimientos de atención a la
salud (como los hospitales), mediante muestreo polietápico. Entre la información que se recolecta
podemos señalar datos de pacientes, sus médicos y personal que los atiende, así como las instituciones,
incluyendo consultas médicas, hospitalizaciones (altas y bajas) y cirugías (Centers for Disease Control
and Prevention, 2013 y Boslaugh, 2008). Asimismo, se evalúa la calidad de la atención y el servicio
médicos. También, periódicamente se implementa la Encuesta Nacional de Atención Médica
Ambulatoria, la cual abarca servicios de urgencia y consultas externas.
Además, la misma NCHS realiza una encuesta para evaluar su página web (número de visitas,
opinión sobre el sitio y la información contenida —facilidad para encontrar la información deseada,
facilidad de interpretarla, relevancia, exactitud y oportunidad de la información—, medio por el cual
se accesa al sitio web, motivos de utilización, evaluación general del sitio, los archivos, las publicacio-
nes, las encuestas, los productos y el servicio, tipo de encuesta e información consultada, estadísticas
obtenidas, usos de la información y variables demográficas).
En esta misma nación se efectúa desde 1961 la Encuesta Nacional de Mortalidad (NMFS), que se
basa en una muestra de 22 957 certificados de defunción (Bezy, 2007).
El lector interesado en encuestas de salud a nivel macro en Estados Unidos puede consultar
Harris-Kojetin, Sengupta, Park-Lee y Valverde (2013) o su equivalente más inmediato.
Otro ejemplo es la encuesta que indaga las tasas de embarazo entre adolescentes y jóvenes esta-
dounidenses (15 a 19 años), que incluso presenta los datos por origen étnico (cabe señalar que en
12 Para introducirse en este tema se recomienda ver Waghorn y Lloyd (2009).
13

2009, la tasa de embarazo de las mujeres blancas en estas edades es menos de la mitad —42.8 por 1 000—
que de las jóvenes hispanas —100.5 por 1 000— yafroamericanas —114.5 por 1 000—) (Curtin, Abma,
Ventura y Henshaw, 2013).
En el ámbito de la práctica hospitalaria se pueden aplicar encuestas para analizar diversas cuestiones
como opiniones de cirujanos respecto de ciertos procedimientos quirúrgicos u opiniones de internistas
sobre un medicamento. Por ejemplo, Watson et al. (2010) condujeron una encuesta para determinar y
comparar las actitudes de médicos y enfermeras (n=71 y 74 respectivamente) hacia la práctica de pesar a
los pacientes y la pérdida de peso de estos con las mismas actitudes por parte de los propios pacientes
ambulatorios con un diagnóstico de cáncer avanzado (n=129), en hospitales de Irlanda, Reino Unido y
Nueva Zelanda.
Los investigadores de los servicios de salud utilizan los resultados de encuestas realizadas por otros
(denominado análisis secundario) para llevar a cabo evaluaciones de las necesidades, desarrollar perfiles
transversales de las poblaciones, monitorear las poblaciones o cohortes longitudinalmente y recoger medi-
das de preprueba y posprueba para estudios con diseños experimentales o cuasiexperimentales (Kviz,
2009).

Otros ejemplos se muestran en la tabla 6.3.

  Tabla 6.3  Ejemplos adicionales de encuesta en áreas de salud.

Nombre de la Institución y
Año Muestra Ejemplos de variables
encuesta país
1. Características sociode-
mográficas.
2. Prevalencia de trastornos
mentales (alguna vez en la
vida, últimos 12 meses y
últimos 30 días).
3. Tipos de trastornos: del
estado de ánimo (trastorno
depresivo mayor, trastorno
depresivo menor, trastorno
bipolar I, trastorno bipolar II,
trastorno distímico, otros),
trastornos de ansiedad
Probabilística con 4 544 (trastorno de angustia,
adultos entre 18 y 65 agorafobia sin trastorno
Estudio nacional de angustia, fobia social,
2003 (en años de edad, residentes
de salud mental Ministerio de fobia específica, trastorno
proceso de en 5 526 hogares urbanos
(Ministerio de Salud y Protección de ansiedad generalizada,
reportar la de los diferentes estratos
la Protección Social, Colombia. trastorno de estrés postrau-
de 2013). socioeconómicos de 60
Social, 2005). mático, otros), trastornos
municipios de 25 departa-
mentos del país. relacionados con sustancias
(abuso del alcohol, depen-
dencia del alcohol, abuso
de drogas, dependencia de
drogas, dependencia de
nicotina), otros (trastorno
del déficit de atención,
anorexia nerviosa, ansiedad
por separación en el adulto,
bulimia nerviosa, trastorno
disocial, trastorno negati-
vista desafiante, síndrome
de tensión premenstrual,
trastorno de ansiedad por
separación), etcétera.
14       Capítulo 6  Definición de encuesta o survey.

  Tabla 6.3  Ejemplos adicionales de encuesta en áreas de salud (continuación).

Nombre de la Institución y
Año Muestra Ejemplos de variables
encuesta país
Niveles de salud mater-
na e infantil, prevalencia
anticonceptiva, fecundidad y
mortalidad de la población,
Encuesta
conocimiento del VIH-SIDA
demográfica y
28 376 viviendas del país, y características de la vio-
de salud fami-
Instituto Nacional en las que se entrevistó lencia doméstica. Asimismo,
liar (Instituto
de Estadística e 2012 a más de 24 500 mujeres proporciona información
Nacional de
Informática, Perú. en edad fértil, es decir de sobre el estado nutricional
Estadística e
15 a 49 años de edad. de la población menor de
Informática,
cinco años y sus madres,
2013).
prácticas de lactancia y nivel
de anemia tanto de mujeres
como de niños, a nivel
nacional y departamental.
Se consideran todas las
adicciones. En el caso del
tabaco se estimó, entre
Comisión Nacional otras variables,: estatus
contra las Adic- como fumador (fumador
Encuesta
ciones, Secretaría Muestra probabilística activo, exfumador y nunca
nacional de
de Salud y Centro estratificada en ocho ha fumado), edad de inicio
adicciones 2011
Nacional para la regiones del país. 1 994 del consumo diario, consu-
(Secretaría de
Prevención y Con- viviendas por región. mo promedio de cigarrillos
Salud, 2012).
trol de las Adiccio- de los fumadores diarios,
nes, México. adicción a la nicotina, expo-
sición al humo del tabaco,
gasto en tabaco, lugar de
compra y marca, etc.
Prevalencia nacional de
discapacidad, grados de
Primer estudio
Fondo Nacional de discapacidad, estado de
nacional de la Muestra estratificada por
la Discapacidad e salud de la población obje-
discapacidad regiones a nivel país de
Instituto Nacional 2004 tivo, discapacidad y trabajo,
(Fondo Nacional 13 350 viviendas (11 000
de Estadísticas, acceso a servicios de salud,
de la Discapaci- urbanas y 2 350 rurales).
Chile. apoyos sociales y ayudas
dad, 2005).
técnicas, uso del tiempo
libre, etcétera.

Más ejemplos de encuestas
Las encuestas se pueden utilizar también en otras áreas de conocimiento además de las ciencias sociales.
Por ejemplo, un ingeniero civil puede llevar a cabo una encuesta entre colegas para analizar qué materiales
se han utilizado para construir cierto tipo de edificios y cuál ha sido su desempeño. En ingeniería indus-
trial podría efectuarse una encuesta para evaluar qué sistemas o métodos de manufactura o calidad se
implementan en plantas de cierto rubro específico (por ejemplo, de ensamblado de automóviles), cómo
se ejecutan, qué estrategias y prácticas se utilizan, qué problemas se han presentado y la manera como se
resolvieron, etc. O bien, cómo abordan un modelo de gestión o producción como el lean manufacturing.
En ellas se incluyen preguntas cerradas y abiertas (imaginemos la siguiente interrogante: si tuviera que
hacer una línea de producción más eficiente, ¿qué modelo o metodología implantaría?, ¿por qué?).
Un ingeniero en sistemas que se encuentra frecuentemente con problemas técnicos, podría hacer una
encuesta para analizar cómo los enfocaron y resolvieron otros colegas o simplemente recolectar sugeren-
cias.
15

  Tabla 6.4  Ejemplos adicionales de encuestas.
Naturaleza Referencia Descripción

Encuesta sobre el
El estudio incluyó a 53 adolescentes embarazadas (muestra no
conocimiento, actitud
probabilística por conveniencia) que fueron invitadas a participar y se
y comportamiento
contactaron en hospitales. A todas ellas se les aplicó un cuestionario
concernientes al uso de Wu (2010)
que medía el conocimiento respecto de los anticonceptivos, su actitud
anticonceptivos entre
a utilizarlos y si los habían usado en sus encuentros sexuales previos,
adolescentes embara-
incluyendo la primera vez.
zadas en Beijing, China.

La encuesta integró dos muestras de estudiantes y académicos, así
Creencias y actitudes como sus parientes, cuyas edades oscilaron entre los 20 y 80 años: una
del consumidor hacia el de Zaragoza, Aragón (conocimiento elevado, n=390) y otra de Cataluña
jamón curado en seco (bajo conocimiento, n=312). Para ser incluidos se requería que fueran
y la denominación de consumidores habituales de jamón curado en seco. El cuestionario fue
origen protegida del Cilla et al. (2006) proporcionado a los sujetos, quienes lo contestaban en sus hogares
jamón de Teruel en dos (autoadministrado). Las preguntas cuestionaban básicamente sobre
regiones españolas que su frecuencia de consumo, los lugares donde compran del producto,
difieren en el conoci- sus creencias respecto de factores que incidían en la calidad del jamón
miento del producto. y actitudes hacia el jamón de Teruel con denominación de origen
protegida.
Los autores llevaron a cabo una encuesta sobre la carga de fuego en
cuatro escuelas primarias y tres secundarias de Ottawa, Canadá, lo
que implicó considerar una superficie de piso de 6 313.0 m2. En las
primarias se evaluaron tres clases de cuartos: salones de clase, cuarto
de cómputo y las bibliotecas. En las secundarias, además de los cuartos
anteriores, se agregaron los salones de ciencia y arte. Se incluyeron las
áreas de piso libres y las de piso cubiertas por mobiliario.
Encuesta de cargas de Los resultados muestran que la densidad promedio de carga de fuego
Hadjisophocleous y
fuego en las escuelas para los salones de clase de las escuelas primarias es 397.5 MJ/m2,
Chen (2010)
primarias y secundarias que es aproximadamente el doble que la densidad de las aulas en las
escuelas de secundaria encuestadas. La media de densidad de la carga
de fuego total de todas las habitaciones encuestadas en las escuelas
primarias es de 426.3 MJ/m2 y de las escuelas secundarias de 313.7
MJ/m2.11
Asimismo, Claret y Andrade (2007) implementaron una encuesta para
analizar la carga de fuego de edificios históricos en Ouro Preto, en la
provincia de Minas Gerais, Brasil.
Los investigadores efectuaron una encuesta nacional en centros
penitenciarios masculinos y femeninos, nacionales y estatales, con la
finalidad de conocer qué programas y servicios se estaban implan-
tando para padres y madres reclusos que tuvieran hijos menores de
edad, dado que la literatura indica que el encarcelamiento parental
aumenta el riesgo de que los niños y jóvenes experimenten problemas
Encuesta nacional emocionales y conductuales, y más adelante tengan bajo desempeño
sobre los programas y en la escuela y se involucren en situaciones criminales. Los progra-
servicios que se ofrecen Hoffmann, Byrd y mas relacionados con la crianza de los hijos en prisión ofrecen cierta
a padres reclusos en Kightlinger (2010) promesa de disminuir las consecuencias negativas del confinamiento
centros penitenciarios del padre y/o la madre, tanto en el caso de niños y jóvenes como en
de Estados Unidos. el del propio prisionero. El asunto es preocupante, ya que cuando se
hizo el estudio (2007), aproximadamente 810 000 hombres y mujeres
reclusos eran padres de más de 1.7 millones de menores de 18 años,
un tercio de los cuales se convertirá en adulto mientras su progenitor
está encarcelado.
La muestra consistió en 387 directores de centros carcelarios (39% de
tasa de respuesta).
11 En términos más sencillos, la carga de fuego de un edificio o compartimento es una forma de establecer la posible gravedad de un incendio hipo-
tético potencial. Es la producción de calor por determinada unidad de superficie, a menudo en MJ/m2 o KJ/m2, calculada a partir del valor del poder
calorífico de los materiales presentes. Carga de fuego se utiliza para la evaluación de riesgos de seguridad industrial. El objetivo de realizar un estudio
de carga de fuego es determinar la cantidad total de calor capaz de desarrollar la combustión completa de todos los materiales contenidos en un sector
de incendio. Además, con el resultado obtenido, se puede establecer el comportamiento de los materiales constructivos, resistencia de las estructuras,
tipos de ventilación, sea esta mecánica o natural, y por último, calcular la capacidad extintora mínima necesaria a fin de instalarla en dicho lugar,
etcétera (Menendez, 2013).
16       Capítulo 6  Definición de encuesta o survey.

  Tabla 6.4  Ejemplos adicionales de encuestas (continuación).
Naturaleza Referencia Descripción

La investigación se realizó utilizando el diseño de encuesta. El objetivo
Efecto del bullying era analizar el efecto del bullying laboral sobre la rotación de los
personal y el ambiente empleados. Las participantes eran enfermeras blanco de tal clase de
organizacional caracte- Houshmand, intimidación. Se incluyeron 357 casos de 41 unidades hospitalarias.
rizado por este sobre la O’Reilly, Robinson Asimismo, se consideró el efecto del bullying personal y a nivel organi-
rotación de personal. y Wolff (2012) zacional (ambiente).
Los resultados indicaron que la intención de renunciar es similar cuando
las enfermeras son el objeto directo del bullying que cuando laboran en
una unidad caracterizada por altos niveles de este tipo de agresión.
La encuesta pretendía establecer el conocimiento por parte de los
clientes potenciales de un producto (tarjeta médica) y una marca, la
participación de esta en el mercado, las razones por las cuales los clien-
Estudio de conoci- tes compran o no el producto y la preferencia por la marca adquirida,
Hernández-Sam- los beneficios que perciben de una tarjeta médica y la marca elegida, el
miento de las tarjetas
pieri, Fernández, grado de satisfacción con el producto y la marca seleccionada, percep-
médicas y las marcas
Cuevas y Méndez ción del costo en general de la tarjeta médica y por marca, recordación
que compiten en el
(2007) de las campañas publicitarias por marca, etcétera.
mercado mexicano.
El tamaño de muestra fue de 1 979 personas encuestadas en urbes
mexicanas donde se promocionaba la marca (con más de medio millón
de habitantes).
Mediante una encuesta se evaluó el grado de satisfacción de la pobla-
ción beneficiaria de dos programas sociales aplicados en el estado de
Guanajuato, México: SAVETAS y ADRENEL, los cuales abarcan diversos
rubros: apoyos para el empleo —capacitación y generación de empleos
y autoempleos—, educación —becas—, vivienda —techo digno y piso
firme—, servicios para la comunidad—drenaje y agua potable—, salud
—servicios y campañas—, alimentación —despensas, dotación de
Satisfacción de los bene- alimentos y servicios de nutrición—, seguridad jurídica —regularización
Cuevas, Hernán-
ficiarios de los programas de documentos personales y de la tenencia de la vivencia y tierras
dez-Sampieri y
sociales del Gobierno de agrícolas/ganaderas— y desarrollo humano —asesoría familiar, pro-
Méndez (2009)
Guanajuato. blemas de alcoholismo y drogadicción, esparcimiento, incremento de la
autoestima, conflictos, etc.—, entre otros.
Asimismo, se recolectaron datos sociodemográficos.
La estrategia de muestreo fue probabilística y polietápica (muestreo
aleatorio simple para seleccionar comunidades y muestreo sistemático
para elegir viviendas e informantes). De un universo de 157 211 fami-
lias beneficiarias se encuestó a 1 217.
La encuesta Toronto entre adolescentes tiene como objetivo recabar
La encuesta Toronto entre información sobre la relevancia y el acceso a los servicios de salud
Flicker et al.
adolescentes (servicios de sexual para los adolescentes de dicha población (13 a 17 años). Se
(2010)
salud sexual). mide, entre otras cuestiones, el conocimiento y definición de salud
sexual, los riesgos para esta y los servicios disponibles.
Con la finalidad de conocer los usos y hábitos de los adultos que viven
en el área metropolitana de la Ciudad de México respecto a los medios
de comunicación colectiva, se realizó una encuesta en una muestra por
conglomerados de 1 812 personas. Entre otros tópicos se consideró el
canal de televisión predilecto, los programas televisivos, contenidos
y horarios favoritos, el número de horas que diariamente escuchan
Uso de medios de comu- la radio, la estación radiofónica y contenidos preferidos, los horarios
Hernández-Sam-
nicación en la Ciudad de en que sintonizan emisiones radiofónicas, la frecuencia de lectura de
pieri et al. (2004)
México. periódicos y revistas, cuáles escogen leer y qué contenidos les interesan
más, la frecuencia de asistencia al cine, géneros, películas, días y
horarios predilectos, así como la exposición a anuncios publicitarios
espectaculares y otros medios alternativos (publicidad en autobuses, el
metro y diversas formas de transporte público).
Se incluyeron menciones y recordación.
17

Encuestas para niños
Las encuestas han sido muy eficaces para conocer las opiniones y puntos de vista de los niños. Lloyd y
Devine (2010) demostraron que pueden aplicarse exitosamente vía internet a infantes de 10 y 11 años y
desarrollaron un método para ello. Desde luego, también las encuestas que utilizan la autoadministra-
ción del cuestionario son eficaces en el caso de los menores de edad (De Leeuw, Hox y Kef, 2003), pero
debe tomarse en cuenta que hay niños que tienen deficiencias para leer y comprender las preguntas y las
alternativas de respuesta, así como la secuenciación de ellas. Otra alternativa son los cuestionarios que se
contestan a través de entrevistas asistidas en un dispositivo electrónico (por ejemplo, computadora, sis-
tema CASI). El contexto puede ser la escuela o el hogar. En el caso de infantes algunos estudios demues-
tran que es más eficaz este medio que los cuestionarios impresos (Borgers, De Leeuw y Hox, 2000).

EJEMPLO DE UN DOCUMENTO QUE SUELE ENTREGÁRSELES
A LOS ENCUESTADORES CON RECOMENDACIONES
(TIPS) PARA EL TRABAJO DE CAMPO
Este documento fue entregado durante la capacitación a encuestadores de un estudio que pretendía eva-
luar a empresas del estado de Guanajuato, México, en términos de su responsabilidad social. En cada
organización seleccionada se aplicaba un cuestionario estandarizado, grupalmente a los empleados (al
mayor número posible de ellos) y mediante entrevista a los directivos (cuando esto no era factible, por
horario y ocupaciones, podían responderlo en uno de los grupos o de manera autoadministrada). Con
base en los resultados, el Gobierno Estatal certificaba o no a las empresas en cuanto a dicha responsabi-
lidad.12

Tips

Arreglo personal
Es importante vestir un atuendo formal pero sencillo, pues debemos considerar que se establecerá con-
tacto con tres niveles diferentes dentro de la empresa:
• Director
• Gerentes o mandos medios
• Empleados
Esto provoca que tengamos que cuidar la imagen que se busca proyectar, puesto que por un lado se
debe ser profesional y generar una percepción de responsabilidad y seriedad en el proyecto para que los
directivos nos respeten y colaboren con lo que les solicitaremos; pero al mismo tiempo tenemos que
generar confianza en los trabajadores para que tengan una respuesta positiva ante nosotros y expresen
honestamente sus percepciones acerca de la empresa, los procesos y las relaciones y/o comunicación que
existe dentro de la misma.
Por ello, se sugiere cuidar la presencia, limpieza y:
• Hombres: de preferencia usar pantalón de vestir y camisa, zapatos limpios y estar bien peinados.
• Mujeres: pantalón de vestir, camisa o blusa discreta, su peinado, maquillaje y accesorios deben ser
también discretos, zapatos de preferencia de tacón pero no alto (cerrados por normas de seguridad).
• En ambos casos es importante llevar una chaqueta americana, chamarra o saco discreto preparado
para el momento de entrevistarse con los altos mandos o mandos medios.

“Yo” como encuestador
Antes de presentarse en la empresa, es importante considerar varios aspectos.
12 El estudio fue conducido simultáneamente por la Subsecretaría del Trabajo y Previsión Social y la Universidad de Celaya en 2008 y 2009.
Manuscrito no publicado.
18       Capítulo 6  Definición de encuesta o survey.

Visualizarnos como un agente externo de las empresas, por lo que los integrantes de estas pueden:
• Sentirse amenazados o nerviosos ante la evaluación.
• Considerar que sus respuestas serán usadas en su contra y recibirán represalias por parte de sus supe-
riores.
• Exagerar en sus respuestas y generar alboroto con sus compañeros (nunca falta).
Ante estas situaciones, el encuestador debe mantener la calma, usar un tono de voz tanto amable
como respetuoso y debe aclarar el motivo de su presencia.
Pedir a los demás miembros de la empresa que se encuentren presentes (además del entrevistado) que
guarden silencio en caso de encontrarse inquietos, que respeten a sus otros compañeros y que sean hones-
tos en sus respuestas.
En situaciones de extremo nerviosismo o tensión, se puede bromear un poco o modular la voz al
explicar el cuestionario, de tal manera que nos mostremos amigables sin ser irrespetuosos ni mostremos
abuso de confianza (es importante cuidar estos detalles para que podamos establecer una buena comuni-
cación con los encuestados sin perder la autoridad).

Con empleados
• Comenzar con la presentación e introducción de nuestra persona (nombre, de qué institución veni-
mos).
• Aclarar el motivo de nuestra visita a la empresa (“buscar la certificación de la empresa como empresa
socialmente responsable”).
• Agradecerles por su presencia, tiempo y colaboración para auxiliarnos en este proyecto.
• Explicar cómo se va a ejecutar el modelo de certificación.
• Preguntar por directivos para conocer si es un grupo mixto o si se van a aplicar todas las encuestas al
mismo tiempo a todos los niveles.
• Revisar en conjunto con ellos el cuestionario (pregunta por pregunta para aclarar cualquier problema
de redacción).
• Enfatizar las opciones de respuesta.
Hacer hincapié en:
• Que la encuesta es para fines de evaluación de la empresa en general.
• Que las respuestas serán confidenciales.
• Que ningún colaborador o miembro de la empresa tendrá acceso a las encuestas (ni empleados, ni
directivos).
• Que sus jefes (especificar siempre) no podrán conocer sus respuestas y, por ende, no puede existir
ningún tipo de represalias o consecuencias en su trabajo, sueldo o trato personal.
• Aclarar y solicitar repetidamente que en verdad requerimos de su HONESTIDAD al responder, para
que los resultados que se obtengan realmente reflejen lo que se vive en la empresa y pueda servirnos
para conocer la compañía y hacer una propuesta efectiva que les beneficie a ellos como empleados y
a los directivos (BENEFICIO MUTUO, “ganar, ganar”).
• Asegurarse que han entendido cada pregunta.
Observar la forma en que contestan las encuestas:
• De forma rápida y sin prestar atención.
• Con dudas y demostrando confusión.
• Con nerviosismo.
En cualquiera de estas situaciones, acercarse a la persona en cuestión y preguntar si todo está claro, si
necesita que se despeje alguna duda y/o recordarle que será confidencial la encuesta.
Durante el llenado de las encuestas, nosotros como encuestadores, debemos tomar nota de todos los
detalles que se presenten:
19

• Cómo se encontraba el grupo (nervioso, bromista, alterado, silencioso, con prisa o apurado, etcétera).
• Señalar si el grupo en general compartía un mismo estado de ánimo o si sólo se presentaba en una
persona o en un sector de los encuestadores (sólo los mandos medios, sólo los empleados generales,
sólo una o dos personas).
• Si surgieron dudas en cuanto a:
• Cómo responder.
• Alguna cuestión de redacción.
• Confusión sobre lo que se pregunta.
• Señalar en qué pregunta hubo la duda y qué fue lo que se acordó de forma grupal (es decir, cómo se
especificó que debía ser contestada o cómo se interpretó la pregunta)
Al finalizar el llenado de las encuestas agradecer nuevamente por su participación y su disposición
para auxiliarnos, recordarles que es confidencial y que no habrá represalias.

**Nota: es importante ofrecer una expresión relajada y amable en todo momento, sonreír al escuchar una
pregunta o cuestionamiento de los participantes o al responderles.
Resulta conveniente mostrarse receptivos ante cualquier indicio de molestia o desconfianza por parte
de los encuestados o bien, durante la entrevista con directivos. En este caso tenemos que seguir nuestros
instintos para afrontar la situación, pero siempre manteniendo una actitud serena, paciente y activa para
esclarecer dudas y garantizar el cumplimiento de nuestro trabajo (explicando lo que buscamos, mostrando
seriedad en lo que hacemos, especificando la trascendencia y el impacto del proyecto), y por supuesto,
buscando mejorar la actitud de nuestro interlocutor, asegurando que el resultado de la evaluación será
para beneficio de todos los involucrados.
Algo importante es usar el sentido común para averiguar más acerca de la situación que vive la empre-
sa, para ello se pueden emplear distintos métodos ante ciertas circunstancias:
Por ejemplo, si se observa que hay un grupo en particular que está inconforme o nervioso, se puede
comenzar una plática “informal” asegurándonos que ellos perciban que estamos hablando únicamente
para “pasar el tiempo”, o “en lo que terminan el cuestionario”, iniciando con frases como:
• ¿Y usted(es) lleva(n) mucho tiempo colaborando en esta empresa?
• ¿En qué puesto se encuentran? o ¿qué actividades realizan?
• ¿Cómo se enteraron del puesto?
• ¿Y se sienten cómodos?
• ¿Habían trabajado en puestos similares en otra empresa?
• ¿Es un buen lugar para trabajar?
Desde luego, debemos poner atención a las respuestas y en cuanto se pueda (sin que nos vean) anotar
la esencia de estas o grabarlas en audio o video (por ejemplo, usando el teléfono celular o móvil).
Generalmente los empleados que se encuentran inconformes se liberan cuando se les interroga de esta
manera más informal, puesto que no se sienten amenazados. Pero, tomar en cuenta:
1. No obstruir el proceso de llenado de encuestas (procurar que sea al finalizar las mismas, puesto que
quizá no se cuente con el tiempo necesario y se perjudique el itinerario).
2. Asegurarnos de utilizar un tono de voz que denote curiosidad, “sin amenaza” de chisme, y ser amables
y respetuosos, evitando hacer comentarios o emitir opiniones personales, limitarnos a “sólo escu-
char”.

Entrevistas con directivos
Presentarnos y explicar el motivo de nuestra presencia. Agradecer por su tiempo y disponibilidad para
cooperar con el proyecto. Entregar y explicar el cuestionario (en caso de que no lo haya llenado al mismo
tiempo que el resto de los empleados). Aclarar cualquier duda que tengan.
Solicitar la evidencia que se pide para demostrar que la organización es socialmente responsable (es
importante que el trato sea amable pero con firmeza y sin titubear, puesto que al ser ellos directivos tienen
20       Capítulo 6  Definición de encuesta o survey.

que percibir nuestra seguridad y profesionalismo, para que así cooperen con nosotros). En caso que se
muestren evasivos, negativos o no quieran mostrarnos los documentos, explicarles que son necesarios
para validar la evaluación y poder certificar a la empresa. Supuestamente ellos deberán estar enterados
previamente, por lo que es muy baja la posibilidad de que desconozcan este requisito, así que con
respeto se les debe recordar que se les avisó y que a nosotros como encuestadores se nos dijo que no
había inconveniente en mostrarnos dicha evidencia.
Al finalizar, reiterarles nuestro agradecimiento e informarles que una vez finalizado el proceso de
evaluación se les notificará de los resultados obtenidos de la investigación.

Durante el recorrido
Observar de manera “cuidadosa” y sin causar interrupciones o interferir en las actividades de los
empleados (recordemos que no porque estemos evaluando ellos dejan de cumplir con sus obligaciones
dentro de la empresa).
Solicitar algún tipo de explicación por parte de los empleados (únicamente si es necesario, como
lo relativo al uso del equipo de seguridad, si es que se observa que no se utiliza).
A los encuestadores se les pueden dar breves recomendaciones adicionales sobre cuestiones de
comunicación, realización de entrevistas (etapas, cómo lograr rapport, cierre de entrevistas, programa-
ción neurolingüística, etcétera).
capítulo

7 Recolección de los datos cuantitativos.
Segunda parte

INTRODUCCIÓN
En este capítulo se tratan algunos temas que por cuestiones de espacio no fueron incluidos en el capítulo 9 (Recolección de
los datos cuantitativos) del texto impreso de Metodología de la investigación, 6ª edición, o bien, no se profundizó en ellos.
Fundamentalmente, esos temas son los siguientes: procedimiento “paso a paso” para construir un instrumento de medición,
el escalograma de Guttman (escala de actitudes), pruebas e inventarios, contextos de administración de cuestionarios, análisis
de contenido, observación cuantitativa, y obtención y análisis de datos secundarios (comprendido el metaanálisis) y un
comentario sobre las fuentes de error en las mediciones.

PROCEDIMIENTO PARA CONSTRUIR UN INSTRUMENTO DE MEDICIÓN “PASO A PASO”
En el capítulo 9, en la sección “¿Qué procedimiento se sigue para construir un instrumento de medición?”, se expuso en
términos generales el proceso para desarrollar un instrumento o sistema de recolección de datos. Ahora revisaremos con
mayor profundidad cada una de las fases.

Fase 1: Redefiniciones fundamentales
Al comenzar a desarrollar el o los instrumentos de medición, vale la pena una última reflexión para cerciorarnos de cuáles
son nuestras variables y algunas otras precisiones.
Para tal efecto, sugerimos contestar las preguntas que se muestran en la tabla de la página 2.
Una vez que se responden estas preguntas, se cuenta con las redefiniciones más importantes para proseguir.

Fase 2: Revisión de la literatura enfocada en instrumentos de medición
Si al elaborar el marco teórico efectuamos una revisión adecuada de la literatura, esta fase suele ser innecesaria. Pero puede
ocurrirle a quien se inicia en la investigación, que al consultar las fuentes primarias no se haya enfocado en los instrumentos
de medición utilizados. En esta situación, resulta indispensable evaluar nuevamente la literatura, centrándose en tales instru-
mentos, lo cual resulta sencillo, porque —supuestamente— tenemos las referencias a la mano.
Cuando se valoran los diferentes instrumentos utilizados en estudios previos, conviene identificar —en cada caso— el
propósito del instrumento tal como fue concebido por el investigador o investigadores, y analizar si es similar al nuestro.
2       Capítulo 7  Recolección de datos cuantitativos. Segunda parte

¿Qué va a ser medido? (identificación y lista de variables).

Variable o concepto 1: _____________________________________________________________________.

Variable o concepto 2: _____________________________________________________________________.

Variable o concepto 3: _____________________________________________________________________.

Variable o concepto k: _____________________________________________________________________.

¿Qué o quiénes van a ser medidos? __________________________________________________________.

¿Cuándo (fechas precisas)?_________________________________________________________________.

¿Dónde (lugar específico)? _________________________________________________________________.

¿Cuál es nuestro propósito al recolectar los datos? (debe ser coherente con el planteamiento)
______________________________________________________________________________________
______________________________________________________.

Nuestras definiciones operacionales son:
Variable o concepto 1: ____________________________________________________________________.

Variable o concepto 2: ____________________________________________________________________.

Variable o concepto3: ____________________________________________________________________.

Variable o concepto k: ____________________________________________________________________.

¿Qué tipo de datos queremos obtener? (Por ejemplo: respuestas verbales, conductas observadas, contestaciones
escritas, estadísticas epidemiológicas, proyecciones internas, marcas de sistema electrónico, mediciones del desem-
peño de una maquinaria, indicadores económicos, etcétera).

Este es el primer punto que tomamos en cuenta para ver qué instrumentos pueden sernos útiles.
Asimismo, se recomienda considerar los siguientes elementos:
• Las variables que mide el instrumento o herramienta: ¿cuántas y cuáles?
• Los dominios de contenido de las variables (dimensiones, componentes o indicadores): ¿cuáles y qué
tan extensos son? (Sharma y Petosa, 2014, Mertens, 2010 y Punch, 2009).
• La muestra: ¿a qué o a quiénes fue administrado? ¿Qué perfil o características poseen las unidades
medidas?
• Las condiciones de aplicación: ¿en qué lugar y contexto fue utilizado? ¿Cómo y cuándo fue adminis-
trado? ¿Por quién o quiénes se aplicó? ¿Eran individuos con capacidades y entrenamiento para imple-
mentarlo, calificarlo e interpretarlo? ¿Qué tiempo requiere para ser aplicado, codificado y calificado?
• La información sobre la confiabilidad: ¿de qué tipo es? ¿Cómo fue establecida? ¿Qué procedimientos
se utilizaron para calcularla? ¿Cómo se reportó? ¿Los resultados son aceptables y significativos?
• La información sobre la validez: ¿qué evidencia de contenido, criterio y constructo se aportó? ¿Se
estableció suficiente evidencia sobre la validez total? (de Vet , Terwee, Mokkink y Knol, 2011).
• La información sobre la objetividad: ¿se aplicó de manera estandarizada?
• Los recursos necesarios para administrarlo y su costo: ¿qué recursos se requieren para aplicarlo? (por
ejemplo: informáticos).
Sobre la base de tales elementos, se seleccionan uno o varios instrumentos que pueden ser apropiados
para nuestra investigación.

Fase 3: Identificación del dominio de las variables que se medirán y sus
indicadores
Esta fase, prácticamente simultánea a la anterior, se refiere a la precisión del dominio de las variables que
mediremos, fundamentándonos en las definiciones conceptuales de estas y la revisión de instrumentos
Metodología de la investigación 3

previos de recolección de datos. Es decir, debemos señalar puntualmente los componentes, dimensio-
nes o factores que teóricamente integran cada variable. Incluso, se sugiere hacerlo gráficamente como
en la figura 7.1., con la “satisfacción laboral”).
  Figura 7.1  Ejemplo de establecimiento de factores con la variable satisfacción laboral.

Satisfacción con el Satisfacción en relación
jefe o superior con el entrenamiento o
capacitación

Satisfacción respecto de
los compañeros
Satisfacción con el
salario (recompensas,
Satisfacción en torno a retribuciones...)
las condiciones de
trabajo
Satisfacción hacia el
desarrollo o crecimiento
personal logrado
Satisfacción respecto de Satisfacción con el
las perspectivas futuras desempeño personal
en la organización en el trabajo

Una vez ubicados tales factores es necesario establecer los indicadores de cada uno de ellos. Por
ejemplo, en el caso de la “satisfacción en torno a las condiciones de trabajo”, estos podrían ser: satis-
facción sobre la jornada laboral, horarios de entrada, salida y alimentación, lugar, transporte, ilumina-
ción, servicio médico y vacaciones. Cuando se trata de la “satisfacción sobre el desempeño personal en
el trabajo”: satisfacción respecto a la productividad, eficiencia, eficacia, calidad del servicio, desperdi-
cio y calidad factual.
Para cada indicador se generan uno o más ítems tal como se comentó
en el capítulo 9 del texto impreso, lo que, recordemos, se denomina ope- Operacionalización  Paso de una varia-
ble teórica o abstracta a indicadores e
racionalización de las variables (la secuencia: variable → factores, dimen- ítems o valores empíricos verificables.
siones o componentes → indicadores → ítems o valores). La
operacionalización es la base de las definiciones operacionales de las varia-
bles.
Una vez que se ha operacionalizado la variable (se cuenta con ítems o valores concretos), se espe-
cifica qué instrumento puede medirla y se construye su definición operacional, la cual implica especi-
ficar y describir el procedimiento para medir la variable a través del instrumento.
Para reforzar lo anterior paso por paso, Solís (2013), Hernández-Sampieri et al. (2013) y Sjoberg
y Nett (1980) consideran que las siguientes etapas conforman la medición de una variable:
1. Definición nominal de la variable: identificarla y nombrarla.
2. Definición conceptual de la variable.
3. Dimensionalización de la variable: determinar sus factores, dimensiones o componentes.
4. Definición de indicadores empíricos e índices de cada factor o dimensión de la variable (que es lo
que en este apartado denominamos identificación del dominio de la variable que se debe medir y
sus indicadores).
5. Identificación, desarrollo o generación de ítems o valores de cada indicador o índice.1
1 Recordemos que a veces se sigue la secuencia completa: variable → dimensiones → indicadores → ítems o valores, mientras que en
otras ocasiones se transita de la variable directamente al <<<<ítem, escala o valor. Por ejemplo, temperatura → lectura de un valor en una
escala de un aparato (termómetro); o bien, presión arterial (aplicación de un procedimiento y lecturas de escalas en un esfigmomanómetro:
mmHg).
4       Capítulo 7  Recolección de datos cuantitativos. Segunda parte

6. Definición instrumental de la variable: especificar los instrumentos que se utilizarán para recopilar
los datos pertinentes de los indicadores empíricos y de los ítems o valores requeridos para cada indi-
cador.
7. Definición operacional de la variable: determinar el procedimiento detallado que se seguirá para
aplicar el instrumento de recolección de datos y medir la variable.
Para ilustrar la operacionalización, tomemos el ejemplo de Lee y Guerin (2009), el cual se trata en la
obra impresa. Recordemos que esta investigación tuvo como objetivo “identificar si la satisfacción respec-
to de la calidad del diseño ambiental del interior de áreas de trabajo u oficinas afectaba significativamen-
te la satisfacción general del espacio de trabajo por parte de sus ocupantes y su desempeño laboral”.
La satisfacción respecto de la calidad del diseño ambiental del interior del área de trabajo fue medida
aplicando a los participantes la encuesta IEQ (Indoor environmental quality) desarrollada por el Centro
para el Medio Ambiente de la Universidad de California en Berkeley.
Se establecieron las dimensiones de tal satisfacción y los indicadores de ellas, que fueron operaciona-
lizados utilizando ítems escalados bajo el sistema de Likert con siete puntos que van de “muy satisfecho”
(+3) a “muy insatisfecho” (—3); lo mismo se aplicó a la satisfacción general sobre el espacio de trabajo.
Las dimensiones consideradas y sus indicadores se muestran en la tabla 7.1.
  Tabla 7.1  Dimensiones e indicadores de la variable "satisfacción de la calidad del diseño ambien-
tal del interior del área de trabajo".

Dimensión o criterio Indicadores medidos (satisfacción sobre…)

Diseño de la oficina • Espacio aprovechable para el trabajo individual, guardar/almacenar
• Nivel de privacidad visual
• Facilidad para interactuar con compañeros de trabajo

Mobiliario • Confort
• Capacidad/adaptabilidad
• Colores y texturas del piso, muebles y acabados

Temperatura • Temperatura ambiental

Ventilación • Calidad del aire en el espacio personal (respirable, ambiente ventilado,
rancio/no rancio, olores agradables…)

Iluminación • Cantidad de luz
• Confort visual (deslumbrante/oscuro, reflejos, contraste, etcétera)

Acústica • Ruido.
• Privacidad de sonidos (aislamiento)

Limpieza y mantenimiento • Limpieza del espacio
• Mantenimiento del edificio
• Servicio de limpieza y mantenimiento del espacio de trabajo

El desempeño, como ya se mencionó en el texto impreso, se midió perceptualmente preguntán-
doles a los participantes el grado en que cada criterio facilita/interfiere con la capacidad de terminar el
trabajo. Desde luego, hubiera sido ideal agregar datos directos del desempeño que son estándares de
toda clase de ocupaciones y organizaciones (porque las empresas hacen distintas y muy variadas valo-
raciones del desempeño laboral y también dependen del puesto) tales como asistencia-ausentismo
(número de días laborados), productividad e índice de asuntos resueltos en el último mes (número de
asuntos encargados/número de asuntos resueltos), etcétera.
En ocasiones, las dimensiones o factores son pruebas (caso frecuente en ciencias físicas o de la
salud). Por ejemplo, la medición fisiológica del sueño según lo determinado por la polisomnografía,
(del griego poly, “muchos”; somno, “sueño”; y graphy, “escritura”) que no es otra cosa que una prueba
de múltiples parámetros usada en el estudio del sueño.
Metodología de la investigación 5

El estudio polisomnográfico incluye tres estudios básicos: electroencefalografía (EEG), electrooculo-
grafía (EOG) y electromiografía (EMG). Los otros parámetros analizados son: electrocardiografía, oxime-
tría de pulso, esfuerzo respiratorio, CO2 trascutáneo, registro de sonidos para evaluar ronquidos, EMG de
extremidades y monitorización continua por video (Hall et al., 2008).
Para reforzar este punto se recomienda que en el curso de la investigación se discutan en clase ejem-
plos de operacionalización de variables de la ciencia o disciplina en la cual se enmarca la asignatura (por
ejemplo, en ingenierías, ver cómo se operacionalizan variables como presión, aceleración, volumen, masa,
etc.; en medicina, presión arterial, crecimiento de un tumor cancerígeno, obesidad, etc.; en administra-
ción, productividad de los trabajadores —dependiendo del tipo de organización— , rentabilidad de la
empresa, etc.; en psicología, autoestima, depresión, personalidad, etcétera).

Fase 4: Decisiones claves
Una vez evaluados varios instrumentos (al menos un par en el caso de estudiantes de licenciatura o pre-
grado) que se utilizaron previamente, es necesario tomar una serie de decisiones fundamentales, que
agrupamos en tres rubros:
1. Utilizar un instrumento de medición ya elaborado, adaptarlo o desarrollar uno nuevo
En el primer caso, debemos elegir un instrumento que obviamente se encuentre disponible (“esté a la
mano” y podamos utilizarlo sin violar ningún derecho de autor) y sea posible su aplicación (al respec-
to, debemos cuestionarnos si en realidad podemos administrarlo). Asimismo, debemos seleccionar
que: a) se haya generado lo más moderno posible; b) se cite con mayor frecuencia y amplitud en la
literatura; c) sea bien evaluado por expertos de asociaciones académicas y profesionales; d) demuestre
mayor confiabilidad, validez y objetividad; e) se pueda aplicar más a nuestro planteamiento y propó-
sito de recolección de datos; f) se adecue mejor a nuestra muestra y contexto, y g) se adapte en mayor
medida a las aptitudes que tenemos (que estemos más calificados para utilizarlo). Solo deben seleccio-
narse instrumentos que reporten fiabilidad, validez y objetividad ya que no es posible confiar en una
forma de medir que carezca de este tipo de evidencia clara y precisa. Cabe señalar que algunos instru-
mentos se han validado para contextos iberoamericanos. Por ejemplo, la Escala Clima-UNI con 96
ítems para medir el clima organizacional, puede ser aplicada tal cual al medio laboral mexicano
(Hernández-Sampieri, Méndez y Contreras, 2013 y Hernández-Sampieri, 2005). Su confiabilidad
promedio es de 0.95 y posee evidencia de validez de todo tipo. Desde luego, si se quisiera administrar
en otra nación latinoamericana, debe volver a validarse y, en el caso de España, tendría que adecuarse.
Si se trata de una herramienta escrita (como un cuestionario), es ineludible revisar la redacción.
En la segunda situación, el instrumento elegido se adapta al ambiente de nuestro estudio; es decir, se
realizan algunos ajustes a su presentación, instrucciones, ítems (preguntas, categorías de observación, etc.).
También se revisan cuidadosamente el lenguaje y la redacción. Este es el caso de instrumentos que se tradu-
cen y validan. Por ejemplo, el instrumento Children’s Knowledge of Abuse Questionnaire-Revised
(CKAQ-R), versión en español,2 fue adaptado de su homólogo, el cual fue generado en Estados Unidos y
se tradujo como Cuestionario del Conocimiento del Abuso Infantil-Revisado.
Si ninguna de las dos opciones anteriores resulta satisfactoria, tenemos que desarrollar uno pro-
pio. Este puede elaborarse a partir de varios instrumentos previos, de nuevas concepciones e ítems, o
bien, una mezcla de estos. Para tal efecto, idealmente debe generarse un conjunto de ítems y/o cate-
gorías para los indicadores de cada dimensión, con el apoyo de un grupo de expertos (en una o varias
sesiones del tipo denominado “tormenta de ideas”). Posteriormente, los ítems se deben someter a
evaluación de otros expertos y redactar la introducción e instrucciones. Por ejemplo, Hernández-
Sampieri (2005), construyó su instrumento mediante la selección de ítems de varios cuestionarios y
escalas desarrolladas en Estados Unidos, y otras más que habían sido aplicadas en México, además de
incluir nuevos reactivos.
2 Este instrumento es parte del ejemplo “El abuso sexual infantil” tratado en la sexta edición impresa de Metodología de la investigación (capítulos
cuantitativos), cuyo reporte del estudio original se presenta en forma de artículo académico en los ejemplos de este centro de recursos en línea
o página web.
6       Capítulo 7  Recolección de datos cuantitativos. Segunda parte

Una vez más, recordemos que el tránsito de la variable a los ítems es progresivo, como se muestra en el
siguiente ejemplo:
Ejemplo

Variable Dimensión Indicadores Ítems

Intención de voto Intención de voto En las próximas elecciones para alcalde, ¿por
por partido favorable qué partido piensa votar? (con sus opciones de
respuesta)

Intención del Intención de voto En las próximas elecciones para alcalde, ¿por
voto para las desfavorable qué partido nunca votaría? (con sus opciones
próximas eleccio- de respuesta)
nes para alcalde

Intención de voto Intención de voto En las próximas elecciones para alcalde, ¿por
por candidato favorable qué candidato piensa votar? (con sus opciones
de respuesta)
Intención de voto En las próximas elecciones para alcalde, ¿por
desfavorable qué candidato nunca votaría? (con sus opcio-
nes de respuesta)

2. Resolver el tipo de instrumento, formato y/o procedimiento
La segunda decisión es simultánea a la primera cuando se utiliza un instrumento ya elaborado o
adaptado, pues este ya posee sus características y tiene un formato y procedimiento propios. Sin embar-
go, cuando se desarrolla uno nuevo, el investigador debe decidir de qué tipo será (cuestionario, aparato,
procedimiento, hoja de observación, escala de actitudes, prueba estandarizada, etc.) y cuál será su for-
mato y procedimiento de aplicación, lo cual depende de la clase y características físicas (tamaño, colores,
tipo de fuente, especificaciones de papel y aspectos similares). Por ejemplo, no es lo mismo un cuestio-
nario escrito en papel que uno incluido en una página web, e incluso que un cuestionario en tableta. O
bien, para medir la masa corporal hay distintos escáneres.
3. Determinar el contexto de administración
Este paso implica decidir en qué espacio físico se implementará (si en un aula de capacitación, en un
salón de clases, en la calle, en los hogares, de manera telefónica, en una cámara Gesell, en un labora-
torio, en el consultorio, en una sala ambulatoria, en un acelerador de partículas, etc.). Desde luego,
la naturaleza de los datos que se buscan y el tipo de instrumento elegido nos ayudan en esta tarea. Por
ejemplo, ya sabemos que si deseamos datos escritos y vamos a utilizar un cuestionario, este puede
administrarse en distintos contextos, mientras que si nuestro interés es observar, lo podemos hacer en
un lugar público, en un salón o en una cámara Gesell. Cuando se comentó sobre las formas de aplicar
cuestionarios se profundizó en el tema, pero en el caso de pruebas estandarizadas estas suelen admi-
nistrarse en lugares que permitan a los participantes concentrarse, como aulas universitarias, salones
de hoteles y despachos privados. En cambio, la observación depende de los hechos o conductas que
se pretende registrar.

Fase 5: Construcción del instrumento
En esta etapa se generan todos los ítems o reactivos (o escalas de valores) y categorías del instrumento, de
acuerdo con la naturaleza de este y su formato. Recordemos que un ítem es, por ejemplo, una pregunta
Metodología de la investigación 7

de un cuestionario, una categoría de un sistema de observación, un valor en la escala de un dispositivo o
una estadística en un sistema de registro. Al final de esta etapa el producto es una primera versión del
instrumento. Una parte muy importante de ella es cómo vamos a registrar los datos y el valor que les
otorgaremos (codificación).

Fase 6: Prueba piloto
Esta prueba consiste en administrar el instrumento a personas, objetos o fenómenos con características
semejantes a las de la muestra objetivo de la investigación (unidades). Se somete a prueba no solo el ins-
trumento de medición, sino también las condiciones y contexto de aplicación y los procedimientos invo-
lucrados. Se debe verificar que las instrucciones se comprenden y que los ítems (lecturas o equivalentes)
funcionen de manera adecuada. En el caso de cuestionarios, se debe evaluar el lenguaje y la redacción. Los
resultados se utilizan para calcular la confiabilidad inicial y, de ser posible, la validez tentativa del instru-
mento de medición. La prueba piloto se realiza con una pequeña muestra (inferior a la muestra definiti-
va).
Recordemos que el tamaño de la muestra para la prueba o estudio piloto se puede calcular utilizando
STATS®, donde el tamaño de la población o universo es el tamaño de la muestra calculado y el nivel de
confianza puede ser de 95 o 99%. Es decir, y valga la redundancia, se extrae una muestra de la propia
muestra de la investigación.
Por ejemplo, Hernández-Sampieri (2005) aplicó el cuestionario del clima organizacional a una prue-
ba piloto en dos muestras de 30 y 32 participantes, respectivamente. La confiabilidad inicial de estas
pruebas fue de 0.91 y 0.92.
En ocasiones, el instrumento se somete a varias pruebas piloto y se depura paulatinamente (en el caso
de dispositivos, se calibran). Núñez (2001) generó una primera versión de su escala del sentido de vida
(conformada por 135 reactivos), la aplicó a un grupo y realizó ajustes sobre los resultados; posteriormen-
te, una segunda versión (180 ítems) fue administrada a otro grupo piloto similar al primero; se volvieron
a efectuar cambios en el instrumento, hasta que llegó a una versión final, la cual contenía 99 reactivos.
Cabe señalar que cuando se desarrolla un nuevo instrumento, es conveniente incluir un elevado
número de ítems, para elegir a los que más contribuyan a su confiabilidad, validez y objetividad. Desde
luego, sin excedernos ni caer en redundancias excesivas, es decir que el número o cantidad de reactivos
debe ser manejable. Además, la inclusión de cada ítem debe estar justificada (Neuman, 2009). Por ello, se
recomienda que los reactivos se generen mediante una o varias sesiones con expertos (DeVellis, 2012 y
Gall, Gall y Borg, 2003), los cuales pueden ser profesores universitarios, consultores de empresas y espe-
cialistas en el tema de estudio. Cuando no encontramos expertos, nuestra revisión de la literatura tiene
que ser exhaustiva y profunda.
Como ya se comentó, la prueba piloto evalúa todo el procedimiento de medición. Así, por ejemplo,
en el experimento de Naves y Poplawsky (1984), se evaluó la conducta de aceptación-evitación de los
participantes hacia el supuesto individuo con capacidad mental distinta (que recordemos era un actor)
mediante observación. Cada interacción se filmó y se analizó. Durante la prueba piloto se descubrió que
la iluminación era insuficiente y no se podían registrar ciertas conductas no verbales; ante ello, la prueba
se perfeccionó.
En el caso de instrumentos para aplicar mediciones en personas, parte fundamental de la prueba
piloto consiste en conversar con los participantes para recoger sus opiniones con respecto al instrumento
y al contexto de aplicación (por ejemplo, si lo consideran largo o corto, comprensible, no intrusivo, etc.).
Una vez, al comenzar una prueba piloto de un instrumento para evaluar al superior inmediato, uno de los
participantes inquirió: “En el cuestionario se pregunta sobre nuestro jefe, pero, ¿a cuál de ellos se refieren?
Porque en estos momentos en el área de producción tenemos dos superiores, el de siempre, nuestro super-
visor regular; pero como estamos fabricando un nuevo modelo de automóvil, también tenemos un supe-
rior de este proyecto”. Sin la prueba piloto, al levantar los datos no se hubiera sabido a qué superior se
referían, y la confusión hubiera sido inevitable.
8       Capítulo 7  Recolección de datos cuantitativos. Segunda parte

A continuación incluimos algunas recomendaciones para tal prueba en el caso de instrumentos escri-
tos (cuestionario, examen o prueba estandarizada).3
• Es aconsejable que se otorguen espacios para comentarios de los participantes.
• Solicitar a los participantes que señalen ambigüedades, opciones o categorías no incluidas, términos
complejos y redacción confusa.
• Tomar en cuenta y evaluar lo que escribieron los participantes durante todo el proceso.
• Estar atento a que no se presenten “patrones tendenciosos” por efecto del instrumento en: a) el orden
de las preguntas, b) el orden de las opciones de respuesta, c) tendencias en las respuestas (por ejemplo:
que siempre tiendan a estar de acuerdo o en contra de todo, sin que realmente sea su opinión; o que
respondan “no sé” a una buena parte de las preguntas; que dejen de contestar a varios ítems, etcétera).
• Simular las condiciones reales de administración de la mejor manera posible (por ejemplo, si el cues-
tionario va a enviarse por correo, la prueba piloto debe hacerse por este medio: se les envía y, poste-
riormente, pero de manera inmediata, se les reúne en grupo para comentar o, al menos, se simulan
las condiciones en el grupo: a los participantes se les entrega el cuestionario en un sobre postal, el cual
abren y leen, etcétera).

Fase 7: Versión final
Así, con los resultados de la prueba piloto, el instrumento de medición preliminar se modifica, ajusta y
mejora, dependiendo de su tipo: se calibra el dispositivo, se reconsideran escalas o categorías, se eliminan
o agregan ítems, se cambian palabras, se otorga más tiempo para responder, etc. Finalmente, se tiene la
versión definitiva administrar (si se trata de cuestionarios, se incluye un diseño gráfico atractivo para los
participantes y de acuerdo con el medio: impreso en papel, página web, tableta o PC, etcétera).

Fase 8: Entrenamiento del personal
Las personas del equipo de investigación que van a administrar y/o calificar el instrumento, ya sea que se
trate de operadores, entrevistadores, observadores, encuestadores o individuos que dirijan las sesiones para
aplicarlo, deben recibir un entrenamiento en varias cuestiones:
a) La importancia de su participación y su papel en el estudio.
b) El propósito del estudio.
c) Las personas e instituciones que patrocinan y/o realizan la investigación.
d) La calendarización y tiempos del estudio (fechas claves de entrega de información).
e) La confidencialidad que deben guardar respecto de la investigación y sobre todo de los participantes.
Esta no puede violarse bajo ninguna circunstancia.
f) La manera en que deben vestirse si van a entrevistar o tener contacto con los participantes.
g) El respeto y la sensibilidad que deben tener hacia los participantes (por ejemplo, no discriminar ni
utilizar lenguaje que pudiera resultar ofensivo).
h) No discutir ni molestarse con los participantes (ya que nos están haciendo un favor).
i) Cómo establecer un ambiente de confianza.
j) Usar gafetes y cartas de identificación.
k) El instrumento de medición (estructura, orden, ítems, instrucciones para el personal y para los par-
ticipantes) y sus condiciones de administración.
Durante el entrenamiento, el personal que aplicará y/o calificará las respuestas o mediciones debe
realizar varios ensayos a la vista de todos (de entrevista, observación, aplicación de prueba, implementa-
ción de un dispositivo o procedimiento, etc.), porque ello la permitirá corregir aquellas situaciones que
puedan afectar la objetividad y el correcto desempeño en la recolección de los datos.
El entrenamiento puede llevarse a cabo mediante una o más sesiones, según sea el caso. Se recomien-
da —al menos— una reunión previa al inicio de la recolección de datos y una después del levantamiento
3 Algunas de estas sugerencias fueron adaptadas de Mertens (2010) y Koretz (2009).
Metodología de la investigación 9

de estos. Durante la sesión o sesiones se motiva al personal, se escuchan sus sugerencias y se responden
inquietudes.

Fase 9: Autorizaciones
Antes de recolectar los datos, es necesario gestionar varias autorizaciones, las cuales dependen del contex-
to de la investigación. Por ejemplo, en estudios con materiales delicados (sustancias radioactivas o peligro-
sas), de parte de organismos públicos que supervisan su manejo y utilización. Si se trata de estudios en
empresas, se necesita el permiso por parte de los representantes de las organizaciones a las cuales pertene-
cen los participantes (directivos y líderes sindicales, directores y maestros en las escuelas —si son menores
de edad, de sus tutores,—, funcionarios gubernamentales, etcétera).
Para este fin conviene producir una breve presentación del estudio en un programa para tal efecto
(Power Point, Flash, Prezi, etc.) e idealmente en algún formato multimedia o de video (que pueda repro-
ducirse utilizando un programa para PC, DVD u otros dispositivos) y presentar el protocolo o proyecto
escrito que de cualquier manera debemos elaborar.
En segundo término, es ineludible obtener el consentimiento de los propios participantes, en parti-
cular por escrito. Desde luego, en encuestas en la vía pública o en los hogares, a veces esto resulta compli-
cado y la autorización suele ser verbal o implícita. El asunto es más delicado cuando se trata de menores
de edad y personas con capacidades diferentes. En este caso, el consentimiento tienen que otorgarlo los
tutores y las personas que se integrarán a la muestra. No obtenerlo o lograrlo mediante engaños es una
clara violación a la ética de la investigación. No puede filmarse a alguien sin su autorización, salvo conduc-
tas públicas manifiestas (consultar capítulo 2 de este centro de recursos en línea).

Fase 10: Administración del instrumento
Este es el momento de la verdad, en el cual todo nuestro trabajo conceptual y de planeación se con-
fronta con los hechos. La administración depende del tipo de instrumento que hayamos seleccionado y la
experticia de todo el equipo que participa. Debemos aclarar que una cuestión es el tipo de instrumento
en sí y otra el contexto de administración. En la literatura sobre recolección de datos cuantitativos todavía
hay cierta confusión al respecto. Por ejemplo, ciertos autores desarrollan el tema de los “cuestionarios” en
las secciones de surveys o encuestas, otros en el apartado sobre entrevistas, algunos más los consideran en
sí mismos como un tema o los incluyen en medición. Debido a estas diferencias, hemos decidido ver en
el capítulo 9 del libro y en este capítulo del centro de recursos en línea cada instrumento y los contextos
más comunes en que se usan.

CONTEXTOS DE ADMINISTRACIÓN DE LOS CUESTIONARIOS
En el capítulo 9 del libro (dentro del apartado “¿En qué contextos puede administrarse o aplicarse un
cuestionario?”), se comentaron los principales contextos de administración de los cuestionarios. Ahora, en
esta sección reforzaremos algunos aspectos sobre el tema.

Autoadministración grupal
Cuando el cuestionario se aplica grupalmente, es importante verificar algunas cuestiones, que se incluyen
en la tabla 7.2.

Autoadministración por envío
En el caso de autoadministración por envío mediante el correo o mensajería, el cuestionario se remite junto
con una carta explicativa firmada por el investigador o investigadores, la cual cumple las funciones de la
introducción (con los elementos comentados previamente en el capítulo 9 del libro: propósito del estudio,
motivadores, agradecimiento, tiempo de respuesta, etc., excepto las instrucciones que suelen incluirse en
el instrumento). Si la carta está membretada con el logotipo del instrumento, mejor aún.
10       Capítulo 7  Recolección de datos cuantitativos. Segunda parte

  Tabla 7.2  Listado de puntos a verificar al administrar cuestionarios en grupo.4
1. ¿Tenemos suficientes cuestionarios? Sí No
______________ ______________

2. ¿Hemos diseñado alguna medida para que quienes no Sí No
puedan asistir a la sesión respondan al cuestionario? ______________ ______________
¿Cuál?
______________

3. ¿Se notificó formalmente a los participantes potenciales Sí No
de la fecha, hora y lugar en que se aplicaría el cuestiona- ______________ ______________
rio?
¿Cómo? (carta, correo electrónico,
memo, mensaje)
______________

4. ¿Se verificó que el lugar donde se aplicará el cuestio- Sí No
nario presenta las condiciones adecuadas de espacio e ______________ ______________
iluminación?
¿Quién verificó?
______________

5. ¿Se aisló el lugar de fuentes potenciales de ruido u otras Sí No
distracciones? ______________ ______________

6. ¿Quiénes van a leer las instrucciones y asistir a los parti- Persona(s): No hay designados
cipantes a lo largo de la sesión? ______________ ______________

7. ¿Las instrucciones incluyen cómo responder al cuestio- Sí No
nario? ______________ ______________

8. ¿Se contempló un tiempo razonable para responder Sí No
dudas e inquietudes de los participantes antes de que ______________ ______________
comiencen a contestar el cuestionario?

9. Quienes van a leer en voz alta las instrucciones, ¿tienen Sí No
una voz nítida y suficientemente fuerte para que todos le ______________ ______________
escuchen y su lectura será pausada?

10. ¿Se verificará que todos hayan respondido al cuestio- Sí No
nario? ______________ ______________

11. ¿Quién dará las gracias a los participantes por su Persona(s): No hay designados
cooperación? ______________ ______________

12. ¿Quién entregará o enviará las cartas de agradecimien- Persona(s): No hay designados
to o equivalentes a los participantes y a quienes facilitaron ______________ ______________
la sesión? ¿A través de qué medios?
Medios:
______________

4 Adaptado de McMurtry (2005).
Metodología de la investigación 11

Se recomienda que los cuestionarios sean breves y concisos de acuerdo al planteamiento y los objeti-
vos de medición. Si al hablar de otros instrumentos autoadministrados se comentó que las instrucciones
deben ser precisas y claras, esta condición resulta particularmente importante en estos casos, ya que las
posibilidades de realimentación y resolución de dudas se reducen al mínimo. La carátula, además de lo
que se señaló previamente, debe contener la fecha exacta de envío. En las instrucciones es necesario agre-
gar la fecha en que se requiere sea devuelto y la forma de regresar el cuestionario contestado, paso a paso.
De ser posible, resulta aconsejable designar a una persona para que atienda dudas y comentarios del ins-
trumento y el estudio, por medio telefónico, correo electrónico y/o una red social (whatsApp, twitter o
facebook, por ejemplo). Obviamente, esta persona tiene que proporcionar sus datos completos. Ofrecer
a los participantes un resumen de los resultados, una vez que concluya la investigación, es una práctica
recomendable (este informe se puede enviar por correo electrónico, mostrar en una página web o equiva-
lente).
Asimismo, el paquete para cada individuo potencial incluye dos sobres personalizados: uno que con-
tiene el cuestionario y la carta, y el otro para que devuelva el cuestionario cumplimentado. Desde luego,
este último con los datos completos del remitente (destinatario final) y con el porte de regreso o la guía de
paquetería prepagada (es necesario cubrir todos los gastos generados en este proceso). Un diseño original
de los sobres puede ser de gran ayuda, al menos para que sean abiertos.
Es fundamental contactar vía telefónica y/o correo electrónico al futuro encuestado, para motivarlo a
que conteste el cuestionario. Una vez que se reciba su respuesta, es preciso agradecerle su cooperación.
Algunas personas se niegan a participar en investigaciones, porque fueron tratadas con descortesía una vez
que se obtuvo de ellas lo que se deseaba.
Los cuestionarios autoadministrados pueden ser procesados de forma casi inmediata si se usa codifi-
cación por lectura óptica u otros medios electrónicos. Es decir, si el papel del cuestionario cubre ciertos
requisitos y es respondido con un lápiz o bolígrafo especial o en computadora, celular o tableta, se evita la
codificación, puesto que el sistema lee las respuestas y automáticamente las envía a la base de datos corres-
pondiente.
Vinuesa (2005) señala que la encuesta por correo postal permite una selección muestral de los parti-
cipantes de acuerdo con su perfil sociodemográfico, de compra, estilo de vida, etc., y de individuos con-
cretos (profesionales, miembros de alguna asociación, etcétera).
Algunas desventajas residen en que nunca podremos estar seguros de quién respondió el cuestionario
y la ausencia de un encuestador impide asegurar la franqueza de las respuestas.
Por correo electrónico. Se trata de un procedimiento similar, pues lo único que cambia es el medio de
contacto y el cuestionario puede ser contestado en el dispositivo de quien responde (PC, laptop, tableta,
celular, etc.). La carta, carátula, instrucciones y el cuestionario son enviados a través de un correo electró-
nico (e-mail).
Por medio de una página de internet o servidor de la web. Esta vía es similar a las dos anteriores en
cuanto a la mecánica. Sin embargo, en este caso se le pide al participante (por contacto telefónico, correo
electrónico, mensaje en celular u otro medio; o bien, mediante una red social en internet) que acceda a un
sitio web o hipervínculo (locación URL única),5 donde se localiza el cuestionario, el cual se puede conte-
star en el momento o por etapas; otra modalidad puede ser que se “descargue” o “baje” el cuestionario para
guardarlo como archivo en la computadora y posteriormente, una vez contestado, se envía por correo u
otro mecanismo electrónico.6
Los cuestionarios utilizados en medios electrónicos regularmente se elaboran en un programa de
texto e imagen, o se escanean (si están impresos con anterioridad) y “se anexan” al correo electrónico
(como un “archivo adjunto”), o se pueden colocar o “subir” al sitio web, aunque para este segundo caso lo
más común es que se elaboren especialmente para tal medio. En ambas situaciones, las posibilidades de
diseño del instrumento son amplísimas.

5 El acceso puede ser público o limitado mediante contraseñas (ID) o números PIN.
6 Entre los principales programas para el uso de encuestas electrónicas podemos mencionar a: WebCT, Googledocs y Blackboard.
12       Capítulo 7  Recolección de datos cuantitativos. Segunda parte

Las limitaciones de los estudios que utilizan el correo electrónico y la web residen en que no todas las
personas poseen computadora e internet (sobre todo en América Latina) y algunos individuos (por ejem-
plo, los mayores de 60 años) se resisten a utilizar estos recursos, porque es una tecnología relativamente
reciente y desconocida para gran parte de ellos. Varios estudios han encontrado que la mayoría de los
usuarios de internet son personas educadas, jóvenes y de estratos medios o altos (y en Estados Unidos,

  Tabla 7.3  Ventajas y desventajas de administrar cuestionarios mediante internet.7

Ventajas Desventajas
Costo relativamente bajo. Dificultad de acceso a directorios.

Codificación automática. No se sabe quién contesta.

Normalmente se aplican rápidamente (pero no es una Generalmente la muestra es no probabilística. No hay
regla). una elevada representatividad o poder de generaliza-
ción.
Instrumentos con diseños sumamente atractivos e inte- Riesgo de que quien responde se concentre más en la
ractivos (por ejemplo, posibilidad de incorporar gráficas forma que en el fondo.
multimedia, sonido y videos).
Elevado control del proceso de envío y recepción de cues-
tionarios.

predominantemente blancos) (Nathan, 2008).
Algunas ventajas y desventajas de aplicar cuestionarios vía internet se mencionan en la tabla 7. 3.
La administración de cuestionarios por internet es útil en estudios exploratorios y descriptivos
(Nathan, 2008).
En cuanto a las tasas de respuesta por internet y correo, la situación es variable y las investigaciones
a este respecto arrojan distintos resultados. Fricker y Schonlau (2002), en una primera revisión de estudios
que recolectaron datos a través de la web (muestras probabilísticas o censos), reportan índices de entre 38
y 44%, que son las más altas las que se conocen entre empleados, y un estudio entre estudiantes con una
tasa de 8%. En otra revisión de la literatura, consideraron investigaciones en las cuales preguntaban a los
encuestados si preferían contestar vía internet o mediante el correo, oportunidad en la que descubrieron
preferencias mucho mayores por el segundo medio (seis investigaciones con porcentajes que oscilaron
entre 73 y 96%, mientras que por internet el porcentaje varió entre 4 y 27%). Solo se conoce un estudio
donde la elección por internet fue de 80% y por correo tradicional 20%, y una entre dentistas con tasas
de 84% y 16%, respectivamente, lo que podría indicar que personas con alto nivel educativo y tecnológi-
co prefieren la web para responder a cuestionarios. En una tercera revisión de trabajos donde se compara-
ron el correo electrónico y el correo tradicional, en ocho estudios se obtuvo una tasa de respuesta mayor
o mucho mayor vía este último (las muestras incluyeron profesores y empleados federales). Solo en el caso
de colaboradores de la empresa telefónica AT&T la tasa fue de 38% por correo y 68% por e-mail). En
otros tres estudios, en dos se prefirió el primer modo. En definitiva, todavía no hay claridad sobre cuál tipo
de contexto de administración es mejor en términos de calidad de la información obtenida y las tasas de
respuesta, lo que significa que se requiere mayor investigación al respecto (Fowler, 2014 y Carley-Baxter,
Peytchev y Black, 2010).
Desde luego, como menciona Mertens (2010), una tasa de devolución de cuestionarios cumplimen-
tados por correo o de manera electrónica por encima de 50% es muy favorable.
Asimismo, el tópico o tema está relacionado con la tasa de respuesta y puede interactuar con el medio
elegido (Carley-Baxter, Peytchev y Black, 2010). En ello también influye el contexto histórico, social y
económico del momento en el que se lleva a cabo el levantamiento de datos. Por ejemplo, si el entorno
está caracterizado por violencia y delincuencia, preguntar sobre temas de seguridad pública y criminalidad
puede ser delicado debido a que las personas pueden atemorizarse al responder o pensar que hay “trasfon-
do” en la recolección de respuestas. Preguntar sobre asuntos de salud en el momento de una epidemia,

7 Tourangeau, Conrad y Couper (2013); Sue y Ritter (2012); Nathan (2008) y Couper (2003).
Metodología de la investigación 13

también resulta inconveniente. Otro caso de estos se presenta cuando se inquiere sobre niveles socioeco-
nómicos o temas relacionados cuando se ha concretado una reforma fiscal o acciones de fiscalización.
Las encuestas de casa en casa son problemáticas si hay robos en la ciudad o comunidad, pues las
personas no permiten el acceso a sus domicilios y ni siquiera desean contestar en las puertas de sus
hogares. La desconfianza es mayúscula.
Las tasas de respuesta por cualquier medio se incrementan cuando: 1) quienes responden al cues-
tionario reciben beneficios económicos, 2) los instrumentos no son extensos, 3) se produce un segui-
miento sistemático de las respuestas y persistente a casos de no respuesta, 4) se establece una vinculación
personal con los participantes y 5) hay contacto antes del envío (Häder, 2012; McCarty, House,
Harman y Richards, 2006 y Cook, Heath y Thompson, 2001 y 2000).
De acuerdo con varios experimentos y otros tipos de estudios, en encuestas donde el cuestionario
es contestado en dispositivos pequeños se producen efectos negativos en las respuestas (Peytchev y
Hill, 2010). Si algunas opciones no aparecen en la pantalla, algunos participantes señalan no haber
visto todas las categorías o ignorar aquellas que necesitan de recorrer la pantalla. Lo mismo en las
preguntas, varios sujetos contestan con base en la parte de la interrogación que se percibe primero. En
ocasiones, si los teclados son pequeños, los encuestados no proporcionan toda la información reque-
rida, incluso evitan contestar ciertas preguntas. En ocasiones, con pantallas y teclados miniatura
surgen sesgos al contestar (por ejemplo, marcar regularmente la primera opción). Este mediocre
panorama puede mejorar en el futuro cuando las personas de todas las edades se familiaricen con estas
tecnologías. Es necesario efectuar más investigación sistemática en relación con el tema.
Otra ventaja de la autoadministración por envío (correo tradicional, correo electrónico y página de
internet) es que cuando se hacen preguntas personales o de mayor carga emotiva, el sujeto puede contestar
de manera más relajada y sincera, puesto que no está frente a otra persona.

Entrevistas interactivas y telefónicas
Una posibilidad novedosa son las entrevistas interactivas (algunas representan modalidades telefónicas, otras
se trata de los denominados “medios inteligentes” de correo electrónico o de sitios web), en donde un sis-
tema se contacta vía telefónica o por correo electrónico con los participantes potenciales y administra el
cuestionario o lo envía. Son mecanismos con reconocimiento de voz, lectura óptica y dictado digital. El
problema es —hasta el momento— que la mayoría de las personas se percata de que no es otro ser humano
con quien entra en contacto y suele negarse a responder. Además, la saturación de correos electrónicos,
llamadas telefónicas y sitios web hacen difícil captar la atención de los participantes potenciales. Si se utili-
zan estos sistemas, se aconseja que los cuestionarios sean muy breves, no más de diez preguntas. Desde
luego esta situación irá modificándose y cada vez serán más los estudios que utilicen tales tecnologías.
Para administrar cuestionarios vía entrevista telefónica se dispone de varias tecnologías, además de las
ya comentadas de reconocimiento de voz y dictado digital, como el CATI (Computer-Assisted Telephone
Interviewing), la cual permite que el entrevistador se siente frente a su computadora u ordenador, cuyo
sistema selecciona números telefónicos generados al azar y los marca automáticamente (Outwater, 2008
y Boslaugh, 2007). Una vez que contesta la persona indicada, él comienza a leer las preguntas en el moni-
tor y anota las respuestas (desde luego, mediante el teclado o el mouse), las cuales son capturadas y codi-
ficadas de manera automática. El sistema gestiona el desarrollo de la entrevista, ya que remite a las
opciones adecuadas (en caso de preguntas condicionadas, como por ejemplo: “¿Tiene usted una cuenta en
este banco, sí o no?” Si la respuesta es “sí”, el sistema continúa con la siguiente pregunta enlazada: “¿Qué
servicios usa…?” Pero si la respuesta fue un “no”, puede concluir con un muchas gracias…, o pasar a otras
preguntas). El entrevistador puede utilizar diademas con audífonos y micrófono. O bien, el sistema tiene
la facilidad de reconocimiento de voz y de capturar directamente la respuesta. Es una interfase con el
Random Digit Dialing (Sue y Ritter, 2012 y Outwater, 2008).
Algunas recomendaciones para las entrevistas telefónicas son las siguientes:8

8 Mertens (2010); Kuusela, Callegaro y Vehovar (2009) y The Psychology Research Handbook (2006). Esta última fuente es una excelente intro-
ducción para el alumno que comienza a adentrarse en las encuestas telefónicas.
  Tabla

  Tabla 6.3  Ejemplos adicionales de encuesta en áreas de salud (continuación).
14       Capítulo 7  Recolección de datos cuantitativos. Segunda parte

1. Reclutar entrevistadores con habilidades de comunicación verbal (voz clara, capacidad de realimentar,
manejo de conflictos verbales, agilidad mental para responder, etcétera).
2. Asignar a una persona que monitoree permanentemente a los entrevistadores (supervisor).
3. Enviar una carta, telefonema o correo electrónico previo, en que se indique el objetivo de la entrevis-
ta, la persona o institución que realiza la encuesta y el día y hora en que se efectuará la comunicación
telefónica.
4. Llevar a cabo la comunicación en el día y hora acordados.
5. El entrevistador debe identificarse y recordarle al entrevistado el propósito del estudio; asimismo,
debe asegurarse de que es un buen momento para la comunicación.
6. Entre la comunicación previa y la entrevista telefónica no debe pasar más de una semana (programar
llamadas adecuadamente).
7. El entrevistador debe asegurarse de que está hablando con la persona correcta o que posee el perfil
adecuado según la definición de la muestra.
8. Indicar el tiempo que tomará la entrevista.
9. Utilizar un cuestionario breve con preguntas preferentemente estructuradas (cerradas) y sencillas.
Más de 15 o 17 preguntas suelen complicar la situación.
10. El entrevistador debe vocalizar correctamente y a la misma velocidad de su interlocutor.
11. Anotar casos de rechazos y las razones.
12. En el entrenamiento, simular las condiciones de aplicación (igual en la prueba piloto).
13. Establecer metas de comunicaciones telefónicas por hora.
14. Si se pretende grabar la entrevista, debe interrogarse al participante si está de acuerdo con ello.

Desde luego, estas recomendaciones se aplican a una encuesta telefónica cuyos tiempos de ejecución
son extensos. Sin embargo, en ocasiones tenemos que realizar sondeos inmediatos para obtener tendencias
en la opinión pública y algunas de estas recomendaciones no son pertinentes. Por ejemplo, después de una
catástrofe (como un magnicidio, acto terrorista o desastre natural), una noticia mundial (la elección de un
nuevo pontífice, una invasión de un país o un acuerdo de paz) o local (un triunfo electoral, un nuevo
impuesto o el rechazo a un mandatario). Tales fueron los casos de las encuestas que se realizaron en los días
posteriores al asesinato de J. F. Kennedy (Sheatsley y Feldman, 1964), las que se efectuaron después de los
ataques terroristas del 11 de septiembre de 2001 en Nueva York (University of Southern California y
Bendixen & Associates, 2002), las que se realizaron con motivo de los atentados ocurridos en Madrid el
11 de marzo de 2004 (Michavila, 2005), las ulteriores a las explosiones del 7 de julio de 2005 en Londres
(COMPAS, 2005; The Harris Poll, 2005 y British Broadcasting Corporation, 2005), la encuesta telefóni-
ca nacional que se implementó en México luego del brote del virus de la influenza humana (Consulta
Mitofsky, 2009) y la que se aplicó también en México después de la elección del papa Francisco (BGC-
Excélsior, 2013).
Finalmente, es necesario destacar la importancia de no realizar investigaciones que requieran enviar el
cuestionario en épocas complejas del año (vacaciones de verano o invierno: en Navidad la saturación es
impresionante) o que lo sean para la población en estudio (por ejemplo, a fiscalistas y contadores de
empresas durante momentos de cierres contables y pago de impuestos; a las personas de edad avanzada en
épocas de frío extremo, etcétera).

Un apunte: comparación entre contextos de entrevistas personales
Jaffe, Pasternak y Grifel (1983) hicieron un estudio para comparar, entre otros aspectos, las respuestas
obtenidas en dos puntos: en el hogar y en los lugares de venta. El estudio se interesaba en la conducta del
comprador y los resultados concluyeron que se pueden obtener datos exactos en ambos puntos, aunque la
entrevista en los lugares de compraventa es más barata.
A la misma conclusión llegaron Hernández-Sampieri, Cuevas y Méndez (2009), quienes entre 2007
y 2009 hicieron ocho encuestas para conocer la intención del voto y las tendencias electorales en varios
municipios de México, y encontraron resultados similares a las que arrojaron las entrevistas en el hogar y
en sitios públicos (parques, mercados, centros comerciales, etcétera).
a 6.4  Ejemplos adicionales de encuestas.

Metodología de la investigación 15

Aplicaciones multimodales de cuestionarios
El ideal de la aplicación de cuestionarios es la versión multimodal o su implementación utilizando varios
contextos de administración (por ejemplo, en encuestas), la cual se ha popularizado en los últimos años
y combina diferentes maneras de recolectar la información en un mismo proyecto de investigación que
incluye datos cuantitativos y cualitativos. Por ejemplo, utilizar la encuesta tradicional por entrevista per-
sonal para obtener datos cuantitativos básicos y respuestas a unas cuantas preguntas abiertas, junto con
otras formas complementarias como la encuesta telefónica (tanto a teléfonos fijos como móviles o celula-
res) para realizar preguntas muy cortas y cerradas, la encuesta por internet para penetrar ciertos aspectos
mediante preguntas abiertas y otras más complejas, y la administración de cuestionarios grupales con la
finalidad de lograr profundidad en determinadas respuestas. Aunque, desde luego, las preguntas centrales
son las mismas.
Se recomienda este enfoque cuando se dispone de un presupuesto suficiente y se pretende elucidar
problemas asociados con la potencial cobertura deficiente que implica utilizar un solo método o incre-
mentar las tasas de respuesta (Link, 2008). También, cuando se intenta acceder a diversas poblaciones con
distintas características, como disponibilidad de teléfono e internet, dispersión geográfica y nivel socioeco-
nómico y educativo. Por ejemplo, una encuesta que sea administrada a diversos tipos de personas del
sector salud: funcionarios o ejecutivos (que como tienen poco tiempo para responder el cuestionario
puede ser autoaplicado), enfermeras y empleados de apoyo (administración grupal), médicos y pacientes
actuales (mediante entrevistas personales), pacientes dados de alta (telefónica e internet), etcétera.
Dillman, Smyth y Christian (2009) sugieren que cuando se implemente una encuesta multimodal,
se limite a ciertas preguntas y que las opciones de respuesta sean las mismas entre los varios formatos (y se
reduzcan categorías o se disponga de las alternativas básicas del método más sencillo, por ejemplo, el
cuestionario para la versión telefónica), se eviten cambios en la estructura esencial de las preguntas para
no modificar el estímulo, las instrucciones sean equivalentes en los diferentes modos y se efectúen pruebas
pilotos con todos los instrumentos, para asegurar que siempre se obtenga la misma información de mane-
ra válida y confiable, lo cual depende del planteamiento del problema y lo que pretenda el investigador.

ESCALOGRAMA DE GUTTMAN
En el libro Metodología de la investigación, 6ª edición, concretamente en las escalas de actitudes, como
técnicas para recolectar datos, se comentaron el escalamiento tipo Likert y el diferencial semántico, por lo
que quedó pendiente el escalograma de Guttman. Ahora lo consideraremos. 9
Este método para medir actitudes fue desarrollado por Louis Guttman (1916-1987).10 Se basa en el
principio de que algunos ítems indican en mayor medida la fuerza o intensidad de la actitud. La escala está
constituida por afirmaciones, las cuales poseen las mismas características que el escalamiento tipo Likert.
Sin embargo, el escalograma garantiza que la escala mida una dimensión única. Es decir, cada afirmación
mide la misma dimensión de la misma variable. a esta propiedad se le conoce como unidimensionalidad
(Reckase, 2009).
Algunos autores consideran que el escalograma, más que un método de medición de actitudes, es una
técnica para determinar si un conjunto de afirmaciones reúne los requisitos de un tipo particular de esca-
la (Engelhard, 2008; Shye, 2008 y Edwards, 1983).
Para construir el escalograma es necesario desarrollar un conjunto de afirmaciones pertinentes al objeto de
actitud, las cuales deben variar en intensidad (Trochim, 2008). Por ejemplo, si pretendiéramos medir la
actitud hacia la calidad del trabajo en el nivel gerencial, la afirmación “la calidad tiene que vivirse en todas
las actividades del trabajo y en el hogar”, es más intensa que “la calidad debe vivirse sólo en las actividades
más importantes del trabajo”. Dichas afirmaciones se aplican a una muestra a manera de prueba piloto. Una
9 Para profundizar en esta escala, se sugiere consultar a DeVellis (2012); Abdi (2010); Roberts y Jowell (2008); Fabrigar y MacGregor (2006);
Dunn-Rankin et al. (2004); Cliff, Kyats y Keats (2002); Weller y Romney (1990); Black y Champion (1976); Guttman (1976); Lingoes (1976); Dotson
y Sumers (1976) y Nie et al. (1975).
10 Guttman hizo importantes aportaciones a la medición, además del escalograma, entre otras cuestiones, fue quien conceptualizó en 1944 los
niveles de medición nominal, ordinal, de intervalos y de razón (Katz, 1988 y Stevens, 1951).
16       Capítulo 7  Recolección de datos cuantitativos. Segunda parte

vez administradas, se procede a su análisis. Cabe mencionar que las categorías de respuesta para las afirma-
ciones pueden variar entre dos (“de acuerdo-en desacuerdo”, “sí-no”, etc.) o más categorías (por ejemplo, las
mismas categorías que en el caso de Likert).

Técnica de Cornell
La manera más conocida de analizar los ítems o las afirmaciones y desarrollar el escalograma es la técnica
de Cornell (Guttman, 1976), en la cual se procede a:
1. Obtener el puntaje total de cada participante o sujeto en la escala.
2. Ordenar a los sujetos o encuestados de acuerdo con su puntaje total (del puntaje mayor al menor, de
manera vertical descendente).
3. Ordenar las afirmaciones de acuerdo con su intensidad (de mayor a menor y de izquierda a derecha).
4. Construir un cuadro donde se crucen los puntajes de los participantes ordenados con los ítems y sus categorías, de
manera jerarquizada. Así, tenemos un cuadro donde los sujetos constituyen los renglones y las categorías de
los ítems forman las columnas, lo cual se representa en la figura 7.2.
5. Analizar el número de errores o rupturas en el patrón ideal de intensidad de la escala.

  Figura 7.2  Manera de disponer los resultados para el análisis de ítems mediante la técnica de Cornell.

Menos intenso

Ítems

Más intenso Categorías Menos intenso

Personas Puntajes
De acuerdo con Mayor
su puntaje

Menor

Ejemplo
Suponga que aplicamos una escala con cuatro ítems o afirmaciones a 14 participantes, cuyo objeto de actitud es “la
calidad dentro de la organización” (la variable es la conciencia sobre la calidad por parte de los empleados).
La calidad de la organización, definida como “el grado en que los empleados de una empresa se orientan a
cumplir con las especificaciones y requerimientos de los clientes en cuanto a sus productos y servicios” (en precio,
tiempo de entrega, cumplimiento de estándares del mercado, etcétera).
Cada afirmación tiene dos categorías de respuesta (“de acuerdo” y “en desacuerdo”, codificadas como
uno y cero, respectivamente).
Afirmación A: “La calidad tiene que vivirse siempre en todas las actividades del trabajo y en el hogar”.
Afirmación B: “La calidad tiene que vivirse siempre en todas las actividades del trabajo”.
Afirmación C: “La calidad tiene que vivirse solamente en las actividades más importantes del trabajo”.
Afirmación D: “La calidad tiene que vivirse solamente en la actividad más importante del trabajo”.
Los resultados se muestran en la tabla 7.4.
Metodología de la investigación 17

  Tabla 7.4  Ejemplo de la técnica de Cornell para el análisis de ítems o afirmaciones.

AFIRMACIONES
A B C D
Sujeto DA ED DA ED DA ED DA ED PUNTUACIONES TOTALES
(1) (0) (1) (0) (1) (0) (1) (0)
1 X X X X 4
2 X X X X 4
3 X X X X 4
4 X X X X 3
5 X X X X 3
6 X X X X 3
7 X X X X 2
8 X X X X 2
9 X X X X 2
10 X X X X 2
11 X X X X 1
12 X X X X 1
13 X X X X 0
14 X X X X 0
DA = de acuerdo o “1” ED = en desacuerdo o “0”

Ahora bien, como se observa en la tabla 7.4, los participantes están ordenados por su puntuación
en la escala total. Asimismo, las frases deben ordenarse por su intensidad (en el ejemplo, A tiene mayor
intensidad que B, B mayor que C, y a su vez, C mayor que D), y sus categorías se encuentran jerarqui-
zadas de acuerdo con su valor, de izquierda a derecha. Hay que recordar que si la afirmación es nega-
tiva, la codificación se invierte (si a la frase la calidad es poco importante para el desarrollo de una
empresa recibe la respuesta “de acuerdo” se codificará con cero, y si es “en desacuerdo” con uno). En el
ejemplo de la tabla 7.4 encontramos cuatro afirmaciones positivas.
Los sujetos que estén “de acuerdo” con la afirmación A, que es la más intensa, muy probablemen-
te también lo estén con las afirmaciones B, C y D, ya que su intensidad es menor. Los individuos que
respondan “de acuerdo” a la afirmación B tenderán a estar “de acuerdo” con C y D (afirmaciones
menos intensas), pero no necesariamente con A. Quienes estén “de acuerdo” con C  lo más probable
es que se encuentren “de acuerdo” con D, pero no necesariamente con A y B.
Debe observarse que el individuo número 1 estuvo “de acuerdo” con las cuatro afirmaciones. Los
casos 2 y 3 respondieron de igual forma. Las puntuaciones de estos equivalen a cuatro (1 + 1 + 1 + 1).
Los participantes 4, 5 y 6 obtuvieron una puntuación de tres, pues estuvieron “de acuerdo” con tres
afirmaciones y así sucesivamente (los últimos dos sujetos estuvieron “en desacuerdo” con todas las
afirmaciones).
En forma ideal, las personas que obtienen una puntuación total de cuatro en esta escala particular,
es porque respondieron “de acuerdo” a las cuatro afirmaciones. Los individuos que alcanzan una pun-
tuación total de tres respondieron que están “en desacuerdo” con la primera afirmación, pero “de
acuerdo” con las demás afirmaciones. Quienes reciben una puntuación de dos manifiestan estar “en
desacuerdo” con los dos primeros ítems, pero “de acuerdo” con los dos últimos. Del mismo modo, los
participantes con puntuación de uno respondieron “en desacuerdo” a las tres primeras afirmaciones y
“de acuerdo” a la última. Por último, aquellos que estuvieron “en desacuerdo” con las cuatro afirma-
ciones, recibieron una puntuación total de cero.
Los sujetos se escalan de manera perfecta, sin que nadie rompa el patrón de intensidad de las
afirmaciones: si están “de acuerdo” con la afirmación más intensa, también lo están con las menos
intensas. En otro ejemplo, si estoy de acuerdo con la afirmación “podría casarme con una persona de
nivel económico diferente al mío”, seguramente estaré de acuerdo con la afirmación “podría viajar en un
18       Capítulo 7  Recolección de datos cuantitativos. Segunda parte

automóvil con una persona de nivel económico diferente al mío” (casarse es mucho más intenso que viajar).
Cuando los individuos se escalan de manera perfecta respecto de las afirmaciones, se puede decir que
los ítems en realidad varían gradualmente en intensidad. Es la prueba empírica de que están escalados por
su intensidad. Se le denomina reproductividad al grado en que un conjunto de afirmaciones o ítems esca-
lan perfectamente según su intensidad. Esto significa que el patrón de respuesta de una persona en rela-
ción con todos los ítems puede reproducirse con exactitud si tan solo se conoce su puntuación total en la
escala completa (Roberts y Jowell, 2008 y Black y Champion, 1976).
La reproductividad ideal se logra cuando nadie rompe el patrón de intensidad de la escala. Sin embargo,
en la realidad sólo algunas cuantas escalas del tipo de Guttman reúnen la reproductividad ideal; la mayo-
ría contienen inconsistencias o rupturas del patrón de intensidad. El grado en que se alcanza el patrón
perfecto de intensidad de la escala o reproductividad se determina mediante el análisis del número de
personas o casos que rompen dicho patrón (Abdi, 2010), que es el quinto paso para construir el escalogra-
ma de Guttman.

Análisis del número de errores o rupturas
del patrón ideal de intensidad de la escala
Un error es una inconsistencia en las respuestas de una persona a una escala; es un rompimiento con
el patrón ideal de intensidad de esta. La tabla 7.5 muestra tres ejemplos de error encerrados en círculos
que, como puede verse, son inconsistencias del patrón ideal. El segundo participante respondió “de acuer-
do” a los ítems más intensos o fuertes y “en desacuerdo” al ítem menos intenso. El cuarto sujeto manifes-
tó estar “de acuerdo” con las afirmaciones B y C (supuestamente más intensas), pero “en desacuerdo” con
D (supuestamente menos intensa). El quinto estuvo “en desacuerdo” con los ítems menos intensos, pero
“de acuerdo” con el más intenso. Son inconsistencias o errores. Si un escalograma presenta diversos errores
significa que los ítems en realidad no tienen distintos niveles de intensidad (o que los participantes no
entienden o son deshonestos).

  Tabla 7.5  Ejemplos de errores o inconsistencias en un escalograma de Guttman.

AFIRMACIONES
A B C D
Sujeto DA ED DA ED DA ED DA ED PUNTUACIONES TOTALES

1 X X X X 4
2 X X X X 3
3 X X X X 3
4 X X X X 2
5 X X X X 1
6 X X X 0

DA = de acuerdo o “1” ED = en desacuerdo o “0”

Los errores se detectan mediante el análisis de las respuestas que rompen el patrón; para ello, se esta-
blecen los puntos de corte en el cuadro donde se cruzan las afirmaciones y sus categorías con las puntuacio-
nes totales. En el ejemplo de la tabla 7.4, los “puntos de corte” serían los que se muestran en la tabla 7.6.
Metodología de la investigación 19

  Tabla 7.6  Ejemplo de establecimiento de los puntos de corte en la técnica de Cornell.

AFIRMACIONES
A B C D
Sujeto DA ED DA ED DA ED DA ED PUNTUACIONES TOTALES
(1) (0) (1) (0) (1) (0) (1) (0)
1 X X X X 4
2 X X X X 4
3 X X X X 4
4 X X X X 3
5 X X X X 3
6 X X X X 3
7 X X X X 2
8 X X X X 2
9 X X X X 2
10 X X X X 2
11 X X X X 1
12 X X X X 1
13 X X X X 0
14 X X X X 0
DA = de acuerdo o “1” ED = en desacuerdo o “0”

No se aprecia ninguna inconsistencia. En cambio, la tabla 7.7 muestra cuatro inconsistencias o erro-
res; las respuestas están desubicadas respecto de los puntos de corte, es decir, rompen el patrón de intensidad
(los errores están encerrados en un círculo.)
  Tabla 7.7  Ejemplo de errores respecto a los puntos de corte.

AFIRMACIONES
A B C D
Sujeto DA ED DA ED DA ED DA ED PUNTUACIONES TOTALES
(1) (0) (1) (0) (1) (0) (1) (0)
1 X X X X 4
2 X X X X 4
3 X X X X 4
4 X X X X 3
5 X X X X 3
6 X X X X 3
7 X X X X 3
8 X X X X 2
9 X X X X 2
10 X X X X 2
11 X X X X 1
12 X X X X 1
13 X X X X 0
14 X X X X 0

= Puntos de corte (líneas punteadas)

Como ya se mencionó, cuando el número de errores es excesivo la escala no presenta reproductividad
y no puede aceptarse. La reproductividad se determina mediante un coeficiente, cuya fórmula es:
" Número de errores %
Coeficiente de reproductibilidad = 1− $ '
# (número de ítems)(número de sujetos) &
  caso, el número total de respuestas es igual al número de ítems o afirmaciones multiplicado
En este
por el número de sujetos. Por lo tanto, la fórmula directa es:
20       Capítulo 7  Recolección de datos cuantitativos. Segunda parte

" Número de errores %
Coeficiente de reproductibilidad = 1− $ '
# (número de ítems)(número de sujetos) &
  En el ejemplo de la tabla 7.7, el coeficiente de reproductividad es:

Cr = 1 – 0.071

Cr = 0.929 = 0.93

El coeficiente de reproductividad oscila entre 0 y 1; cuando equivale a 0.90 o más nos indica que el
número de errores es tolerable, además de que la escala es unidimensional y se acepta. Cuando es menor
que 0.90 no se acepta la escala. Originalmente, Guttman recomendó administrar un máximo de 10 a 12
ítems o afirmaciones a un mínimo de 100 personas (Black y Champion, 1976).
Una vez determinado el número de errores aceptable mediante el coeficiente de reproductividad, se
procede a aplicar la escala definitiva (si dicho coeficiente fue de 0.90 o más, esto es, si el error permitido
no fue mayor a 10%) o a realizar ajustes en la escala (reconstruir ítems, eliminar los que generen errores,
etc.). Estos cinco pasos son una especie de prueba piloto para demostrar que la escala es unidimensional
y funciona.

Codificación de respuestas
Cuando se aplica la versión definitiva de la escala, los resultados se codifican dicotómicamente o usando los
mismos valores que en la escala de Likert, lo que depende del número de categorías de respuesta que se
incluyan (Abdi, 2010; Fabrigar y MacGregor, 2006 y Carmines y Woods, 2003). Al igual que la escala
Likert y el diferencial semántico, todos los ítems deben tener el mismo número de categorías de respuesta,
requisito de todas las escalas de actitud. Asimismo, se considera una respuesta inválida si se marcan dos o
más opciones ante una misma afirmación. El escalograma de Guttman es una escala estrictamente ordinal,
pero que se suele usar como si fuera de intervalo. Puede aplicarse mediante entrevista (con uso de tarjetas
que contengan las opciones o categorías de respuesta) o autoadministrarse.

PRUEBAS E INVENTARIOS
En las ciencias y disciplinas del siglo XXI, gran cantidad de estudios utilizan para sus mediciones pruebas
e inventarios de muy diversos tipos. Estos instrumentos se aplican en seres humanos.

Clasificación de las pruebas e inventarios
Fundamentalmente, las pruebas e inventarios pueden clasificarse en dos tipos: estandarizados y no estan-
darizados.
Los primeros se caracterizan esencialmente porque las instrucciones para administrarse y calificarse
son uniformes, y cuentan con ciclos específicos de desarrollo y reconfirmación. Los segundos, usualmen-
te se generan mediante un proceso menos riguroso y su aplicación es limitada (como una prueba de un
maestro para evaluar el aprendizaje de sus alumnos en una asignatura). Desde luego, los no estandarizados
pueden irse robusteciendo (validándose en diferentes contextos) hasta convertirse en pruebas estandariza-
das.
En teoría, un inventario estandarizado puede aplicarse a cualquier persona del tipo para el cual fue
elaborado (Mertens, 2010), y el tiempo que se brinda para contestarlo en ocasiones es flexible y en otras
no. Cabe destacar que solo podemos comparar los resultados entre grupos a los que se les administró una
prueba estandarizada (por ejemplo, en experimentos), cuando no existen diferencias entre los grupos que
puedan generar sesgos en las respuestas (sería incorrecto comparar las respuestas a un test de razonamien-
to matemático entre niños de diez años y niñas de seis). Por supuesto que, cuando contrastamos grupos
Metodología de la investigación 21

(hombres frente a mujeres, entre distintos niveles socioeconómicos, jerarquías en la empresa, ocupaciones,
etc.) intentamos detectar si hay o no diferencias, pero solo nos interesan las desigualdades entre las varia-
bles medidas o los resultados de la prueba. En cambio, no nos deben interesar las discrepancias entre grupos
en las capacidades para el desempeño de esta, porque supuestamente las capacidades son
las mismas (salvo que el objetivo del estudio sea considerar disparidades en la ejecución de un inventario).
El esquema que se pretende lograr cuando se comparan grupos podría esquematizarse como en la figura 7.3.

  Figura 7.3  Interés al comparar grupos con la misma medición.

Grupo 1

Nos interesan las
similitudes-diferencias Las capacidades y habilidades
en las puntuaciones para responder (desempeño)
Grupo 2 deben ser equivalentes entre
de la prueba de los
grupos (en la variable los grupos
de interés)

Grupo 3

Por ejemplo, si queremos comparar a varios pilotos y saber cuál es el mejor, los autos deberán ser
los mismos, la pista igual, el combustible, equipo humano, etc. Si probamos autos y pilotos, la pista
será la misma, las condiciones ambientales también, etc. Imaginemos que queremos comparar la inte-
ligencia de cuatro grupos, uno de españoles, otro de peruanos, un tercero de italianos y un cuarto de
germanos, y la prueba está en alemán En este caso, los resultados reflejarán la inteligencia o el conoci-
miento del idioma? Más bien lo segundo.

¿Qué pruebas estandarizadas se encuentran disponibles?
En la actualidad existe una amplia diversidad de pruebas e inventarios desarrollados por diversos
investigadores para medir un sinfín de variables. Estas pruebas, que tienen su propio procedimiento
de aplicación, codificación e interpretación, se encuentran disponibles en diversas fuentes secundarias
y terciarias, así como en centros de investigación y difusión del conocimiento. Hay pruebas para medir
habilidades y aptitudes (como habilidad verbal, razonamiento, memoria, inteligencia, percepción,
habilidad numérica), personalidad, intereses personales, valores, desempeño escolar, motivación,
aprendizaje, clima laboral en una organización, inteligencia emocional, etc. También se puede dispo-
ner de pruebas clínicas para detectar conductas anormales, pruebas para seleccionar personal, pruebas
para conocer las percepciones u opiniones de las personas sobre diversos tópicos, pruebas para medir
la autoestima y, en fin, otras muchas variables internas y del comportamiento.
El reto que implica el empleo de estas pruebas es que la mayoría se han desarrollado en contextos
muy diferentes al iberoamericano, por lo que en ocasiones su empleo resulta inadecuado, inválido y
poco confiable. Cuando se utilice una prueba estandarizada como instrumento de medición, es con-
veniente que se seleccione una desarrollada o adaptada por algún investigador para el mismo ámbito de
nuestro estudio, que sea válida y confiable (debemos tener información sobre este aspecto).
En caso de que elijamos una prueba diseñada en otro contexto, será necesario adaptarla y efectuar
pruebas pilotos para calcular su validez y confiabilidad, así como ajustarla a las condiciones de nuestra
investigación. Recordemos que cada vez que se administra un instrumento resulta indispensable
demostrar que es válido y confiable para el contorno en el cual se va a aplicar.
Como ya comentamos, Nuñez (2001) desarrolló una prueba estandarizada para medir el sentido
de vida (bajo la concepción de Victor Frankl), una versión con 59 ítems, mediante el escalamiento tipo
Likert, con el reporte de una confiabilidad alfa-Cronbach de 0.91, y una solución de ocho factores,
22       Capítulo 7  Recolección de datos cuantitativos. Segunda parte

ubicados en cuatro cuadrantes de dos ejes: homo faber (éxito-fracaso) y homo patiens (plenitud-desespera-
ción). Revisó, antes de crear su prueba, 15 instrumentos como el PIL, Logo Test y Song Test, Mile Test,
Life Purpose Questionnaire Test, etc. Comenzó con un instrumento de 180 reactivos que depuró hasta
llegar a sus 59 finales. Este es un excelente ejemplo de una adaptación al medio latinoamericano de una
prueba estandarizada sobre el sentido de vida. Los ítems definitivos se incluyen al terminar esta sección
del capítulo.
En la actualidad encontramos gran variedad de estas pruebas en formato digital (internet, CD,
DVD y USB) que hacen mucho más fácil y divertido contestarlas; un ejemplo es la prueba
Emotional IQ Test (prueba de inteligencia emocional) de Meyer, Salovey y Caruso (1999). En la
web hay diversos sitios donde se localizan estas pruebas: en su buscador teclee entre comillas la
variable a medir y la palabra “prueba o test”, y encontrará un sinnúmero de estos instrumentos para
recolectar datos, pero adáptelos/contextualícelos de acuerdo con lo señalado en el capítulo 9 del
libro impreso. También busque en los sitios recomendados en el capítulo 3 de este centro de recur-
sos en línea.
Un tipo de pruebas estandarizadas bastante difundido lo constituyen las pruebas proyectivas, las cuales
presentan estímulos a los participantes para que respondan a ellos; después se pueden analizar e interpre-
tar las respuestas tanto cuantitativa como cualitativamente. Estas pruebas evalúan proyecciones de las
personas, como, por ejemplo, la personalidad y sus trastornos (Rodríguez, 2007).
Dos pruebas proyectivas muy conocidas son el test de Rorschach (que presenta manchas de tinta en
tarjetas o láminas blancas numeradas a los sujetos y estos relatan sus asociaciones e interpretaciones en
relación con ellas) (Choca, 2012; Weiner, 2009 y Karson, 2006) y el Test de Apercepción Temática o TAT
(que, con un esquema similar al de Rorschach, muestra a los participantes cuadros que evocan pasajes o
historias, y ellos deben elaborar una interpretación, que es analizada por expertos).11 Por ejemplo, Pirkko
(2008) examinó mediante esta prueba historias de 40 niños para evaluar sus fantasías y construcción de
la realidad, mientras que Blankenship et al. (2006) lo utilizaron para medir la necesidad de logro. Por su
parte, Gau y James (2013) implementaron el TAT para confirmar los valores presentes en los espectadores
de deportes (diversión, socialización, estatus, moral, ritual, epistémico, espiritualidad y estético, entre
otros).
Dichas pruebas se estructuran sobre un procedimiento estandarizado, aunque también se consideran
instrumentos cualitativos para recolectar datos, dada la profundidad de información que recogen de las
personas en sus propias palabras. Cabe señalar que, regularmente, su aplicación es estandarizada, no así
su interpretación. Por su parte, el análisis es más bien de corte cualitativo.
Muchas pruebas estandarizadas (como las proyectivas) requieren de un entrenamiento considerable y
un conocimiento profundo de las variables por parte del investigador que las administra e interpreta. No
pueden aplicarse con superficialidad e indiscriminadamente. La manera de emplear, codificar, calificar y
explicar los resultados de las pruebas estandarizadas es tan variada como los tipos existentes.
Algunos ejemplos de las pruebas, se incluyen en la tabla 7.8.
Hay miles de pruebas e inventarios en las fuentes secundarias y bases de datos que se mencionan en
los apéndices 1 y 2 de esta página web o centro de recursos en línea, así como páginas en internet como:
• Tests and Measures in the Social Sciences: Tests available in compilation volumes (pruebas de diver-
sas clases):http://libraries.uta.edu/helen/test&meas/testmainframe.htm
• PsycInfo: http://www.apa.org/psycinfo/
• TestLink (ETS Test Collection Advanced Search o Tests on Microfiche) y The Mental Measurements
Yearbook (también en versión manual de base datos). Se ingresa por medio de las páginas de las uni-
versidades (debe estar suscrita su institución).
• ERIC (mencionada ampliamente): http://www.eric.ed.gov/
• Psych Tests, BBC Surveys and Psychology Tests o Queendom.com.
• Amazon.
11 Para profundizar en la técnica y ver ejemplos de su aplicación se recomienda a: Teglasi (2010); Husain (2009); Sheldon et al. (2007); Cle-
mence (2006); Langan-Fox y Grant (2006); Blankenship et al. (2006) y Weertman et al. (2006).
Metodología de la investigación 23

  Tabla 7.8  Ejemplo de pruebas estandarizadas.
Variable general Variable específica Instrumento/referencias o ejemplos de
aplicación
Inteligencia Coeficiente de inteligencia o IQ de adultos Escala de inteligencia de Wechsler (WAIS)
(Grégoire, 2013; Lichtenberger y Kaufman,
2009; Hartman, 2009 y Kaufman, 2009).
Coeficiente de inteligencia o IQ de niños Escala de inteligencia para niños de Wechsler
(WISC-IV) (Grégoire, 2013).
Inteligencia sensorio-motriz de bebés (6 Escala argentina de Inteligencia Sensorio-
meses a 2 años) motriz (Caballero y Contini, 2008 y Oiberman,
Mansilla y Orellana, 2001).
Memoria Memoria (funcionamiento cognitivo) Escala de la memoria Wechsler (WMS-IV) (Chu,
Lai, Xu y Zhou, 2012).
Personalidad Personalidad en prácticamente todas sus Inventario Multifacético de la Personalidad
dimensiones (MMPI), buscar las actualizaciones más recien-
tes (versión adultos y versión adolescentes)
(Tarescavage et al., 2013; Greene, 2009; Too-
mey, Kucharski y Duncan, 2009; Elliott, 2008 y
Dao, Prevatt y Horne, 2008).

Aptitudes mentales Nivel general de aptitudes mentales de Escala Stanford-Binet para niños (Oerbeck,
niños Johansen, Lundahl y Kristensen, 2012; Walla-
ce, 2009 y Newton et al., 2008). En el caso de
niños autistas se sugiere a Coolican, Bryson y
Zwaigenbaum (2008).
Aptitud cognitiva (nivel mental) para ado- Escala Binet-Simon o Standfor-Binet (Pierson,
lescentes y adultos Kilmer, Rothlisberg y McIntosh, 2012; Wallace,
2009; Terman, 2008 y Roid, 2003).
Machismo Machismo general Escala de machismo (Pardo, Weisfeld, Hill y
Slatcher, 2013).
Actitud hacia el colegio Actitud de adaptación al colegio en estu- Inventario de adaptación al colegio WPS de
diantes de educación media y superior Brown y Leigh (2009).
Creencias familiares Creencias familiares de los padres Inventario de las creencias familiares de los
padres (Fischer y Corcoran, 2007).
Creencias familiares de los adolescentes Inventario de las creencias familiares de los
adolescentes (Fischer y Corcoran, 2007).
Dolor Dolor físico Cuestionarios del dolor McGill [MPQ] (McCle-
llan et al., 2012; Ljunggren, Strand y Johnsen,
2007 y Hyunjeong et al., 2008).
Escala visual análoga (VAS) y Escala de califi-
cación verbal (VRS) (Aicher, Peil, Peil y Diene,
2011).
Percepción en el matri- Satisfacción de la relación marital Escala de felicidad marital [MHS] (Fischer y
monio Corcoran, 2007).
Escala-cuestionario del amor en el matrimonio
y la relación (Pardo, Weisfeld, Hill y Slatcher,
2013).
Actitud hacia el matrimonio Escala de actitud e integración hacia el matri-
monio (Riggio y Weiser, 2008).
Amor y sexo Percepciones sobre el amor y el sexo Escala del amor y el sexo (Hendrick y Hen-
drick, 2002).
24       Capítulo 7  Recolección de datos cuantitativos. Segunda parte

  Tabla 7.8  Ejemplo de pruebas estandarizadas (continuación).

Variable general Variable específica Instrumento/referencias o ejemplos de
aplicación
Percepción de la vida Satisfacción con la vida Escala de satisfacción con la vida (SWLS)
(Wiest, Schüz y Wurm, 2012; Lopez y Snyder,
2003; Vassar, 2008 y Gouveia et al., 2009).
Batería de escalas sobre satisfacción con la
vida de pacientes depresivos y con adicciones:
1) Escala multidimensional sobre la satisfac-
ción con la vida (breve), 2) Escala de construc-
ción positiva de la vida/sentirse contento/
bienestar y 3) Inventario de la depresión de
Beck (Büssing, Heusser y Götz, 2011).

Conciencia ecológica Conciencia ecológica Escala de nueva conciencia ecológica de Ellis
y Thompson (Robinson, Shaver y Wrightsman,
1999).
Calidad de la práctica de la Intervenciones para asistir al paciente en Inventario de intervenciones para asistir
enfermera estado de estrés al paciente en situaciones estresantes de
Edelman y Mandle (Stanhope y Knollmueller,
2001).
Dependencia Dependencia interpersonal Inventario de dependencia interpersonal de
Hirschfield (IDI) (Shahar, 2008 y Tzeng, 1993),
así como también la subescala del Inventario
del estilo personal de Robins (PSI) (Shahar,
2008).
Lealtad del cliente Lealtad hacia la marca Escala de Wunderman de experiencia con la
marca (Morel, 2003).
Encuesta de conciencia y lealtad a la marca
(Panchal , Khan y Ram, 2012).

Jubilación Actitud hacia la jubilación Escalas para medir las actitudes hacia la
jubilación usando diferencial semántico y
escalamiento de Thurstone (Rodríguez, 2006).
Inteligencia emocional Inteligencia emocional y personalidad Veinte cuestionarios de personalidad (rasgos)
(Carter, 2009), así como pruebas de inteligen-
cia emocional (EI) (Stough, Saklofske y Parker,
2009). Prueba audiovisual de la inteligencia
emocional [para PC o dispositivo electrónico]
(Zysberg y Tell, 2013).
En España se adaptó el Meta Mood Scale-24
para medir la inteligencia emocional (Pérez y
Castejón, 2007).

Trastorno alimentario Trastorno o desorden alimentario Inventario del desorden alimenticio II (Zysberg
y Tell, 2013).
Mascotas Actitud hacia las mascotas Escala de actitud hacia las mascotas (Morovati
et al., 2008).
Comportamiento de compra Comportamiento Compulsive Buying Scale (Escala de compra
de compra compulsiva compulsiva) (Koran et al., 2007).

Religiosidad Creencias, asistencia a la iglesia y parti- Diversas escalas y cuestionarios, considerando
cipación o membresía en organizaciones un metaanálisis con 63 estudios (Zuckerman,
religiosas Silberman y Hal, 2013).
Metodología de la investigación 25

Además, se recomiendan: Urbina (2014), Yan, von Davier y Lewis (2014) (pruebas estandarizadas en
dispositivos electrónicos), Cohen, Swerdlik y Sturman (2012), Mertens (2010), Kubiszyn y Borich
(2009), Barrett (2009), Anastasi y Urbina (2009), Groth-Marnat (2009), Abell, Springer y Kamata
(2009), Thorndike y Thorndike-Christ (2009), Kaplan y Saccuzzo (2008) y Mertens y McLaughlen
(2004) (particularmente pruebas para personas con capacidades diferentes), Kamphaus y Reynolds
(2003), Thorndike y Hagen (1989), Cronbach (1984), Norton (1980), Woelfel y Danes (1980) y, desde
luego, las obras clásicas de Torgerson (1985) y Nunnally (1970). Se trata de autores especializados sobre
medición y manejo de pruebas estandarizadas.
Además, existen métodos propios de las diferentes ciencias sociales, como el análisis de redes, para
evaluar la forma en que se manifiesta la comunicación en un sistema social (quién se comunica con quién,
quiénes distorsionan la información, cómo fluye la comunicación, quiénes son los líderes comunicativos,
etc.). Para este análisis se sugiere a Rogers y Kincaid (1981), Wellman y Berkowitz (1997), Wellman
(1999), Knoke y Yang (2007) y Hassanien, Abraham y Snasel (2009). Un ejemplo de esta clase de inves-
tigación es la de Crossley (2008), quien analizó la red social de los “actores claves” involucrados en el
“círculo central” del movimiento punk en el Reino Unido.
Asimismo, los sistemas de medición fisiológica [por ejemplo, Jagroop, Persaud y Mikhailidis (2011),
generaron un método más rápido para medir el colesterol en las plaquetas humanas], escalas multidimen-
sionales que miden a los sujetos en varias dimensiones [como los sistemas Galileo y ALSCAL de Woelfel
y Fink (1980), así como Borg y Groenen (2005), para medir la distancia psicológica entre conceptos en
individuos (como por ejemplo: “patria”, “madre”, “presidente”, “nación” y cualquier otro), en las que se
consideran dimensiones cognitivas y emocionales]; y en fin, otros métodos que escapan del alcance intro-
ductorio de este libro.
En el caso de ingenierías y ciencias físicas vale la pena señalar que cada año se busquen actualizaciones
de libros clásicos como: Instrumentation and measurement in electrical engineering, de Roman Malaric
(Brown Walker Press), Measurement and instrumentation principles, de Alan S. Morris (Butterworth-
Heinemann), Measurement and instrumentation: Theory and application, de Alan S. Morris y Reza
Langari (Butterworth-Heinemann), Theory and design for mechanical measurements, de Richard S. Figliola
y Donald E. Beasley (John Wiley and Sons) e Instrumentation for process measurement and control, de
Norman A. Anderson (CRC Press), solo por mencionar algunos; además, es útil recurrir a revistas cientí-
ficas. Normalmente los profesores que imparten asignaturas específicas en su institución conocen varios
de estas fuentes.

Ejemplo de ítems de prueba estandarizada (Sentido de vida Celaya)12
Los ítems o afirmaciones son calificados a través de una escala de Likert que va desde “totalmente de
acuerdo” hasta “totalmente en desacuerdo”.
1. En mi familia nos escuchamos, nos demostramos amor y ocasionalmente analizamos los desacuerdos.
2. Mi religión ha fomentado el crecimiento de mi capacidad de amar y desarrollarme.
3. Dedico parte de mi vida a realizar actividades desinteresadamente.
4. Estoy convencido de que estoy bien; me acepto y me amo.
5. En la búsqueda de la felicidad intento lograr satisfactores materiales.
6. Honestamente tengo conciencia de que amo las cosas y utilizo a las personas.
7. La afectividad es muy importante en mi vida.
8. Mi alto nivel de energía lo empleo para triunfar.
9. Mi religión me ha proporcionado razones para vivir con rectitud, para estar bien con Dios.
10. Acepto que me traten indignamente, con tal de tener seguridad económica.
11. Promuevo que las personas que dependan de mí tengan aprendizajes significativos.
12. Me gusta todo lo que es fácil y que no requiere pensar mucho.
13. Asisto a congresos, conferencias, tomo cursos y diplomados.
14. Me gusta comunicarme conmigo y sentir que mi cabeza sabe lo que tiene mi corazón.
15. Le agrado a la mayoría de las personas.
26       Capítulo 7  Recolección de datos cuantitativos. Segunda parte

16. Si me dieran la oportunidad, podría hacer algo que realmente ayudara a otros.
17. Repentinamente mi estado de ánimo cae en la desesperanza.
18. Valoro todo lo que favorece mis posibilidades de estar bien.
19. Puedo vislumbrar la posibilidad de cambiar y de crecer en mi persona.
20. Me gusta comprometerme en obras de tipo social.
21. Contagio mi optimismo.
22. Mis problemas personales influyen en mi trabajo.
23. En mi proyecto de vida establezco metas relacionadas con un aprendizaje importante.
24. En mi familia muchas veces hemos rezado juntos.
25. Siento que mi cuerpo pierde fortaleza interna.
26. He buscado activa y libremente a Dios.
27. A mis familiares les disgusta comprometerse en obras de tipo social.
28. En mi familia mis padres acostumbraban devaluarse uno a otro.
29. Me siento insatisfecho con mi trabajo.
30. Mis sentimientos me impiden ver con claridad la realidad.
31. Tengo la sensación de que “algo” le falta a mi vida.
32. A la persona que amo la acepto incondicionalmente.
33. Mi meta al educar no sólo es informar, sino afinar la conciencia.
34. En estos momentos me doy cuenta de que no puedo ocuparme de nada porque no tengo voluntad de
hacerlo.
35. Promuevo una educación que tenga una relación más estrecha con la vida.
36. Invierto parte de mis ingresos en adquirir revistas científicas, buenos libros, videos, documentales,
enciclopedias.
37. Con frecuencia siento que algo malo me va a ocurrir.
38. Mis opiniones políticas no están bien definidas.
39. Renuncio a mi libertad para obtener satisfactores que me convengan.
40. Soy muy sensible al sufrimiento de los demás.
41. Trato de estar con personas divertidas para que me ayuden a salir de mi aburrimiento.
42. En mi familia se carece de sentimientos de lealtad y de pertenencia.
43. Me siento lleno de vida y vitalidad.
44. Disfruto la lluvia y no me importa mojarme.
45. Me parece que sufro más que los demás cuando rompo una relación.
46. Prefiero mantenerme a cierta distancia de la gente y quedarme en mi soledad.
47. Me considero una persona optimista.
48. La vida es como una “pizza” llena de ingredientes, apetecible y deliciosa.
49. Me siento capaz para trabajar eficientemente.
50. Soy instrumento de las circunstancias y el destino.
51. No pasa un día en que no dedique unos minutos para contemplar la belleza de la naturaleza.
52. En mi trabajo confío en mis dotes y en mi capacidad de adaptarme para hacer frente a los desafíos
que se presentan.
53. Admiro a personas como Martin Luther King, Nelson Mandela y la madre Teresa de Calcuta.
54. Diariamente trato en mi trabajo de dar lo mejor de mí mismo.
55. Tengo necesidad de protagonismo, de ser notado.
56. Me gusta echarme boca arriba en el césped y sacar figuras de las nubes.
57. Hay en mi interior una gran riqueza y sensibilidad.
58. Puedo permitirme vivir sentimientos delicados o tiernos.
59. Me siento capaz de hacer bien mi trabajo.
Metodología de la investigación 27

ANÁLISIS DE CONTENIDO

¿Qué es y para qué sirve el análisis cuantitativo de contenido?
Este método tiene mayores implicaciones que simplemente recoger contenidos, pues es, al mismo tiem-
po, un cierto tipo de diseño de investigación y/o técnica de análisis, pero lo incluimos en este capítulo
porque innegablemente su proceso comienza con la recopilación de contenidos de comunicaciones en sus
múltiples formas: verbales, no verbales, escritas y audiovisuales.
De acuerdo con la definición clásica de Berelson (1971), el análisis de con-
tenido es una técnica para estudiar y analizar la comunicación de una manera Análisis de contenido  Técnica para
objetiva, sistemática y cuantitativa. Stalnaker (2014) y Krippendorff (2013) estudiar la comunicación de una
extienden la definición del análisis de contenido a un método de investigación manera objetiva, sistemática y que
cuantifica los contenidos en categorías.
para hacer inferencias válidas y confiables de datos sobre contenidos con respec-
to a su contexto. Krippendorff y Bock (2008), así como Weber (1990) señalan
que tales inferencias implican a la fuente de los mensajes, a los mensajes en sí mismos y a sus receptores o
destinatarios.
Esta herramienta es una técnica muy útil para analizar los procesos de comunicación y sus caracterís-
ticas en muy diversos contextos (Neuendorf, 2001). El análisis de contenido puede aplicarse virtualmente a
cualquier forma de comunicación [páginas web (como las de anuncios publicitarios o personales) y a toda
clase de blogs, mensajes en redes sociales de internet (whatsApp, twitter, facebook, etc.), programas televisi-
vos o radiofónicos, artículos en prensa o periódicos electrónicos, libros, poemas, conversaciones, pinturas,
discursos, cartas, melodías, leyes y reglamentos, etc.)]. Por ejemplo, para analizar la personalidad de alguien
es conveniente evaluar sus escritos; conocer las actitudes de un grupo de personas mediante la valoración de
sus expresiones verbales (desde pandillas hasta movimientos de protesta y pacientes que sufren una determi-
nada enfermedad); indagar sobre las preocupaciones de un pintor o un músico mediante el estudio de su
material; compenetrarse con los valores de una cultura o averiguar las intenciones de un publicista o propa-
gandista (como las campañas nazis de Hitler y Goebbels durante la Segunda Guerra Mundial en todos los
medios de comunicación colectiva de la época).

Usos del análisis de contenido
Riffe, Lacy y Fico (2014); Weber (1990) y Berelson (1971) señalan varios usos del análisis de contenido,
entre los que se destacan:
1. Describir tendencias y características del contenido de la comunicación.
2. Develar diferencias en el contenido de la comunicación (entre personas, grupos, instituciones, países,
medios informativos, etcétera).
3. Comparar mensajes, niveles y medios de comunicación.
4. Intentar predecir los posibles efectos del contenido de la comunicación en la audiencia destinataria.
5. Auditar el contenido de la comunicación y compararlo con estándares u objetivos.
6. Construir y aplicar estándares de comunicación (políticas, normas, etcétera).
7. Exponer técnicas publicitarias y de propaganda.
8. Medir la claridad de los mensajes.
9. Descubrir estilos de comunicación.
10. Identificar intenciones, apelaciones y características de comunicadores.
11. Descifrar mensajes ocultos y otras aplicaciones a la inteligencia militar y a la seguridad política.
12. Revelar “centros” de interés y atención de una persona, un grupo, un medio informativo o una comu-
nidad.
13. Determinar el estado psicológico de personas o grupos.
14. Obtener indicios del desarrollo verbal (por ejemplo, en la escuela, como resultado de la enseñanza, el
aprendizaje de conceptos).
15. Anticipar respuestas a comunicaciones.
28       Capítulo 7  Recolección de datos cuantitativos. Segunda parte

16. Reflejar actitudes, valores y creencias de personas, grupos o comunidades.
17. Cerrar preguntas abiertas.
Asimismo, puede resultar útil para examinar redes sociales (quiénes se comunican con quiénes —per-
files—, para qué —propósitos—, con qué frecuencia, etc.). Por ejemplo, podría estudiarse una red de
jóvenes inscritos en facebook, twitter, whatsApp, Hi5 o mySpace mediante el análisis de sus páginas
(mensajes escritos y visuales).

¿Cómo se realiza el análisis de contenido?
El análisis de contenido se efectúa por medio de la codificación, es decir, el proceso en virtud del cual las
características relevantes del contenido de un mensaje se trans-forman en unidades que permitan su cla-
sificación o categorización precisa. Lo importante del mensaje se convierte en algo susceptible de describir
y analizar. Para codificar es necesario definir el universo, las unidades de análisis y las categorías de análisis
(Krippendorff y Bock, 2008).

Universo
El universo podría ser la obra completa de Paulo Coelho o J. K. Rowling; las emisiones de un noticiario
o informativo en televisión durante un mes; los editoriales publicados en un día por cuatro diarios (por
ejemplo, en España, El Mundo, El País, ABC y La Vanguardia); todos los capítulos de tres telenovelas; las
canciones completas de un grupo musical o solista (U2, Joan Manuel Serrat, Shakira, Coldplay, La Oreja
de Van Gogh, Motel, etc.); los escritos de un conjunto de estudiantes durante un ciclo escolar; los discur-
sos pronunciados por varios contendientes políticos en el mes previo a la elección; los mensajes de un
círculo de amigos intercambiados en una red social en internet durante una semana vacacional; los escri-
tos de un grupo de pacientes en psicoterapia en un periodo específico; las conversaciones grabadas de 15
parejas que participan en un experimento sobre conflictos maritales; los escritos de una secta terrorista,
etc. El universo, como en cualquier investigación cuantitativa, debe delimitarse con precisión. Algunos
autores, como Sánchez Aranda (2005), se refieren al universo como el contexto de la unidad, el cuerpo
más largo del contenido que puede examinarse al caracterizar una o más unidades de registro.

Unidades de análisis
Las unidades de análisis o registro constituyen segmentos del contenido de los mensajes que son
caracterizados para ubicarlos dentro de las categorías. Se predeterminan de acuerdo al planteamiento del
problema, a diferencia de las unidades en el análisis cualitativo, las cuales surgen de manera emergente.
Sánchez-Aranda (2005, p. 221), las define como “El cuerpo de contenido más pequeño en que se cuenta
la aparición de una referencia, ya sean palabras o afirmaciones que nos interesa localizar”. Riffe, Lacy y
Fico (2014) y Berelson (1971) mencionan cinco unidades importantes de análisis:
1. La palabra. Es la unidad de análisis más simple, aunque, como señalan Franzosi (2009) y Kerlinger y
Lee (2002), puede haber unidades más pequeñas, como letras, fonemas o símbolos. Así, se puede
medir cuántas veces aparece una palabra en un mensaje (por ejemplo, número de veces que en los
informativos o noticiarios televisivos de fin de año se menciona al presidente de la República o el
número de alusiones de un grupo psiquiátrico al término “depresión”).
2. El tema. Se define a menudo como un enunciado respecto de algo. Los temas suelen ser más o menos
generales.12 Kerlinger y Lee (2002) utilizan un excelente ejemplo para ello: “Las cartas de adolescen-
tes o estudiantes de colegios superiores pueden ser estudiadas en sus expresiones de autorreferencia”.
Este sería un tema extenso, pero se definirían los temas como cualesquiera de las oraciones que usen
“yo”, “mí” y otros términos que indiquen referencia al “yo” del escritor. Así, se analizaría qué tanta
autorreferencia contienen las cartas.

12 El significado del término “temas” en el análisis cuantitativo del contenido se refiere a tópicos y es distinto al significado de “temas emergen-
tes” en el análisis cualitativo.
Metodología de la investigación 29

Si los temas son complejos, el análisis del contenido es más difícil, en especial si se complica al incluir-
se más de una oración simple.
3. El ítem. Es una unidad de registro muy utilizada y puede definirse como la unidad total empleada por
los productores del material simbólico (Stan, 2009 y Weber, 1990). Ejemplos de ítems son un libro,
un editorial, una emisión de un programa de radio o televisión, un discurso, una ley, una fotografía,
una carta amorosa, una conversación telefónica, un mensaje en una red social de internet, una can-
ción o la respuesta a una pregunta abierta. En este caso, lo que se analiza es el material simbólico total.
4. El personaje. Se trata de un individuo. Por ejemplo, un paciente, un héroe o heroína de una serie
televisiva, un líder histórico, un profesor, un avatar, un joven que publica una página en facebook,
etc. Aquí lo que se analiza es el personaje.
5. Medidas de espacio-tiempo. Son unidades físicas, como el centímetro-columna (por ejemplo, en la
prensa), la línea (en escrito), el minuto (en una conversación o en radio), el mensaje (enviado por
celulares o móviles), el periodo de 20 minutos (en una interacción), el cuadro (en televisión), cada vez
que se haga una pausa (en un discurso, una entrevista o una interacción entre individuos), una pági-
na (red social en la web), etc. Krippendorff y Bock (2008) y Sánchez-Aranda (2005) lo denominan
unidad de enumeración. En este caso, la unidad física (por ejemplo, cada minuto) es ubicado en
categorías (si tenemos 10 minutos de grabación, se colocan diez unidades en las categorías).
Algunos contenidos típicos de herramientas cualitativas de recolección de datos (como las grabaciones
o transcripciones de grupos de enfoque) pueden evaluarse mediante análisis cuantitativo del contenido.
Las unidades se insertan, colocan o caracterizan en categorías y/o subcategorías, lo cual podría represen-
  Figura 7.4  Agrupación de unidades de análisis en categorías.

tarse tal como se muestra en la figura 7. 4.
En cuanto a qué unidad debe seleccionarse, ello depende de los objetivos y las preguntas de inves-
tigación. Sin embargo, Krippendorff (2013) y Berelson (1971) sugieren lo siguiente:
a) En un solo estudio es posible utilizar más de una unidad de análisis.
b) Los cálculos de palabras y las unidades amplias, como el ítem y las medidas de espacio-tiempo,
son más adecuados en los análisis que dan mayor importancia a los asuntos definidos.
c) Las unidades amplias y las más definidas son válidas para aceptar o rechazar una categoría.
d) Por lo general, las unidades amplias requieren de menos tiempo para su codificación que las uni-
dades pequeñas que se refieren a las mismas categorías y materias.
e) Debido a que los temas o las oraciones agregan otra dimensión al asunto, la mayoría de las veces
son más difíciles de analizar que las palabras y las unidades amplias.
f) El tema es adecuado para el análisis de significados y las relaciones entre estos.

Categorías
Las categorías son los niveles donde se caracterizan las unidades de análisis. Como menciona Holsti
(1969), son las “casillas o cajones” en las cuales se clasifican las unidades de análisis. También se pre-
30       Capítulo 7  Recolección de datos cuantitativos. Segunda parte

determinan de acuerdo con el planteamiento del problema. Prasad (2008), Sánchez Aranda (2005) y
Weber (1990) las definen como características o aspectos que presenta la comunicación con la que traba-
jamos (en cuanto a referencias). Por ejemplo, un discurso podría clasificarse como optimista o pesimista,
como liberal o conservador. Un personaje de una caricatura se catalogaría como bueno, neutral o malo.
En ambos casos, la unidad de análisis se categoriza. Veamos esquemáticamente la categorización en la
figura 7. 5.

  Figura 7.5  Ejemplos de unidades de análisis y su clasificación en categorías.
Subcategorías

Optimismo
Discurso A Categoría 1
Pesimismo

Conservadurismo
Discurso A Categoría 2
Liberalismo

Optimismo
Discurso B Categoría 1
Pesimismo

Conservadurismo
Categoría 2
Liberalismo

Discurso K Categoría 1

Categoría 2

Es decir, cada unidad de análisis se incluye o encasilla en uno o más sistemas de categorías. Por ejem-
plo, en un estudio citado por Krippendorff (1980) se analizaron 2 430 actos de violencia televisada. En
cada acto, el personaje principal (unidad de análisis) se categorizó como:
• Bueno, neutral o malo (sistema 1).
• Asociado con hacer cumplir la ley, no relacionado con el cumplimiento de la ley o como un delin-
cuente o criminal (sistema 2).
En este caso, la unidad de análisis o registro es el comportamiento del personaje durante el acto tele-
visivo. Esto podría representarse como se muestra en la figura 7. 6.
  Figura 7.6  Ejemplo con dos categorías y seis subcategorías.
Metodología de la investigación 31

Como ya se comentó, la selección de categorías depende del planteamiento del problema.

Tipos de categorías
Krippendorff (2013) señala cinco tipos básicos de categorías:
1. De asunto o tópico. Se refieren a cuál es el asunto, la materia o la temática tratada en el contenido (¿de
qué trata el mensaje o la comunicación?).
Ejemplo
Analizar las problemáticas que más preocupan a los ciudadanos detectadas en los mensajes enviados por correo
electrónico al alcalde o presidente municipal durante el último mes.
Categoría: Inseguridad
Subcategorías: Asaltos/robos al transitar o caminar en las calles o lugares públicos abiertos, como parques
Asaltos/robos al transitar en automóviles
Asaltos/robos al viajar en transporte público
Asaltos/robos a los hogares
Asaltos/robos en lugares públicos cerrados, como restaurantes, cines, etcétera
Secuestros
Violaciones
Etcétera
Categoría: Deficiencias en los servicios públicos que presta el municipio
Subcategorías: El servicio de recolección de la basura no ocurre todos los días
El servicio de recolección de la basura no se realiza más o menos a la misma hora todos los
días, es decir, es irregular
Suspensión por más de un día del servicio de suministro del agua
Cortes frecuentes en el suministro de agua
Etcétera
Imaginemos que pretendemos investigar el grado en que una determinada telenovela presenta consumo de
alcohol entre sus personajes y las situaciones y contextos en los cuales ocurre, así como su finalidad (reducir es-
trés, inducir al romance, socializar, etc.). Cada periodo de 10 minutos de la telenovela se va a considerar la unidad
de análisis, o podría ser todo el capítulo.
Unidad
1 2 3 4 5 6 7 k

10 m 10 m 10 m 10 m 10 m 10 m 10 m 10 m

Categoría: Relación del personaje con el consumo de alcohol
Subcategorías: El personaje consume bebida alcohólica
El personaje no consume bebida alcohólica
Categoría: Finalidad de consumir alcohol
Subcategorías: Reducir estrés o relajarse
Socializar con otros personajes
Transformar su carácter en uno más asertivo, violento o agresivo
Transformar su carácter en uno más bondadoso o simpático
Inducir al romance a otro personaje
Etcétera

2. De dirección. Estas categorías se refieren a cómo es tratado el asunto (¿po-
sitiva o negativamente?, ¿favorable o desfavorablemente?, ¿nacionalista o no nacionalista?, etcétera).
Ejemplo
Comparar la manera en que dos noticiarios televisivos comentan sobre el presidente de Estados Unidos.
32       Capítulo 7  Recolección de datos cuantitativos. Segunda parte

Categoría: Tono en el tratamiento respecto del presidente de Estados Unidos
Subcategorías: Favorable
Neutral
Desfavorable

3. De valores. Este tipo de categorías indican qué valores, intereses, metas, deseos o creencias se revelan.

Ejemplo
Al estudiar la compatibilidad ideológica de matrimonios, se podría analizar la ideología de cada cónyuge, pidiéndoles un
escrito sobre temas que puedan reflejar valores (sexo, actitud hacia la pareja, significado del matrimonio).
Categoría: Ideología del esposo
Subcategorías: Muy tradicional
Más bien tradicional
Neutral
Más bien liberal
Muy liberal

4. De receptores. Estas categorías se relacionan con el destinatario de la comunicación (¿a quién van diri-
gidos los mensajes?)
Ejemplo
Analizar a quiénes encauza más sus críticas el rector o director general de la universidad en los discursos del último
año dirigidos a toda la comunidad estudiantil.

Categoría: Receptores a quienes se dirigen las críticas del rector o director
Subcategorías: Profesores de tiempo completo
Profesores que no están de tiempo completo (de asignaturas, por honorarios
o tiempo parcial)
Alumnos en general
Alumnos de últimos semestres
Alumnos de semestres intermedios
Alumnos de primeros semestres
Directivos
Empleados administrativos
Padres de familia
A toda la comunidad

5. Físicas. Son categorías para ubicar la posición y duración o extensión de una unidad de análisis. De
posición son, por ejemplo, la sección, página y cuadrante (en prensa escrita o electrónica), y el horario
(en televisión y radio); de duración, los minutos (en una interacción, un comercial televisivo, un
programa de radio, un discurso), los centímetros/columna (en prensa), los cuadros o escenas en una
película, etc. No se deben confundir las unidades de espacio-tiempo con las categorías físicas. Las
primeras son unidades de análisis y las segundas constituyen categorías. Veámoslo en la figura 7.7 con
un ejemplo simple.
Un sexto tipo de categorías es la “intensidad”, que indica más allá de la dirección, grados de fuerza de
la categoría. Por ejemplo, diversos gabinetes, despachos o departamentos de comunicación social de orga-
nismos públicos (como sería el caso de ministerios o secretarías), examinan diariamente las críticas que
hacen los editorialistas de periódicos al titular de la dependencia (ministro o secretario), y determinan si
la crítica es “muy severa”, “severa” y “no severa”.

Requisitos de las categorías
Cuando se lleva a cabo un análisis de contenido se suelen determinar varias categorías, que deben cumplir
los siguientes requisitos:
1. Las categorías y subcategorías deben ser exhaustivas, es decir, abarcar todas las posibles subcategorías
Metodología de la investigación 33

  Figura 7.7  Ejemplo del tiempo como unidad de análisis y como categoría.

de lo que se va a codificar. Por ejemplo, la categoría “ideología del esposo” no podría prescindir de la
subcategoría “neutral”.
2. De preferencia, las subcategorías deben ser mutuamente excluyentes, de tal manera que una unidad de
análisis clasifique en una y sólo una de las subcategorías de cada categoría. Por ejemplo, un personaje
de una serie televisiva no puede ser “bueno” y “malo” a la vez. Si ejerciera ambos roles, habría que
generar la categoría “en momentos malo y en otros bueno”.
3. Obviamente, una unidad de registro puede encajar en una subcategoría de una categoría y en otras
subcategorías de otras categorías. Por ejemplo, al analizar comerciales televisivos podríamos tener,
entre otras categorías, las siguientes:
34       Capítulo 7  Recolección de datos cuantitativos. Segunda parte

Una unidad de análisis (un comercial) puede ubicarse en una subcategoría de “presencia de
color” y en otra subcategoría de la categoría “necesidad fisiológica a que se apela” (por ejemplo: color
y sed), pero no puede situarse en dos subcategorías de la misma categoría, como “hambre” y “sed”
(porque la categoría es la necesidad a que se apela principalmente), a menos que generáramos la sub-
categoría “hambre y sed”.
En ciertos casos especiales, al analista le llega a interesar una categoría donde las subcategorías no sean
mutuamente excluyentes. Tal sería el caso de que la categoría fuera “apelaciones del comercial” (estatus
socioeconómico, salud, juventud, belleza, amor romántico, etcétera).
Un comercial podría utilizar más de una apelación (salud y belleza, por ejemplo).
4. Las categorías y subcategorías deben derivarse del marco teórico y de una profunda evaluación de la
situación.
Ejemplo
Análisis de contenido de series televisivas
Para ejemplificar el análisis de contenido y específicamente la generación a priori de categorías, se acudirá a un estu-
dio de Greenberg et al. (1980). La investigación consistió en un análisis de contenido de las series televisadas por las
tres grandes cadenas de Estados Unidos: ABC, CBS y NBC. Se evaluaron diversos programas durante tres periodos de
1975 a 1978, para determinar el grado en que la televisión estadounidense mostraba actos prosociales y antisociales
como medida de la violencia televisada. Las categorías y subcategorías que se utilizaron son las que se muestran en la
figura 7. 8.

  Figura 7.8  Ejemplo de sistema de categorías.
(Definido como un acto en el cual humanos o
Altruismo animales comparten, se ayudan y cooperan,
siempre y cuando no participen en un acto ilícito)

Mostrar afecto (Referido a ofrecer o exhibir abiertamente
emociones positivas hacia humanos y animales)
Actos
prosociales (Consiste en afirmaciones verbales que explican
Explicación de los sentimientos, pensamientos o acciones de uno
sentimientos de mismo –yo–, y que tienen como propósito
uno mismo lograr un resultado positivo)

(Consiste en afirmaciones verbales que explican
Explicación de los sentimientos, pensamientos o acciones de los
sentimientos de demás y que tienen como propósito lograr un
otros resultado positivo)

Agresión física (referida a cualquier Asalto con algún objeto (un
conducta manifiesta cuya intención arma, un libro, un lápiz,
es dañar, asustar, lesionar o injuriar a etcétera)
uno mismo o a otro individuo,
animal o propiedad) Asalto sin un objeto (por
ejemplo, utilizando las manos)
Agresión verbal (el envío de mensajes
nocivos tales como rechazos, amena- Amenaza física (poner en
zas verbales, insultos o frases hostiles) peligro el bienestar, la salud o
la integridad de alguien)
Actos
antisociales Robo (la acción de tomar intencional Disparar a alguien con un
y deliberadamente una propiedad arma de fuego
que pertenece a otra persona o
institución, sin derecho o permiso)

Engaño (mentira intencional de
alguien con el propósito de provocar
algo malo en detrimento de un
individuo, un grupo o una institución;
por ejemplo: fraude, mentiras, asumir
la identidad de otros)
Metodología de la investigación 35

El estudio consideró como unidad de análisis la conducta (cada vez que se presentaba un comporta-
miento de los personajes era codificado).
Cuando se crean las categorías, estas deben definirse con precisión y es necesario explicitar qué van a
comprender en cada caso y qué se excluirá.
El análisis de contenido consiste en asignar cada unidad a una o más categorías. En realidad, el pro-
ducto de la codificación son frecuencias de categorías. Mediante el programa de análisis estadístico, se
cuenta cuántas veces se repite cada categoría o subcategoría (cuántas unidades de análisis se clasificaron en
cada una de las categorías). Por ejemplo, Greenberg et al. (1980, p. 113) encontraron los resultados que
se muestran en la tabla 7. 9.
  Tabla 7.9  Ejemplo de los resultados de la codificación del estudio de acuerdo con la estudio de Greenberg
et al. (1980).
Incidencia de actos antisociales en los tres periodos
Año 1* Año 2* Año 3*
f % f % f %
I. Agresión física
A. Asalto con un objeto 466 (15.7) 248 (10.8) 370 (13.6)
B. Asalto sin un objeto 111 (3.7) 159 (6.9) 177 (6.5)
C. Amenaza física 180 (6.1) 233 (10.1) 135 (5.0)
D. Disparar 106 (3.6) 75 (3.2) 74 (2.7)
E. Otras 128 (4.3) 171 (7.4) 130 (4.8)

II. Agresividad verbal 1 629 (55.0) 1 099 (47.6) 1 464 (54.0)
III. Robo 61 (2.1) 72 (3.1) 44 (1.6)
IV. Engaño 283 (9.5) 251 (10.9) 319 (11.8)
Total 2 964 (100.0) 2 308 (100.0) 2 713 (100.0)
Horas analizadas (68.5) (58) (63)

*Año 1 incluyó de octubre de 1975 hasta que se grabó un episodio de cada una de las series existentes (1976), año 2
igual, pero en 1976-1977, y año 3 igual, pero de 1977-1978.
f = número de casos o unidades.
% = porcentajes.
A continuación mostramos un ejemplo de análisis de contenido, a manera de ejercicio, que se hace
cotidianamente en la mayoría de los países para clasificar las películas y regular el ingreso (por el factor
edad) a las salas cinematográficas.

Ejercicio
Imagine el lector que le asignan la tarea de clasificar películas u obras cinematográficas para evaluar si son adecuadas
para el público de todas las edades, si sólo son apropiadas para adolescentes y adultos, o únicamente son aptas para
adultos (mayores de 18 años). Por supuesto, la unidad de análisis es el filme o cinta, pero: ¿qué categorías podrían uti-
lizarse para clasificar las unidades?
Algunas de las categorías para clasificar las películas, cintas o filmes podrían ser:
• Contenido de sexo.
• Contenido de violencia.
• Contenido de lenguaje ofensivo, soez o procaz (insultos, groserías, majaderías).
• Contenido sobre adicciones y drogas ilegales.
• Contenido de horror (no terror sino, por ejemplo, escenas de muertos —un holocausto que muestre cadáveres—
o la filmación de la muerte de una persona).
Cabrían al menos tres preguntas sobre estas categorías: ¿son demasiado generales?, ¿qué significa cada una
de ellas?, ¿son suficientes o podrían establecerse otros criterios? Las respuestas podrían ir en varios sentidos. La
primera es indudable: “sí”, tales categorías son demasiado generales. Por ello, su significado es poco preciso. Y
alguien podría agregar otra categoría: contenido de discriminación, y aun otras categorías.
36       Capítulo 7  Recolección de datos cuantitativos. Segunda parte

La categoría “contenido de sexo” podría englobar las siguientes subcategorías primarias: a) desnudos, b)
presentación de actos sexuales, c) degradación de valores mediante el sexo, y otros conceptos. En la subcate-
goría desnudos, podrían agruparse otras subcategorías (secundarias), por ejemplo: 1) eróticos ligados al acto
sexual (uno o varios actores y actrices desnudos, comprometidos en acciones sexuales), 2) eróticos no ligados
al acto sexual (uno o varios actores y actrices simplemente desnudos), 3) no eróticos ni ligados a una acción
sexual (por ejemplo, una escena donde aparezca alguna escultura desnuda, como el David, de Miguel Ángel, o
un bebé desnudo). La presentación de actos sexuales podría abarcar las siguientes subcategorías secundarias:
1) sexo sugerido (escenas donde los actores insinúan que habrá un acto sexual, pero no se ve ninguna acción;
por ejemplo, entran a una recámara, sonríen, se miran entre sí, cierran la puerta…), 2) sexo implícito (escenas
de conducta sexual manifiesta, en la que se observa una acción pero esta no es clara ni precisa; por ejemplo,
una pareja que está en una cama, entre las sábanas y supuestamente tiene una relación sexual) y 3) sexo
explícito (conducta sexual manifiesta y escenificada, en la cual los actores se encuentran desnudos y se obser-
va con claridad y precisión la acción sexual). La degradación de valores podría clasificarse en (subcategorías
secundarias): 1) el sexo se presenta como una forma de entrega y amor de la pareja para el desarrollo ar-
mónico de la relación y el crecimiento humano de sus integrantes, 2) el sexo se presenta como una pulsión
instintiva, 3) el sexo se presenta como una forma de degradación humana o humillación.
La violencia podría ser de distintos tipos (subcategorías primarias): a) física, b) verbal o c) psi-
cológica. En el caso de la violencia física, esta podría llevarse a cabo con armas o sin ellas (subcategorías
secundarias). La violencia física podría provocar ciertos efectos: 1) ningún efecto, 2) heridas reversibles que
no requieren hospitalización, 3) heridas reversibles que requieren hospitalización, 4) heridas irreversibles
que requieren hospitalización y 5) muerte (subcategorías secundarias). La violencia también podría: asociar-
se al consumo de drogas o no y al contenido sexual o no (subcategorías secundarias).
El contenido sobre adicciones y/o drogas podría abarcar las subcategorías primarias: a) producción,
b) distribución y c) consumo. Esta última podría subdividirse en subcategorías secundarias: 1) consumo
de alcohol, 2) tabaco, 3) estupefacientes de daño significativo pero menor (por ejemplo, marihuana) y
4) estupefacientes de daño severo a todo el organismo (por ejemplo, cocaína, heroína, entre otras). Asi-
mismo, otras subcategorías secundarias del consumo podrían estar relacionadas con sus consecuencias:
1) daños reversibles a los sistemas del organismo, 2) daños irreversibles y 3) fallecimiento. Y así, las demás
categorías.
De esta forma, cada película se clasificaría en las categorías y subcategorías. Podríamos señalar que la
presencia de ciertas subcategorías secundarias otorga un estatus u otro a la cinta en cuestión, por ejemplo:

Películas aptas para todo público
• Sólo se permiten desnudos no eróticos; si alguna escena presenta desnudos eróticos (ya sea que estén o
no ligados al acto sexual), el filme se clasificará, según sea el caso, como “apto para adolescentes jóve-
nes (12-15 años)”, o “apto para adolescentes mayores (16 y 17 años) y adultos”.
• Únicamente se permite sexo sugerido; si alguna escena presenta sexo implícito o sexo explícito, el filme
será clasificado según sea el caso.
• Imposible vincular el sexo con valores, mucho menos presentarlo como una pulsión instintiva y menos
aún como una forma de degradación humana o humillación (subcategorías secundarias).
• La violencia únicamente puede presentarse en un contexto fantástico caricaturizado.
• No se permite ningún contenido sobre adicciones y/o drogas.
Así, con cada grupo de edad: apta para adolescentes jóvenes (12-15 años); apta para adolescentes
mayores (16 y 17 años) y adultos; y apta solamente para adultos o mayores de edad.
Este proceso de categorización podría representarse gráficamente de la forma como se muestra en la
figura 7.9, de la página siguiente
Metodología de la investigación 37

  Figura 7.9  Ejemplo de un proceso de categorización de películas.

œ Contenido de sexo
Unidad 1: El hobbit, Historia Ÿ Desnudos
de una ida y una vuelta § Eróticos ligados al acto sexual
! § Eróticos no ligados a una acción sexual
Unidad 2: Frozen Ÿ Presentación de actos sexuales
§ Sexo sugerido
§ Sexo implícito
Unidad 3: 12 años de § Sexo explícito
esclavitud Ÿ Degradación de valores
§ Presentación del sexo como forma de
entrega y amor
Unidad 4: Rápidos y furiosos 7
§ Presentación del sexo como una pulsión
§ Presentación del sexo como una forma de
Unidad 5: X-Men, días del degradación
futuro pasado
œ Contenido de violencia
Ÿ Física
Unidad 6: Gravity § Uso de armas ¨ Sí ¨ No
§ Efectos o consecuencias:
Unidad 7: La película
¨ Ninguno
mexicana… ¨ Heridas reversibles que no requieren
hospitalización
¨ Heridas reversibles que sí requieren
Unidad 8: La película hospitalización
peruana… ¨ Heridas irreversibles que requieren
hopitalización
¨ Mortales
Ÿ Verbal
Ÿ Psicológica
Clasificación: Ÿ Asociada:
• Apta para todo público. § Consumo de drogas
• Apta para adolescentes jóvenes § Sexo
(12-15 años), adolescentes mayores
(16 y 17 años) y adultos. œ Contenido de adicciones y drogas
• Apta para adolescentes mayores
(16 y 17 años) y adultos.
œ Otras categorías y subcategorías
• Apta solo para adultos.

Para complementar el ejercicio le sugerimos que, junto con otros compañeros, lo termine y genere un
sistema para clasificar películas (simplemente mostramos algunas categorías por las cuales puede comenzar;
desde luego, podría no estar de acuerdo con ellas o con las subcategorías mencionadas, o con los criterios para
otorgar un estatus u otro a la cinta). Una vez que desarrolle el sistema, vaya al cine, analice algunos filmes de
estreno y otórgueles su propia clasificación de acuerdo con sus criterios.

¿Cuáles son los pasos para llevar a cabo el análisis de contenido?
Ya hemos mencionado tres:
1. Definir con precisión el universo y extraer una muestra representativa.
2. Establecer y definir las unidades de análisis.
3. Establecer y definir las categorías y subcategorías que representan las variables de la investigación.
Los demás pasos son:
4. Seleccionar los codificadores. Los codificadores son las personas que deben asignar las unidades de
análisis a las categorías. Deben tener un nivel educativo profesional (estudiantes de licenciatura,
como mínimo).
5. Elaborar las hojas de codificación. Estas hojas contienen las categorías y subcategorías, y los codifica-
dores anotan en ellas cada vez que una unidad entra en una subcategoría. En la figura 7. 10 se mues-
38       Capítulo 7  Recolección de datos cuantitativos. Segunda parte

  Figura 7.10 Elementos de una hoja o registro de codificación.

Descripción del material que
Indicador de quien se analizará (discurso, nota
codificó: número, Frecuencias (veces que se periodística, sesión terapéu-
iniciales o letras repite cada categoría) tica, etcétera)

Fecha en
que se
codificó el MATERIAL
material CODIFICADOR: 1 CAPÍTULO DE
A ANALIZAR:
LA SERIE
FECHA: 29-11-2014 “La teoría del
DURACIÓN: 60
Big Bang”
MINUTOS
CATEGORÍAS FRECUENCIAS TOTALES

ALTRUISMO (1.1) 2
ACTOS PROSOCIALES (1)

Suma de
frecuencias
MOSTRAR AFECTO (1.2) 5 en cada
categoría o
EXPLICACIÓN DE LOS PROPIOS subcategoría
3
SENTIMIENTOS (1.3)
EXPLICACIÓN DE LOS
0
Categorías SENTIMIENTOS DE OTROS (1.4)
y subcategorías
Asalto con objeto
AGRESIÓN FÍSICA (2.1) 0
(2.1.1)

Asalto sin objeto 0
(2.1.2)
Amenaza física 0
ACTOS ANTISOCIALES (2)

(2.1.3)

Disparar (2.1.4) 0

Otros (2.1.5)
0

AGRESIÓN VERBAL (2.2) 3

ROBO (2.3) 0

ENGAÑO (2.4) 1

TOTAL 14 Total de
frecuencias o
unidades

Pueden agregarse páginas para comentarios del codificador

tran los elementos de una hoja o registro de codificación, que puede estar impresa en papel o
elaborada en un programa para cualquier dispositivo electrónico (PC o tableta, por ejemplo).
Incluso puede ser una hoja en Excel.
Las hojas o registros de codificación pueden incluir elementos más precisos para describir el
material. Por ejemplo, para analizar artículos de periódicos: nombre del periódico, fecha de publi-
cación, género periodístico (reportaje, entrevista, editorial, artículo de fondo, carta, inserción
pagada, artículo general), signatario del texto, sección donde se publicó, página, volumen de
publicación (año, número o equivalente), ubicación en los cuadrantes de páginas,
Metodología de la investigación 39

X

tamaño (en centímetros/columna), nombre del codificador, día de codificación, etc. Una hoja puede
servir para una o varias unidades, según nos interese o no tener datos específicos de cada unidad
(normalmente se prefiere tener la información por unidad).
Asimismo, las categorías y subcategorías deben codificarse con sus respectivos valores numéricos. En la
hoja de codificación de la figura 7.10, 1 (uno) significa acto prosocial y 2 (dos) acto antisocial (así,
1.1 es “altruismo”, 1.2 “mostrar afecto”, etc.). Recordemos que puede haber categorías secundarias y
terciarias o sistemas aún más desglosados.
6. Entrenar a los codificadores. Esta capacitación incluye que los codificadores se familiaricen y compe-
netren con las variables, comprendan las categorías y subcategorías, así como las definiciones de
ambas. Además, debe entrenárseles en la manera de codificar, y discutir ampliamente con ellos las
diferentes condiciones en que puede manifestarse o estar presente cada categoría y subcategoría.
Asimismo, tienen que entender en forma cabal en qué consiste la unidad de análisis.
Parte del entrenamiento implica realizar una prueba piloto con el sistema de categorías y subca-
tegorías, es decir, realizar un análisis de contenido en una muestra representativa del universo del
material de estudio (por ejemplo, unos programas de las series televisivas que se analizarán, segmentos
de los libros de un autor —capítulos de cada obra—, partes de los discursos de oradores —páginas
de cada discurso—. Como se puede apreciar, en este caso, en lugar de muestrear con individuos, se
realiza con unidades de significado). Así, podemos descubrir categorías y/o subcategorías no contem-
pladas previamente. La prueba piloto también nos sirve para evaluar el nivel de confiabilidad de los
codificadores, lo que nos conduce a la siguiente etapa.
7. Determinar la confiabilidad de los codificadores. Todos los codificadores realizan análisis de contenido
provisional de una parte representativa del material (este debe ser el mismo para todos los codificado-
res), con la finalidad de determinar el grado de acuerdo o consenso entre ellos. Si no hay consenso,
no puede efectuarse una evaluación confiable de la muestra o universo de contenido.
Para llevar a cabo la evaluación se calcula la confiabilidad de cada codificador (individual) y la
confiabilidad entre codificadores. El cálculo de la confiabilidad individual de los codificadores depen-
de de que sean uno o varios.
a) Si se dispone de un solo codificador (porque el material es reducido) se observan las diferencias de la
codificación del mismo mensaje hecha por el codificador en dos tiempos diferentes. Si las diferen-
cias son muy pequeñas, el codificador es individualmente confiable. Este tipo de confiabilidad se
llama confiabilidad intracodificador, la cual mide la estabilidad de la prueba y reprueba de un
codificador a través del tiempo.
Otro método consistiría en que el codificador trabaje una parte representativa del material y
después, un experto externo y el investigador, revisen su trabajo y apliquen a su codificación (resulta-
dos) la siguiente fórmula:
Número de unidades de análisis catalogadas
correctamente por el codificador
Confiabilidad individual=
Número total de unidades de análisis
 
Por ejemplo, un mensaje que conste de 20 unidades y se logren correctamente las 20, la con-
! $
fiabilidad será de 1= # 20 & , que es el máximo de confiabilidad. Si el codificador sólo pudo codificar
" 20 % ! 15 $
en forma correcta 15
  de las 20, la confiabilidad sería de 0.75 = # & .
" 20 %
b) Si se
dispone de varios codificadores, la confiabilidad individual
  puede determinarse así: se solicita
a todos los codificadores que codifiquen el mismo material, se toman los resultados de todos
40       Capítulo 7  Recolección de datos cuantitativos. Segunda parte

menos los de uno y se compara la codificación de este con la del resto. Así se procede con cada
codificador.
También puede aplicarse a todos los codificadores la fórmula para calcular la confiabilidad indi-
vidual: quien se distancie del resto se considera un caso poco confiable. Si varios muestran valores
bajos, se practica con otro material hasta alcanzar índices mínimos de .90 (para la individual).

Ejemplo
Codificador A Codificador B Codificador C Codificador D
0.89 0.93 0.92 0.67

El codificador D tiene baja confiabilidad.

El cálculo de la confiabilidad intercodificadores se realiza por pares de codificadores (parejas). Se pide a
cada pareja que codifique el material, se comparan los resultados obtenidos por las parejas, se cuenta el
número de acuerdos entre ellas, se determina el número de unidades de análisis y se aplica la siguiente
fórmula:
Número total de acuerdos entre dos parejas
Confiabilidad entre parejas=
Número total de unidades de análisis codificadas
 
Después se suman los resultados de esta fórmula y se divide entre el número de comparaciones, que
depende del número de parejas. Veámoslo con un ejemplo:

Ejemplo
Las parejas codifican el material:

Codificador A

Codificador B Pareja 1 à Codificación de material = Resultado 1

Codificador C
Pareja 2 à Codificación de material = Resultado 2
Codificador D
Codificador E
Pareja 3à Codificación de material = Resultado 3

Codificador F

Se determina el número de acuerdos entre las parejas (un acuerdo consiste en que dos parejas codifi-
can en la misma categoría/subcategoría a una misma unidad de análisis).

Pareja Número de unidades de análisis Número de acuerdos entre parejas
codificadas

1 18 Entre parejas 1 y 2 = 17

2 18 Entre parejas 1 y 3 = 16

3 17 Entre parejas 2 y 3 = 16
Metodología de la investigación 41

Se aplica la fórmula de confiabilidad entre parejas:

17
C1 y 2 = = 0.94
18
 
16
C1 y 3 = = 0.89
18
 
16
C2 y 3 = = 0.89
18
 
Debe observarse que no hubo consenso total entre cuántas unidades de análisis podían distinguirse
en el material (la pareja 3 distinguió 17 unidades, y las parejas 1 y 2 distinguieron 18). En este caso, para
aplicar la fórmula de confiabilidad entre parejas, se toma en cuenta el máximo de unidades de análisis
codificadas por alguna de ellas.
Pareja Número de unidades de análisis codificadas Número de acuerdos
por alguna de las parejas. Si fuera: entre parejas

A 25 21
Se toma el máximo
B 22

En este caso, la fórmula de confiabilidad sería:

21
C AB = = 0.84
25
 
Se obtiene la confiablidad total (que es la suma de las confiabilidades entre parejas sobre el número de
comparaciones). En nuestro ejemplo sería:

No es conveniente tolerar una confiabilidad menor de 0.85 (ni total, ni entre dos parejas) y de ser
posible debe superar el 0.89. Al igual que con otros instrumentos de medición, la confiabilidad oscila
entre cero (0 = nula confiabilidad) y uno (1 = confiabilidad total).
En el análisis de contenido, una confiabilidad baja puede deberse a que las categorías o unidades de
análisis no se definieron con claridad y precisión, a un deficiente entrenamiento o a la inhabilidad de los
codificadores. Cuando se obtiene una baja confiabilidad tiene que detectarse y corregirse el problema.
Asimismo, es conveniente calcular la confiabilidad a la mitad de la codificación (con 50% del mate-
rial codificado) y al completar esta.
8. Llevar a acabo la codificación. Esta fase implica asignar las unidades al sistema de categorías y contar
las frecuencias de repetición de las unidades en las categorías (número de unidades que corresponden
a cada categoría).
9. Vaciar los datos de las hojas o registros de codificación y obtener totales de cada categoría. Este vaciado
puede ser de las hojas o registros a la matriz de SPSS, Minitab o programa equivalente, o bien,
mediante el empleo de dispositivos ópticos.
10. Realizar los análisis estadísticos apropiados. Se calculan estadísticas dependiendo del nivel de medición
de las categorías (frecuentemente no paramétricas).
42       Capítulo 7  Recolección de datos cuantitativos. Segunda parte

El análisis de contenido transforma sistemáticamente material verbal, textual o visual en datos cuanti-
tativos, mediante un conjunto de códigos y reglas previamente establecidos (Stark y Roberts, 2005). Una de
sus aplicaciones más socorridas es la evaluación de los mensajes transmitidos a través de los medios de comuni-
cación colectiva. Por ejemplo, Taylor (2009) lo implementó para determinar cómo son retratadas las víctimas
de feminicidio y sus perpetradores en los periódicos de Florida (durante un periodo de cinco años). Huhn,
Oettler y Peetz (2009) exploraron los tópicos que son tratados por la prensa de Costa Rica, El Salvador y
Nicaragua al referirse a la violencia. Asimismo, Stein (2009) investigó la forma en que las organizaciones socia-
les de Estados Unidos utilizan internet (mediante una encuesta entre usuarios y análisis de contenido de páginas
web de 86 organizaciones durante un periodo de cuatro meses en 2006). Auster y Michaud (2013) analizaron
el contenido de la mercadotecnia de los parques temáticos de Disney en internet.
El análisis de contenido también puede aplicarse creativamente a una enorme variedad de investiga-
ciones. Por ejemplo, DeCicco (2007) estudió el contenido de los sueños de un grupo de mujeres y demos-
tró su relación significativa con el descubrimiento de sí mismas. Tian (2009) inspeccionó las apelaciones
publicitarias utilizadas y los valores culturales reflejados en los anuncios en los periódicos y la televisión de
China. Smith (2008) desarrolló un libro sobre múltiples aplicaciones del análisis de contenido para efec-
tuar inferencias sobre la personalidad y la motivación de las personas, así como respecto a características
y experiencias de grupos. Por su parte, Harpster, Adams y Jarvis (2009), del FBI, y un departamento de
policía, examinaron los indicadores verbales de denuncias hechas sobre homicidios a través del teléfono
de urgencias 911, para determinar la inocencia o culpabilidad de la persona que llama. Entre sus resulta-
dos descubrieron seis dimensiones lingüísticas que pueden ser útiles para analizar las llamadas telefónicas
sobre homicidios y apoyar las investigaciones.
Algunos ejemplos adicionales se muestran en la tabla 7. 10.
Finalmente, hemos de señalar que con el desarrollo de las nuevas tecnologías de comunicación, el
análisis de contenido se mantiene vigente y en expansión.13

OBSERVACIÓN

¿Qué es y para qué sirve la observación cuantitativa?
Esta técnica de recolección de datos consiste en registrar de manera sistemática, válida y confiable los
comportamientos o conductas que se manifiestan, de acuerdo a un conjunto de reglas y procedimientos
predeterminados derivados del planteamiento del problema de investigación (Yoder, 2013 y McKechnie,
2008). Puede utilizarse como instrumento de medición en muy diversas circunstancias. Polster y Collins
(2007) y Haynes (1978) mencionan que es el método que más utilizan quienes se orientan conductual-
mente. Por ejemplo, es útil para determinar la eficacia de diferentes estilos de liderazgo de los profesores
en la enseñanza, así como para analizar conflictos familiares, eventos masivos (como la violencia en los
estadios de fútbol o el rechazo a algún gobierno en manifestaciones públicas), la aceptación de un produc-
to en un supermercado, el comportamiento de personas con capacidades mentales distintas, el efecto de
ciertas conductas de atención y cuidado con los pacientes por parte de las enfermeras sobre el apego al
tratamiento médico prescrito, los riesgos en el trabajo, la adaptación de un equipo humano al uso de
cierta maquinaria, etcétera.
Desde luego, la observación no es adecuada como instrumento de recolección en todos los estudios.
Tal sería el caso de los procesos cognitivos o cuestiones internas de los individuos (McKechnie, 2008).
La observación cuantitativa, como método para recolectar
Observación cuantitativa  Registro sis- datos, es similar al análisis de contenido. Por ello, en este apartado
temático, válido y confiable de com- algunos conceptos sólo se mencionarán, pero no se profundizará en
portamiento manifiesto. Se recolecta ellos, pues se trataron en el apartado sobre análisis de contenido.
información sobre la conducta más que
de percepciones. Un aspecto importante que se debe destacar es que en la obser-
vación el instrumento de recolección de datos es una o varias perso-
13 Para revisar técnicas específicas de análisis de contenido aplicadas a los medios de comunicación masiva actuales, recomendamos a Divakaran
(2009), y respecto de la investigación turística a Stepchenkova, Kirilenko y Morrison (2009).
Metodología de la investigación 43

  Tabla 7.10  Ejemplos adicionales de análisis de contenido.

Título de la Referencia Breve síntesis
investigación

Análisis de contenido Yu (2009) El propósito del estudio fue entender cómo los diarios impresos y electrónicos
de la cobertura en las cubrían en las noticias a las deportistas asiáticas que habían ganado medallas
noticias de las atletas en las olimpiadas de Sydney, Atenas y Beijing y si enfatizaban sus características
asiáticas femeninas y qué expectativas y estereotipos señalaban sobre ellas. Se analizaron
266 artículos noticiosos entre el 1 de enero de 2000 y el 31 de agosto de 2008. Uno
de los descubrimientos es que la mayoría se refería a buceo y maratón, a pesar de
que las atletas son también competitivas en otros deportes. Los artículos provenían
de periódicos de China, Canadá, Estados Unidos, Inglaterra, Japón, Francia, India y
Malasia, principalmente.

Los prejuicios asocia- Álvarez y Her- Como parte de un proyecto de investigación mixta más amplio, en una primera
dos con la edad y que nández-Sampieri etapa los investigadores analizaron el contenido de ofertas de empleo publicadas
generan discrimina- (2014) durante 2013 en Celaya, Guanajuato, México, en dos muestras probabilísticas (una
ción en los procesos extraída de una bolsa de trabajo en línea y la otra seleccionada de los dos princi-
de reclutamiento en pales periódicos locales (n1=368 y n2=337), con el fin de detectar si había o no
las empresas discriminación por edad y género en el caso de diferentes empleos que no tuvieran
limitaciones físicas. Descubrieron que en tales anuncios se presentaba discrimina-
ción en ambas variables demográficas. La segunda fase, cualitativa y en proceso,
implica entrevistar en profundidad a una muestra de ejecutivos y empleados para
descubrir las razones de tal discriminación.

Un análisis de conte- Hays y Emelian- Aproximadamente 30% de los individuos de diferentes culturas son víctimas de vio-
nido de las evalua- chik (2009) lencia por parte de su pareja, a lo largo de sus vidas. Las investigadoras efectuaron
ciones-intervenciones un análisis de contenido de 38 evaluaciones e intervenciones de tal violencia, descu-
de la violencia entre briendo de manera inductiva siete temas (y sus respectivas limitaciones): contexto
parejas íntimas de la relación, formas de abuso, indicadores inmediatos de riesgo, dinámica familiar,
grado de apoyo, estructura de evaluación e información psicométrica. Posteriormen-
te, los temas fueron considerados como categorías y desplegados en subcategorías
para analizar su frecuencia y evaluar el contenido de todas las valoraciones-aseso-
rías. Por ejemplo, la categoría “forma de abuso” se dividió en las siguientes subcate-
gorías (categorías secundarias): emocional, físico, sexual y conflicto en la relación.
A su vez, cada una, se desplegó en categorías más específicas o terciarias (abuso
emocional: verbal, maltrato, falta de respeto, control, miedo, celos, acoso y acecho).
Los resultados sirvieron para analizar la naturaleza de la evaluación-intervención de
la violencia en la pareja y sus limitaciones, así como recomendar mejores prácticas
cuando se trabaja con esta.

¿La voz de quienes Figenschou Al-Jazeera es el primer canal satelital que transmite noticias en inglés desde Medio
carecen de ella? : Un (2010) Oriente con el propósito de equilibrar el flujo de noticias occidentales y proporcionar
análisis de contenido otra visión sobre el acontecer global (la perspectiva de los países árabes).
cuantitativo del canal La investigación consideró 60 noticieros y definió a la unidad de análisis como la
satelital insignia de noticia (n=1 324). Entre otras categoría se incluyeron: la región (global o interna-
noticias en inglés Al- cional, Asia, África, Norteamérica, Sudamérica, Europa, Oceanía, Medio Oriente), el
Jazeera formato (noticia breve, análisis, entrevista fuera del estudio, entrevista en el estudio,
otras), región general (sur o países no desarrollados y norte o países desarrollados),
fuente de la noticia (establecida, élites independientes, personas ordinarias o gene-
rales, empleados y miembros del staff, otros), género de la fuente y temáticas.
Se calcularon coeficientes de confiabilidad intercodificadores por categoría.
Los resultados dan un panorama claro de cómo el canal maneja la información
noticiosa.
44       Capítulo 7  Recolección de datos cuantitativos. Segunda parte

  Tabla 7.10  Ejemplos adicionales de análisis de contenido (continuación).

Título de la Referencia Breve síntesis
investigación

Misoginia en la Weitzer y Kubrin Esta investigación se llevó a cabo para evaluar la manera en que se representa a
música rapera: un (2009) las mujeres en una muestra de 403 canciones de rap y si se manifiesta misoginia
análisis de contenido en ellas. Una categoría fue la forma como se refieren al género femenino en las
sobre la prevalencia y melodías; en ella, las subcategorías consideradas fueron: nombrar y avergonzar
significados a la mujer (49% de frecuencia), tratar a la mujer como “objeto sexual” (67%),
desconfiar de la mujer (47%), legitimar la violencia contra ella (18%) y prostitución
y proxenetismo (20%).
Un requisito para que las canciones se incluyeran en la muestra fue que formaran
parte de un álbum con certificación de platino (al menos un millón de copias vendi-
das), debido a que así se aseguraba que hubieran sido escuchadas por un segmento
sustancial de la población (se consideraron 130 álbumes producidos entre 1992 y
2000).
La confiabilidad entre codificadores fue de 73.4% para la categoría misoginia.

Imágenes de guerra: Nikolaev (2009) De acuerdo con documentos oficiales estadounidenses e internacionales, el conflicto
Un análisis de conte- de Kosovo fue una guerra civil entre la población serbia respaldada por el gobierno
nido de la cobertura de Yugoslavia y la Organización Terrorista Albanesa (KLA). De esta versión partió
fotográfica en la el trabajo con una pregunta de investigación sencilla pero muy significativa: ¿los
guerra en Kosovo medios impresos estadounidenses contaron esta historia correctamente? La hipótesis
general afirmaba que la cobertura fotográfica de la guerra había sido desequilibrada
con un sesgo evidente contra los serbios.
Se consideraron todas las 365 fotografías (unidades de análisis) dedicadas a la gue-
rra de Kosovo por las revistas Newsweek, Time y U. S. News & World Report en un
periodo de cinco meses de 1999. La confiabilidad entre codificadores fue sumamen-
te significativa (0.97).
Al final, los resultados estadísticos apoyaron la hipótesis.

El contenido de las Marinellie (2009) El estudio se propuso investigar el contenido de las definiciones de palabras pro-
definiciones de los porcionadas por niños, tanto en el modo oral como escrito. Treinta infantes (cuyo
niños: la distinción promedio de edad era de nueve años y dos meses) definieron sustantivos comunes
oral-escrita en ambos modos. Las definiciones fueron codificadas por el uso de términos cate-
góricos (por ejemplo, manzana: fruta; autobús: vehículo) y atributos (por ejemplo,
manzana: roja). Los resultados indicaron que los niños muestran diferentes tipos de
conocimiento de las palabras en los dos modos, pero que la forma escrita es más
útil para producir términos categóricos (para encajar los sustantivos en categorías).
Las definiciones orales tienden a ser más extensas.
Los resultados sirven para planear mejor la enseñanza de conceptos en niños de
educación básica.

nas, porque los equipos (de filmación, para captar movimientos, etc.) solo registran lo que los sentidos
humanos van a percibir (Bentzen, 2008 y Anastas, 2005).
En la observación cuantitativa, a diferencia de la cualitativa, las variables que se observan son especi-
ficadas y definidas antes de comenzar la recolección de los datos. Se enfoca en información que pueda ser
evaluada por medio de los sentidos (datos visuales, auditivos, producto del tacto y el olfato, etc.).
Asimismo, los observadores registran lo que perciben de acuerdo con un sistema y reglas que se aplican
invariablemente, las cuales les ayudan a minimizar su efecto sobre los registros e interacciones con los
participantes observados. Esta circunstancia es particularmente crítica porque los seres humanos somos
selectivos en nuestras observaciones e inducimos cierto grado de variación (Ratcliff y Lassiter, 2007).

Pasos para construir un sistema de observación
Los pasos para construir un sistema de observación son:
1. Definir con precisión el universo de aspectos, eventos, conductas o variables que se observarán. ¿Qué y
Metodología de la investigación 45

quién o quiénes se van a observar y por cuánto tiempo? Por ejemplo, si nuestro interés es conocer los
recursos con que cuentan las escuelas de un distrito escolar, debemos precisar lo que consideramos
como “recurso escolar”. Un universo de aspectos a observar podría ser el comportamiento verbal y no
verbal de un grupo de alumnos durante un semestre en una asignatura. Otro universo lo podrían
constituir las conductas de un grupo de trabajadores durante sus sesiones en círculos de calidad o
equipos para la calidad, en el periodo de un año. O bien, las conductas agresivas de un grupo de
esquizofrénicos en sesiones terapéuticas en cierto periodo. El universo obviamente depende de las
variables que conformen el planteamiento del problema.
2. Especificar las circunstancias de la observación. ¿Dónde y cuándo se conducirán las observaciones? (lugar y
ubicación temporal). Por ejemplo, el aula en la clase de economía durante este semestre desde el inicio y
hasta que concluya el ciclo, antes del periodo de exámenes; todas las sesiones de los grupos para la calidad
del departamento de producción, en el lugar donde se reúnen normalmente; las próximas 10 sesiones
terapéuticas de ciertos pacientes en una cámara Gesell.14 Tales circunstancias dependen del planteamiento
del problema y la situación. Los lugares pueden ser muy variados: una sala de emergencias, un consultorio
médico, una tienda, un aula escolar, un sitio de una comunidad, etc. Resulta obvio que vamos a observar
en lugares adecuados y evitar los que son inapropiados (por ejemplo, intentar registrar conductas crimina-
les en un desfile familiar no sería lo común, lo lógico). A veces se arregla o adapta un ambiente, de tal
modo que sea lo suficientemente estable y se pueda aprovechar para realizar comparaciones entre conduc-
tas por medio de observaciones repetidas (tanto en el tiempo como entre individuos). Además, es indis-
pensable definir si la observación se realizará “en vivo” (mientras ocurren las conductas, aspectos o eventos)
o posteriormente (se filmarán los comportamientos y hechos que después se analizarán). Asimismo, se
debe especificar el tipo de equipo necesario para efectuar las tareas de observación (si observamos células
cancerosas, requeriremos de un potente microscopio; si se trata de planetas, un telescopio de muy largo
alcance; el policía que observa a un grupo de pandilleros requerirá de binoculares y un micrófono especial
que pueda registrar las conversaciones; con tiburones podría necesitarse un equipo que nos logre aislar
de los escualos, etcétera).
Un caso maravilloso de observación por equipo altamente especializado lo ofrece el proyecto
“Impacto Profundo” de la Administración Nacional Aeronáutica y Espacial (NASA, por sus siglas en
inglés). La misión envió una nave espacial para colisionar al cometa Tempel 1 (lo cual implicó una
investigación sumamente avanzada, el diseño de tecnología nunca antes vista, complejos cálculos
matemáticos y proyecciones). Entre algunos de los objetivos del proyecto, podemos citar los siguien-
tes: analizar la composición de los cometas y meteoros similares e indagar más sobre los orígenes del
universo. La colisión calculada se produjo el 4 de julio de 2005 a 23 000 mph (NASA, 2005). La
observación se realizó mediante cámaras fotográficas y de video que se ubicaron en la propia nave
Deep Impact (nave de colisión) y en la nave Flyby, así como mediante algunos de los telescopios más
desarrollados del mundo. Un proyecto ideal para la observación del espacio. Además, ahora los seres
humanos sabemos que somos capaces de impactar cualquier meteorito o cometa que amenace nues-
tro planeta. Conocer la composición de estos objetos permitirá diseñar el proyectil adecuado.
Otro caso es la observación permanente de la superficie de Marte mediante la unidad robot
rodante Curiosity con el fin de estudiar al planeta y sus cambios ambientales, que nos ayudará, entre
otras cuestiones, a evaluar la posibilidad de habitarlo y generar teoría sobre nuestro propio cambio
climático global (NASA, 2014).
3. Incluir todo el universo o extraer una muestra representativa de aspectos, eventos o conductas a observar.
Un repertorio que sea suficiente para observar las conductas, eventos o cuestiones sobre las variables
de interés.
4. Establecer y definir las unidades de observación. Las unidades deben ser captadas por los sentidos. Por
ejemplo, observar cada vez que se presenta una conducta agresiva de un determinado paciente; ana-
14 Este recinto, donde los participantes son colocados para observación, cuenta con dos secciones separadas por un cristal de una sola vista o uni-
direccional (que permite ver de una sección a la otra, pero no de esta hacia la primera). Una sección es regularmente una sala o mesa de trabajo
(desde donde el cristal parece ser un espejo o un vidrio opaco) y la otra, la zona de observación, integrada por butacas, sillas o un aula escolar, en
la cual se ve y se escucha todo lo que ocurre en la sala o mesa de trabajo (además, se filma la acción).
46       Capítulo 7  Recolección de datos cuantitativos. Segunda parte

lizar cada minuto si el alumno está o no atento a la clase de economía (la materia se imparte dos veces
a la semana, dos horas cada clase, de 7:00 a 9:00 horas), etc. El concepto de unidad de análisis es el
mismo que en la recopilación y el análisis de contenido, sólo que en la observación cuantitativa se

  Tabla 7.11  Algunos ejemplos de unidades de análisis o registro.

Estudio Unidades de observación/medición

Evaluar si un programa de televisión con con- Agresiones físicas de los niños (cada vez que se manifiesta una agre-
tenido violento genera conductas agresivas en sión, como golpear a otro niño, empujarlo intencionalmente, etcétera).
los niños.

Determinar la conducta de compra en una tien- Episodio de compra: en el caso de cada cliente, desde que ingresa a la
da de ropa por parte de cierto tipo de clientes. tienda y hasta que sale de ella: ¿qué prendas o accesorios compró?, ¿de
qué colores, texturas?, ¿cuál es su perfil?, etcétera.

Analizar la atención que se presta al tablero de pisodio de interacción: cada vez que un empleado pasa junto al tablero
avisos de la compañía. de avisos, se detiene o no a verlo, cuánto tiempo lo observa y qué infor-
mación capta más su atención.

Evaluar el efecto del consumo de alcohol en el stancia en un bar o cervecería: número de copas o tragos que consumen
comportamiento agresivo de los jóvenes. y número de comportamientos agresivos y sus características (registro
progresivo de todo el tiempo de permanencia en el lugar).

Inferir actitudes de fervor religioso en la iglesia. Cada periodo de tres minutos: registrar conductas que reflejen el fervor
religioso (persignarse, arrodillarse, etcétera).

Deducir conductas de aprobación por parte de Manifestaciones de aprobación (cada vez que el enfermo sonríe a la
los pacientes sobre el trato que reciben de las enfermera, la mira afectuosamente, asiente favorablemente, etcétera).
enfermeras.

Determinar el apego de los pacientes a ciertas Conductas de apego (cada vez que el paciente consume el medicamen-
prescripciones de los tratamientos (medicación to a la hora prescrita y el número de minutos que se ejercita de acuerdo
y ejercicio), mediante filmación. a lo que el médico le solicitó).

La observación mediante diferentes equipos resulta permanente y la
Analizar explosiones solares: magnitud, dura-
unidad es cada explosión (todo su ciclo).
ción y naturaleza.
trata de conductas, eventos o aspectos manifiestos. Algunos ejemplos se presentan en la tabla 7.11.
5. Establecer y definir las categorías y subcategorías de observación. Estas categorías son similares a las
puntualizadas para el análisis de contenido. La observación también consiste en asignar unidades
a categorías y subcategorías de observación. En esta, como en las demás técnicas de medición, se
asume que las variables (representadas por las categorías y subcategorías) han sido definidas con-
ceptual y operacionalmente de forma adecuada, para que el observador realice correctamente las
tareas de discriminación, que es su función central. En la tabla 7.12 se muestran ejemplos.
  Tabla 7.12  Ejemplos de definiciones de categorías.

Variable Categorías Definición

Conducta agresiva hacia los demás 0 a k conductas agresivas Comportamientos que se manifiesten con la intención
aparente de injuriar o dañar a otra persona, ya sea mediante
insultos verbales o signos no verbales y acciones físicas.

Conducta de compra (ropa) 0 a k artículos adquiridos Compra de artículos a crédito o al contado.
Metodología de la investigación 47

  Tabla 7.12  Ejemplos de definiciones de categorías (continuación).

Variable Categorías Definición

Amabilidad en el servicio cuando el • Amable Amable: atender al cliente sonriéndole y haciendo contacto
cliente tiene alguna necesidad • Neutral visual con él. Preguntarle por sus necesidades, resolver sus
inquietu-des, no interrumpirlo cuando esté hablando, dar
• Grosero
solución a las necesidades pertinentes, mantenerse con él
hasta que la solución solicitada se implemente, preguntar si
requiere algo más e inquirirle si está satisfecho.

Neutral: no sonreír al cliente, hacer contacto visual solo una
vez o no mantener tal contacto. No demostrarle que se le
está escuchando, no permanecer con él hasta que la solución
se haya
implementado y no verificar su satisfacción con esa solución.

Grosero: no sonreír al cliente, mostrarse molesto por sus
peticiones, no establecer contacto visual, no preguntarle por
sus necesidades, no resolver sus inquietudes, interrumpirlo
cuando habla, no solucionar las necesidades pertinentes, no
mantenerse con él hasta que la solución solicitada se haya
implementado, no preguntar si requiere algo más ni inquirirle
si está satisfecho.

Oportunidad en la atención al 0 a k minutos y segundos Tiempo que el cliente espera en fila (línea o cola).
cliente (en una sucursal bancaria,
en una taquilla en el cine, puesto
de venta de boletos en un estadio
de fútbol)

Ejemplo

De unidades y categorías
En el caso del experimento citado en el capítulo 7 (al hablar de la manipulación de variables independientes en
experimentos) para probar la hipótesis “A mayor grado de información sobre la deficiencia mental que el sujeto
normal maneje, mostrará menor evitación en la interacción con el deficiente mental” (Naves y Poplawsky, 1984).
Las unidades de análisis eran lapsos de 10 segundos. La interacción entre la persona normal y el actor que hacía
el papel de “deficiente mental” (individuo con capacidad mental distinta) duraba tres minutos. La variable depen-
diente fue “evitación de la interacción” y las categorías fueron cuatro (Naves y Poplawsky, 1984, pp. 107-109):
1. Distancia física: se refiere a si el participante experimental aumenta o disminuye su distancia hacia el
interlocutor a partir de la distancia que inicialmente ocuparía; esta distancia inicial estuvo delimitada
por los asientos que el actor y el sujeto debían ocupar y, según la teoría, es la distancia en la que dos
extraños en una situación de comunicación pueden interactuar de manera cómoda. Las dimensiones
o subcategorías que este indicador adquiere son: acercarse (afiliación) con valor de “2”, mantenerse
estático, con valor de “1”; y alejarse (evitación) del actor (deficiente mental), con valor de “0”; mediante
inclinaciones corporales, o bien, al modificar por completo su distancia.
2. Movimientos corporales que denotan tensión: esta categoría intenta captar los movimientos que el
sujeto realiza: si efectuaba movimientos que indicaran tensión (evitación) el valor era de “0”; ningún
movimiento con valor de “1”; y movimientos que señalan que se experimenta relajación (afiliación), con
valor de “2”. En este indicador específicamente se analizan si los movimientos de pies y piernas están a
un ritmo acelerado, si hay ademanes con brazos y manos (como rascarse, sentir picor, etc.) y la postura
en general del participante.
3. Conducta visual del sujeto: según se estipula en esa investigación, este factor adquiere dos dimensiones
o subcategorías:
a) Dirigida hacia el interlocutor (afiliación) con valor de “1”.
b) Dirigida hacia cualquier otra parte (evitación) con valor de “0”.
4. Conducta verbal: este indicador está compuesto por el contenido verbal del discurso del sujeto hacia el
deficiente y se orienta primordialmente a la forma del discurso; incluye dos modalidades:
48       Capítulo 7  Recolección de datos cuantitativos. Segunda parte

a) Frases u oraciones completas (afiliación), con valor de “1”.
b) Frases dicotómicas y silencios (evitación), con valor de “0”.
La modalidad de frases dicotómicas incluye respuestas monosilábicas (sí, no), murmullos, sonidos
guturales; los silencios que se interpretan como respuestas dicótomas (de evitación) son aquellos no
naturales en el discurso, cuando expresamente el individuo se queda en silencio. La conducta verbal se
mide a través del diálogo que sostenga la persona con el deficiente mental; es decir, en respuesta al
guión que el actor interpreta ante cada sujeto (que es idéntico para todos) y en las intervenciones que
el mismo individuo realice.
En este caso, además de medir la conducta verbal en cuanto a su forma, convendría medirla
también en cuanto a su contenido; es decir, determinar si las frases emitidas por el participante en
respuesta a lo expresado por el deficiente revelan un contenido positivo o negativo.

Los periodos de observación, las unidades y categorías varían de acuerdo con el planteamiento del
problema e hipótesis.

Las subcategorías pueden ser escalas de actitudes
Las subcategorías pueden ser tratadas como escalas del tipo Likert, Guttman o diferencial semántico.

Ejemplo

Categoría Subcategoría
Atención del alumno Elevada (3)
Meida (2)
Baja (1)
Nula (0)
Disciplina del alumno Completa (3)
Aceptable (2)
Media (1)
Indisciplina (0)
O bien, agresividad del niño Muy alta (5)
Alta (4)
Regular (3)
Baja (2)
Inexistente (1)
O, al hablar del desempeño laboral observado en coordinadores de escuelas o asociaciones:

: : : : : :
Productividad (5) (4) (3) (2) (1) (0) Improductividad

: : : : : :
Actitud de servicio Actitud de no servicio
(5) (4) (3) (2) (1) (0)

Cumplimiento-incumplimiento
Etcétera

6. Diseñar la manera de registrar las observaciones (mediante un formulario, hoja de codificación o guía
de observación).15 Este instrumento, en el cual se ingresan o anotan los datos, está prediseñado sobre
la base de la revisión de la literatura o construido especialmente para el estudio. Su formato es similar
al que se presentó en el apartado sobre análisis de contenido. Anastas (2005) indica que en ocasiones
se utilizan sistemas de observación probados debido a: a) los costos (desarrollar uno requiere tiempo,
varias pruebas y recursos), b) existen diversos instrumentos válidos y confiables para un amplio reper-
15 Recordemos: en papel o como documento de PC, puede ser una hoja de Excel.
Metodología de la investigación 49

torio de conductas, y c) se facilita la comparación con los estudios que utilizaron el mismo sistema
de observación (se comparte un marco interpretativo). En ocasiones, los instrumentos son apara-
tos que registran las observaciones (pistola láser de lectura de velocidad, scanner, sistema de video,
telescopio, microscopio, etc.). En el caso de Naves y Poplawsky (1984), el formato de codificación
es el que se muestra en la figura 7.11; asimismo, se agrega otro ejemplo en la figura 7.12.
El ejemplo de la figura 7.12 es un formato para registrar conductas inapropiadas en la clase y

3’
40” 50”
Condición experimental:

30”
20”
10”
2’
50”
40”
30”
20”
10”
40” 50” 1’
Nombre del participante:
  Figura 7.11  Primer ejemplo de un formato de registro o codificación.

30”
Fecha:
20”
10”
0’

Acercamiento (2)

F. dicótomas (0)
Alojamiento (0)

F. completas (1)
A otra parte (0)

Silenciosos (0)
Subcategoría

corporales Relajación (2)
Ninguno (1)

Al sujeto (1)
Estático (1)
Tensión (0)
Codificador:

Movimientos

Conducta

Conducta
Distancia
Categoría

verbal
visual
física
Hora:
50       Capítulo 7  Recolección de datos cuantitativos. Segunda parte

  Figura 7.12  Formato de registro de conductas inapropiadas.

CONDUCTAS INAPROPIADAS EN EL SALÓN DE CLASE O AULA

FECHA: HORA:

CLASE: PROFESOR:

NÚMERO DE ESTUDIANTES: GRADO:

Conductas inapropiadas (CI): Número de estudiantes involucrados (N):

Agresión física 1-Individuo

Ofensa verbal 2 - Diada

Insulto no verbal (señas) 3 - Grupo pequeño (3 a 5)

Hablar en clase 4 - Grupo grande (6 a 15)

Ruido provocado 5 - Toda la clase

Desobediencia

No enfocado en la clase (distraído)

1 - Otra

Estudiantes

Núm. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

CI

N

Núm. 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

CI

N

Núm. 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45

CI

N

Núm. 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60

CI

N

analizar cuáles son las que se presentan con mayor frecuencia y el número de estudiantes involucrados
(Creswell, 2005).
Los números (columnas) representan episodios de conducta inapropiada en la clase (cada vez que
ocurre). En la fila “CI” (conducta inapropiada) se coloca la letra inicial de la conducta (ejemplo: A, agre-
sión física, O, ofensa verbal; H, hablar en clase…), y “1” si son otras. Asimismo, en la fila “N” se indica
el número de estudiantes involucrados en el episodio.
La hoja de codificación, formato o guía debe ser acompañada de las instrucciones para su llenado y
los registros, así como la mención de las unidades de observación y el tiempo que durará esta. Debe evi-
tarse un instrumento que sea tan complejo que sea difícil de codificar y utilizarse en la realidad.
7. Determinar el papel de los observadores. ¿Qué tan cercanos deben estar el observador y los observados?
Metodología de la investigación 51

A este respecto mucho se ha escrito y los papeles varían desde una distancia prudentemente lejana
hasta una cercanía completa (McCurdy y Uldam, 2014).
Williams (2008), Polster y Collins (2007) y Anastas (2005) plantean dos roles fundamentales de la
relación observador-observados: a) participante (donde hay relación entre el observador y las perso-
nas observadas) y b) no participante (la relación es mínima —simplemente por el hecho de que los
individuos saben que están siendo observados— o puede ser nula, si los individuos no lo saben).
La ética de la investigación marca que siempre que va a observarse a un ser humano, se debe obtener
su consentimiento; asimismo, no se deben invadir sus esferas privadas (baños, recámaras, despachos,
etc.). Anastas (2005) está de acuerdo con este principio, aunque marca una excepción: cuando se
observan conductas inocuas que pudieran ocurrir de manera natural en situaciones públicas y cuando
las personas observadas no son identificadas o afectadas por los observadores. En última instancia, si
el investigador trata de evitar la “reactividad” en el proceso (que la presencia de los observadores pro-
voque reacciones poco o nada naturales en los participantes), una vez que se efectúan las observacio-
nes debe solicitársele a cada sujeto su autorización, mantener su nombre en el anonimato, nunca
mostrar las filmaciones o registros y respetar su negativa, si es el caso.
Jorgensen (1989) sugiere tres actuaciones: a) participante activo: el observador interactúa plenamente
con los observados, tiene un papel de miembro, es uno más de ellos (por ejemplo, si se trata de obser-
var el compromiso de trabajadores en los grupos de calidad, el observador es un miembro del grupo
con funciones específicas), b) participante privilegiado: no es un miembro del grupo, pero tiene acce-
so a información amplia y privada; los observados lo conocen y le tienen confianza; y c) observador
limitado; no tiene más que el papel de observador externo. Rogers y Bouey (2005) los clasifican en
el siguiente continuo:

Participante completo: Participante observador: Observador participante: Observador completo:
total interacción; su rol su rol primario es parti- su rol primario es obser- nula participación; se
primario es participar y cipar, pero casi a la par var, aunque tiene ciertas limita a observar
generar la interacción observa participaciones

McKechnie (2008) y Patton (2001) sugieren que el observador debe ubicarse en varios continuos
para establecer su papel (que es una ubicación aproximada y no exacta):
52       Capítulo 7  Recolección de datos cuantitativos. Segunda parte

Sin que de ninguna manera sea una norma, cuando la observación cuantitativa trabaja con per-
sonas, regularmente es no participante, encubierta o intermedia, de corta estancia y enfocada, mien-
tras que la observación cualitativa es participante, abierta, prolongada y general.
8. Seleccionar a los observadores-codificadores. Puesto que son las personas que codificarán la conducta,
deben conocer las variables, categorías y subcategorías. Las habilidades más importantes de un buen
observador son:
• Selectividad para registrar lo que observa, de acuerdo con reglas.
• Uso de todos los sentidos, particularmente ante lo que no se esperaba encontrar.
• Capacidad para aplicar el sistema de registro que involucra el procesamiento de información.
9. Entrenar a observadores-codificadores (en las variables, categorías, subcategorías, unidades de análisis y
el procedimiento para codificar, así como sobre las diferentes maneras en que puede manifestarse una
categoría o subcategoría de conducta). Debido a que, en algún grado, la observación involucra hacer
juicios, el entrenamiento debe apoyar la estandarización de procedimientos y, por ende, la objetividad.
10. Efectuar la prueba piloto y calcular la confiabilidad de los observadores (intraobservador e interobserva-
dores). En la prueba piloto se evalúa todo lo relativo al proceso de observación. Desde la iluminación
ambiental (ejemplo, cámara Gesell), el sonido y los equipos de filmación, hasta el lugar donde se
coloquen los observadores, las instrucciones y la guía de observación o registro.
Gracias a la prueba piloto podemos detectar problemas potenciales y corregirlos (por ejemplo, si
vamos a observar conductas agresivas de niños y nada más hemos trabajado con adultos, nos percata-
remos de que la agresión no se manifiesta igual en ambos casos. De este modo, durante la prueba
piloto podemos registrar comportamientos agresivos no contemplados, que se agregarán como sub-
categorías en el instrumento de observación definitivo). Esto se hace con una muestra del repertorio
de conductas o actos que se considerarán. Con respecto a la confiabilidad, recordemos que debe
demostrarse y no simplemente asumirse, y se determina para evaluar si los observadores catalogan o
clasifican coherentemente (confiabilidad individual) y si registran entre sí de manera similar los mis-
mos eventos o conductas (confiabilidad interobservadores). Los procedimientos y las fórmulas pue-
den ser las mismas que las vistas en el apartado sobre el análisis de contenido; lo único que cambia es
la palabra “codificadores”, “codificación”, “codificadas”, por “observadores”, “observación”, “observa-
das”. Por ejemplo:

 
Número total de acuerdos entre dos parejas
Confiabilidad entre parejas=
Número total de unidades de análisis codificadas
 
Haynes (1978, p. 160) proporciona otra fórmula para calcular la confiabilidad entre observado-
res o el grado de acuerdo interobservadores (Ao).

 
donde Ia es el número total de acuerdos e Id es el número total de desacuerdos entre observadores,
respectivamente. Un “acuerdo” se define como la codificación de una unidad de análisis en una mis-
ma categoría/subcategoría por distintos observadores. Se interpreta como cualquier coeficiente de con-
fiabilidad (0 a l).
Cuando se trata de establecer la confiabilidad es muy importante evitar que los observadores “copien”
o vean el trabajo de sus compañeros, ya que esto puede ocurrir.
Bakeman y Quera (2011); Grinnell, Williams y Unrau (2009), así como Anastas (2005) consideran
como una confiabilidad interobservadores mínima aceptable un puntaje de 0.85 u 85%. Si se elige
Metodología de la investigación 53

un instrumento ya desarrollado, al igual que en otros métodos de medición, debe demostrarse que en
los estudios donde se aplicó resultó válido y confiable, y adaptarse a las condiciones de nuestra inves-
tigación.
Para establecer la validez de contenido se analiza el dominio de nuestras categorías y subcategorías en
contraste con el universo de posibles conductas que pueden manifestarse. Muchas veces, la validez de
criterio se establece usando otra técnica (por ejemplo, la “hostilidad”, que se infiere de observar actos
agresivos, puede validarse mediante una escala que mida tal variable).
1. Llevar a cabo la codificación por observación.
2. Vaciar los datos de las hojas o formatos de codificación y obtener los totales de cada categoría.
3. Realizar los análisis apropiados.
La observación es una excelente herramienta de recolección de los datos en ciertas poblaciones, como
los niños y las personas con capacidades distintas. Por ejemplo, Rapport et al. (2009) utilizaron la obser-
vación para analizar los procesos y patrones de atención en el aula por parte de niños con trastorno por
déficit de atención con hiperactividad (TDAH). Sutherland et al. (2013) desarrollaron un sistema de
observación directa de la interacción del profesor con sus alumnos infantes para evaluar la eficacia del
primero y estudiar los patrones de vinculación, así como analizar conductas problemáticas. Asimismo, la
observación se utiliza como un método para recolectar datos sobre el comportamiento de los pacientes
(desde su conducta social hasta las reacciones ante los tratamientos y sus expresiones). Por ejemplo,
Mendez et al. (2013) generaron e implementaron un inventario para observar las conductas de enfermos
de Alzheimer y demencia frontotemporal.
También puede ser una herramienta en estudios longitudinales. Mejia et al. (2009) observaron duran-
te un periodo de poco más de dos años para comprender qué factores inciden en la conducta grupal de un
equipo de trabajo comunitario dedicado a la prevención del VIH. Grabaron en video 18 sesiones del
grupo.

CODIFICACIÓN EN EL ANÁLISIS DE CONTENIDO Y LA OBSERVACIÓN
Una vez recolectados los datos del análisis de contenido o la observación, todos deben codificarse, es decir,
asignar códigos (generalmente numéricos) a las categorías y/o subcategorías. Por ejemplo, en el caso del
estudio de Naves y Poplawsky (1984), la codificación es la que se muestra en la tabla 7.13 (que correspon-
de al primer ejemplo de un formato de registro o codificación, figura 7. 11).
Además, la matriz de SPSS o equivalente sería la de la tabla 7.14 (desde luego, solo se incluyen 10
casos a manera de ejemplo).

RECOPILACIÓN Y ANÁLISIS DE DATOS SECUNDARIOS
La recopilación y análisis de datos secundarios se fundamenta en información disponible recolectada
por otros analistas distintos del investigador. Esta técnica para recabar los datos puede subdividirse en: a)
datos estadísticos provenientes de fuentes oficiales y b) datos para metaanálisis. En ambos casos se acude
a bases de información que pueden encontrarse en una o varias fuentes y que son útiles para los propósitos
del estudio (Schmidt y Hunter, 2014 y Vartanian, 2010). La diferencia entre estos dos tipos estriba en que
los primeros recogen estadísticas como datos para analizar (por ejemplo, tasas de defunción o mortalidad
y nacimiento, número de hectáreas de riego, cifras de egreso en los distintos niveles del sistema escolar,
número de camas de los hospitales y pacientes atendidos, número de monumentos históricos por tipo,
producto interno bruto, número de instalaciones deportivas y tamaño en metros cuadrados, extensión de
la red de alcantarillado, índice de inflación, monto de la deuda externa pública y privada, unidades pro-
ducidas por una o varias fábricas, digamos de autos, etc.); en cambio, el metaanálisis recopila datos de
estudios efectuados por otros sobre el planteamiento del problema, los evalúa y puede volver a analizarlos
e integrarlos en una base mayor de información; o bien, sumarlos y compararlos (Ringquist, 2013) .
Krysik (2005) considera tres tipos de datos secundarios: datos obtenidos del nivel “micro”, datos
54       Capítulo 7  Recolección de datos cuantitativos. Segunda parte

  Tabla 7.13  Ejemplo de codificación en el caso del estudio de Naves y Poplawsky (continuación).
Variable Categorías Subcategorías Códigos Columnas

– Tratamiento experi- – Grupo cultural 1 1
mental – Grupo sociopsicológico 2

– Conducta – Distancia física – Alejamiento 0
– Acercamiento 2 2
– Estático 1

– Movimientos corporales – Tensión 0
– Relajación 2 3
– Ninguno 1

– Conducta visual – Al sujeto 1 4
– A otra parte 0

– Conducta verbal – Frases completas 1 5
– Frases dicótomas o 0
silencios

– Codificador – LRE 1 6
– MRM 2
– APY 3

Desde luego, Naves y Poplawsky (1984) para las categorías de “conducta de evitación” obtenían esta codi-
ficación cada 10 segundos (cada unidad de análisis), y sumaban el número de 2 (dos) y 1 (uno) y lo trans-
formaban en porcentaje. Aquí suponemos que toda la interacción con el supuesto deficiente mental puede
categorizarse y subcategorizarse. Recordemos que eran 30 participantes.

  Tabla 7.14  Matriz o vista de los datos para la codificación de la tabla 7.13 (Naves y Poplawsky).

Columna 1 Columna 2 Columna 3 Columna 4 Columna 5 Columna 6
Tratamiento Distancia Movimientos Conducta Conducta Codificador
experimental física corporales visual verbal
S1 1 0 0 0 0 1
S2 1 0 0 0 0 1
S3 2 2 0 1 1 2
S4 1 1 0 0 0 2
S5 2 2 2 1 1 2
S6 1 0 1 1 0 3
S7 2 2 2 1 1 3
S8 2 2 2 1 1 3
S9 2 1 2 0 1 1
S10 1 2 1 0 0 2

agregados y datos cualitativos micro.
a) Datos obtenidos del nivel “micro”. Son derivados de unidades de análisis individuales como personas,
organizaciones u hogares (número de habitantes por vivienda, número de trabajadores de la empresa,
preferencias de votantes por partidos políticos y candidatos en un distrito electoral, satisfacción labo-
ral de los trabajadores, etc.). La mayoría de las veces los datos se recolectan por medio de encuestas.
Por ejemplo, los censos económicos (vistos en el capítulo de encuestas o surveys de este centro de
recursos en línea) generan esta clase de datos, al igual que los de población.
Metodología de la investigación 55

La encuesta nacional de adicciones de estudiantes (implementada anualmente en varios países
latinoamericanos) es otro caso y recolecta —entre otros datos— los siguientes:16
1. Personas económicamente activas en el sistema familiar.
2. Distribución del tiempo libre del estudiante.
3. Convivencia del alumno en el hogar (padres y otros parientes).
4. Estructura del sistema matrimonial de los tutores del estudiante (padres casados, divorciados, separa-
dos, etcétera).
5. Ocupación de las personas económicamente activas del hogar.
6. Personas con quienes los estudiantes se comunican más dentro del hogar.
7. Actividades deportivas del estudiante (tipos y periodicidad de cada actividad deportiva, tiempos de
dedicación, entre otros).
8. Conducta de fumar (inicio, frecuencia de la conducta de fumar, consumo diario de cigarrillos).
9. Ingesta de alcohol (inicio, periodicidad, consumo semanal).
10. Percepción proyectiva del consumo de estupefacientes o drogas ilegales (se responde a la pregunta: ¿A
cuántos de tus compañeros de escuela has visto consumir droga?, ¿a cuántos de tus amigos, fuera de la escue-
la?).
11. Conocimiento del tipo de droga que se consume (cuestionamiento: Señala la droga que sabes consu-
men en este plantel… Señala la droga que sabes se consume en tu vecindario…).
12. Preferencia de consumo en el entorno inmediato por tipo de estupefaciente (fuera de la escuela).
13. Percepción del encuestado respecto de si es un problema general el consumo de estupefacientes.
14. Percepción respecto de si se pueden conseguir drogas o estupefacientes dentro de la escuela.
15. Percepción respecto de si se consume droga o sustancias ilegales dentro de la escuela.
16. Percepción respecto de si el consumo de estupefacientes es un problema en su entorno.
17. Preferencia de consumo en la escuela por tipo de estupefaciente.
18. Actitud ante el consumo de estupefacientes por una amistad.
19. Manifestación de haber consumido algún estupefaciente.
20. Edad de inicio de consumo.
21. Figura o tipo de persona que invitó a experimentar el consumo (amigo, tutor, etcétera).
22. Tipo de estupefaciente o droga consumida por primera vez.
23. Consumo de diferentes clases de estupefacientes.
24. Preferencia individual de consumo por tipo de estupefaciente.
25. Periodicidad del consumo.
26. Motivos del consumo.
27. Acciones recomendadas por los encuestados para reducir el consumo, evitarlo o prevenirlo.
28. Conciencia del consumo de estupefacientes.
29. Fuente más impactante de conocimiento del problema social que implica el consumo de estupefa-
cientes.
30. Comentarios abiertos (cualitativo).

El investigador, aunque no generó estos datos, tiene acceso directo a ellos (a la información individual
original; a los cuestionarios, registros, matriz de datos, etc.) y, por lo tanto, los puede volver a analizar
(incluso a veces puede identificar a los encuestados o sus perfiles). Por ética, regularmente sólo debe pro-
porcionarse la matriz de datos y respetar el principio de confidencialidad.
b) Datos agregados. Consisten en datos individuales que ya se han procesado y reunido con otros en cifras
estadísticas, tablas o cuadros. En estos, las características de las unidades de análisis no pueden ser
identificadas (por ejemplo: el investigador recibe el dato sobre el promedio de satisfacción laboral en
una escala o la tasa de desempleo y obviamente no puede reanalizar los datos, sólo utilizarlos para los
fines que convengan).

16 Por ejemplo, en México la publica periódicamente el Consejo Nacional Contra las Adicciones (CONADIC).
56       Capítulo 7  Recolección de datos cuantitativos. Segunda parte

Estos datos se pueden obtener de:
1. Oficinas y agencias gubernamentales y oficiales (Ministerio de Educación de Argentina; Ministerio
de Educación, Cultura y Deporte de España; Dirección de Impuestos y Aduanas Nacionales de
Colombia; Instituto Nacional de Estadística de Bolivia; Ministerio de Desarrollo e Inclusión Social
del Perú; Banco Central de Venezuela; Consejo Nacional de Ciencia y Tecnología de México, etcéte-
ra).
2. Organizaciones privadas (Cámara de Comercio de Santiago de Chile, Consejo de Fundaciones
Privadas de Guatemala, Fundación Cultural Española para el Fomento de la Artesanía, Centro de
Estudios Económicos del Sector Privado en México, Fundación Ford, entre otras).
Algunas bases de datos privadas contienen archivos periodísticos, como por ejemplo: U.S. News
Archives on the Web (periódicos de Estados Unidos), Reuters y Europrensa (Universidad Complutense
de Madrid), International News Archives on the Web (varios países, incluidos diarios latinoamerica-
nos), etc. Los periódicos más importantes del mundo poseen su propia base de datos.
3. Organizaciones no gubernamentales (Agencia de Cooperación en Ingeniería Ambiental o ACIA, Pro
Amazonia “Selva Para la Vida”, Alianza Cívica en México, Asociación Bienestar y Desarrollo en
España, Asilo de Ancianos de Celaya y otras).
4. Organizaciones internacionales (Comisión Económica para América Latina y el Caribe; Organización
de las Naciones Unidas para la Educación, la Ciencia y la Cultura, UNESCO; Organización Mundial
de la Salud, OMS; Fondo de las Naciones Unidas para la Infancia, UNICEF; Fondo Monetario
Internacional, etcétera).
Las primeras tres fuentes genéricas varían en cada país, por lo que resultaría poco práctico intentar
mencionarlas. Por ello, cada estudiante o profesor debe tener en mente cuáles son y qué tipo de informa-
ción pueden proporcionar.17
De los datos resulta fundamental conocer:18
• El nombre y la filiación institucional de quien los recolectó.
• El periodo de recopilación.
• La muestra (método de selección, tamaño, características…).
• El método de recolección, incluyendo el instrumento, procedimiento, confiabilidad y validez, etcéte-
ra.
• Localización (disponibilidad).
Y de ser posible:
• Procedimientos de codificación.
• Análisis practicados.
• Sugerencias para el análisis.
c) Datos cualitativos micro. Son producidos por una persona y recabados por otra. Al investigador le
llega el dato (cartas recopiladas por otros, transcripciones de entrevistas hechas por psicólogos, graba-
ciones de las llamadas de los pasajeros que iban en los aviones secuestrados por terroristas en los
atentados a las torres gemelas del World Trade Center en Nueva York en 2001, etc.). Tales datos
pueden ser reanalizados por el investigador.
Las ventajas de los datos secundarios residen en que su costo es generalmente el más barato de
todos los métodos de recolección y a veces son la única opción para el investigador (Smith, 2008;
Sieppert, McMurtry y McClelland, 2005 y Encyclopedia of Evaluation, 2004); además, pueden
replicarse estudios con base en ellos. Gran cantidad de datos secundarios se localiza mediante inter-
net. Sus desventajas potenciales consisten en que a veces no son accesibles, no están estandarizados,

17 Para el caso de España recomendamos a Berganza y García (2005) y a Corbetta (2003) y desde luego una búsqueda en los disparadores genéri-
cos de internet. Para las organizaciones no gubernamentales latinoamericanas, por ejemplo, en el caso del medio ambiente, la siguiente dirección
en internet incluye una gran cantidad de ellas: http://www.ecoportal.net/content/view/full/158.
18 Se aplica también a los datos “micro”. 
Metodología de la investigación 57

pueden haberse omitido variables importantes para nuestro estudio y es factible que den una falsa
impresión de ciertos subgrupos (los promedios de ingreso nacional per cápita, por ejemplo, suelen
resultar engañosos).
Corti (2008) presenta las siguientes dificultades y retos cuando se deben reutilizar y compartir datos
secundarios:
1. Consideraciones y limitaciones que impone la necesaria ética al reportar datos.
2. Cobertura y representación de los datos y su contexto.
3. Desconocimiento de los métodos usados para recolectarlos.
4. Falta de tiempo para familiarizarse con los datos generados.
5. Falta de infraestructura para acceder a los datos de interés.
6. Interpretación incorrecta del sentido de los datos.
7. Violación de los derechos de autor y propiedad intelectual.

El proceso para utilizar datos secundarios en una investigación se resume en la figura 7.13.19
  Figura 7.13  Proceso esencial para utilizar datos secundarios.

! Analizar la relación entre el
planteamiento del problema
Evaluar la calidad de los datos:
y los datos secundarios:
• Muestra
• ¿Son pertinentes para el
• Confiabilidad
estudio?
• Validez
• ¿Representan adecuada-
• Método de recolección
mente una operacional-
• Fuente de origen
ización de nuestras variables?

En el caso de datos estadísti-
Preparar los datos cos, verificarlos preferente-
para su análisis mente en al menos dos
fuentes confiables (validación
cruzada).

Para el manejo de archivos se recomienda consultar a Webb, Campbell y Schwartz (2000).

El metaanálisis
Esta clase de procedimiento de recolección y análisis de datos implica sintetizar resultados de investiga-
ción por medio de varios estudios que consideran el mismo planteamiento y variables (Schmidt y Hunter,
2014 y Wiersma y Jurs, 2008). El término metaanálisis fue acuñado en 1976 por el estadístico norteame-
ricano Gene V. Glass, mientras era profesor de la Universidad de Colorado en Boulder (Encyclopedia of
Health Services Research, 2009).
Los pasos de un metaanálisis son muy similares a los de otros tipos de indagación, con la salvedad de
que la unidad de análisis ya no es el participante, evento o caso, sino el estudio realizado por otros inves-
tigadores. El reto es resumir los datos a partir de los diferentes estudios de manera muy bien estructurada,
que evite errores y facilite su ulterior análisis.
Cabe señalar que el metaanálisis será más preciso entre más homogéneos sean los estudios que se
consideran, en cuanto a la preguntas de investigación, variables, método, instrumentos de medición y
análisis estadístico. Por lo tanto, el primer paso consiste en ponderar si es posible combinarlos (nos referi-
mos solo a estudios cuantitativos). Tal consideración nos puede llevar a un sinfín de opciones, desde
19 Adaptado de Corti (2008), Sieppert et al. (2005) y Krysik (2005).
58       Capítulo 7  Recolección de datos cuantitativos. Segunda parte

descubrir que hay varias investigaciones que son totalmente compatibles y pueden mezclarse, hasta encon-
trar que algunas solo tienen un ítem en sus cuestionarios o un indicador cuyos resultados nos sean de
utilidad.
Existen diferentes propuestas para homogeneizar estadísticamente los resultados de distintos estu-
dios, entre las que se destacan tres, que se conocen con el nombre de modelo de efectos fijos, modelo de
efectos aleatorios y, por último, el modelo bayesiano (Molinero, 2003).
En el modelo de efectos fijos, los estudios se combinan y se asume que no existe heterogeneidad entre
ellos; por lo tanto, todos constituyen estimaciones de un efecto real cuya magnitud se desea conocer. Así
pues, las inferencias realizadas se condicionan a las investigaciones incluidas.
En el modelo de efectos aleatorios las inferencias se fundamentan en suponer que los estudios seleccio-
nados para el análisis constituyen una muestra aleatoria del universo de estudios posibles, y sus resultados
son más conservadores pues tienen en cuenta una fuente extra de variación, ya que se incluyen dos fuentes
potenciales: la existente dentro de los estudios y la variación entre ellos (Molinero, 2003, p. 3).
La utilización de modelos bayesianos requiere de modelos estadísticos complejos de varianza.
El metaanálisis constituye un intento de resolver contradicciones entre los resultados de diferentes
investigaciones y evaluar patrones comunes en distintos estudios. Es un método sumamente impor-
tante para generar teoría.
Como todo método inferencial, tiene sus dificultades y limitaciones. Uno de los principales retos es
que al ser un enfoque que generalmente se ejecuta de forma retrospectiva, tiene una posibilidad mayor de
introducir sesgos (error sistemático). Otros desafíos son los que se derivan del procedimiento de combinar
datos de múltiples estudios, entre los cuales puede haber diferencias en cuanto a método y muestreo
(Card, 2011 y Smith, 2008).
El procedimiento general de un metaanálisis es similar al de los datos secundarios, pero se agregan
algunos elementos como el análisis mismo (figura 7.14).
  Figura 7.14  Proceso esencial del metaanálisis.

Evaluar si el metaanáli- Definir los criterios de Analizar la relación entre el plant-
sis puede responder al selección de los estudios eamiento del problema y los
planteamiento del que deben ser incluidos estudios:
problema en el análisis (criterios
de inclusión y exclusión) • ¿Son pertinentes los estudios para
la investigación planteada?
• ¿Qué tan homogéneos o hetero-
géneos resultan y en qué sí pueden
conjuntarse y en qué no?

Preparar los datos
para su análisis
(crear matrices u a) Elegir los aspectos, ítems o indicado-
res, dimensiones y variables en las
otras bases de
cuales van a conjuntarse o compararse.
datos que permitan
b) Evaluar la calidad de los estudios:
estadísticas agrega- Seleccionar los estudios
das y contrastes, que se incluirán • Muestra.
etcétera) • Confiabilidad.
• Validez.
• Método de recolección.
• Fuente de origen.

Otros parámetros: vea el capítulo 10 de
Analizar los datos Reportar inferencias este centro de recursos en línea
Metodología de la investigación 59

Algunas recomendaciones para el metaanálisis las proporcionan Schmidt y Hunter (2014), Harpe
(2009) y Céspedes (1995):
1. Realizar una cuidadosa revisión de la literatura de los estudios que son adecuados potencialmente
para integrarse como unidades de análisis.
2. Generar parámetros precisos de inclusión y exclusión de estudios, con índices de calidad para que los
estudios elegidos sean los apropiados.
3. Seleccionar investigadores independientes que revisen cuidadosamente, clasifiquen, codifiquen,
cuantifiquen y finalmente evalúen y elijan el grupo de estudios que será incluido en el metaanálisis
(MA). Primero, cada investigador valora de manera autónoma, mientras que la selección final se hace
en equipo.
4. Evaluar minuciosamente la homogeneidad-heterogeneidad de las unidades o investigaciones a consi-
derar.
5. Elaborar una guía de los datos de los estudios escogidos que deben ser considerados para ser procesa-
dos mediante el metaanálisis.
6. Combinar los resultados obtenidos y asegurar la calidad de los datos y su procesamiento estadístico
adecuado (puede ser en matrices, procedimientos estadísticos, bases de datos comparativas, etcétera).
7. Preferentemente utilizar datos provenientes de muestras aleatorias.

El análisis estadístico general del modelo de efectos fijos (no existe heterogeneidad, hay homogenei-
dad o las investigaciones que se estiman muestran un efecto uniforme, debido al uso de un mismo trata-
miento), utiliza el método de Mantel-Haentzel-Peto.
Si los estudios son heterogéneos al mostrar el efecto ante un tratamiento (modelo de efectos aleato-
rios), se utiliza el método de Cochran-Dersimonian-Laird (Céspedes, 1995).
En general, se obtiene para las estadísticas calculadas, el tamaño del efecto (Nugent, 2009; Wiersma
y Jurs, 2008 y Glass, 1976), el cual se revisó en el capítulo 10 del libro impreso. Recordamos que es una
medida de la “fuerza” de la diferencia de las medias u otros valores considerados (Creswell, 2013a). Resulta
ser una medida en unidades de desviación estándar. Su cálculo fue ejemplificado con la prueba t.
Existen diversos programas computacionales para el metaanálisis, entre los cuales se encuentran los
siguientes:
• RevMan®: The Cochrane Collaboration’s Review Manager. The Cochrane Collaboration (tiene ver-
sión en español).
• BUGS y WinBUGS.
• SAS® (programa ya comentado, en su página existe un subprograma para metaanálisis).
• STATA ®.
• SPSS®, entre otras aplicaciones del programa SPSS MACRO.
• MetaWin.
Y otros muchos que puede buscar vía disparador (o motor de búsqueda) en internet.

EJEMPLOS DE ESTUDIOS BASADOS EN DATOS SECUNDARIOS
Shu-li et al. (2008) efectuaron una investigación para desarrollar un modelo que predijera la permanencia
de personas ancianas en su hogar (en lugar de acudir a asilos, por ejemplo), utilizando datos secundarios
de 9 879 individuos de la base de información pública de Estados Unidos: “The National Home and
Hospice Care Survey 2000 (NHHCS 2000)”. Descubrieron que el principal predictor de la permanencia
es que la persona viva con familiares. Asimismo, Smith (2009) se fundamentó en análisis de datos secun-
darios para evaluar las inequidades en la educación británica entre escuelas.
Hernández-Sampieri et al. (2008) realizaron un estudio de mercado utilizando datos secundarios con
la finalidad de indagar sobre la conveniencia de abrir clínicas de cirugía estética y plástica en México.
Mediante búsquedas en diversas fuentes de internet, medios impresos (revistas y diarios de circulación
nacional) y bases de datos, lograron ubicar a las principales clínicas que operaban a nivel nacional y en las
regiones y ciudades más pobladas del país (Ciudad de México, Monterrey, Guadalajara, Tijuana y Puebla),
60       Capítulo 7  Recolección de datos cuantitativos. Segunda parte

establecer los precios de sus servicios, determinar el mercado potencial y sus características (por ejemplo,
número de cirugías que se practicaron durante el último año, interés por practicarse una cirugía plástica,
preocupación por la estética personal…), evaluar las apelaciones de su publicidad y otras cuestiones. Una
encuesta hubiera arrojado resultados más precisos, pero también hubiese sido más cara, de tal modo que
se hizo una investigación de acuerdo con el presupuesto del inversionista español. Incluso, los autores le
proporcionaron un análisis del marco jurídico mexicano para abrir y operar tales clínicas.
En derecho, el análisis de datos secundarios es muy importante, porque se consideran resoluciones
judiciales o juicios previos y la indagación va mucho más allá de una simple revisión de antecedentes.
El metaanálisis es muy socorrido en todos los campos. Tal es el caso de las ciencias de la salud. En
epidemiología, por ejemplo, la proliferación de estudios con resultados contradictorios puede afrontarse
con metaanálisis, como ocurre con los informes conflictivos sobre el efecto de la dieta en el riesgo del
cáncer de mama (Thacker y Stroup, 2007). Asimismo, para determinar la eficacia de un procedimiento
quirúrgico o contrastar resultados discordantes de experimentos clínicos (Davis, Li y Leucht, 2009).
Lo y Lo (2013) implementaron un metaanálisis que incluía a 24 estudios para determinar la eficacia
de la enseñanza a través del idioma inglés como método de instrucción. Por su parte, Lin, Niddam y Hsu
(2014), a partir de considerar que la resonancia magnética funcional ha sido ampliamente usada para
investigar la representación del cerebro asociada con el dolor dental evocado por la estimulación pulpal
eléctrica y que los estudios experimentales han sido heterogéneos y con muestras pequeñas, además de que
la representación común del cerebro sobre el dolor dental sigue siendo esquiva, efectuaron un metaanáli-
sis sobre seis investigaciones relacionadas con el dolor dental (n = 87) y sometieron a prueba tres hipótesis:
1) el dolor dental está asociado a la red del “núcleo” relacionado con el dolor; 2) la activación cerebral
vinculada con el dolor es organizada somatotípicamente en la corteza somatosensorial; y 3) el dolor dental
se encuentra asociado con la red cognitiva-afectiva relacionada con el dolor.
Sofi et al. (2014) llevaron a cabo un metaanálisis sobre la correlación entre el insomnio y los padeci-
mientos cardiovasculares, incluyendo en su muestra a 13 estudios (n= 122 501 individuos).
Dos de los colaboradores de esta edición, Roberto Hernández-Sampieri y Sergio Méndez Valencia se
encuentran en proceso de realización de un metaanálisis sobre estudios que vinculan empíricamente el
clima laboral y la cultura organizacional, a partir de investigaciones usadas como ejemplos en la quinta y
sexta ediciones de Metodología de la investigación.
Para profundizar en el metaanálisis en la sociología se recomienda a Roelfs et al. (2013) y un ejemplo
en turismo puede leerse en Castro-Nuño, Molina-Toucedo y Pablo-Romero (2013). Asimismo, para
detallar los aspectos de muestreo en el metaanálisis se sugiere a Valentine, Pigott y Rothstein (2010), y
para errores de muestreo a Marín-Martínez y Sánchez-Meca (2010).

Estudio para el diagnóstico municipal
En las anteriores ediciones de esta obra se integraba un ejemplo para diagnosticar y caracterizar a un
municipio con el fin de elaborar su plan de desarrollo. Regularmente, estos diagnósticos son estudios
mixtos, pero una parte muy importante de sus insumos lo constituyen los datos secundarios, que se gene-
ran con base en indicadores, los cuales han sido desarrollados por diferentes organizaciones dedicadas a la
investigación municipal (por ejemplo: el Instituto Vasco de Estadística; el Centro de Investigación y
Desarrollo Económico de México (CIDE); el Instituto de Estadística de la Comunidad de Madrid; el
Sistema Nacional de Indicadores Municipales (SINIM) de la Unidad de Información Municipal del
Gobierno de Chile; el Instituto Nacional de Estadística, Geografía e Informática en México (INEGI); el
Instituto Brasileiro de Geografía y Estadística; el Sistema Nacional de Información Municipal,
CEDEMUN, de la Secretaría de Gobernación de México; la Federación Nacional de Departamentos de
Colombia; el Departamento de Estadística del Ayuntamiento de Barcelona; etcétera).
Algunos indicadores se aplican a cualquier municipio y son relevantes para todas las entidades pobla-
cionales (número de habitantes, ingreso per cápita, ingresos totales del municipio, gasto total del munici-
pio, inversión total, etc.), mientras que otros indicadores resultan importantes sólo para ciertos municipios
(por ejemplo, los indicadores relativos a la producción agrícola son irrelevantes para un municipio com-
pletamente urbano). Por ello, en cada diagnóstico municipal deben elegirse los indicadores (datos secun-
Metodología de la investigación 61

darios) significativos para la entidad en cuestión.
También, cada provincia, departamento, región o estado genera indicadores a su nivel, lo mismo que
las naciones.
En este centro de recursos en línea: Material complementario ® Documentos ® Documento 3:
“Indicadores”, se incluyen ejemplos de indicadores secundarios municipales que pudieran recolectarse
para realizar un diagnóstico de un municipio, con el fin de que los estudiantes que apenas comienzan en
estos menesteres de la metodología de la investigación los puedan comprender sin mayores complicacio-
nes (se cubren unas cuantas áreas, no su totalidad ni mucho menos). Tampoco son los únicos, ya que hay
miles de ellos. Están agrupados por áreas generales (las cuales también pueden fluctuar según el autor u
otros criterios). Determinados indicadores pueden formar parte de dos o más áreas. Sin polemizar (por-
que cuando se sopesan pueden generar discusiones severas), se presentan en el documento mencionado y
fueron en particular desarrollados para un municipio del Estado de México. Sería interesante como ejer-
cicio que en cada institución se propusieran los que serían los más adecuados para su municipio.

Errores en las mediciones
Esta parte se escribe porque es una pregunta que se nos ha hecho constantemente sobre los tipos de erro-
res en la medición.
Cualquier instrumento de medición tiene un grado de error (recordemos lo señalado en el capítulo 9
del libro y al inicio de este capítulo).
Imaginemos que realizamos la evaluación de la autoestima en un grupo de estudiantes. Si la mido un
día y la vuelvo a medir al día siguiente, y posteriormente a la semana, podemos esperar que las puntuacio-
nes sean las mismas en las tres mediciones. La autoestima como otros atributos no varían a través del
tiempo, a menos que “algo” los haga variar (un estímulo, la maduración de la persona, un suceso de vida,
entre otros). Es decir, si los estudiantes obtuvieron puntuaciones estadísticamente diferentes en las prue-
bas, su desempeño y resultados se debieron a la influencia de otro motivo distinto a su propia autoestima.
Estas otras razones provocan error. El grado en que un instrumento se encuentra libre de error indica su
confiabilidad. Entre más fiable resulta un instrumento, el investigador puede acercarse a una verdadera
estimación del atributo considerado. Tal “exactitud” se obtiene al minimizar las fuentes de error en la
medida de lo posible y con la estimación del grado de error que permanece. Pues bien, hay dos tipos de
errores que pueden ocurrir: sistemáticos y no sistemáticos. Los primeros maximizan o minimizan el des-
empeño de un instrumento y afectan la confiabilidad y la validez (Mertens, 2010). En el ejemplo de la
autoestima, un método para desarrollarla o fortalecerla (por ejemplo, motivacional o terapéutico) puede
ser visto como una influencia sistemática en la variable o atributo. El efecto del error sistemático en las
respuestas es constante y puede predecirse. Pero los errores no sistemáticos (que conciernen a los investi-
gadores) varían de situación en situación (aplicaciones distintas) y en consecuencia no pueden predecirse (o
es sumamente complejo), pero sí prevenirse.
Estos errores pueden caer en tres categorías: a) personales (dependen de cada individuo, como el
estrés, el cansancio o la motivación), b) condiciones de administración del instrumento (instrucciones
distintas a quienes responden, temperatura ambiental, lenguaje, etc.) y c) modificaciones en los instru-
mentos o tareas (por ejemplo, cambios en ítems o las conductas a observar). Normalmente, la confiabili-
dad es calculada mediante una estadística que compara el desempeño de los mismos individuos en tiempos
diferentes o partes distintas del instrumento y que oscila entre cero y uno, su fin es precisamente ayudar
al investigador a identificar el grado de error que se presenta en la medición, en su consistencia interna;
mediante la fiabilidad y un análisis del investigador se deben hacer transparentes las fuentes de error.
capítulo

8 Análisis estadístico.
Segunda parte

INTRODUCCIÓN
Con este capítulo se complementa el 10 de Metodología de la investigación, 6ª edición, además de que se
actualizó su contenido. Se presentan primero las hipótesis estadísticas, las puntuaciones z, cálculos inferen-
ciales o estimaciones de parámetros y luego el cálculo del coeficiente alfa-Cronbach y el sustento del análisis
de varianza unidireccional. Asimismo, los análisis multivariados y algunas fórmulas para prueba t y chi
cuadrada, así como una secuencia de análisis en Minitab y otra en SPSS. Finalmente, se profundiza en el
concepto de significancia. Desde luego, se asume que se revisó previamente el capítulo en cuestión.1

HIPÓTESIS ESTADÍSTICAS
En el capítulo 10 se señaló que cada prueba estadística obedece a un tipo de hipótesis de investigación e
hipótesis estadística distinta. Las hipótesis estadísticas son la transformación de las hipótesis de investiga-
ción, nulas y alternativas en símbolos estadísticos. Algunas revistas académicas solicitan que se incluyan estas
hipótesis y nos ayudan a conceptualizar ciertas pruebas que se revisaron en el capítulo 10 del texto impreso.
En ocasiones, el investigador traduce su hipótesis de investigación y nula (y cuando se formulan hipótesis
alternativas, también estas) en términos estadísticos. Básicamente hay tres tipos de hipótesis estadísticas, que
corresponden a clasificaciones de las hipótesis de investigación y nula: 1) de estimación, 2) de correlación y
3) de diferencias de medias (Murphy, Myors y Wolach, 2014; Castro-Rea, 2009; Kalaian y Kasim, 2008). A
continuación mencionaremos y daremos ejemplos de cada una de ellas.

Hipótesis estadísticas de estimación

Estas herramientas heurísticas corresponden a las que, al hablar de hipótesis de investigación, se les denomi-
na hipótesis descriptivas de un dato que se pronostica. Sirven para evaluar la suposición de un investigador
respecto del valor de alguna característica o variable en una muestra de individuos, otros seres vivos, sucesos
u objetos, y en una población. Se fundamentan en información previa. Supongamos que, basándose en
ciertos datos, un investigador plantea la siguiente hipótesis: “El promedio mensual de casos de trastorno
1 A lo largo del capítulo se muestran ejemplos sencillos de aplicación o uso de los métodos estadísticos tratados, buscando simplificarlos. El objetivo
de incluirlos es únicamente didáctico para estudiantes no expertos en estadística o en las áreas de conocimiento a las que se refieren. Si el lector
es una eminencia en el campo, le solicitamos que recuerde esta nota y sea comprensible. Además, si puede contribuir a mejorarlos, le pediríamos
amablemente que vía un representante de McGraw-Hill Interamericana nos haga llegar sus recomendaciones para considerarlas, recordando que el
enfoque del libro no es al cálculo o desarrollo de fórmulas respecto de cada método, sino a su utilización e interpretación de resultados.
2       Capítulo 8  Análisis estadístico. Segunda parte Metodología de la investigación 3

psiconeurótico caracterizados por reacción asténica que serán atendidos en los hospitales de la ciudad de Hipótesis estadísticas de la diferencia de medias u otros valores
Linderbuck durante el próximo año resultará mayor a 20”. Además, desea transformar esta hipótesis de
investigación en una hipótesis estadística. Lo primero que debe hacer es analizar cuál es la estadística a la En estas hipótesis se compara una estadística entre dos o más grupos. Supongamos que un investigador
que su hipótesis hace referencia (en el ejemplo se trata de un promedio o media mensual de casos atendi- plantea la siguiente pregunta de estudio: ¿Difieren los periódicos Télex y Noticias en cuanto al promedio
dos). El segundo paso consiste en encontrar cómo se simboliza esa estadística (promedio se simboliza de editoriales mensuales que dedicaron, durante el último año, al tema del terrorismo internacional?2 Su
como X  ). El tercer paso consiste en transformar la hipótesis de investigación en una forma estadística: hipótesis de investigación podría ser: “Existe una diferencia entre el promedio de editoriales mensuales
que dedicó, durante el último año, al tema del terrorismo internacional el diario Télex, y el que dedicó el
Hi: X  > 20 (“el promedio mensual de casos atendidos durante el próximo año será mayor a 20”). diario Noticias”. La estadística que se compara entre los grupos (editoriales de Télex, un grupo, y editoria-
les de Noticias, otro grupo) es el promedio mensual ( X   ). La hipótesis estadística se formularía así:
La hipótesis estadística nula sería la negación de la hipótesis anterior: es diferente

Ho:  X < 20 (“el promedio mensual de casos atendidos durante el próximo año será menor a 20”).
Hi: X1 ≠ X2 (el promedio del grupo 2: editoriales de Noticias)
Y la hipótesis alternativa podría ser:
(promedio del grupo uno: editoriales de Télex)
Ha:  X = 20 (“el promedio mensual de casos atendidos durante el próximo año será igual a 20”).
La hipótesis nula:
Después, el investigador debe comparar el promedio estimado por la hipótesis con el promedio actual
de la muestra que seleccionó. La exactitud de su estimación se evalúa con esta comparación. Además, Ho: (“No hay diferencia entre los promedios de los dos grupos de editoriales”).
como señalan Black y Champion (1976), algunos investigadores consideran las hipótesis estadísticas de
estimación como hipótesis de diferencia, pues en última instancia lo que se evalúa es la diferencia entre Con otra estadística (porcentaje) y tres grupos, se obtendrían hipótesis estadísticas como las siguientes:
un valor planteado en la hipótesis y un valor observado en una muestra.
La estimación de estas hipótesis no se limita a promedios, ya que puede incluirse cualquier estadística: Hi: %1 ≠ %2 ≠ %3 (“Los porcentajes de los tres grupos son distintos”).
porcentajes, medianas, modas, etc. (Crosby et al., 2006). Su valor radica en que sirven para perfecionar Ho: %1 = %2 = %3 (“No hay diferencias”).
pronósticos con respecto a las variables a las que se refieren.

Hipótesis estadísticas de correlación Nota: los grupos pueden ser métodos de producción y la variable de contraste puede ser la productivi-
Estas hipótesis tienen por objetivo traducir en términos estadísticos una correlación entre dos o más varia- dad; o bien, grupos a los que se les administran distintos medicamentos y la variable a comparar, la
bles. El símbolo de una correlación entre dos variables es “r” (minúscula), y entre más de dos variables “R” reducción de los niveles de ácido úrico; métodos de enseñanza y aprendizaje, etcétera.
(mayúscula). La hipótesis “a mayor cohesión en un grupo, mayor eficacia en el logro de sus metas prima-
rias”, se traduciría tal como se muestra en el esquema. PUNTUACIONES z
Hi: r x y ≠ 0 (no es igual a cero o, lo que es lo Las puntuaciones z son transformaciones que se pueden hacer a los valores o las puntuaciones obtenidas
mismo, ambas variables están con el propósito de analizar su distancia respecto de la media, en unidades
correlacionadas) de desviación estándar. Una puntuación z nos indica la dirección y el Puntuación z Medida que indica la direc-
La correlación entre dos variables grado en que un valor individual obtenido se aleja de la media, en una ción y el grado en que un valor individual
(cohesión y eficacia) escala de unidades de desviación estándar (Shapiro, 2008 y Tacq, 2003). se aleja de la media, en una escala de
unidades de desviación estándar.
Como mencionan Nie et al. (1975), las puntuaciones z son el método que
La hipótesis nula se traduciría:
más se utiliza para estandarizar la escala de una variable medida en un
nivel por intervalos.
Ho: rxy = 0 (Las dos variables no están correlacionadas; su correlación es cero).
X−X
Su fórmula es: z=
Otro ejemplo:   s
 
donde X es la puntuación o el valor que se desea transformar,  X es la media de la distribución y s,
Hi: Rxyz ≠ 0 (La correlación entre las variables autonomía en el trabajo, variedad de las tareas desempe-
la desviación estándar de esta. El resultado z es la puntuación transformada en unidades de desviación
ñadas y motivación intrínseca no es igual a cero. Es decir, las tres variables “x”, “y”, “z” están asociadas).
estándar.
Ho: Rxyz = 0 (No hay correlación)
Supongamos que en una distribución de frecuencias obtuvimos una media de 60 y una desviación
estándar de 10, y deseamos comparar una puntuación de “50” con el resto de la distribución. Para ello,
Nota: si usted está estudiando métodos de investigación, sustituya las variables anteriores por otras de su
propio campo o área (presión arterial, peso corporal, aceleración, masa, inteligencia emocional, autoesti-
ma, aprendizaje, etcétera). 2 Nombres completamente ficticios.
4       Capítulo 8  Análisis estadístico. Segunda parte Metodología de la investigación 5

transformamos esta puntuación o tal valor en una puntuación z. comparan) (Delbaere et al., 2007). No debe olvidarse que, específicamente, los elementos de la fórmula
Tenemos que: X = 50 son la media y la desviación estándar que corresponden al valor que se desea transformar (de su misma
X  = 60 distribución). También, las puntuaciones z sirven para analizar distancias entre puntuaciones de una mis-
s = 10 ma distribución y áreas de la curva que abarcan tales distancias, o para evaluar el desempeño de un grupo
de participantes en varias pruebas. Las puntuaciones z son un elemento descriptivo adicional que se agre-
La puntuación z correspondiente a un valor de “50” en esa distribución de frecuencias es: ga para analizar nuestros datos (Babbie, 2014).
50 − 60
z= = −1.00
10 ESTIMACIÓN DE PARÁMETROS: UN EJEMPLO CON LA MEDIA
  POBLACIONAL
Podemos decir que el valor “50” se localiza a una desviación estándar por debajo de la media de la
distribución (el valor “30” está a tres desviaciones estándar por debajo de la media). En el capítulo 10 del texto impreso se mencionó que una de las funciones de la estadística inferencial es
Estandarizar los valores permite comparar puntuaciones de dos distribuciones diferentes (la forma de estimar parámetros; pues bien, cuando se calcula la media de una muestra y no estamos muy seguros de
medición es la misma, aunque se trata de distribuciones distintas). Por ejemplo, podemos contrastar una su representatividad podemos seguir un procedimiento para comprobar si nuestra hipótesis respecto de la
distribución obtenida en una preprueba con otra obtenida en una posprueba (en un contexto experimen- media poblacional es aceptada o rechazada.3 Lo anterior es para responder a la siguiente pregunta: ¿qué
tal). Supongamos que se trata de un estímulo que incrementa la productividad. En la preprueba un tra- hacemos para ver si nuestra hipótesis sobre la media poblacional es aceptada o rechazada? Pero antes de
bajador mostró una productividad de 130 (la media del grupo fue de 122.5 y la desviación estándar de estudiar el procedimiento, es necesario hacer las siguientes consideraciones:
10). En la posprueba obtuvo 135 (la media del grupo fue de 140 y la desviación estándar de 9.8). ¿Mejoró a) La distribución muestral es una distribución normal de puntuaciones z, es decir, la base de la curva
la productividad del trabajador? En apariencia, la mejoría no es considerable. Si no transformamos las dos está conformada por unidades de desviación estándar.
calificaciones en puntuaciones z no es posible asegurarlo porque los valores no pertenecen a la misma b) Las puntuaciones z son distancias que indican áreas bajo la distribución normal. En este caso, áreas
distribución. Por ello, transformamos ambos valores a puntuaciones z y los convertimos a una escala de probabilidad.
común donde la comparación es válida. El valor de 130 en productividad en términos de unidades de c) El área de riesgo es tomada como el área de rechazo de la hipótesis; por el contrario, el área de con-
desviación estándar es igual a: fianza, como el área de aceptación de la hipótesis.
130 −122.5 d) Se habla de una hipótesis acerca del parámetro (en este caso, media poblacional).
z= = 0.75
10.0
Por su parte, el valor de 135 corresponde   a una puntuación z de: Si partimos de estas consideraciones, el procedimiento es:
135−140 1. Sobre bases firmes (revisión de la literatura e información disponible), establecer una hipótesis acerca
z= = −0.51
9.8 del parámetro poblacional. Por ejemplo: el promedio de horas diarias que se exponen los niños de la
Como observamos, en términos absolutos   135 es una mejor puntuación que 130, pero no en térmi- ciudad de Valladolid a la televisión en fin de semana es de 3.0 horas (media poblacional hipotética).
nos relativos (en relación con sus respectivas distribuciones). 2. Definir el nivel de significancia. Por ejemplo, 0 .05 o 5%.
La distribución de puntuaciones z no cambia la forma de la distribución original, pero sí modifica las 3. Recolectar los datos en una muestra representativa. Vamos a suponer que obtuvimos una media de
unidades originales a las que convierte en “unidades de desviación estándar” (Babbie, 2014; Taylor, 2007; 2.9 horas y una desviación estándar de 1.2 horas; la muestra incluyó 312 niños.
Wright, 1979). La distribución de puntuaciones z tiene una media de 0 (cero) y una desviación estándar 4. Estimar la desviación estándar de la distribución muestral de la media utilizando la siguiente fórmula:
de 1 (uno). La figura 8.1 muestra la distribución de puntuaciones z.
  Figura 8.1  Distribución de puntuaciones z. Para X  :

en la cual  S x es la desviación estándar de la distribución muestral de la media, s representa la desvia-
ción estándar de la muestra y n es el tamaño de la muestra.

En el ejemplo

5.
Transformar la media de la muestra en una puntuación z, en el contexto de la distribución muestral,
-3z -2z -1z 0 +1z +2z +3z con una variación de la fórmula ya conocida para obtener puntuaciones z:

Las puntuaciones z también sirven para comparar mediciones de distintas pruebas o escalas aplicadas 3 En este ejemplo se utiliza la media, tal vez el caso más conocido, pero puede ser cualquier otro parámetro poblacional.
a los mismos participantes (los valores obtenidos en cada escala se transforman en puntuaciones z y se
6       Capítulo 8  Análisis estadístico. Segunda parte Metodología de la investigación 7

donde X es la media de la muestra (recordemos que la distribución muestral es de medias y no de
puntuaciones), X  es la media hipotética de la distribución muestral (parámetro poblacional),  S x es    S x = 0.0246
la desviación estándar de la distribución muestral de medias. Así, tenemos: z = 40.65
2.9− 3.0
La media está situada a más de 40 desviaciones estándares de la media; se localiza en la zona crítica
z= = −1.47 (más allá de 1.96 desviaciones estándares): rechazar la hipótesis.
    0.0679
6. En la tabla de áreas bajo la curva normal (ver apéndice 4, tabla 1, de este centro de recursos en línea o
en STATS®), buscar aquella puntuación z que deje a 25% por encima de ella, que es 1.96. En la tabla ¿POR QUÉ ES IMPORTANTE OTRO CONCEPTO PARA ESTIMAR
del apéndice 4 se presenta la distribución de puntuaciones z, sólo la mitad, pues debemos recordar PARÁMETROS: EL INTERVALO DE CONFIANZA?
que es una distribución simétrica y se aplica igual a ambos lados de la media. Así se incluye en los
textos de estadística. Se busca 2.5%, porque la tabla sólo abarca la mitad de la distribución y el riesgo Se ha hablado de la distribución muestral por lo que respecta a la prueba de hipótesis, pero otro procedi-
que afrontamos es de 5% (2.5% del extremo de cada lado). La tabla mencionada contiene cuatro miento de la estadística inferencial es construir un intervalo donde se localiza un parámetro (Healey,
columnas: la primera indica puntuaciones z; la segunda expresa la distancia de la puntuación z a la 2014; Vaish, 2008 y Wiersma y Jurs, 2008). Por ejemplo, en lugar de pretender probar una hipótesis
media; la tercera, el área que está por debajo de esa puntuación desde el comienzo de la distribución, acerca de la media poblacional, puede buscarse un intervalo donde se ubique dicha media. Esta tarea
como se muestra en la gráfica: requiere un nivel de confianza, al igual que en la prueba de hipótesis inferenciales. El nivel de confianza
es al intervalo de confianza lo que el nivel de significancia es a la prueba de hipótesis. Es decir, se trata de
una probabilidad definida de que un parámetro se va a ubicar en un determinado intervalo. Recordemos
que los niveles de confianza —expresados en porcentajes— más comunes en la investigación son 0.95 y
0.99 (.05 y .01). Su sentido es similar al ya comentado: si es de 0.95 quiere decir que tenemos 95% en
favor de que el parámetro se localice en el intervalo estimado, contra 5% de que se ubique en un interva-
Z lo equivocado. El nivel de 0.99 señala 99% de probabilidad de seleccionar el intervalo adecuado. Tales
niveles de confianza se expresan en unidades de desviación estándar. Una vez más se acude a la distribu-
ción muestral, concretamente a la tabla de áreas bajo la curva normal (apéndice 4, tabla 1 de este centro
Por su parte, la cuarta señala el área que está por encima de esa puntuación:
de recursos en línea o en STATS® “Áreas bajo la curva normal”), y se elige la puntuación z correspondien-
te al nivel de confianza seleccionado. Una vez hecho esto, se aplica la siguiente fórmula:
( )(
Intervalo  de  confianza = estadígrafo+   Puntuación  z  que  expresa  el  nivel  de  confianza Desviación  estándar  de  la  distribución  muestal  correspondiente
   
)
En la fórmula, el estadígrafo es la estadística calculada en la muestra, la puntuación z es 1.96 con un
nivel de 0.95 y 2.58 con un nivel de 0.99, en tanto que el error estándar depende del estadígrafo en cues-
tión. Veámoslo con el ejemplo de la media en el caso de la exposición diaria a la televisión (en fin de
Z semana) de los niños de Valladolid:
Media = 2.9 horas
Las áreas se expresan en proporciones. Lo que buscamos es una puntuación z que deje por enci- s = 1.2 horas
ma un área de 0.0250 o 2.5% (la encontramos en la cuarta columna de la tabla); esta puntuación z    S x = 0.0679 (desviación estándar de la distribución muestral de la media).
es de 1.96. Siempre que nuestro nivel de significancia sea 0.05, tomamos la puntuación z de 1.96. Nivel de confianza = 0.95 (z = 1.96)
7. Comparar la media de la muestra transformada a puntuación z con el valor 1.96; si es menor, aceptar Intervalo de confianza = 2.9 ± (1.96) (0.0679)
la hipótesis; si es mayor, rechazarla. Veamos el ejemplo: Intervalo de confianza = 2.9 ± (0.133)
Intervalo de confianza: la media poblacional está entre 2.767 y 3.033 horas, con 95% de probabili-
Media  de  la  muestra  transformada  a  z Nivel  de  significancia  del  0.05 dades de no cometer error.
    1.47   ±1.96
Decisión: aceptar la hipótesis a un nivel de significancia de 0.05 (95% a favor y 5% de riesgo de come- CÁLCULO DEL COEFICIENTE DE CONFIABILIDAD (FIABILIDAD) ALFA-
ter un error).
CRONBACH
En los capítulos 9 y 10 se definió el coeficiente alfa de Cronbach (∝), así como sus usos e interpretación.
Si la media obtenida al transformarse en z hubiera sido: 3.25, 7.46 o un valor mayor → rechazar
Los programas de análisis estadístico como SPSS, Minitab, SAS y otros, lo incluyen y calculan instantá-
la hipótesis.
neamente. Sin embargo, para quienes no tienen acceso a estos programas, presentamos la forma de obte-
nerlos. De acuerdo con Carmines y Zeller (1988, pp. 44 y 45), así como Barchard (2006) y Corbetta
Veamos un ejemplo de rechazo de la hipótesis: (2003), existen tres procedimientos para determinar el coeficiente “∝” o alfa:
Media de la muestra = 2.0
1. Sobre la base de la varianza de los ítems, con la aplicación de la siguiente fórmula:
Desviación estándar de la muestra = 0.65
n = 700
8       Capítulo 8  Análisis estadístico. Segunda parte Metodología de la investigación 9

⎡ k ⎤ ⎡ ∑ i=1 Si ⎤
k 2

α=⎢ ⎥ ⎢1− ⎥
⎣ k −1 ⎦⎣⎢ S 2
⎥ 4(0.494)
   
t
⎦ α=
  1+ 0.494(4 −1)
en la cual:
1.98
α=
k = número de ítems de la escala 2.48
Si2 = suma de la varianza de los ítems  α = 0.798
!!  
S   t2 = varianza total  α = 0.80  (al  cerrar  la  cifra)
!! Este es un coeficiente aceptable, pero debemos recordar que todos los ítems de la escala deben
 
O bien con la fórmula: estar medidos en intervalos o razón.
3. Mediante otra fórmula que se basa en la correlación promedio (Corbetta, 2003, p. 238).
Se usa la siguiente fórmula: nr
α=
!! 1+ r(n −1)
En donde N representa el número de ítems de la escala, “∑s2 (Y1)”es igual a la sumatoria de las varian-  
en la cual n representa el número de ítems o elementos de la escala y r es su correlación promedio.
zas de los ítems y “s2x” equivale a la varianza de toda la escala.
2. Sobre la base de la matriz de correlación de los ítems. El procedimiento sería:
a) Aplicar la escala.
RUTA DEL ANÁLISIS MULTIVARIADO
b) Obtener los resultados. Tal como se señaló en la obra impresa, particularmente en el capítulo 10, el análisis de los datos cuantita-
c) Calcular los coeficientes de correlación bivariados r de Pearson entre todos los ítems (todos contra tivos es un proceso de toma de decisiones respecto a qué métodos concretos y técnicas específicas se utili-
todos de par en par). zarán para responder a las preguntas y cumplir con los objetivos de investigación que incluye: determinar
d) Elaborar la matriz de correlación con los coeficientes obtenidos. Por ejemplo: la confiabilidad y validez del instrumento de medición (o instrumentos, si son varios); eliminar reactivos,
valores o indicadores que generan error o afectan la confiabilidad y validez de la medición (de cada instru-
Ítems
mento); analizar la relación entre los ítems, valores o indicadores que integran cada instrumento de medi-
1 2 3 4 ción; explorar los datos a través del análisis descriptivo de las variables y evaluar las hipótesis planteadas
1 — 0.451 0.399 0.585 mediante la revisión minuciosa de los resultados del análisis estadístico inferencial de los datos. Así, se
2 ya fue calculado — 0.489 0.501 realizan tres clases de análisis estadístico básico:
3 ya fue calculado ya fue calculado — 0.541 a) Análisis exploratorios.
4 ya fue calculado ya fue calculado ya fue calculado — b) Análisis descriptivos.
c) Análisis inferenciales.
Los coeficientes que se mencionan como “ya fue calculado” se ubican en la parte inferior de las líneas Por lo regular, los análisis exploratorios y descriptivos anteceden a los inferenciales. Lo primero que
horizontales (guiones). Es decir, cada coeficiente se incluye una sola vez y se excluyen los coeficientes se debe hacer es verificar que las mediciones hayan sido válidas y confiables, porque si no lo fueron, todo
que vinculan al ítem o puntuación consigo misma (1 con 1, 2 con 2, 3 con 3 y 4 con 4). lo demás no tiene sentido debido a que estaríamos analizando información sobre una base errónea o con
e) Se calcula p (promedio de las correlaciones). datos inconsistentes e inválidos, contaminados de error. En este caso, determinamos la confiabilidad
  mediante una técnica apropiada, generalmente la obtención de un coeficiente, el cual depende del nivel
p=
∑P de medición de la variable analizada4 (por ejemplo, si los datos son de intervalo o razón, el coeficiente alfa
  NP de Cronbach). Asimismo, consideramos toda la evidencia disponible sobre la validez (por ejemplo, para
!∑
P es la sumatoria de los valores de las correlaciones y NP el número de correlaciones no la validez concurrente, un coeficiente de correlación entre la variable medida y el criterio externo; y para
repetidas o no excluidas. la validez de constructo, si los datos son de intervalos o razón, les aplicamos el análisis de factores por
 
componentes principales y/o escalamiento multidimensional). Con ello, exploramos la naturaleza y
0.451+ 0.399+ 0.585+ 0.489+ 0.541+ 0.501 estructura de nuestros datos, eliminamos ítems o reactivos que producen error (es decir, no consideramos
p=
    6 sus datos para los análisis descriptivos e inferenciales).
p
    = 0.494 Los análisis estadísticos exploratorios nos señalan cómo se agrupan o dispersan determinados datos,
constructos, variables, dimensiones y categorías, pero también los relacionan. Constituyen técnicas que
f) Se aplica la fórmula siguiente: pueden ser aplicadas a datos que representan conglomerados, factores, dimensiones o agrupamientos,
involucran básicamente las tareas de clasificar datos en grupos (donde cada grupo representa unidades
Np
α= —casos, observaciones, dimensiones, categorías o variables— que son relativamente similares entre sí y
!! 1+ p(N −1) diferentes de las unidades de otro u otros grupos) y evaluar la naturaleza de las relaciones entre tales grupos
Donde N es el número de ítems y  p el   promedio de las correlaciones entre ítems.
En el ejemplo: 4 Recordemos que todos los análisis estadísticos dependen del nivel de medición de la variable o variables involucradas.
10       Capítulo 8  Análisis estadístico. Segunda parte Metodología de la investigación 11

en términos de independencia. Estos análisis no distinguen entre las variables independientes y depen-
dientes, sino que más bien analizan simultáneamente el conjunto completo de relaciones interdependien-   Figura 8.2  Ruta del análisis cuantitativo (toma de decisiones).
tes (valoran la similitud entre grupos examinando todos los vínculos).
Los análisis descriptivos nos proporcionan información sobre el comportamiento de la muestra en las
variables medidas: valores numéricos que las representan (distribuciones de frecuencias, medidas de ten-
dencia central y de la variabilidad). Nos sirven para organizar y resumir los datos con la finalidad de
profundizar en el entendimiento de una o más variables y los casos estudiados.
Mientras que los análisis de estadística descriptiva generan propiedades numéricas o valores en la
muestra, los análisis inferenciales estiman parámetros (valores de la población o universo) a partir de esta-
dísticas calculadas en la muestra. Es decir, nos sirven para generalizar los resultados al universo o pobla-
ción (predicción de parámetros) y probar hipótesis.
Para someter a escrutinio empírico cada hipótesis, se selecciona una o varias pruebas o métodos esta-
dísticos que dependen de varios factores, entre ellos —como ya se señaló— el nivel de medición de las
variables (análisis paramétricos y no paramétricos) y el número de variables involucradas (univariados o
multivariados).
Recordemos que los análisis paramétricos se basan en ciertas premisas o supuestos:
1. La variable dependiente debe tender hacia una distribución normal.
2. Las mediciones de las variables deben ser independientes entre sí.
3. Las poblaciones o universos involucrados en los análisis deben poseer una varianza igual o muy similar.
4. Las variables consideradas deben estar medidas en un nivel por intervalos o razón.

Con frecuencia, en ciencias sociales no se cubren completamente tales criterios (por ejemplo, las
mediciones sobre percepciones y las escalas de actitudes se asumen como de intervalo cuando en realidad
son ordinales), por lo cual los números son relativos y más bien indican tendencias hacia ciertos sectores Fuente: Roberto Hernández-Sampieri
de las mediciones. Asimismo, en determinadas ocasiones se recurre a la estadística no paramétrica que no
necesita cumplir con tales requisitos (por ejemplo, no requiere que la distribución sea normal). Muchos
investigadores prefieren “considerar” sus mediciones como de intervalos porque las pruebas paramétricas   Figura 8.3  Familia del modelo lineal general de análisis.
son estadísticamente más “poderosas” (por ejemplo, detectan con mayor precisión las diferencias entre
grupos o relaciones entre variables cuando ambas realmente existen) (Onwuegbuzie y Combs, 2010).
Este camino o secuencia, que se muestra en la figura 8.2, implica, como ya se señaló, ir tomando
decisiones a medida que se desarrollan los análisis y se obtienen resultados.
La estadística inferencial paramétrica puede dividirse en univariada o multivariada y casi todas las
pruebas o técnicas, con la excepción del análisis discriminante predictivo, son parte de un modelo lineal
general (GLM por sus siglas en inglés). En consecuencia, todas implican correlación (Onwuegbuzie y
Combs, 2010 y Henson, 2000) y relaciones de variación (varianzas), es decir, diversos métodos estadísticos
paramétricos parten de analizar las relaciones entre las varianzas de los constructos o variables que integran
o conforman las hipótesis (cómo fluctúa o se “mueve” una variable en función de otra u otras). Con el fin
de examinar correlaciones o relaciones causales existen varias pruebas aglutinadas en la denominada “fami-
lia” del modelo lineal general de análisis (ver figura 8.3). Algunas fueron revisadas en el capítulo 10 de la
obra impresa, en particular las univariadas y bivariadas, y ahora en el presente capítulo presentaremos
algunos de los métodos multivariados.5
De acuerdo a la figura 8.3, podemos apreciar —por ejemplo— que los análisis de correlación son una
derivación o parte de la regresión, la cual, a su vez, es un tipo especial de correlación canónica, que en
realidad resulta una clase de análisis de vías. Ahora bien, no necesariamente cuando ejecutamos un análisis
de correlación implica que vamos a efectuar el de regresión, pero a la inversa esto no ocurre, es decir, cuan-
do se lleva a cabo un análisis de regresión, estimamos las correlaciones pertinentes. De manera similar, un e
nte: Roberto Hernández-Sampieri
análisis canónico puede usarse para llevar a cabo un análisis de regresión o aun un análisis de correlación;
por su parte, un análisis de vías o rutas puede utilizarse para uno canónico y así sucesivamente. rios). Así, si asumimos que se cumplen las premisas de la estadística paramétrica y conocemos el número
Una característica de varios de los métodos que integran el modelo lineal general de análisis es que de variables independientes y dependientes y sus niveles de medición, podemos seleccionar el análisis más
involucran una o más variables independientes (predictores) y una o más variables dependientes (crite- apropiado de acuerdo al planteamiento del problema y las hipótesis establecidas.
5 No se muestran todos y los que se presentan se centran en su utilidad e interpretación general.
12       Capítulo 8  Análisis estadístico. Segunda parte Metodología de la investigación 13

SUSTENTO DEL ANÁLISIS DE VARIANZA UNIDIRECCIONAL eleva al cuadrado cada una de estas desviaciones, y luego se suman. Finalmente se sopesa el número de
individuos en cada grupo y la media cuadrática se obtiene con base en los grados de libertad intergrupales
En el capítulo 10 del texto impreso se explicó que el ANOVA unidireccional produce un valor F, el cual (no se determina con base en el número de puntuaciones de toda la muestra). Para determinar la media
se basa en una distribución muestral, conocida como distribución F, valor que compara las variaciones en cuadrática dentro de los grupos primero se calcula la desviación de cada puntuación respecto de la media
las puntuaciones debidas a dos diferentes fuentes: variaciones entre los grupos que se contrastan y varia- de su grupo; posteriormente, esta fuente de variación se suma y se combina para obtener una media de la
ciones dentro de los grupos. varianza intragrupal de todas las observaciones, con base en los grados de libertad totales (Martin y
Si los grupos difieren realmente entre sí, sus puntuaciones variarán más de lo que puedan variar las Bridgmon, 2012; The SAGE Glossary of the Social and Behavioral Sciences, 2009w; Doncaster y Davey,
puntuaciones entre los casos o integrantes de un mismo grupo. Veámoslo con un ejemplo cotidiano. 2007; Field, 2006 y Wright, 1979).
Tenemos tres familias A, B y C. La familia A está integrada por Felipe, Angélica, Elena y José Luis. La Las fórmulas de la media cuadrática son:
familia B está compuesta por Chester, Pilar, Íñigo, Alonso y Carlos. Y la familia C está integrada por
Suma de cuadrados entre grupos
Rodrigo, Laura y Roberto. ¿Qué esperamos? Pues que los integrantes de una familia se parezcan más entre Media cuadrática entre grupos =
sí que a los miembros de otra familia. Esta conclusión se graficaría como en la figura 8.4. Grados de libertad entre grupos

Los grados de libertad entre grupos = K-1 (donde K es el número de grupos).
  Figura 8.4  Ejemplo de las variaciones de los grupos comparados.
Suma de cuadrados intragrupos
Media cuadrática dentro de los grupos =
Grados de libertad intragrupos

Los grados de libertad intragrupos = n - K (n es el tamaño de la muestra, la suma de los casos o indi-
viduos de todos los grupos, y K, recordemos, es el número de grupos).
Pues bien, cuando F resulta significativa, quiere decir que los grupos difieren “significativamente”
entre sí (en términos estadísticos), es decir, se acepta la hipótesis de investigación y se rechaza la hipótesis
nula.
Cuando se efectúa el análisis de varianza por medio de un programa computacional estadístico, se
genera una tabla de resultados básicamente con los elementos de la tabla 8.1.

  Tabla 8.1  Elementos para interpretar un análisis de varianza unidireccional realizado en SPSS.

Fuente de variación Sumas de Grados de libertad Medias cuadráticas Razón F Significancia
(Source) cuadrados (Degrees of (Mean squares) (F-ratio) de F
(Sums of squares) freedom) (F prob.)

Entre grupos SS entre gl entre SS entre/gl entre ∝
MC !entre
Es decir, esperamos homogeneidad intrafamilias y heterogeneidad interfamilias. ¿Qué sucedería si los (between groups)
miembros de las familias se parecieran más a los integrantes de las otras familias que a los de la suya pro- !! MC !intra
 
pia? Que no hay diferencia entre los grupos (en el ejemplo, familias). Intragrupos SS intra gl intra SS intra/gl intra
Esta misma lógica se aplica a la razón F, la cual nos indica si las diferencias entre los grupos son mayo- (within groups)
res que las diferencias intragrupos (dentro de estos). Estas diferencias se miden en términos de varianza.
Total SS entre gl entre +
La varianza es una medida de dispersión o variabilidad alrededor de la media y se calcula en términos de
SS intra gl intra
desviaciones elevadas al cuadrado. Recuerde que la desviación estándar es un promedio de desviaciones
respecto de la media ( X − X ) y la varianza es un promedio de desviaciones respecto de la media elevadas al En Minitab se dan los siguientes elementos:
 
cuadrado. Por eso, la varianza se simboliza como s2 y su fórmula es: Fuente GL (grados SC (suma de MC (media F (valor) P (significancia)
de libertad) cuadrados) cuadrática)
∑(X − X ) 2

n Una vez más, el valor alfa o probabilidad a elegir es 0.05 o 0.01. Si es menor que 0.05 es significativo
!! en este nivel, y si es menor que 0.01 también es significativo en este nivel. Cuando el programa o paque-
  de varianzas, se expresa así:
En consecuencia, la razón F, que es una razón
te estadístico no incluye la significancia se acude a la tabla 3 del apéndice 4 (tabla de la distribución F o en
Media cuadrática entre los grupos STATS® a “Valores de “F” con un nivel de confianza de 0.05 y 0.01”). Esta tabla contiene una lista de
F=
Media cuadrática dentro de los grupos razones significativas (razones F) que debemos obtener para aceptar la hipótesis de investigación en los
  niveles de confianza de 0.05 y 0.01. Al igual que en el caso de la razón t, el valor exacto de F que debemos
obtener depende de sus grados de libertad asociados. Por lo tanto, la utilización de la tabla se inicia al
En esta expresión la media cuadrática implica un promedio de varianzas elevadas al cuadrado. La
buscar los dos valores gl, los grados de libertad entre los grupos y los grados de libertad intragrupos. Los grados
media cuadrática entre los grupos se obtiene al calcular la media de las puntuaciones de todos los grupos
de libertad entre grupos se indican en la parte superior de la tabla, mientras que los grados de libertad
(media total), después se obtiene la desviación de la media de cada grupo respecto de la media total y se
14       Capítulo 8  Análisis estadístico. Segunda parte Metodología de la investigación 15

intragrupos se han colocado al lado izquierdo. El cuerpo de la tabla de la distribución F presenta razones Responde a esquemas como el que se muestra en la figura 8.6.
F significativas en los niveles de confianza de 0.05 y 0.01.
  Figura 8.6  Esquema de un análisis factorial de varianza.
Si F = 1.12
gl entre = 2
gl intra = 60
x1
Este valor F se compara con el valor que aparece en la tabla de la distribución F que es 3.15, pero
como el valor F calculado es menor al de dicha tabla, deberíamos rechazar la hipótesis de investigación y
x2 Y
aceptar la hipótesis nula. Para que el valor F calculado sea significativo debe ser igual o mayor al de la tabla.
xk
ANÁLISIS MULTIVARIADO
En el capítulo 10 del libro, cuando analizamos los principales métodos estadísticos paramétricos, concre-
Esta herramienta constituye una extensión del análisis de varianza unidireccional, solo que incluye
tamente después de revisar el ANOVA unidireccional, nos preguntábamos qué ocurre cuando tenemos
más de una variable independiente. Evalúa los efectos por separado de cada variable independiente y los
diversas variables independientes y una dependiente, varias independientes y dependientes. tal como
efectos conjuntos de dos o más variables independientes.
observamos en diagramas como el que se muestra en la figura 8.5.

  Figura 8.5  Ejemplo con cuatro variables independientes y una dependiente. Variables: dos o más variables independientes y una dependiente.
Nivel de medición de las variables: la variable dependiente (denominada criterio) debe estar medida en
un nivel por intervalos o razón, y las variables independientes (denominadas factores) pueden estar en
Autoestima
de la persona cualquier nivel de medición, pero expresadas de manera categórica.

Interpretación y ejemplo
Edad
Sentido de vida
Hi: “La similitud en valores, la atracción física y la realimentación positiva son variables que inciden en
de la persona la satisfacción sobre la relación en parejas de novios”.
Género
Categorías de las variables: similitud (valores similares-valores no similares), atracción física (alta,
media y baja) y realimentación (positiva-negativa).
Religión Contexto: muestra de parejas de adultos jóvenes (23-29 años) de Santiago de Chile, pertenecientes a
estratos económicos altos (n = 400).

La respuesta era obvia: requerimos de otros métodos estadísticos. Estos son los que revisaremos a El ANOVA efectuado mediante un paquete estadístico computacional como SPSS produjo los siguientes
continuación y una vez más, sobre la base de que existen computadoras y programas como el SPSS, del elementos básicos:
mismo modo centrándonos en los elementos fundamentales de interpretación. • Fuente de la variación (source of variation). Es el factor que origina variación en la dependiente. Si una
fuente no origina variación en la dependiente, no tiene efectos.
¿Qué son los métodos de análisis multivariados? • Efectos principales (main effects). Es el efecto de cada variable independiente por separado; no está
contaminado del efecto de otras variables independientes ni de error. Suele proporcionarse la suma de
Los métodos de análisis multivariado son aquellos en que se analiza la relación entre diversas variables todos los efectos principales.
independientes y al menos una dependiente (Johnson y Wichern, 2013 y Abdi, 2003). Son métodos más • Interacciones de dos direcciones (2-way interactions). Representa el efecto conjunto de dos variables
complejos que requieren del uso de computadoras para efectuar los cálculos necesarios. independientes, aislado de los demás posibles efectos de las variables independientes (individuales o
Su elección también depende del tipo de hipótesis sometida a prueba (el modelo conceptual de rela- en conjunto). Suele proporcionarse la suma de los efectos de todas estas interacciones.
• Interacciones de tres direcciones (3-way interactions). Constituye el efecto conjunto de tres variables
ciones entre variables implicado en el planteamiento del problema), el objetivo de análisis (resultados independientes, aislado de otros efectos. Suele proporcionarse la suma de los efectos de todas estas
pretendidos) y el número de variables involucradas y su nivel de medición (Kleinbaum, Kupper, Nizam y interacciones.
Rosenberg, 2013; Cunnings, 2012; Godby, 2007; Abdi, 2003). • Puede haber efecto de K direcciones, lo cual depende del número de variables independientes.
Primero revisaremos algunos, y al final incluiremos una tabla que resume los más utilizados.
En nuestro ejemplo, tenemos los resultados que se muestran en la tabla 8.2.
¿Qué es el análisis factorial de varianza? ANOVA (análisis de varianza de k
direcciones o varios factores)
Definición: Es una prueba estadística para evaluar el efecto de dos o más variables independientes sobre
una variable dependiente.
16       Capítulo 8  Análisis estadístico. Segunda parte Metodología de la investigación 17

trolada es una característica antecedente que puede variar entre los grupos o influir en los resultados y
  Tabla 8.2  Ejemplo de resultados en el ANOVA. afectar la claridad de las interpretaciones (Babbie, 2014; Spencer, 2013 y Mertens, 2010).
VARIABLE DEPENDIENTE: SATISFACCIÓN EN LA RELACIÓN
Perspectivas o usos: Wildt y Ahtola (1978, pp. 8-9) destacan tres perspectivas del análisis de covarianza:
Fuente de variación Suma de Grados de Medias Razón Significan-
(SOURCE OF VARIA- cuadrados libertad cuadráticas cia de F O
TION) (SUMS OF (DEGREES OF (MEAN SQUA- P (p) A. Perspectiva experimental. Se aplica a aquellas situaciones en que el interés del investigador se centra en
FREEDOM) RES)
SQUARES) las diferencias observadas en la variable dependiente a través de las categorías de la variable indepen-
Efectos principales (main — — — 22.51 0.001** diente (o variables independientes). El experimentador asume que hay otras variables independientes
effects) cuantitativas que contaminan la relación y cuya influencia debe ser controlada (figura 8.7).
Similitud — — — 31.18 0.001**
Atracción — — — 21.02 0.001**   Figura 8.7  Ejemplo de variables independientes que afectan a una dependiente.

Realimentación — — — 11.84 0.004**
X1
Interacción de dos — — — 7.65 0.010*
direcciones Variables
(2-way interactions) independientes X2
categóricas
Similitud — — —
Atracción 4.32 0.040*
Xk
Variable
Similitud
Realimentación
— — —
2.18 0.110
Y dependiente

Atracción — — — Z1
Realimentación 1.56 0.190 Variables
Interacción de tres — — — 8.01 0.020* independientes Z2
direcciones (3-way cuantitativas
interaction) continuas
Zk
Similitud
Atracción — — —
Realimentación Además, el investigador solo se interesa por conocer la relación entre las variables independientes
—Residual — — —
categóricas (Xs) y la variable dependiente (Y). Desea al mismo tiempo remover y controlar el efecto
de las variables independientes cuantitativas no categóricas (continuas) (Zs). Es decir, desea tener un
—Total — — —
esquema como el de la figura 8.8.
Nota: A los estudiantes que se inician en el ANOVA normalmente les interesa saber si las razones “F” resultaron o no
significativas; por lo tanto, sólo se incluyen estos valores. Por ello, los autores les recomiendan concentrarse en dichos
  Figura 8.8  Ejemplo de control de variables independientes no categóricas.
valores y evitar confusiones. Desde luego, el investigador experimentado acostumbra estudiar todos los valores.
** Razón “F” significativa al nivel del 0.01 (p < 0.01)
* Razón “F” significativa al nivel del 0.05 (p < 0.05) X1

Como podemos ver en la tabla 8.2, la similitud, la atracción y la realimentación tienen un efecto Categóricas X2
significativo sobre la satisfacción en la relación. Respecto de los efectos de dos variables independientes
conjuntas, solo la similitud y la atracción tienen un efecto, hay un efecto conjunto de las tres variables Xk
independientes (interacción). La hipótesis de investigación se acepta y la nula se rechaza. Asimismo, se
Variable
recuerda al lector que en el capítulo 5 del presente centro de recursos en línea —Diseños experimentales: Y dependiente
segunda parte—, en series cronológicas, factoriales y cuasiexperimentos (en el apartado sobre diseños facto-

Re otrola
riales) se explica la noción de interacción entre variables independientes. Cabe agregar que el ANOVA es

co
mo
n
un método estadístico propio de los diseños experimentales factoriales. Z1

ve
r
r
Continuas Z2
¿Qué es el análisis de covarianza?
Definición: es un método estadístico que analiza la relación entre dos o más variables independientes y una Zk
variable dependiente, mediante el cual se elimina o controla el efecto de al menos una de las independien-
tes. Similar al ANOVA, excepto que permite tal control. Con frecuencia la variable independiente con-
18       Capítulo 8  Análisis estadístico. Segunda parte Metodología de la investigación 19

El objetivo es “purificar la relación entre las independientes categóricas y la dependiente, mediante el La variable independiente es el tipo de método con tres categorías o niveles (método nuevo, método
control del efecto de las independientes no categóricas o continuas”. tradicional y ausencia de método) y la dependiente es el aprendizaje en computación (medida por una prueba
estandarizada a nivel de intervalos). Se tiene un esquema como el de la figura 8.9.
Recordemos algunos ejemplos de variables independientes categóricas: género (masculino, femenino),
inteligencia (agrupada: alta, media, baja), ingreso (en categorías: menos de un salario mínimo, dos a   Figura 8.9  Esquematización de la relación causal entre las variables del ejemplo.
cuatro salarios mínimos, cinco a 10 salarios mínimos, 11 o más salarios mínimos), tipo de combustible
en una aeronave (combustible 1, combustible 2), medicamento administrado (medicamento A, medi- Tipo de método (X) Aprendizaje (Y)
camento B, medicamento C), presencia-ausencia de un tratamiento experimental, etc. Los niveles de
medición nominal y ordinal son categóricos en sí mismos, mientras que los niveles de intervalos y El investigador sabe que el aprendizaje (su varianza) se puede deber a muchas razones, además del
razón deben transformarse en categorías más discretas. Estos últimos son en sí cuantitativos, continuos método. Es decir, el aprendizaje varía por diversos motivos, lo cual se representa en forma de conjuntos en la
y de categorías múltiples. Por ejemplo, el ingreso en su “estado natural” (pesos, dólares, euros, etc.) figura 8.10.
varía de la categoría cero hasta la categoría (K)k, ya que puede haber millones de categorías.
  Figura 8.10  Representación a la varianza del aprendizaje debido al tipo de método y a otros factores.

Variable categórica: unas cuantas categorías o un rango medio.
Variable continua: muchas categorías (a veces una infinidad).
Variable Variable
independiente: dependiente:
A las mencionadas variables independientes cuantitativas continuas, cuya influencia se controla, se les
método (X) aprendizaje (Y)
denomina “covariables”. Una covariable se incluye en el análisis para remover su efecto sobre la varia-
ble dependiente e incrementar el conocimiento de la relación entre las variables independientes cate-
góricas de interés y la dependiente, lo cual aumenta la precisión del análisis (Van Breukelen, 2010;
Doncaster y Davey, 2007).
Desde esta perspectiva, el análisis de covarianza puede ser concebido primero como un ajuste en la Varianza del aprendizaje
variable dependiente respecto de diferencias en la covariable o las covariables y, posteriormente, como no explicada (que no se
una evaluación de la relación entre las variables independientes categóricas y los valores ajustados de Varianza en común debe al método sino a
entre método y otros factores)
la variable dependiente (Weisberg, 2014; Wildt y Ahtola, 1978). En términos de Creswell (2005): el
procedimiento “ajusta” las puntuaciones en la dependiente para dar cuenta de la covarianza [por aprendizaje
decirlo en términos sencillos: “hace equivalentes a los grupos en la(s) covariable(s)” y controla influen- Por medio del experimento el investigador desea conocer la varianza en común entre método y aprendi-
cias potenciales que pueden afectar a la variable dependiente]. zaje (cuantificarla), la relación X → Y (“pura”). Si los niños son asignados al azar a los grupos del experimento
B. Perspectiva de interés por la covariable. Esta perspectiva se ejemplifica con aquellas instancias en las y estos son de tamaño aceptable, el diseño mismo remueve la influencia de las covariables que pudieran
afectar. Pero si no es factible hacerlo y tiene un diseño cuasiexperimental (grupos intactos), debe remover tal
cuales la intención principal se centra en analizar la relación entre la variable dependiente y la covaria- influencia con el análisis de covarianza (eliminar al mínimo posible la varianza del aprendizaje no explicada),
ble (variable cuantitativa continua) o las covariables. En este caso el enfoque es distinto; la influencia para evitar que las covariables impidan ver con claridad la relación X → Y. Por ejemplo, el nivel educativo
que se remueve es la de las variables independientes categóricas. Primero se controla el efecto (en este tecnológico de los padres puede influir (hace variar al aprendizaje), efecto que debe ser controlado introdu-
caso “contaminante”) de estas variables y después se analiza el efecto “purificado” de las covariables. ciéndolo como covariable. Esto se ilustra una vez más en forma de conjuntos en la figura 8.11.
C. Perspectiva de regresión. En esta tercera perspectiva, tanto las variables independientes categóricas
como las covariables resultan de interés para el investigador, quien puede desear examinar el efecto de   Figura 8.11  Representación de la varianza del aprendizaje debida tanto a la variable independiente
cada variable independiente (todas las covariables y no covariables) y después ajustar o corregir los como a la covariable introducida.
efectos de las demás variables independientes.
En cualquier caso, el análisis de covarianza elimina influencias no deseadas sobre la variable dependiente. Variable
Se puede utilizar en contextos experimentales y no experimentales. La mayoría de las veces la función del dependiente
ANCOVA es “remover” la varianza compartida entre una o más covariables y la dependiente, para así Variable aprendizaje Nivel educativo
independiente (Y) de los padres
valorar en su justa dimensión la relación causal entre la(s) variable(s) independiente(s) de interés y la (covariable)
método (X)
dependiente (Sharma, Durvasula Ployhart, 2012; Creswell, 2005). Veámoslo conceptualmente pero de
forma gráfica con un ejemplo simple.
Ejemplo
Estudio: al investigador le interesa analizar el efecto de un nuevo método de enseñanza de computación para
niños sobre el aprendizaje de esta. La hipótesis es: “El nuevo método de enseñanza de la computación (MA-
Varianza en común: Varianza compartida entre el nivel
RHS) provocará un mayor aprendizaje en los niños que un método tradicional”.
entre método y educativo de los padres y el
Entonces, implementa el siguiente experimento: a un grupo de infantes lo expone al nuevo método
aprendizaje aprendizaje (la cual se controla
de enseñanza de computación (MA-RHS); el segundo grupo aprende con un método tradicional; finalmente,
con el ANCOVA)
un tercer grupo, de control, no recibe ningún tipo de enseñanza en computación.
20       Capítulo 8  Análisis estadístico. Segunda parte Metodología de la investigación 21

Entre más covariables se controlen, más se explicará sobre la varianza común entre el método y el apren- Interpretación: depende de cada caso específico, pero el análisis de covarianza efectuado mediante un
dizaje. programa estadístico computacional produce un cuadro de resultados muy parecido al del análisis de
Lo que el investigador desea también se puede expresar gráficamente en forma causal como en la figura varianza. Los elementos más comunes pueden observarse en la tabla 8. 3.
8.12.
  Tabla 8.3  Ejemplo de elementos comunes de un análisis de covarianza.
  Figura 8.12  Representación del control de la influencia de la covariable.
Fuente de Sumas de Sumas de Grados de Medias Razón F (F) Significancia de F
variación cuadrados cuadrados libertad cuadráticas (Sig.)
Tipo de método Aprendizaje
(Source of y productos ajustadas (Degrees of
variation) cruzados (Sum (Adjusted sum freedom)
of squares and of squares)
Nivel educativo cross products)
ANCOVA
tecnológico de los
padres (covariable) La razón F es, igual que en el análisis de varianza, una razón de varianzas. El razonamiento estadístico
Controlar influencias de la covariable
es el mismo y F se interpreta igual, incluso se utiliza el mismo cuadro de la distribución F (tabla 3, apén-
Otro ejemplo donde puede interesarnos controlar el efecto de la covariable sería: probar si un nuevo dice 4 o en Stats®, a “Valores de F al nivel de confianza de 0.05 y 0.01). Solamente que las inferencias y
combustible es más eficaz para propulsar una aeronave específica que el que se ha utilizado previamente, conclusiones se hacen al considerar que las medias de la variable dependiente, a través de las categorías de
controlando la masa del avión (figura 8.13). las variables independientes, se han ajustado, lo cual elimina el efecto de la covariable o covariables.
  Figura 8.13  Un segundo ejemplo ilustrado del control de la influencia de una covariable.

Variable independiente: Ejemplo
tipo de combustible
utilizado [tipo 1 (nuevo), Variable dependiente:
tipo 2 (previamente propulsión Diseño de investigación que utiliza el análisis de covarianza
utilizado) Hi: “Los trabajadores que reciban realimentación verbal sobre el desempeño de parte de su supervisor
mantendrán un nivel mayor de productividad que los trabajadores que reciban realimentación sobre el desem-
Re ntr

peño por escrito, y más aún que los trabajadores que no reciban ningún tipo de realimentación”.
m ola
co

ov r
er

Covariable: masa
o

Hi: X1 > X2 > X3

O bien, analizar el efecto de dos clases de medicamentos sobre la disminución de la presión arterial, (verbal) (por escrito) (ausencia)
controlando el peso del individuo (figura 8.14).
El investigador plantea un diseño experimental para intentar probar su hipótesis. Sin embargo, no
  Figura 8.14  Ejemplo adicional que ilustra el control de la influencia de la covariable. puede asignar aleatoriamente a los trabajadores a los tres grupos del experimento (pertenecen a equipos
prestablecidos por la empresa). El diseño sería con grupos intactos (cuasiexperimental) y se esquematizaría
así:
Variable independiente:
tipo de medicamento Variable dependiente:
(A y B) presión arterial
G1 X1 X1
Re ont
m ro

G2 X2 X2
c
ov la
er r

Covariable: peso
o

G3 X3

Wildt y Ahtola (1978, p. 13) definen algunos usos del análisis de covarianza:
1. Incrementar la precisión en experimentos con asignación al azar. Asimismo, el investigador presupone que hay un factor que puede contaminar los resultados (actuar
2. Eliminar influencias extrañas o contaminantes que pueden resultar cuando las pruebas o los indivi- como fuente de invalidación interna): la motivación. Diferencias iniciales en motivación pueden invalidar el
estudio. Como la asignación al azar está ausente, no se sabe si los resultados son influidos por dicho factor.
duos no son asignados al azar a las diferentes condiciones experimentales (grupos de un experimen-
Entonces, el experimentador decide eliminar o controlar el efecto de la motivación sobre la productividad para
to). conocer los efectos de la variable independiente tipo de realimentación. La motivación se convierte en cova-
3. Eliminar efectos de variables que confundan o distorsionen la interpretación de resultados en estudios riable. El esquema es el que se muestra en la figura 8.15.
no experimentales.
22       Capítulo 8  Análisis estadístico. Segunda parte Metodología de la investigación 23

  Figura 8.15  Ejemplo en que la motivación es covariable. ¿Qué es el análisis de factores por componentes principales (AFC)?
Realimentación A grandes rasgos, el AFC es un método estadístico multivariado que se utiliza para determinar el número
Productividad (variable
(variable independiente
dependiente) y la naturaleza de un grupo de constructos subyacentes en un conjunto de mediciones. Un constructo es un
categórica de interés) atributo para explicar un fenómeno (Wiersma y Jurs, 2008). En este análisis se generan “variables artifi-
ciales” (denominadas factores) que representan constructos. Los factores se obtienen de las variables origi- <