You are on page 1of 544

1 010 1 59700 .1 2a.

79

Investigación del Comportamiento


/
investigación
del
comportamiento

SEGUNDA EDICION

Fred. N. Kerlinger
New York University

Traducido al español
con la colaboración de
DR. JOSE RAFAEL BLENGIO
JOSE CARMEN PECINA H.

:1
:
NUEVA
EDITORIAL
• •
INTERAMERICANA
México-España-Brasil-Colombia-Ecuador-Venezuela
S. A. de C. V.

México, D. F. 1985
"D. R." © 1975, por NUEVA EDITORIAL INTERAMERICANA, S. A. de C. V.
Cedro 512, México 4, D. F., México

Este libro no puede ser reproducido, total o parcialmente, sin autorización escrita del editor

Primera edición en español 1975

Traducción y adaptación de la segunda edición en inglés de la obra


Foundations of Behavioral Research, by Fred N. Kerlinger

COPYRIGHT UNDER THE INTERNATIONAL COPYRIGHT UNION

© 1973, HOLT, RINEHART ANO WINSTON, INC., NEWYORK

Impreso en México - Printed in Mexico


ISBN 968-25-0039-7(Reimpresión revisada)
ISBN 0-03-085462-S(Edición original)
A Betty, Paul y Stephen
Prefacio

Algunas actividades despiertan en los seres hu- forma de certidumbre inteligente y dedicación emo-
manos más interés, devoción y entusiasmo que cional razonada.
otras. Entre ellas figuran predominantemente la Esta obra se elaboró con el propósito de ayudar a
ciencia y el arte. Tal circunstancia plantea una inte- los estudiantes a entender la naturaleza fundamental
resante y crucial pregunta psicológica a. la que no se del método científico para la resolución de proble-
puede dar una respuesta inequívoca. Lo único que mas. Conforme a tal propósito, se consideran exten-
resulta claro es que, una vez que las personas em- samente los problemas técnicos y metodológicos.
prenden una investigación científica o una actividad No es posible comprender ninguna actividad hu-
artística, le dedican gran parte de sus pensamientos, mana compleja, en especial la investigación cientí-
energías y emociones. Al parecer existen notables fica, sin cierta competencia técnica y metodológica.
diferencias entre la ciencia y el arte, pero, al menos, Pero dicha competencia carece de sentido si no se
en algo son semejantes: suscitan en los seres huma- capta la finalidad básica y la naturaleza de la activi-
nos una gran pasión.(1) dad investigadora. En el estudio controlado y obje-
Este texto versa sobre la investigación de la con- tivo .de las relaciones que existen entre los fenóme-
ducta, y, sobre todo, aspira a infundir en los estu- nos, todo se subordina a esto. Por tal razón, este
diantes el interés por la investigación en general, y texto, como lo indica su nombre, pone de relieve los
de las ciencias de la conducta y la pedagogía en fundamentos o bases de la investigación de la con-
particular. Parte considerable de este libro, aborda ducta.
cuestiones de índole teórica y técnica, no obstante, Para alcanzar el objetivo señalado, el libro reúne
dicha exposición, se funda en la certidumbre de que cuatro características generales:
la investigación es una actividad profundamente ab- La primera consiste en que es un tratado sobre
sorbente y de interés vital. investigación científica; se limita a lo que en general
Tal vez parezca extraño que en una obra sobre se acepta como enfoque científico. Es decir, excluye
este tema, el autor principie hablando de interés, a la investigación histórica, jurídica, bibliotecaria y
entusiasmo y dedicación apasionada. Supuesta- filosófica, etc.(2) En suma, destaca el entendimiento
mente deberíamos ser objetivos y manifestar una y la resolución de los problemas que enfrenta el
actitud oriéntada, de manera decidida, hacia los fe- investigador.
nómenos psicológicos, sociológicos y educaciona- La segunda impele al lector a captar las relaciones
les. Y tal supuesto es cierto, pero más importante íntimas, a menudo díficiles de determinar, que exis-
aún es transmitir la emoción que emana de una in- ten en un problema de investigación y el diseño y
vestigación bien hecha. En ese momento culmi- metodología adecuados para su resolución. Si bien
nante, las dificultades y frustraciones inherentes a se presenta un tratamiento extenso de los problemas
esta tarea, aunque nunca se desvanecen, parecen metodológicos, el texto no es un tratado sobre méto-
mucho menos importantes. Lo que intentamos decir dos. Siempre se da atención preferente al problema,
es que el interés subjetivo constituye una poderosa al diseño respectivo y a la relación entre ambos. Se
motivación para desarrollar una mentalidad objetiva induce al lector a pensar en función de las estructu-
en el estudio de los fenómenos. Es poco probable ras y las relaciones.
que pueda realizarse algún trabajo trascendente sin La tercera característica es que gran parte del
que ello conlleve un considerable esfuerzo personal. contenido está vinculado a las nociones de conjunto,
Por tal motivo, el autor insta a los estudiantes a que relaciones y varianza. Estas ideas al igual que las de
discutan y entablen debates sobre la investigación, e probabilidad, estadística y de mediciones, permiten
incluso a contradecir, a tomar posiciones, a que sean integrar el campo diverso de la actividad investiga-
obstinados, para que después su obstinación tome la dora en un todo unificado y coherente.

(1) El término "passionate commitment" esdePolanyi,Personal (2) En el Apéndice B se presenta una exposición breve de la
Know/edge. Chicago: University oí Chicago Press, 1958. investigación histórica y metodolósica.

VII
VIII PREFACIO

La cuarta se refiere a que una parte considerable zan y explican los diseños principales de investiga-
del libro comprende problemas de investigación psi- ción experimental y no experimental. La séptima,
cológica y educacional. Como autor coincido que si dedicada a tipos de investigación, se toma, natural-
bien es necesaria una obra sobre investigación de mente, de la parte precedente, y en ella se explora la
fundamentos, por otra parte existe poca investiga- llamada investigación ex post facto y los distintos
ción científica educacional; gran parte de la investi- experimentos de laboratorio, experimentos de
gación versa sobre la conducta. En suma, aunque campo, estudios de campo e investigaciones por en-
esta obra trata los fundamentos técnicos de la inves- cuesta.
tigación científica de la conducta en general, pone de La parte octava se dedica principalmente a los
relieve problemas y ejemplos psicológicos y educa- problemas de medición teórica, mientras que la no-
cionales, sin ignorar otras disciplinas relacionadas vena trata los problemas prácticos y técnicos de la
con la conducta. captación de los datos necesarios para resolver pro-
El contenido del texto se divide en diez partes. En blemas científicos. Se describen extensamente y se
la primera, se estudia el lenguaje y el enfoque cientí- ilustran métodos estándar de observación y compi-
fico. Los tres capítulos que la integran, exponen la lación de datos-entrevistas, pruebas y escalas obje-
naturaleza de la ciencia, de los problemas e hipótesis tivas, observación directa de la conducta, métodos
científicas, de las nociones de variables, construc- de proyección, análisis de contenido- y el uso y
ciones y definiciones. La parte segunda presenta los análisis de los materiales disponibles. La sociome-
fundamentos teóricos y matemáticos. Gran parte de tría, la metodología Q y el diferencial semántico,
la descripción de estas cuestiones, se funda en las podrían haberse presentado con otros métodos; sin
ideas de conjunto, relaciones y varianza. Estos con- embargo, por la importancia que tienen y su uso
ceptos se definen :en base a la teoría matemática frecuente en la investigación de la conducta y, por-
moderna. Por fortuna la teoría es sencilla, aunque tal que al parecer no existen discusiones detalladas de la
vez resulte un tanto extraña al principio. Sin em- metodología Q y el diferencial semántico, se dedicó
bargo, una vez que el lector se acostumbre al len- a cada uno de ellos un capítulo.
guaje y al razonamiento habrá adquirido dominio de El texto finaliza con exposiciones bastante exten-
poderosos instrumentos que le posibilitarán el estu- sas, pero elementales, del análisis de regresión múl-
dio de temas más complejos. tiple, el análisis multivariable y el análisis factorial.
Resulta imposible efectuar una investigación ade- La esencia misma de la investigación de la conducta
cuada o leer y comprender informes de investigación es multivariable: muchas variables interactúan en
sin entender el pensamiento probabilístico y estadís- forma compleja e influyen en otras variables. Si
tico. Es por ello que las partes tercera, cuarta y bien, algo de la complejidad puede eliminarse por
quinta se dedican principalmente al pensamiento medio del análisis de varianza, sólo con métodos
probabilístico, muestreo, aleatoriedad, naturaleza y multivariables es posible abordar de manera ade-
objetivos de la estadística y a la inferencia estadís- cuada la complejidad de muchos problemas psicoló-
tica, incluyendo una amplia exposición de ese gran gicos, sociológicos y educacionales. Actualmente
invento que es el análisis de varianza. El primero de nos hallamos en medio de una revolución del pensa-
los capítulos versa sobre el tema importantísimo de miento y la práctica de investigación. Esta actividad
los principios del análisis y la interpretación. El capí- está cambiando su enfoque de manera predominante
tulo cuatro y el siguiente, sobre las divisiones o univariable al multivariable. Tal transformación es
particiones cruzadas -análisis de frecuencias y por- extensa y profunda, pues afecta aun a la naturaleza
centajes- que se incluyeron en esta parte,con la de la teoría y de los problemas. Como autor abrigo la
expectativa de aclarar los objetivos del análisis esperanza de que antes de concluir la lectura de esta
cuantitativo y las estadísticas. En realidad, las par- obra, el estudiante estará convencido de la necesi-
tes tercera, cuarta y quinta tienen como finalidad dad de considerar, con cierta extensión, temas hasta
extraer inferencias de los datos mediante los méto- cierto punto difíciles como la regresión múltiple y el
dos cuantitativos. La interpretación consiste, en análisis factorial o de factores.
esencia, en hacer inferencias. El objetivo final del Cabe hacer una aclaración en este punto sobre el
análisis cuantitativo y las estadísticas es la interpre- nivel del libro y de los lectores. Ellibro es un texto de
tación. ciencias de la conducta, escrito para estudiantes
Conforme a lo antes expuesto, las partes primera a graduados que poseen conocimientos elementales
quinta proporcionan una porción substancial de las de\psicología, estadística y medición. Aunque mu-
bases teóricas y matemáticas de la investigación de chos términos e ideas usados en problemas educa-
la conducta. El resto del libro emplea estos conoci- cionales y psicológicos se definen en el texto, se
mientos para abordar problemas de diseño, medi- supone que el lector tiene ciertas nociones de térmi-
ción, observación y compilación de los datos. nos como inteligencia, aptitud, estatus socioeconó-
La sexta parte, "Diseños de investigación", viene mico, autoritarismo, etc. Se dan las definiciones de
a ser el corazón estructural del libro, pues se esbo- todos los términos técnicos, pero probablemente
PREFACIO IX

muchos estudiantes necesitarán la ayuda de un queda una sensación de seguridad sobre los detalles
maestro para comprenderlos cabalmente. del cálculo. De esta forma no hay que perder el
Puede suceder que los términos e ideas estadísti- tiempo preguntándose cuáles son las respuestas co-
cas obstaculicen el progreso del estudiante. Si bien rrectas. Lo importante es comprender los procedi-
es plausible estudiar el libro y llegar a entender su mientos y no los cálculos en sí mismos.
contenido sin preparación estadística previa, la ¿En qué difiere esta-edición de la primera? En
comprensión de los temas resultará más fácil para el primer lugar se han descubierto todos los errores y
lector que ha tomado un curso de estadística. En la torpezas que pasaron inadvertidos en la primera ver-
parte cuarta se hacen sugerencias que ayudarán al sión. Segundo, el libro es más extenso, ya que la
estudiante a allanar ciertas dificultades estadísticas. investigación misma ha crecido en diversidad y
El libro Investigación del comportamiento es ade- complejidad. Por ejemplo, los métodos Monte Cario
cuado para cursos de uno o dos semestres. Si se usa casi desconocidos hace pocos años, han llegado a ser
en cursos de un solo semestre deberá estudiarse en cada vez más importantes en la investigación mo-
forma selectiva. Aunque compete a cada maestro derna, por lo que resulta necesario explicarlos e
tomar las decisiones sobre la selección, se sugieren ilustrarlos. La adición de las Guías de estudio en casi
las siguientes partes y capítulos para dichos perio- todos los capítulos -debida a las recomendaciones
dos: las partes primera y segunda, y los capítulos 8 de algunos usuarios- contribuyó también a que el
al 12, 17, 19, 23 y 25 al 29. (Pueden omitirse los texto tuviera mayor extensión. Tercero, se añadie-
capítulos 25, 26 y 27.) Para un curso de dos semes- ron dos capítulos sobre regresión y métodos afines,
tres han de estudiarse bien todos o la mayoría de los temas que se omitieron en la primera edición. El
capítulos. Cualquiera que sea la elección, debe to- análisis multivariable puede excluirse o tratarse su-
marse en cuenta que el estudio de los temas más perficialmente, pero a costa de que el libro sea obso-
avanzados a menudo presupone el entendimiento de lescente u obsoleto.
las partes anteriores. Cuarto, más de la mitad de los ejemplos de inves-
A fin de que le sea más sencillo al lector estudiar, tigación usados en la edición primera fueron substi-
comprender y superar algunas dificultades inheren- tuidos, en general, por ejemplos actuales de las fuen-
tes a este campo de estudio, se emplearon varios tes más diversas. Quinto, hay una cantidad de mate-
recursos. En primer lugar, muchos de los temas se rial considerablemente mayor sobre la computa-
presentan con gran amplitud. Para evitar que se pre- dora. Un libro contemporáneo sobre investigación
sente la posibilidad de tener que repetir el tema que no incluya estos valiosos auxiliares, resulta
porque no se comprendió, el material se repite aun- anómalo.
que con palabras distintas y ejemplos diferentes. A pesar de que se ha cambiado gran parte del texto
Segundo, se dan muchos ejemplos tomados de la y la organización del material, su enfoque básico y
investigación real, y también muchos hipotéticos. finalidad son esencialmente los mismos: entendi-
Quien lea el libro de principio a fin, hallará gran miento de los principios de investigación por medio
número y amplia variedad de problemas, hipótesis y de una exposición extensa y la inclusión de numero-
datos, y muchos estudios de la investigación real de sos ejemplos. Ningún autor puede estar por entero
las ciencias sociales y de la conducta. satisfecho con la organización y contenido de su
Tercero, una cualidad sobresaliente del texto son libro. Una de las metas de la primera y segunda
los ejemplos numéricos en los que sólo se usan nú- ediciones ha sido proporcionar a los maestros y es-
meros comprendidos entre el cero y el nueve. Es tudiantes con diversa preparación, materiales sufi-
posible explicar con suficiente claridad las ideas cientes, para que tengan la posibilidad de escoger los
fundamentales de la estadística, la medición y el que les sean de utilidad. No obstante, el contenido
diseño con números pequeños, pues así se evitan de la obra es altamente selectivo, si se toma en
cálculos matemáticos tediosos. Se sugiere que el cuenta la gran diversidad y profundidad de los diver-
lector trabaje concienzudamente en cada ejemplo sos métodos de investigación de la conducta. El
por lo menos una vez. El manejo de los datos es autor espera que su selección satisfará las necesida-
indispensable para una comprensión inteligente del des tanto de estudiantes como de los docentes.
diseño y metodología de investigación. Todos los libros se asemejan, en cierta medida, a
Cuarto, muchos capítulos tienen al final Guías de una empresa cooperativa. Si bien, la redacción
estudio que incluyen lecturas complementarias, así puede deberse a una sola persona, ésta depende de
como problemas cuyo propósito es integrar y conso- muchas otras en cuanto a ideas, crítica y apoyo.
lidar el material expuesto en los capítulos. Muchos Entre las muchas que contribuyeron a las dos edi-
de ellos son fruto de la experiencia docente con ciones, expreso mi agradecimiento a las siguientes.
estudiantes graduados. Después de los problemas se Leyeron el manuscrito original entero de la pri-
da respuesta a la mayoría de aquéllos que invo- mera edición e hicieron muchas valiosas y construc-
lucran cálculos. Si se incluye la respuesta para que el tivas sugerencias, los profesores Theodore New-
lector pueda comparar el resultado que obtuvo, comb, Dale Harris y Jum Nunnally. El profesor
X PREFACIO

Newcomb también nos ofreció el estímulo y aliento gué de manera obstinada a reducir o cambiar el enfo-
iniciales, necesarios para que el libro fuera una reali- que que hice de la teoría de conjuntos. Si algo
dad. El profesor Harris, constribuyó con su gran hice . . . ¡fue dedicarle mayor espacio! Reconozco
experiencia en investigación, cuyo valor no puede una deuda de gratitud en la revisión a mi colega y
ponderarse. El incisivo y penetrante análisis del pro- amigo, el profesor Elazar. Pedhazur, gracias a él
fesor Nunnally fue inestimable, especialmente con pude eliminar muchas deficiencias y mejorar el libro.
algunas cuestiones técnicas difíciles. Deseo expresár también mi gratitud a colegas y
Los profesores Newcomb y Harris leyeron el ma- alumnos del Psychology Laboratory de la Universi-
nuscrito de la presente edición e hicieron de nuevo dad de Amsterdam, quienes me señalaron errores y
valiosas sugerencias. Los profesores Ellis Page y ambigüedades en el texto, algunos de los cuales pude
William Asher, y dos críticos anónimos, me hicieron corregir.
llegar críticas detalladas de la primera edición con Dificilmente ambas ediciones podrian haber sido
notas en las que sugerían cambios. En profesor Page escritas sin los permisos sabáticos que me concedió
también leyó el manuscrito de esta edición. He to- la Universidad de Nueva York durante 1%1-1962 y
mado en consideración muchas de las recomenda- 1970-1971. Agradezco profundamente a esta institu-
ciones de estos docentes. El profesor Ernest Nagel ción su generosa ayuda.
me ayudó a mejorar ciertos problemas de lógica de la La familia de un autor paga un precio muy alto por
ciencia. Su pensamiento me permitió aclarar y mejo- la realización de una obra. Sus miembros siguen al
rar varias secciones de este texto. escritor en sus altibajos impredecibles. Más que a
Hago patente mi gratitud a los muchos maestros y nadie hago patente mi reconocimiento a mi esposa e
estudiantes que me han enviado cartas con comenta- hijos a quienes dedicó este libro.
rios sobre el libro (señalando errores). También han
sido de utilidad las críticas publicadas. He prestado Fred N. Kerlinger
cuidadosa atención a todos los cambios y correccio-
nes sugeridas. En algunos casos, incorporé tales Amsterdam, Holanda
modificaciones. En otros no, por ejemplo, me ne- Enero de 1973
Indice

Parte l Parte 2
EL LENGUAJE Y EL ENFOQUE DE LA CIENCIA CONJUN'IOS, RELACIONES Y VARIANZA
Capítulo l Capítulo 4
LA CIENCIA Y EL METODO CIENTIFICO CONJUNTOS
Ciencia y sentido común . . . . . . . . . . . . . . 2 Subconjuntos . . . . . . . . . . . . . . . . . . . . . . . . 34
Cuatro métodos del conocimiento 4 Operaciones con conjuntos ........ , . . . 35
Objetivos de la ciencia, Conjuntos universales y vacíos
la explicación científica y negación de conjuntos . . . . . . . . . . . . . . . 35
y la teoria . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 Diagramas de conjuntos . . . . . . . . . . . . . . . 36
Investigación científica: Operaciones con más de dos conjuntos . 37
una definición . . . . . . . . . . . . . . . . . . . . . . . . 7 Particiones y particiones cruzadas . . . . . . 37
El método científico . . . . . . . . . . . . . . . . . . 7 Definición de conjuntos . . . . . . . . . . . . . . . 39
Niveles de discurso* . . . . . . . . . . . . . . . . . . 39
Guías de estudio . . . . . . . . . . . . . . . . . . . . . 41
Capítulo 2
PROBLEMAS E HIPOTESIS Capítulo 5
Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 RELACIONES
Hipótesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Relaciones como conjuntos de pares
Importancia de los problemas ordenados . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
de las hipótesis . . . . . . . . . . . . . . . . . . . • . . . 13 Determinación de relaciones
Ventajas de los problemas en la investigación . . . . . . . . . . . . . . . . . . . . 43
y de las hipótesis . . . . . . . . . . . . . . . . . . . . . 14 Reglas de correspondencia y trazo
Problemas, valores y definiciones • . . . . . 15 de mapas ............................ 44
Generalidad y especificidad Funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
de los problemas e hipótesis . . . . . . . . . . . 16 Formas de demostrar relaciones . . . . . . . 46
Naturaleza multivariable Guías de estudio . . . . . . . . . . . . . . . . . . . . . 48
de la investigación y de
los problemas conductuales . . . . . . . . . . . . 16 Capítulo 6
Observaciones finales: poder VARIANZA
especial de las hipótesis . . . . . . . . . . . . . . . 17 Cálculo de medias y varianzas . . . . . . . . . 50
Guías de estudio . . . . . . . . . . . . . . . . . . . . . . 17 Tipos de varianza . . . . . . . . . . . . . . . . . . . . 51
Componentes de la varianza . . . . . . . . . . . 58
Capítulo 3 Covarianza . . . . . . . . . . . . . . . . . . . . . . . . . . 60
CONSTRUCCIONES HIPOTETICAS, Varianza de factor común . . . . . . . . . . . . . 61
VARIABLES Y DEFINICIONES Guías de estudio . . . . . . . . . . . . . . . . . . . . . 62
Conceptos y construcciones hipotéticas 19
Variables , . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 Parte 3
Definiciones constitutivas PROBABILIDAD, ALEATORIEDAD
y operacionales de las construcciones Y MUESTREO
hipotéticas y de las variables . . . . . . . . . . 20 Capítulo 7
Tipos de variables . . . . . . . . . . . . . . . . . . . . 23 PROBABILIDAD
Variables continuas y categóricas . . . . . . 26 Definición de probabilidad . . . . . . . . . . . . . 66
Construcciones hipotéticas, variables Espacio muestral, puntos de muestreo
observadas e intermedias . . . . . . . . . . . . . . 27 y eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
Guías de estudio . . . . . . . . . . . . . . . . . . . . . 30 Cálculo de probabilidades con monedas . 69

XI
XII INDICE

Un experimento con dados . . . . . . . . . . . . 70 Capítulo 11


Eventos compuestos . . . . . . . . . . . . . . . . . . 71 FINALIDAD, ENFOQUE Y METODOLOGIA
Algunos elementos de la teoría formal . . 72 DE LA ESTADISTICA
Eventos compuestos y sus probabilidades 73 El enfoque básico . . . . . . . . . . . . . . . . . . . . 131
Independencia, exclusión mutua Definición y finalidad
y exhaustividad . . . . . . . . . . . . . . . . . . . . . . 74 de la estadística . . . . . . . . . . . . . . . . . . . . . . 131
Probabilidad condicional . . . . . . . . . . . . . . 77 Estadísticas binonúales . . . . . . . . . . . . . . . 133
Guías de estudio . . . . . . . . . . . . . . . . . . . . . 81 Varianza ............................ 134
Ley de los grandes números . . . . . . . . . . . 135
Capítulo 8 Curva normal de la probabilidad
MUESTREO y desviación estándar . . . . . . . . . . . . . . . . . 136
Y ALEATORIEDAD Interpretación de datos por medio
Muestreo, muestreo aleatorio de la curva normal de probabilidades:
y representatividad . . . . . . . . . . . . . . . . . . . 83 datos de frecuencia . . . . . . . . . . . . . . . . . . . 137
Aleatoriedad . . . . . . . . . . . . . . . . . . . . . . . . . 85 Interpretación de datos por medio
Aleatorización . . . . . . . . . . . . . . . . . . . . . . . 87 de la curva normal de probabilidad:
Asignación aleatoria . . . . . . . . . . . . . . . . . . 89 datos continuos . . . . . . . . . . . . . . . . . . . . . . 138
Tamaño de Ja muestra . . . . . . . . . . . . . . . . 90
Tipos de muestras . . . . . . . . . . . . . . . . . . . . 91 Capítulo 12
Guías de estudio . . . . . . . . . . . . . . . . . . . . . 93 PRUEBA DE HIPOTESIS Y ERROR
ESTANDAR
Parte 4 Ejemplos: diferencias entre medias ..... 141
ANALISIS, INTERPRETACION, Diferencias absolutas y relativas ....... 141
EST ADISTICÁ E INFERENCIA Coeficientes de correlación ............ 142
Capítulo 9 Prueba de hipótesis:
PRINCIPIOS DEL ANALISIS substantiva y de nulidad . . . . . . . . . . . . . . 143
Y DE LA INTERPRETACION La naturaleza general del error estándar 144
Medidas de frecuencia Demostración Monte Cario . . . . . . . . . . . . 145
y medidas continuas . . . . . . . . . . . . . . . . . . 97 Inteñerencia estadística . . . . . . . . . . . . . . . 149
Reglas de categorización . . . . . . . . . . . . . . 98 Guías de estudio ..................... 150
Tipos de análisis estadístico . . . . . . . . . . . 100
Indices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 Parte 5
Interpretación de los datos ANALISIS DE VARIANZA
de investigación ..................... , . 109 Capítulo 13
Sugerencias de estudio . . . . . . . . . . . . . . . . 111 FUNDAMENTOS DEL ANALISIS
DE VARIANZA
Capítulo JO ,Ejemplo sencillo de subdivisión
ANALISIS DE DIVISIONES de la varianza . . . . . . . . . . . . . . . . . . . . . . . . 154
CRUZADAS Razón t ............................. 156
Datos y terminología variable . . . . . . . . . . 112 Análisis de varianza . . . . . . . . . . . . . . . . . . 156
Definición y fines de las divisiones Un ejemplo de diferencia
cruzadas ............................ 113 estadísticamente significativa . . . . . . . . . . 158
Divisiones cruzadas simples y reglas Cálculo del análisis de la varianza
para construirlas ..................... 114 con una sola variable ................. 159
Cálculo de porcentajes ................ 115 Un ejemplo de investigación ........... 161
Cálculo de porcentajes y probabilidad Fuerza de las relaciones: correlación
condicional . . . . . . . . . . . . . . . . . . . . . . . . . . 116 y análisis de varianza ................. 161
Significación estadística Componentes de la varianza . . . . . . . . . . . 165
y prueba de X2 ••••••••••••••••••••••• 118 Comparaciones planeadas
Niveles de significación y pruebas post hoc ................... 166
estadística . . . . . . . . . . . . . . . . . . . . . . . . . . 120 Guías de estudio ..................... 169
Tipos de divisiones cruzadas
y tablas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 Capítulo 14.
Mediciones cruzadas, relaciones, pares ANALISIS FACTORIAL DE LA VARIANZA
ordenados y representaciones gráficas .. 127 Dos ejemplos de investigación ......... 172
Apéndice: otros tipos de divisiones Naturaleza del análisis factorial
cruzadas ............................ 128 de varianza . . . . . . . . . . . . . . . . . . . . . . . . . . 173
Guías de estudio ..................... 129 Un ejemplo ficticio sencillo . . . . . . . . . . . . 174
INDICE XIII

Un ejemplo de interacción ............. 179 Observaciones finales ................. 244


Análisis factorial de varianza Guías de estudio . . . . . . . . . . . . . . . . . . . . . 245
con tres o más variables . . . . . . . . . . . . . . 180
Ventajas del análisis factorial Capítulo 20
de la varianza ........................ 182 DISEÑO DE INVESTIGACION
Análisis factorial de varianza Y SUS APLICACIONES:
y precisión . . . . . . . . . . . . . . . . . . . . . . . . . . 184 GRUPOS ALEA TORIZADOS
Algunos ejemplos de investigación . . . . . 186 Diseño sencillo con sujetos asignados
Una palabra más sobre la interacción . . . 188 aleatóricamente . . . . . . . . . . . . . . . . . . . . . . 246
Advertencias ......................... 190 Diseños factoriales . . . . . . . . . . . . . . . . . . . 248
Guías de estudio . . . . . . . . . . . . . . . . . . . . . 192 Valoración de los diseños con sujetos
asignados aleatóricamente . . . . . . . . . . . . . 251
Capítulo 15 Guías de estudio ..................... 252
ANALISIS DE VARIANZA:
GRUPOS CORRELACIONADOS Capítulo 21
Definición del problema . . . . . . . . . . . . . . . 193 DISEÑO DE INVESTIGACION
Obtención de varianzas por resta ....... 199 Y SUS APLICACIONES;
Ejemplos de investigación . . . . . . . . . . . . . 200 GRUPOS CORRELACIONADOS
Guías de estudio . . . . . . . . . . . . . . . . . . . . . 202 Paradigma general . . . . . . . . . . . . . . . . . . . . 254
Diseños multigrupales con grupos
Capítulo 16 correlacionados . . . . . . . . . . . . . . . . . . . . . . 258
ANALISIS DE VARIANZA Diseños factoriales con grupos
NO PARAMETRICO correlacionados . . . . . . . . . . . . . . . . . . . . . . 260
Y ESTADISTICAS CONEXAS Análisis de la covarianza ....•......... 261
Estadísticas paramétricas Descripción de los procedimientos
y no paramétricas . . . . . . . . . . . . . . . . . . . . 204 seguidos en el análisis de covarianza . . . 261
Análisis de varianza no paramétrico . . . . 206 Diseño de investigación y análisis:
Propiedades de Jos métodos observaciones finales . . . . . . . . . . . . . . . . . 263
no paramétricos ...................... 211 Guías de estudio ..................... 264
Guías de estudio . . . . . . . . . . . . . . . . . . . . . 211
Parte 7
Parte 6 TIPOS DE JNVESTIGACION
DISEÑO DE JNVESTIGACION Capítulo 22
Capítulo 17 INVESTIGACION EX POST FACTO
DISEÑO DE INVESTIGACION: Diferencia básica entre
SIGNIFICADO, PROPOSITO Y PRINCIPIOS la investigación experimental
Propósito del diseño de investigación ... 214 y la investigación ex post facto ........ 269
El diseño de investigación como Autoselección e investigación
control de varianza ................... 217 ex post facto . . . . . . . . . . . . . . . . . . . . . . . . . 269
Maximizacióndelavarianzaexperimental 219 Investigación ex post facto
Maximización de Ja varianza de error . . . 221 en gran escala . . . . . . . . . . . . . . . . . . . . . . . . 270
Guías de estudio ..................... 222 Investigación ex post facto
Capítulo 18 a pequeña escala . . . . . . . . . . . . . . . . . . . . . 273
DISEÑOS INADECUADOS Y CRITERIOS Verificación de hipótesis
DE LOS DISEÑOS alternativas o de "control" ............ 274
Método experimental y método Evaluación de la investigación
ex post facto ......................... 223 ex post facto ......................... 275
Simbolismo y definiciones . . . . . . . . . . . . . 224 Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . 277
Diseños defectuosos . . . . . . . . . . . . . . . . . . 225 Addendum: casualidad
Criterios del diseño de investigación .... 228 e investigación científica .............. 277
Guías de estudio . . . . . . . . . . . . . . . . . . . . . 230 Guías de estudio . . . . . . . . . . . . . . . . . . . . . 278
Capítulo 19 Capítulo 23
DISEÑOS GENERALES EXPERIMENTOS DE LABORATORIO,
DE INVESTIGACION EXPERIMENTOS DE CAMPO
Fundamentos conceptuales del diseño Y ESTUDIOS DE CAMPO
de investigación . . . . . . . . . . . . . . . . . . . . . . 232 Un experimento de laboratorio:
Ventajas y desventajas del apareamiento 237 estudios de Miller sobre el aprendizaje
Variantes de diseños básicos .......... 241 de respuestas viscerales . . . . . . . . . . . . . . . 279
XIV INDICE

Un experimento de campo: estudio Validez y confiabilidad


del estilo personal clásico, de los instrumentos de medición
efectuado por Winter y otros . . . . . . . . . . 280 psicológica y pedagógica . . . . . . . . . . . . . . 332
Un estudio de campo: estudio Guías de estudio ..................... 332
de Newcomb en el Bennington
College . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280 Parte 9
Características y criterios METODOS DE OBSERVACION
de los experimentos de laboratorio, Y RECOLECCION DE DATOS
los experimentos de campo · Introducción . . . . . . . . . . . . . . . . . . . . . . . . . 336
y los estudios de campo ............... 281 Capítulo 28
Experimentos de campo . . . . . . . . . . . . . . . 283 ENTREVISTAS Y PROGRAMAS
Estudios de campo . . . . . . . . . . . . . . . . . . . 285 DE ENTREVISTA
Guías de estudio . . . . . . . . . . . . . . . . . . . . . 288 Entrevistas y programas como
herramientas científicas . . . . . . . . . . . . . . . 337
Capítulo 24 Programa de entrevista ................ 338
ENCUESTAS Valor de las entrevistas
Tipos de encuesta . . . . . . . . . . . . . . . . . . . . 290 y de los programas de entrevista . . . . . . 342
Metodología de las encuestas .......... 292 Addenda: ejemplos de la entrevista
Dos estudios . . . . . . . . . . . . . . . . . . . . . . . . . 294 como instrumento de investigación . . . . . 342
Aplicaciones de las encuestas Guías de estudio . . . . . . . . . . . . . . . . . . . . . 343
a la educación . . . . . . . . . . . . . . . . . . . . . . . 296
Capítulo 29
Ventajas y desventajas de la encuesta .. 297
Guías de estudio . . . . . . . . . . . . . . . . . . . . . 298 PRUEBAS Y ESCALAS OBJETIVAS
Objetividad y métodos objetivos
de observación ...........•........... 345
Partes Pruebas y escalas: definiciones . . . . . . . . 345
MEDICION Tipos de mediciones objetivas . . . . . . . . . 346
Capítulo 25 Tipos de escalas y reactivos objetivos .. 352
FUNDAMENTOS DE LA MEDICION Elección y construcción
Definición de medición ................ 301 de medidas objetivas .......... '. . . . . . . . 357
Medición e isommfismoconla "realidad" 303 Valoración de pruebas
Propiedades, construcciones y escalas objetivas . . . . . . . . . . . . . . . . . . . . 357
hipotéticas e indicadores Guías de estudio . . . . . . . . . . . . . . . . . . . . . 357
de objetos . . . . . . . . . . . . . . . . . . . . . . . . . . . 303
Niveles de medición y valoración Capítulo 30
escalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305 METODOS PROYECTIVOS, MATERIALES
Comparaciones de escalas: DISPONIBLES Y ANALISIS
consideraciones prácticas DE CONTENIDO
y métodos estadísticos . . . . . . . . . . . . . . . . 308 Concepto de proyección . . . . . . . . . . . . . . 360
Gasificación de las medidas proyectivas 361
Capítulo 26 Técnicas proyectivas
CONFIABILIDAD e investigación del comportamiento:
Definiciones de confiabilidad . . . . . . . . . . 311 una valoración . . . . . . . . . . . . . . . . . . . . . . . 364
Teoría de la confiabilidad ............. 313 Materiales disponibles . . . . . . . . . . . . . . . . 365
Interpretación del coeficiente Análisis de contenido . . . . . . . . . . . . . . . . . 367
de confiabilidad . . . . . . . . . . . . . . . . . . . . . . 317 Aspectos metodológicos
Error estándar de la media del análisis de contenido .............. 369
y de la medición ..................... 318 La computadora y el análisis
Mejoramiento de la confiabilidad ....... 319 de contenido ......................... 371
Valor de la confiabilidad . . . . . . . . . . . . . . 320 Empleo del análisis del contenido
y de los materiales disponibles
Capítulo 27 en la investigación del comportamiento . 372
VALIDEZ Guías de estudio . . . . . . . . . . . . . . . . . . . . . 373
Tipos de validez ..................... 321
Definición de la validez Capítulo 31
en términos de varianza: OBSERVACIONES DE LA CONDUCTA
la relación entre confiabilidad Problemas de la observación
y validez de la varianza ............... 329 de la conducta . . . . . . . . . . . . . . . . . . . . . . . 376
INDICE XV
Características de las observaciones . . . . 377 Significación estadística
Escalas de clasificación . . . . . . . . . . . . . . . 381 de la regresión y de R . . . . . . . . . . . . . . . . 434
Ejemplos de sistemas de observación . . . 383 Contribuciones relativas de las X a Y . . . 435
Otros problemas analíticos
Capítulo 32 e interpretativos . . . . . . . . . . . . . . . . . . . . . . 437
SOCIOMETRIA Ejemplos de investigación . . . . . . . . . . . . . 438
Definición ........................... 388 Análisis de regresión múltiple
Tipos de selección sociométrica . . . . . . . . 388 e investigación científica .............. 441
Métodos de análisis sociométrico ...... 388
Aplicaciones de la sociometría Capítulo 36
a la investigación ..................... 391 REGRESION MUL TIPLE, ANALISIS
Medición sociométrica DE LA VARIANZA Y OTROS
en la investigación social METODOS MULTIVARIABLES
y educativa . . . . . . . . . . . . . . . . . . . . . . . . . . 392 Análisis unidireccional de la varianza
Guías de estudio . . . . . . . . . . . . . . . . . . . . . 393 y análisis de regresión múltiple . . . . . . . . 444
Un ejemplo con tres grupos . . . . . . . . . . . 446
Capítulo 33 Codificación y análisis de datos . . . . . . . . 449
Análisis factorial de varianza,
DIFERENCIAL SEMANTICO
análisis de covarianza
Construcción y empleo
y análisis de regresión múltiple . . . . . . . . 451
del diferencial semántico . . . . . . . . . . . . . . 396
Análisis canónico y discriminativo . . . . . 454
Formato y administración La computación y el análisis
del diferencial semántico . . . . . . . . . . . . . . 398 multivariable . . . . . . . . . . . . . . . . . . . . . . . . . 456
Análisis de los datos Análisis multivariable e investigación
suministrados por el diferencial
de la conducta . . . . . . . . . . . . . . . . . . . . . . . 458
semántico . . . . . . . . . . . . . . . . . . . . . . . . . . . 399 Guías de estudio . . . . . . . . . . . . . . . . . . . . . 459
Algunas aplicaciones
del diferencial semántico Capítulo 37
a la investigación . . . . . . . . . . . . . . . . . . . . . 403
ANALISIS FACTORIAL
Guías de estudio . . . . . . . . . . . . . . . . . . . . . 405
Ejemplo hipotético . . . . . . . . . . . . . . . . . . . 461
Matrices y ponderaciones factoriales ... 462
Capítulo 34 Algo sobre la teoría factorial . . . . . . . . . . . 464
METODOLOGIA Q Representación gráfica de factores
Teoría; clasificaciones Q estructuradas y cargas factoriales . . . . . . . . . . . . . . . . . . . 465
y no estructuradas; análisis Métodos de análisis factorial . . . . . . . . . . . 466
de la varianza . . . . . . . . . . . . . . . . . . . . . . . . 41 O Análisis factorial de segundo orden . . . . . 471
Análisis y arreglos factoriales Puntuaciones factoriales . . . . . . . . . . . . . . . 473
en la metodología Q .................. 413 Ejemplos de investigación . . . . . . . . . . . . . 475
Ventajas y desventajas Guías de estudio . . . . . . . . . . . . . . . . . . . . . 483
de la metodología Q .................. 414
Metodología Q en la investigación Apéndices
social y educacional .................. 417 Apéndice A
Guías de estudio ..................... 418 INFORME DE INVESTIGACION
La finalidad .......................... 488
Parte 10 La estructura . . . . . . . . . . . . . . . . . . . . . . . . 488
REGRESION MULTIPLE Algunas referencias útiles . . . . . . . . . . . . . 492
Y ANALISIS FACTORIAL
Introducción . . . . . . . . . . . . . . . . . . . . . . . . . 422 Apéndice B
Capítulo 35 INVESTIGACION HISTORICA
BASES DEL ANALISIS DE REGRESION Y METODOLOGICA
MULTIPLE Investigación histórica . . . . . . . . . . . . . . . . 493
Dos ejemplos de investigación ......... 423 Investigación metodológica . . . . . . . . . . . . 494
Análisis de regresión simple ........... 424
Re,gresión lineal múltiple . . . . . . . . . . . . . . 428 Apéndice C
El coeficiente de correlación múltiple . . . 431 LA COMPUTADORA Y LA INVESTIGACION
Pruebas de significación ............... 433 DE LA CONDUCTA
Interpretación de los estadísticos Algunas características importantes
de regresión múltiple . . . . . . . . . . . . . . . . . 434 de la computadora . . . . . . . . . . . . . . . . . . . . 496
XVI INDICE

Forma en que operan los programas Fichas bibliográficas . . . . . . . . . . . . . . . . . . 500


de computación: programación
y lenguaje Fortran . . . . . . . . . . . . . . . . . . . . 497
Programas disponibles ................ 498 Apéndice D
La computadora y el análisis NUMEROS ALEATORIOS Y ESTADISTICAS
de la conducta ....................... 499
Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . 499 Indice alfabético . . . . . . . . . . . . . . . . . . . . . . . 511
PARTE 1
El lenguaje y el enfoque de la ciencia
CAPITULO 1
La ciencia y el método científico

Para comprender cualquier actividad humana cómo difiere su enfoque del que podría llamarse un
compleja, debemos captar el lenguaje y el enfoque enfoque por sentido común.
de quienes la realizan. Lo mismo hemos de hacer
para entender la ciencia y la investigación científica.
Es preciso conocer y comprender, al menos en Ciencia y sentido común
parte, el lenguaje y el método científico de resolu- Señala Whitehead que para el pensamiento crea-
ción de problemas. dor, el sentido común es mal maestro. "Su único
Una de las cosas que más confunden a quien estu- criterio para juzgar es que las nuevas ideas han de
dia ciencia es el sentido especial que el científico asemejarse a las antiguas."(1) Esta afirmación es
asigna a algunas palabras de uso común, lo que se correcta. El sentido común puede ser un mal maes-
complica aún más con la invención de nuevos térmi- tro al evaluar el conocimiento. Pero, ¿en qué se
nos. Hay buenas razones para este empleo especia- asemejan la ciencia y el sentido común y en qué
lizado del lenguaje, que se harán evidentes más ade- difieren? Desde un punto de vista ambos son simila-
lante. Por ahora basta decir que hemos de aprender y res. Según esto, la ciencia seria una extensión siste-
entender el lenguaje de los científicos de la psicolo- mática y controlada del sentido común, pues éste,
gía y la educación. Debemos saber lo que quiere como dice Conant, es una serie de conceptos y es-
decir el investigador de psicología al hablamos de quemas teóricos adecuados para los usos prácticos
sus variables independientes y dependientes. de la humanidad.(2) Pero unos y otros pueden ser
Cuando nos dice que empleó la asignación aleatoria gravemente engañosos en la ciencia moderna-parti-
en sus procedi¡p;entos experimentales, no sólo he- cularmente en la psicología y en la educación. Los
mos de sa!Jer lo que quiere decir sino que debemos educadores del siglo pasado estuvieron convencidos
entender por qué lo hizo. -sólo fue cuestión de sentido común- de la utilidad
De manera análoga hay que comprender con cla- del castigo como instrumento básico en la pedago-
ridad el modo en que el científico aborda los proble- gía. Hoy sabemos que era totalmente erróneo este
mas. La dificultad no estriba tanto en que su enfoque antiguo punto de vista sobre la motivación, basado
sea distinto al del lego; por supuesto, es diferente, en el sentido común.
pero no extraño ni mágico. Todo lo contrario. Una En el aprendizaje, la recompensa es ciertamen-
vez entendido, parecerá natural y casi inevitable que te más eficaz que el castigo.
el científico proceda así. En realidad, tal vez nos
preguntaremos por qué no se estructura conscien-
(1) A. Whitehead, An Introduction to Mathematics. Nueva
temente así una parte mucho mayor del pensamiento York: Holt, Rinehart and Winston, 1911, pág. 157.
humano para solución de problemas. (2) J. Conant, Science and Common Sense. New Haven: Yale
Así pues, la Parte l de este libro se propone ayudar University Press, 1951, págs. 32-33. Concepto es una palabra que
al estudiante a aprender y entender el lenguaje y el expresa una abstracción fonnada por generalización a partir de
método científico y de investigación. En los capítu- casos particulares. "Agresión" es un concepto, una abstracción
que expresa ciertas acciones particulares que tienen la caracterís-
los incluidos en esta parte se estudiarán muchos de tica simílar de lastimar a personas u objetos. Esquema conceptual
los supuestos fundamentos de la sociología y la pe- es un conjunto de conceptos relacionados entre sí por proposicio-
dagogía. En ciertos casos, no será posible dar defini- nes hipotéticas y teóricas. (Véase ibid., págs. 25, 47-48.) Construc-
ciones completas y satisfactorias por falta de ante- ción hipotética (construcro) es un concepto con el signiticado adi-
cional de haber sido creado o destinado a fines científicos especia-
cedentes, en este punto inicial de nuestra exposi- les. "Masa", "energía", "hostilidad", "introversión" y "rendi-
ción. En tales casos, primero trataremos de formular miento" son construcciones hipotéticas. Convendría llamarlas más
y valernos de aproximaciones razonablemente pre- precisamente "clases o tipos concebidos operacional mente", es
cisas de las definiciones satisfactorias que aparecen ·decir, clases o conjuntos de objetos y acontecimientos agrupados
en base a características comunes definidas por el científico. El
después. término "variable" se definirá en un capítulo ulterior. Por ahora
Comenzaremos nuestro estudio examinando có- significa el nombre o símbolo de una característica que adopta
mo debe abordar el científico sus problemas y distintos valores numéricos.

2
LA CIENCIA Y EL METODO CIENTIFICO 3

La ciencia y el sentido común difieren formal- cuente de la delincuencia en distintas clases de ve-
mente en cinco maneras. Sus desigualdades giran en cindarios. Desde luego, hay una gran diferencia en-
torno a las palabras "sistemático" y "controlado". tre ambos enfoques.
Primero, el uso de esquemas conceptuales y de es- Otra diferencia entre ciencia y sentido común qui-
tructuras teóricas es notablemente distinto. Aunque zás no sea tan profunda como la anterior. Hemos
el ser humano común se sirve de "teorías" y concep- dicho que el científico se preocupa constantemente
tos, de ordinario lo hace en forma imprecisa. A veces por estudiar las relaciones que existen entre los fe-
acepta ingenuamente explicaciones fantásticas de nómenos. También lo hace el lego que se v~e del
los fenómenos naturales y humanos. Por ejemplo, sentido común. El primero busca las relaciones en
considera una enfermedad como castigo por sus pe- forma consciente y sistemática. En cambio, la preo-
cados o atribuye una depresión económica a los cupación del segundo por las relaciones es vaga, no
judíos. En cambio, el científico construye sistemáti- sistemática, incontrolada. Por ejemplo, con fre-
camente estructuras teóricas, verifica su coherencia cuencia percibe la aparición fortuita de dos fenóme-
externa y somete a prueba empírica algunos de sus nos y en seguida los liga indisolublemente corno
aspectos. Además, se da cuenta de que sus concep- causa y efecto.
tos son términos artificiales que pueden mostrar o no Para ilustrar lo dicho veamos la relación sometida
una estrecha relación con la realidad. a prueba en un estudio de Hurlock.(3) En terminolo-
Segundo, el científico somete a prueba, de manera gía más reciente esa relación podría expresarse así:
sistemática y empírica, sus teorías. e hipótesis. Lo el reforzamiento positivo (recompensa) produce
mismo hace el hombre común con las suyas, pero las mayores incrementos del aprendizaje que el nega-
prueba de un modo que podría llamarse selectivo. tivo (castigo) o que la ausencia de reforzamiento. La
Con frecuencia "escoge" evidencias porque con- relación se da entre éste (recompensa y castigo) y
cuerdan con su hipótesis. Tomemos el estereotipo: aprendizaje. En el siglo pasado los educadores y
los negros tienen aptitudes para .la música. Si una padres creían que el reforzamiento negativo (cas-
persona cree esto, "verificará" fácilmente su opi- tigo) era el agente más eficaz para aprender. En la
nión al advertir que muchos negros son músicos. actualidad unos y otros suponen que el reforza-
Pero no percibirá las excepciones del estereotipo: miento positivo (recompensa) es más eficaz. Podrán
por ejemplo, el negro carece de dotes y sentido mu- decir que sus puntos de vista no son más que fruto
sical. El científico social experto, a sabiendas de que ••del sentido común''. Es obvio, afirmarán, que si se
la "tendencia a la selección" es un fenómeno psico- le recompensa (o castiga) el niño aprenderá mejor.
lógico común, protege cuidadosamente la investiga- Por el contrario, aunque el científico adopte perso-
ción contra sus conceptos preconcebidos y sus pre- nalmente uno u otro de estos puntos de vista o nin-
dilecciones y contra el apoyo selectivo de su hipóte- guno de ellos, es probable que insista en efectuar
sis. Ante todo, no se conforma con una exploración pruebas sistemáticas y controladas de ambas rela-
teórica de la relación, sino que procura probarla en el ciones (y de otras), tal como lo hizo Hurlock.
laboratorio o en el campo; no se contenta con las Una última diferencia entre sentido común y cien- .
relaciones aceptadas entre métodos de enseñanza y cia radica en las distintas explicaciones de los fenó-
aprovechamiento, entre inteligencia y creatividad, menos observados. Al tratar de explicar sus relacio-
entre valores y decisiones administrativas. Insiste nes el científico descarta con cuidado las llamadas
en probarlas mediante pruebas sistemáticas contro- "explicaciones metafisicas". La explicación meta-
ladas y empíricas. física es una proposición indemostrable. Se habla en
Una tercera diferencia reside en la noción de con- lenguaje metafisico al decir que las personas son
trol. En la investigación científica este término signi- pobres y padecen hambre porque es voluntad de
fica varias cosas. Por ahora significará que el cientí- Dios, que con el estudio de materias difíciles mejora
fico trata de descartar sistemáticamente las varia- el carácter moral del niño o que es malo ser autorita-
bles que son la "causa" posible de los efectos que rio en el salón de clases.
estudia, y conserva sólo las variables que, según Ninguna de las proposiciones mencionadas es
supone, son la "causa" verdadera. El ser humano demostrable; por tanto, son metafisicas. De ahí que
común raras veces se molesta en controlar sistemá- la ciencia no se interese por ellas. Esto no significa
ticamente sus explicaciones de los fenómenos que que el científico necesariamente rechace tales afir-
ha observado. Hace poco esfuerzo por controlar las maciones, las descarte de la vida, diga que no son
fuentes extrañas de influencia. Tiende a aceptar las ciertas o sostenga que carecen de sentido. Quiere
explicaciones que coinciden con sus ideas precon- decir únicamente que, como científico, no se ocupa
cebidas y· con sus preferencias. Si cree que las con- de ellas. En resumen, la ciencia estudia las cosas que
diciones de vida en los barrios pobres causan delin-
cuencia, estará propenso a desdeñar la delincuencia (3) E. Hurlock, "An Evaluation of Certain Incentives U sed in
en vecindarios de gente que no sea pobre. Por el Schoolwork", Journal of Educational Psychology, XVI ( 1925),
contrario, el científico busca y •'controla'' lo fre- 145-159.
4 EL LENGUAJE Y EL ENFOQUE DE LA CIENCIA

pueden ser observadas y sometidas a prueba públi- estadounidense es inferior a la educación rusa y la
camente. Si las proposiciones o preguntas no ofre- europea, que las mujeres no conducen bien los au-
cen esa posibilidad, no son cuestiones científicas. tomóviles-, ¿significa ello que así ocurre realmente?
Según el método a priori eso sucede y "es lógico".
Cuatro métodos del conocimiento El cuarto método es el método de la ciencia.
Charles Peirce, el gran filósofo estadounidense, Afirma Peirce:
manifestó que hay cuatro formas generales de cono-
cimiento o, como lo hizo, de fijar una creencia.( 4) La Por consiguiente, para satisfacer nuestras du-
primera es el método de tenacidad. En él, los hom- das, ... es necesario descubrir un método por el cual
bres se aferran a la verdad, una verdad que saben nuestras creencias se funden, no en cosas humanas,
cierta porque la creen firmemente, porque siempre sino en cierta permanencia externa; en algo ajeno a los
la han tenido por cierta. La frecuente repetición de efectos de nuestro pensamiento ... El método debe
ser tal que la conclusión final de todos los hombres sea
semejantes "verdades" parece confirmar su vali- la misma. Es el método de la ciencia. Su hipótesis
dez. Los datos psicológicos recientes nos han de- fundamental ... es esta: hay cosas reales cuyos carac-
mostrado que los hombres se adhieren a sus creen- teres son absolutamente independientes de nuestras
cias frente a hechos que claramente las contradicen. opiniones ... (5)
Y además deducirán "nuevos" conocimientos de
proposiciones que acaso sean falsas. El enfoque científico(6) tiene una caracterlstica
El segundo método de conocimiento o de fijar una que no posee ningún otro: se corrige a sí mismo. En
creencia es el método de autoridad. Es un método de todo el camino del conocimiento científico hay com-
creencia establecida. Si la Biblia lo dice, así debe probaciones internas, que han sido concebidas y
ser; si un afamado fisico dice que Dios existe, así utilizadas para controlar y verificar las actividades y
debe ser. Si una idea está respaldada por el peso de la conclusiones del científico en su búsqueda de un
tradición y la sanción pública, será cierta. Este mé- conocimiento fidedigno y externo a él. El científico
todo, señala Peirce, es superior al de tenacidad por- no acepta la veracidad de una aseveración, aunque
que el progreso humano, aunque lento, puede alcan- los datos al inicio le parezcan prometedores. Insiste
zarse por medio de él. En realidad, la vida no sería en someterla a prueba y en que cualquier procedi-
posible sin el método de autoridad, pues muchas de miento de verificación debe quedar abierto a la ins-
las cosas que debemos aceptar se fundan en él. En pección pública.
consecuencia, no debe llegarse a la conclusión de Dice Peirce que las comprobaciones empleadas en
que es deficiente, sólo lo es en determinadas circuns- la investigación científica están ancladas lo más po-
tancias. sible en la realidad externa al científico y a sus opi-
El método a priori es la tercera forma de conocer o niones, percepciones, juicios, valores, actitudes y
fijaruna creencia. (Cohen y Nagel lo llaman método emociones personales. Acaso la palabra más indi-
de intuición.) Basa su superioridad en el supuesto de cada para expresar esto sea objetividad. Pero como
que las proposiciones aceptadas por el "apriorista" veremos luego, ese enfoque exige algo más. La ver-
son evidentes por sí mismas. Adviértase que las dad es que se consigue un conocimiento más fide-
proposiciones a priori "concuerdan con la razón" y digno mediante la ciencia porque ésta apela a los
nó necesariamente con la experiencia. Se piensa que hechos: las proposiciones se someten a verificación
los hombres, por libre comunicación e intercambio, empírica. Se hará una objeción: también la teoría
pueden alcanzar la verdad porque sus inclinaciones que el científico usa y exalta es parte del ser hu mano.
naturales tienden hacia ella. La dificultad de esta Pero como señala Polanyi: "Una teoría es algo que
posición racionalista reside en la expresión "con- no soy yo";(7) en consecuencia, ésta le ayuda al
cuerdan con la razón''. ¿La razón de quién? Supón- científico a lograr mayor objetividad. En conclusión,
gase que dos hombres, mediante procesos raciona- los hombres de ciencia usan sistemática y conscien-
les llegan a distintas conclusiones, como sucede con temente el aspecto autocorrectivo del enfoque cien-
frecuencia. ¿Cuál está en lo cierto?¿ Es u na cuestión tífico.
de gusto personal, como señala Peirce? Si algo es
evidente por sí mismo para varias personas -por La ciencia y sus funciones
ejemplo, que aprender materias difíciles adiestra la ¿Qué es la ciencia? Esta pregunta no es fácil de
mente y forma el carácter moral, que la educación contestar, y por eso no se intentará dar directamente

(4) J. Buchler, dir., Phi/osophica/ Writings of Peirce. Nueva (5) Buchler, op. cit., pág. 18.
York: Dover, 1955, cap. 2. En esta exposición me tomo ciertas (6) La posición de este libro es que no hay un único método
libertades en la formulación original de Peirce, con la intención de científico como tal. Hay muchos métodos que los hombres de
aclarar las ideas y adaptarlas mejor a este trabajo. Un buen estudio ciencia pueden utilizar y de hecho emplean, pero tal vez sea ".álido
de los cuatro métodos se encuentra en M. Cohen y E. Nagel, An decir que existe un solo enfoque científico.
Introduction to Logic and Scientific Method. Nueva York: Har- (7) M. Polanyi, Personal Kt10.,iedge. Chicago: University of
court, 1934, págs. 193-1%. Chicago Press, 1958, pág. 4.
LA CIENCIA Y EL METODO CIENTIFICO 5

una definición. En cambio, hablaremos de nociones Por el contrario, el punto de vista dinámico consi-
y puntos de vista sobre la ciencia y luego trataremos dera a Ja ciencia más como u na actividad, vale decir,
de explicar sus funciones. lo que hace el científico. El estado presente del
Ciencia es una palabra muy mal comprendida. conocimiento es importante por supuesto, pero lo es
Hay tres estereotipos muy difundidos que impiden principalmente porque constituye la base para en-
entender la actividad científica. El primero es aquel sanchar Ja teoría y la investigación científicas. A esto
que la considera una tarea que consiste en llevar se le ha llamado punto de vista heurístico. El término
puesta una bata blanca, saber usar el estetoscopio y "heurístico", significa que es útil para descubrir o
trabajar en un laboratorio. El científico es percibido revelar, y tiene ahora la noción de autodescubri-
como una persona peculiar que trabaja con hechos miento ligada a él. Por ejemplo, el método heurístico
en el laboratorio, utiliza equipo complicado, efectúa d.e enseñanza subraya la necesidad de que los estu-
innumerables experimentos y apila hechos con in- diantes descubran las cosas por ellos mismos. En la
tención de mejorar la suerte de la humanidad. Así, ciencia! este punto de vista presta atención preÍe-
aunque parezca un excavador sin imaginación que rente a la teoría y a los esquemas conceptuales inter-
busca hechos, es redimido por sus nobles intencio- dependientes que sirven para ampliar la investiga-
nes. Y hemos de creerle cuando nos dice. por ejem- ción. El enfoque heurístico es aquel que pone de
plo, que esta o aquella pasta dental es buena o que no relieve la importancia de descubrir las cosas por uno
fumemos cigarrillos. mismo.
El segundo estereotipo es el que considera al El aspecto heurístico de la ciencia es lo que la
hombre de ciencia como un individuo distinguido distingue en buena parte de la ingeniería y la tecno-
que piensa, elabora complejas teorías y general- logía. A partir de una conjetura heurística, el cientí-
mente pasa el tiempo en una torre de marfil, aislado fico da un salto arriesgado. Según Polanyi: "Es la
del mundo y de sus problemas. El científico es un zambullida que permite llegar a Ja otra orilla de la
teórico bastante impráctico, aunque su pensamiento realidad. En cada zambullida se juega la vida profe-
y su teoría le conducen a veces a resultados de sional." (9) El punto de vista heurístico puede equi-
importancia práctica, tales como bombas atómicas. pararse también a la solución de problemas; pero en
El tercer estereotipo iguala a la ciencia con la él lo principal es la solución imaginativa, no la ordi-
ingeniería y la tecnología. Se estima que es ciencia la naria. Este punto de vista destaca la solución de
construcción de puentes, el perfeccionamiento de problemas en vez de los hechos y series de datos.
automóviles y cohetes, la automatización de la in- Cuando unos y otros han sido establecidos son útiles
dustria, la invención de máquinas dé enseñanza, etc. para el científico heurístico, pues le conducen a otras
Según este estereotipo, la tarea d~I científico es tra- teorías, a nuevos descubrimientos e investigaciones
bajar en el mejoramiento de lasinvenciones y arte- ulteriores.
factos del hombre. Es visto como una especie de Sin ofrecer todavía una definición directa de la
ingeniero altamente especializado que se esfuerza ciencia -pero ciertamente implicando una- exami-
para que la vida sea fácil y eficiente. namos a continuación su función. Nos encontramos
Las nociones anteriores impiden al estudiante en- con dos puntos de vista distintos. El hombre prác-
tender la ciencia, las actividades y el pensamiento tico, generalmente no científico, ve en ella una disci-
del hombre de ciencia, así como la investigación plina o actividad encaminada a mejorar las cosas, a
científica en general. En una palabra, hacen que su lograr el progreso. Algunos científicos también
tarea sea más dura de lo que sería en otro caso. Por adoptan esta posición. En su opinión, la función de
tanto, es preciso desecharlas para que ocupen su la ciencia es hacer descubrimientos, conocer los he-
Jugar otras nociones más exactas. chos, impulsar la ciencia para mejorar la situación
También en el mundo científico hay dos puntos de del hombre. Las ramas de Ja ciencia que poseen
vista generalizados sobre la ciencia: el estático y el claramente este carácter reciben amplio y decidido
dinámico.(8) El punto de vista estático, que por lo, apoyo. Esto lo atestigua·eJ incremento dado en los
visto influye en la mayor parte del vulgo y de los últimos 40 ó 50 áños a la investigación médica y
estudiantes, sostiene que la ciencia es una actividad militar. Esa función de la ciencia recibe el apoyo de
que aporta al mundo datos sistematizádos. La labor la mayor parte del vulgo y de muchos científicos.
del científico consiste en descubrir hechos y agregar- Aquí predomina el criterio de utilidad práctica.
los al conjunto de información ya existente. Concre- Puede afirmarse. que este concepto ha dominado y
tamente, la ciencia es concebida como un conjunto sigue dominando casi toda la investigación en el
de hechos y una forma de explicar Jos fenómenos campo educativo.( 1O)
observados. Así pues, se hace hincapié en el estado
presente de los conocimientos y en su incremento, (9) Polanyi, op. cit., pág. 123.
(10) Véase, de F. Kerlinger, "Practicality and Educational Re-'
en la extensión de los conocimientos y en el actual search", School Review, LXVII (1959), 281-291; "Research in
conjunto de leyes, teorías, hipótesis y principios. Education", en R. Ebel, V. Noll y R. Bauer, dirs., Encyclopedia of
Educational Research, 4a. edición, Nueva York; Macmillan, 1969,
(8) Conant, op. cit., págs. 23-27. págs. 1127-1144.
6 EL LENGUAJE Y EL ENFOQUE DE LA CIENCIA

Braithwaite expresa un punto de vista muy dife- La teoría es un conjunto de construcciones hipo-
rente sobre la función de la ciencia: "Su fun- téticas (conceptos), definiciones y proposiciones re-
ción ... es establecer leyes generales acerca del lacionadas entre sí, que ofrecen un punto de vista
'comportamiento' de los sucesos y objetos empíri- sistemático de los fenómenos, al especificar las re-
cos de los que trata la ciencia en cuestión, capaci- laciones existentes entre variables, con objeto de
tándonos de esa manera para relacionar nuestros explicar y predecir los fenómenos.
conocimientos sobre los hechos conocidos por sepa-
rado y formular predicciones confiables acerca de La definición dice tres cosas. En primer lugar, la
acontecimientos todavía desconocidos''.( 11) La re- teoría es un conjunto de proposiciones constituido
lación entre este punto de vista sobre la función de la por conceptos definidos y relacionados entre sí. En
ciencia y el punto de vista dinámico-heurístico ex- segundo lugar, establece las relaciones recíprocas
puesto antes, es obvia, salvo que se agrega un ele- entre un grupo de variables (construcciones hipoté-
mento importante: la creación de leyes generales; o ticas), y al hacerlo presenta un punto de vista siste-
teoría, si se quiere. Si deseamos entender la investi- mático sobre los fenómenos deséritos por las varia-
gación moderna de la conducta y sus aciertos y debi- bles. Por último, explica los fenómenos. Esto lo hace
lidades, habrá que explorar los elementos de la afir- especificando cuáles variables están relacionadas
mación de Braithwaite. Para ello examinaremos los con otras y la manera en que se relacionan, capaci-
objetivos de la ciencia y la explicación científica, así tando así al investigador para predecir ciertas varia-
como el papel y la importancia de la teoría. bles a partir de otras.
Supongamos ·que tenemos una teoría acerca del
Objetivos de la ciencia, fracaso en la escuefa. Nuestras variables serían: in-
la explicación científica y la teoría teligencia, aptitudes verbales y numéricas, ansie-
El objetivo fundamental de la ciencia es la teoría. dad, clase social y motivación. Desde luego, el fe-
Dicho en un lenguaje menos críptico, su finalidad nómeno que deseamos explicar es el fracaso en Ja
consiste en explicar los fenómenos naturales. Tales escuela; o quizá más exactamente el aprovecha-
explicaciones reciben el nombre de teorías. En vez miento escolar. El fracaso se explicaría a partir de
de tratar de explicar todas y cada una de las conduc- las relaciones que cada una de las seis variables tiene
tas infantiles, el científico de la psicología busca con el fracaso escolar o por las combinaciones de
explicaciones generales que abarquen y enlacen va- ellas y el fracaso escolar. Si utiliza debidamente ese
rias conductas distintas. Así, no intenta explicar los grupo de construcciones hipotéticas, el científico
métodos con que los niños resuelven los problemas "entenderá" dicho fracaso. Puede "explicarlo" y,
de aritmética, sino que busca las explicaciones gene- hasta cierto punto por lo menos, "predecirlo".
rales de cualquier clase de método relativo a la solu- Es obvio que la explicación y la predicción pueden
ción de problemas. El podría denominar a semejante ser incorporadas a la teoría. La verdadera naturaleza
explicación teoría de la solución de problemas~ de una teoría radica en su explicación de los fenóme-
La descripción del objetivo fundamental de la nos observados. Examinemos la teoría del reforza-
ciencia como teoría puede parecerle extraña al estu- miento. Una proposición sencilla que deriva de ella
diante, a quien probablemente se le ha inculcado la es esta: si una respuesta es recompensada (refor-
noción de que las actividades humanas han de pro- zada) cuando ocurre, tenderá a ser repetida. El cien-
ducir resultados prácticos. Si dijésemos que el obje- tífico que la formuló lo hizo para explicar la unifor-
tivo de Ja ciencia es el mejoramiento de la humani- midad observada en las respuestas. ¿Por qué ocu-
dad, algunos lectores leerían rápidamente las pala- rrieron y volvieron a ocurrir con gran regularidad?
bras y deinmediato las aceptarían. Pero el objetivo Porque fueron recompensadas. Esta es una explica-
básico no es el mejoramiento dela humanidad sino la ción, aunque acaso no sea satisfactoria para mu-
teoría. Por desgracia, esta vasta y verdaderamente chos. Alguien se preguntará: ¿por qué con la recom-
compleja definición no es muy fácil de entender. No pensa aumenta la probabilidad de emitir una res-
obstante, hemos de intentar comprenderla porque es puesta? Una teoría bien elaborada daría la explica-
importante. ción. Pero hasta la fecha carecemos de una respuesta
Otros objetivos que han sido mencionados son: adecuada. Lo único que podemos decir es que, con
explicación, comprensión, predicción y control. un alto grado de probabilidad, el reforzamiento de
Pero si aceptamos que la teoría es la meta final de Ja una respuesta hace que ésta se realice y vuelva a
ciencia, la explicación y Ja comprensión resultan ejecutarse. En otras palabras, las proposiciones de
simplemente objetivos secundarios de la meta final a una teoría, los enunciados de las relaciones, consti·
causa de la definición y naturaleza de la teoría: tuyen la explicación de los fenómenos naturales por
lo menos en lo que se refiere a ella.
Con respecto a la predicción y al control, se pUede
(11) R. Braithwaite, Scientific Explanation. Cambridge; Cam- decir que el científico no tiene que preocuparse por
bridge University Press, 1955, pág. l. la explicación ni por la comprensión. Le bastan la
LA CIENCIA Y EL METODO CIENTIFICO 7

predicción y el control. Los partidarios de esta pers- de la investigación teórica porque, entre otras cosas,
pectiva dirán que la adecuación de una teoría es su tienen mayor aplicabilidad y generalidad.
poder predictivo. Si mediante ella logramos prever
bien, la teoría queda confirmada y eso es suficiente. Investigación científica:
No necesitamos buscar más explicaciones subya- una definición
centes. Dado que podemos predecir con fidelidad, Por fortuna es más fácil definir la investigación
también podemos controlar porque el control se de- científica que la ciencia y la teoría. Pero es dificil
duce de la predicción. lograr que los científicos e investigadores coincidan
Es válido el punto de vista sobre la ciencia basado en tal definición. Aun así, ofrecemos una:
en la predicción. No obstante, en este libro la pre-
dicción es considerada como un aspecto de la teoría. La investigación científica es una investigación
Por su misma naturaleza una teoría debe predecir, o sistemática, controlada, empírica y crítica, de pro-
sea, si de las proposiciones primitivas de una teo~a posiciones hipotéticas sobre las supuestas relacio-
deducimos otras más complejas estamos en esencia nes que existen entre fenómenos naturales.
"prediciendo". Por ejemplo, cuando explicamos los
fenómenos observados, estamos siempre afirmando La definición requiere poca explicación porque en
una relación entre la clase A y la clase B. La finalidad su mayor parte es una expresión condensada y for-
de la explicación científica es especificar las relacio- malizada de lo que se dijo o se dirá. No obstante, hay
nes de una clase de eventos empíricos con otra, en dos puntos que conviene destacar. Primero, cuando
determinadas condiciones. Así decimos: si A es afirmamos que la investigación científica es sistemá-
cierto, entonces lo será también B; A y B designan tica y controlada, queremos decir que está tan orde-
clases de objetos o eventos.(12) Pero esto es predic- nada que los investigadores pueden tener una segu-
ción, prever A apartirdeB. Por ello toda explicación ridad crítica en los resultados. Según veremos más
teórica entraña una predicción. Aquí volvemos a la adelante, ello significa que las observaciones son
idea de que la teoría es la meta final de la ciencia. objeto de un riguroso control. Se descartan de ma-
Todo lo demás se deduce de ella. Esto es quizá lo nera sistemática todas las explicaciones alternativas
que se debe entender cuando se afirma "no hay nada del fenómeno menos una. Se tiene entonces mayor
más práctico que una buena teoría". confianza en la realidad concreta de una relación
No es nuestra intención desacreditar ni denigrar a verificada que si no se hubiesen controlado las ob-
la investigación que no esté orientada específica y servaciones ni suprimido las posibilidades alternati-
deliberadamente hacia la teoría. Hay muchas y va- vas.
liosas investigaciones científicas de orden social que Segundo, la investigación científica tiene carácter
persiguen una meta de corto alcance: descubrir rela- empírico. Si el hombre de ciencia cree en la natura-
ciones específicas. Es decir, se limitan a descubrir leza específica de algo, necesita someter a una
que una relación es parte de la ciencia. Pero las prueba externa su creencia Dicho de otro modo, la
relaciones que resultan al final más útiles y satisfac- opinión subjetiva debe ser confrontada con la reali-
torias son las más generalizadas, las que están liga- dad objetiva. El hombre de ciencia ha de someter sus
das a otras dentro de una teoría. nociones al tribunal de la investigación empírica y de
La noción de generalidad es importante, gracias a la verificación. Debe mostrarse hipercrítico ante los
ella las teorías se aplican a múltiples fenómenos, a resultados de sus investigaciones"y ante los resulta-
numerosas personas en muchos lugares. Por su- dos obtenidos por los demás. Sabe que su informe de
puesto, la relación específica goza de menor aplica- investigación es leído por otros mientras está escri-
bilidad. Por ejemplo, si se descubre que la llamada biendo. Es fácil errar, exagerar o generalizar dema-
ansiedad de prueba se relaciona con la calificación siado cuando se escribe sobre un trabajo propio;
obtenida; ese dato, aunque interesante e importante, pero no es fácil escapar a la sensación de que los ojos
tendrá menor aplicabilidady se comprenderá menos de los científicos están atisbando incesantemente
que si se encuentra antes la relación en una red de por encima del hombro de uno.
variables interdependientes, que forman parte de
una teoría. Son buenos los objetivos modestos, limi- El método científico
tados y específicos. Pero son mejores los objetivos Es la manera sistematizada especial en que se
efectúan el pensamiento y la investigación de índole
(12) Las expresiones que presentan esta forma: "Si pes cierto, reflexiva. En su famoso análisis del pensamiento
entonces también lo será q", llamadas expresiones condicionales reflexivo, How We Think, Dewey nos dejó un mo-
en lógica, son parte de la esencia de la investigación científica.
Junto con los conceptos o variables que las constituyen son los delo de la investigación de problemas.(13) La pre-
principales ingredientes de las teorías. El fundamento lógico de la
investigación científica que sirve de base a gran parte del razona-
miento presentado en este libro fue esbozado en la obra de Kerlin- (13) J. Dewey, How We Think. Boston: Heath, 1933, págs. 106-
ger "Research in Education", op. cit., 1132-1134. 118.
8 EL LENGUAJE Y EL ENFOQUE DE LA CIENCIA

sente exposición se basa en su análisis, aunque he- instrumentos técnicos de que dispone. Por ejemplo,
mos modificado un poco su tratamiento a fin de antes de la invención de la estadística moderna, al-
adaptarlo al contexto científico en que estamos tra- gunos problemas de investigación de la conducta
bajando. eran insolubles. Resultaba difícil, si no imposible,
verificar simultáneamente dos o tres hipótesis inter~
Problema-obstáculo-idea dependientes. Era punto menos que imposible de-
Por lo regular, el científico experimentará un obs- mostrar el efecto interactivo de las variables. Y te-
táculo que se opone a la comprensión, una vaga nemos razones para pensar que ciertos problemas
inquietud frente a los fenómenos observados y no son insolubles si no se abordan en forma multiva-
observados, una curiosidad por conocer las causas riada. Un ejemplo lo constituyen los métodos de
de las cosas. Su primer y más importante paso es enseñanza y su relación con el aprovechamiento y
conseguir una idea clara, formular el problema con con otras variables. Es probable que los métodos
cierto grado de inteligibilidad. Ral'as veces, o nunca, pedagógicos no difieran mucho, si nos lim.itamos a
captará el problema en su totalidad durante esta estudiar sus efectos simples. Posiblemente no actua-
etapa. Necesita luchar con él, tratar de resolverlo, rán igual en condiciones diferentes, con maestros y
convivir con él. Afirma Dewey: "Hay un estado de alumnos distintos.
dificultad, perplejidad y tensión, en que Ja dificultad Un ejemplo nos ayudará a entender esta etapa.
engloba Ja situación impregnándola en su totali- Supongamos que un investigador se halla intrigado
dad" .(14) Tarde o temprano de manera explícita o por la conducta agresiva. Se pregunta por qué la
implícita, se plantea el problema por lo menos en gente se muestra agresiva en situaciones donde la
forma incipiente y tentativa. En esta etapa "intelec- agresividad no es apropiada. Ha observado que pa-
tualiza'', como dice Dewey, "lo que en un principio rece producirse después que las personas experi-
es meramente cualidad emocional de la situación mentan dificultades de diversas clases. (Obsérvese
total" .(15) En cierto sentido, esta es la parte más la vaguedad del problema.) Reflexiona durante algún
difícil e importante de todo el proceso. Sin una cierta tiempo, lee la literatura sobre el tema en busca de
formulación del problema, el científico pocas veces indicios, efectúa más observaciones y luego enuncia
podrá avanzar y esperar que su trabajo sea fructí- una hipótesis: Ja frustración produce agresión. De-
fero. fine 'ta "frustración" como la imposibilidad de al-
canzar una meta y la "agresión" como una conducta
Hipótesis caracterizada por ataque físico o verbal contra otras
Tras pensar en el problema, volver a Ja experien- personas u objetos.
cia en busca de posibles soluciones, observar Jos Razonará más o menos así: si la frustración origina
fenómenos relacionados con él, el científico está en agresión, habrá un alto grado de ésta en los niños que
condiciones de enunciar una hipótesis. La hipótesis asisten a escuelas donde se imponen restricciones y
es un enunciado conjetural, una proposición provi- no se les permite mucha libertad ni expresarse. Asi-
sional sobre la relación que hay entre dos o más mismo, en situaciones sociales difíciles que causen
fenómenos o variables. El científico dirá: "Si ocurre frustración, hemos de esperar más agresión que "la
esto y aquello, se presentarán estos efectos." normal''. Avanzamos un paso en nuestro razona-
miento: si a sujetos experimentales les damos pro-
Razonamiento-deducción blemas interesantes para que los resuelvan y des-
Esta etapa, o actividad, suele ser desdeñada u pués les imped,imos hacerlo, cabrá esperar cierto
omitida. En cierto modo es acaso la parte más impor- tipo de conducta agresiva.
tante de la contribución de Dewey al análisis del Como ya se dijo, el razonamiento puede cambiar
pensamiento reflexivo. En ella el científico deduce el problema. Advertiremos que el problema inicial
las consecuencias de sus hipótesis. Al hablar del no era más que un caso especial de otro más amplio,
auge de la ciencia moderna, Conant dice que el fundamental e importante. Por ejemplo, quizá co-
nuevo elemento surgido en el siglo xv11 fue el empleo mencemos con una hipótesis menos extensa: las si-
del razonamiento deductivo.( 16) Aquí es donde son tuaciones escolares restrictivas causan negativismo
importantes la experiencia, el conocimiento y la en los niños. En consecuencia, generalizaremos el
perspicacia. Cuando el científico infiere las conse- problema así: la frustración produce agresión. Aun-
cuencias de una hipótesis, casi siempre desemboca que ésta es una forma de pensamiento diferente de la
en un problema muy distinto del inicial. Por otra expuesta antes, es importante a causa de lo que
parte, puede advertir que sus inferencias le hacen podemos denominar cualidad heurística. En ocasio-
pensar que el problema no puede ser resuelto con los nes el razonamiento desemboca en problemas más
amplios, más básicos y por tanto de mayor impor-
(14) lbid., pág. 108. tancia, además de proporcionarle a la hipótesis ori-
(15)lbid., pág. 109. ginal implicaciones operacionales (que son
(16) Conant, op. cit., pág. 46. comprobables).
LA CIENCIA Y EL METODO CIENTIFICO 9

Observación-prueba-experimento Es extraordinariamente importante summ1strar


Ya debe estar claro que la fase observación- retroalimentación, a partir de los resultados de la
prueba-experimento es sólo una parte de la empresa investigat;ión, al problema, a las hipótesis y final-
científica. Si el problema fue expuesto con claridad, mente a la teoría. Así. los teóricos e investigadores
si la hipótesis o las hipótesis fueron formuladas de- del aprendizaje con frecuencia modifican sus teorías
bidamente y se han deducido con cuidado sus infe- e investigación a raíz de los hallazgos experimenta-
rencias, esta etapa es casi automática -a condición les.( 18) U nos y otros se han dedicado a estudiar los
que el investigador sea técnicamente competente. efectos que producen el medio ambiente y los prime-
La esencia de la comprobación de una hipótesis ros años de educación en el desarrollo ulterior. Su
estriba en demostrar la relación expresada por ella. investigación ha dado variados datos que convergen
No verificamos las variables en sí, sino su relación. hacia este problema de suma trascendencia.( 19)
Toda observación, toda comprobación, toda expe- Parte del núcleo esencial de la investigación cientí-
rimentación tienen una finalidad especial: someter a fica es un constante esfuerzo por reproducir y com-
prueba la relación expresada en el problema. Es un probar los hallazgos, corregir teorías sobre la base
absurdo realizar pruebas sintonocer bien, al menos, de hechos empíricos y hallar mejores explicaciones a
qué y por qué se están efectuando. Formular un los fenómenos naturales. Puede llegarse al punto de
problema de manera vaga e incorrecta (v. gr.: "¿Qué afirmar que la ciencia tiene un aspecto cíclico. Por
efectps produce el plan fundamental de estudios?") ejemplo, un investigador descubre que A se rela-
y luego aplicar pruebas a los estudiantes para cono- ciona con B en tal y tal forma. Después efectúa más
cer su aprovechamiento, digamos, en estudios socia- investigaciones para precisar en qué otras condicio-
les, es un procedimiento equivocado que irremedia- nes A se relaciona de manera similar con B. Otro
blemente conducirá a la ignorancia y, peor aún, a investigador para refutar esta teoría y su investiga-
información errónea. Igualmente es un absurdo de- ción, ofrece distintas explicaciones y datos propios.
cir que vamos a estudiar las prácticas de agrupa- Es de esperarse que aquél modifique su trabajo a la
miento (agrupar a los alumnos por nivel intelectual, luz de los datos aportados por éste y por los demás.
nivel de lectura, etc.) que siguen los maestros, si El proceso no tiene fin.
ignoramos por qué se hace eso o si no expresamos la Resumamos el llamado método científico de in-
relación entre dichas prácticas y alguna otra y otras vestigación. Ante todo, surge la duda, una barrera,
variables. una situación indeterminada que debe ser precisada.
Otro hecho sobre la prueba de una hipótesis es que El científico experimenta vagas dudas, un trastorno
no se lleva a cabo directamente. Como se indicó en la emocional, ideas incipientes. Se esfuerza por plan-
etapa anterior relativa al razonamiento, lo que veri- tear el problema, así sea en forma inadecuada. Estu-
ficamos son las implicaciones deducidas de ellas. dia la literatura, escudriña su experiencia y la ajena.
Nuestra hipótesis podría ser, "Escribir observacio- Muchas veces le basta esperar una chispa de inven-
nes acerca de los trabajos de los estudiantes mejo- tiva en su mente. Tal vez ocurra, tal vez no. Plan-
rará sus trabajos futuros", que fue deducida de una teado el problema y después de formularse debida-
hipótesis más amplia: "El refuerzo de las respuestas mente las preguntas esenciales, el resto es mucho
produce un incremento en el ritmo y la fuerza de las más fácil. Construye la hipótesis y luego extrae las
mismas." No verificamos la aseveración "observa- inferencias empíricas. En este proceso es posible
ciones escritas sobre los trabajos de los estudiantes'' que se cambie el problema original y, por supuesto,
ni la afirmación "el mejoramiento de sus trabajos la hipótesis inicial. A veces la amplía, la reduce y
futuros", sino su relación. hasta la abandona. En fin, la relación expresada se
Subrayó Dewey que la secuencia temporal del verifica mediante Ja observación y la experimenta-
pensamiento reflexivo o de la investigación no es ción. La hipótesis es aceptada o rechazada según los
fija. Nosotros podemos repetir y volver a destacar resultados de la investigación. A continuación la
esta afirmación. Las etapas del método científico no información suministra retroalimentación al pro-
han sido establecidas con claridad. La primeia no blema original y éste se mantiene o se altera según lo
termina claramente antes de iniciarse la ~.:gunda. indiquen las pruebas. Señala Dewey que a veces una
Además podemos efectuar pruebas antes de deducir fa""" del proceso se dilata y adquiere gran importan-
debidamente las implicaciones de la hipótesis.
Puede parecer que la hipótesis misma requiera per-
(18) E. Hilgard y G. Bower, Theories of Learning, 3a. edición,
feccionamiento o elaboración corno resultado de las Nueva York: Appleton, 1966.
implicaciones deducidas a partir de ella.( 17) (19) Por ejemplo, E. Bennett y colaboradores, "Chemical and
Anatomical Plasticity of Brain", Sci en ce, C XLVI (1964), 610-619;
( 17) A menudo se hallará que una vez que se deducen las implica- J. Hunt, /11te/ligence and E.xperience. Nueva York: Ronald, 1961;
ciones de una hipótesis, ésta y su expresión son inadecuadas. Por M. Whiteman y M. Deutsch, "Social Disadvantage as Related to
otra parte, cuando una hipótesis es tan vaga que se puede tomar por lntelective and Language Development". En M. Deutsch, l. Katz y
buena una u otra implicación, con frecuencia surge una dificultad: A. Jensen, dirs., Social Class, Race and Psychological Deve/op-
la imposibilidad de realizar pruebas precisas. ment. Nueva York: Holt, Rinehart y Winston, 1968. págs. 86-114.
10 EL LENGUAJE Y EL ENFOQUE DE LA CIENCIA

cia, otras se omite y puede haber un número mayor o trascendencia. Lo verdaderamente importante son
menor de etapas. Pocas veces la investigación es un la racionalidad controlada de la investigación cientí-
proceso ordenado. En realidad, es much() más des- fica como un proceso de indagación reflexiva, el
ordenado de lo que da a entender la exposición carácter interdependiente de sus partes, el valor su-
anterior. Pero ni el orden ni el desorden tienen gran premo del problema y su expresión.
CAPITULO 2
Problemas e hipótesis

Muchas personas creen que la ciencia es esen- si se desea resolver un problema es preciso saber de
cialmente una actividad que consiste en recopilar qué problema se trata. Podemos decir que una gran
datos. Según Cohen, no es así: parte de la solución reside en saber qué es.lo que se
intenta hacer. Otra parte consiste en saber qué es un
No hay un progreso genuino del conocimiento cientí- problema y, sobre todo, qué es un problema cientí-
fico en el método baconiano de acumular datos empíri- fico.
cos, si no se formulan hipótesis ni se prevé la naturaleza ¿En qué consiste el buen planteamiento del pro-
de lo observado. Si carecemos de cierta idea orienta- blema? Si bien los problemas de investigación difie-
dora no sabremos cuáles datos reunir ... ni podremos
determinar qué es importante y lo que no lo es.(1}
ren considerablemente y aunque no ~xiste una forma
"correcta" de enunciarlos, es posible aprender cier-
tas características de los problemas y la manera de
La persona sin información científica tiene la idea de enunciarlos para utilizarlas con provecho. Ante
que el hombre de ciencia es un individuo muy obje- todo, tomemos dos o tres ejemplos de problemas
tivo que reúne datos sin ideas preconcebidas. Hace publicados y estudiemos sus características. En
mucho tiempo Poincaré señaló cuán errónea es esa primer lugar, examinemos el que abordó Hurlock en
creencia cuando afirmó: el estudio mencionado en el capítulo 1: ¿Cuáles son
A menudo se afirma que los experimentos deberían
los efectos del uso de diversos tipos de incentivos en
realizarse sin ideas preconcebidas. Esto es imposible, el aprovechamiento escolar?(3) Obsérvese que el
pues entonces los experimentos no sólo serían infructí- problema se expresa en forma de pregunta. En este
feros sino que aunque lo deseáramos no podríamos caso la forma más sencilla es la mejor. Obsérvese
lograrlo.(2) también que denota una relación entre variables, en
este caso entre las variables incentivos y aprove-
chamiento escolar.
Problemas El problema es, pues, una oración interrogativa
No siempre es posible para un investigador plan- que pregunta: ¿ QlJé relación existe entre dos o más
tear el problema de manera sencilla, clara y com- variables? La investigación intenta dar respuesta a
pleta. Con frecuencia no posee sino una noción ge- esta pregunta. Si se trata de un problema científico,
neral, vaga y hasta confusa del problema. Ello es casi siempre contendrá dos o más variables. En el
propio de la complejidad de la investigación cientí- ejemplo de Hurlock la formulación del problema
fica. A veces al investigador le cuesta años de explo- relaciona el incentivo con el aprovechamiento esco-
ración, reflexión e investigación poder decir con lar. Otro problema que planteó Page es este: ¿Mejo-
claridad a qué preguntas buscaba dar contestación. ran los comentarios del maestro el aprovechamiento
No obstante, el enunciado adecuado del problema es de sus alumnos?(4) Una variable son los comenta-
una de las partes más importantes de la investiga- rios del maestro (o reforzamiento) y la otra es el
ción. El hecho de que sea difícil o imposible expresar aprovechamiento escolar. La parte relacional se ex-
satisfactoriamente un problema no debe hacer per- presa por la palabra "mejoran". Un tercer problema
der de vista la conveniencia ni la necesidad de formu-
larlo. Tampoco debe usarse la dificultad como ex-
(3) E. Hurlock, "An Evaluation of Certain Incentives U sed in
cusa para no formularlo. Schoolwork", Journal of Educational Psychology, XVI (1925),
Sin dejar de tener en mente la dificultad mencio- 145-159. Cuando cito problemas e hipótesis tomados de otros escri-
nada, podemos enunciar un principio fundamental: tos, no siempre uso las palabras de los autores. Las formulaciones
de algunos problemas son mías y no de los autores. Algunos sólo
utilizan formulaciones de problemas; otros emplean exclusiva-
(1) M. Cohen. A Preface to Logic. Nueva York: Meridian, 1956, mente hipótesis, otros ambas.
pág. 148. (4) E. Page, "Teacher Comments and Student Performance: A
(2) H. Poincaré, Science ami Hypothesis. Nueva Yprk: Dover, Seventy-Four Classroom Experiment in School Motivation".
1952, pág. 143. Journal of Educational Psycho/ogy, XLIX (1958), 173-181.

11
12 EL LENGUAJE Y EL ENFOQUE DE LA CIENCIA

expuesto por Hurlock es más complejo aún: ¿Bajo niños con la educación democrática?" "¿Son bue-
qué condiciones el aprendizaje de cómo aprender se nas las actividades en grupo para los niños?" Pre-
transfiere a nuevas situaciones?(5) Una variable es guntas que pueden denominarse metafísicas en el
"aprender a aprender" (o disposición); la otra es sentido de que se encuentran, por lo menos, tal como
transferencia (del aprendizaje).(6) se expresan, más allá de las posibilidades de una
comprobación empírica. El problema principal es
Criterios sobre problemas que algunas no son relaciones y que la mayoría de
y la forma de pla11tearlos sus construcciones hipotéticas son muy difíciles e
Contamos con tres criterios para reconocer pro- imposibles de definir en una manera que nos permita
blemas adecuados y su formulación acertada. Pri- medirlas.(7)
mercriterio: el problema ha de expresar u na relación
entre dos o más variables. En efecto, se hacen pre- Hipótesis
guntas como las siguientes: ¿se relaciona A con B?, La hipótesis es una expres10n conjetural de la
¿cómo se relacionan A y B con C?, ¿cómo se rela- relación que existe entre dos o más variables. Siem-
ciona A con Ben las condiciones C y D? Las raras pre aparece en forma de oración aseverativa y rela-
excepciones a este criterio se dan principalmente en ciona, de manera general o específica, una variable
la investigación taxonómica o metodológica. (Véase con otra. Hay dos criterios para identificar las hipó-
Apéndice B.) tesis "buenas" y los enunciados correctos. Son
Segundo criterio: el problema debe formularse idénticos a los que se aplicaron a los problemas y a su
claramente y sin ambigüedad en forma de pregunta. enunciación. Primer criterio: las hipótesis son ex-
Así,enlugardedecir: "Elproblemaes ... ",o"El presiones de las relaciones que hay entre variables.
objetivo de este estudio es ... ", hágase una pre- Segundo criterio: indican claramente la necesidad de
gunta, pues las preguntas tienen la virtud de plan- verificar las.relaciones expresadas. Así pues, ambos
tearlos directamente. El propósito de un estudio no criterios significan que las formulaciones de hipóte-
es necesariamente el mismo que el problema de un sis contienen dos o más variables que son mensura-
estudio. Por ejemplo, el objetivo del estudio de Hur- bles o potencialmente mensurables y que especifi-
lock, fue arrojar luz sobre el uso de incentivos en las can cómo se relacionan las variables. Una formula-
situaciones escolares. El problema planteó una pre- ción que carezca de una u otra de las características
gunta acerca de la relación entre incentivos y apro- o de ambas no es una hipótesis en el sentido cientí-
vechamiento. También en este caso la forma más fico de la palabra.(8)
sencilla es la mejor: hacer una interrogante. Tomemos de Ja bibliografía pedagógica tres hipó-
El tercer criterio es a menudo difícil de satisfacer. tesis, y apliquémosles los dos criterios. En primer
Exige que el problema y su formulación sean tales lugar, consideremos una hipótesis muy sencilla: el
que permitan verificación empírica. El problema estudio en grupo contribuye a la obtención de mejo-
cuya relación o relaciones son indemostrables no res calificaciones.(9) Tenemos aquí una relación en-
tiene carácter científico. Ello significa no sólo que se tre dos variables: el estudio en grupo y la obtención
expresa una relación real, sino que las variables de.la de buenas calificaciones. Puesto que la medición de
relación pueden medirse de algún modo. Muchas las variables es fácil, de inmediato se capta la posibi-
preguntas interesantes e importantes no son de tipo lidad de someter a prueba la hipótesis y así se cumple
científico, sencillamente porque no son susceptibles con los dos criterios. La segunda hipótesis es dife-
de comprobación. Algunas preguntas filosóficas y rente porque enuncia la relación en la llamada forma
teológicas, aunque tal vez importantes para el indi- nula: la práctica de una función mental no ejerce
viduo que las examina, no pueden ser probadas em-
píricamente y, por lo mismo, carecen de interés para (7) A partir de un punto de vista diferente, Webb propone los
el científico. La pregunta epistemológica: "¿Cómo siguientes criterios para los problemas de investigación: conoci-
conocemos?" es una de ellas. Una pregunta teoló- miento (del investigador); insatisfacción (escepticismo, ir contra la
corriente, etc.); generalidad (amplitud de aplicabilidad). Su artículo
gica medieval clásica es ésta: "¿Cuántos ángeles es doblemente valioso porque logra prescindir de criterios que no
pueden danzar en la cabeza de un alfiler?" En la vendrían al caso, entre ellos verificabilidad, avidez, conformidad
educación abundan preguntas interesantes aunque ("Todo mundo lo hace"). W. Webb, "The Choice of Problem",
no científicas; v. gr.: "¿Mejora el aprendizaje de los American Psycho/ogist, XVI (1%1), 223-227.
(8) Hay hipótesis )egítimas a las que, por lo menos superficial-
mente, les falta el criterio de relación. Por ejemplo, en las investiga-
(5) H. Harlow, "The Formation ofLearningSets",Psyc/10/ogi- ciones sobre el análisis factorial que se expondrá más adelante a
ca/ Review, LVI (1949), 51-65. veces surgen problemas como el siguiente: ¿en qué factores se
(6) Los problemas se presentan en la misma forma en las varias basan las actitudes sociales? Podriamos recurrir a una hipótesis
ciencias de la conducta. He aquí un problema sociológico pro- como esta: hay dos factores fundamentales en las actitudes socia-
puesto por Etzioni (hay otros en las páginas que siguen): ¿El con- les: I) liberalismo y ll) conservadurismo. Pero en este libro se
flicto aumenta o impide la eficiencia de las organizaciones? A. insistirá en las afirmaciones de índole relacional.
Etzioni, Modem Orga11izatio11s. Englewood Cliffs, N. J.: (9) J. Blue, .. The Effects of Group Study on Grade Achieve-
Prentice-Hall, 1964, pág. 27. · ment" ,Journal ofEduca1io11al Psycho/ogy, XLIX( 1958), 118-123.
PROBLEMAS E HIPOTESIS 13

ningún efecto sobre el aprendizaje futuro de ella una hipótesis de "diferencia". Pero también se
misma.( 10) Adviértase que la relación se expresa puede reducir a la forma general de tipo relacional de
directa y claramente: una variable (práctica de una la cual partimos: las actitudes ante los objetos cog-
función mental) se relaciona con otra (aprendizaje), noscitivos relacionados significativamente con la
por medio de las palabras "no ejerce ningún efecto ocupación son, en parte, una función de la conducta
futuro". Pero en el criterio de comprobabilidad po- y de las expectativas asociadas con esa ocupación.
tencial topamos con una dificultad. Nos enfrenta-
mos al problema de definir "función mental" y Importancia de los problemas
"aprendizaje" de manera que sean mensurables. Si y de las hipótesis
logramos resolverlo satisfactoriamente tendremos Nadie duda que las hipótesis son instrumentos
sin duda una hipótesis. En realidad, ya contamos importantes e indispensables en la investigación
con una hipótesis famosa pero que generalmente no científica. Semejante convicción se basa en tres mo-
ha sido enunciada como tal, sino como un hecho, por tivos principales. El primero lo constituyen los ins-
muchos educadores de ayer y hoy. trumentos de trabajo de la teoría. Las hipótesis se
La tercera hipótesis representa una clase muy ex- pueden deducir de una teoría y de otras hipótesis.
tensa e importante. En ella la relación es indirecta, Por ejemplo, si trabajamos con una teoría de la agre-
oculta. De ordinario se expresa mediante una afirma- sión, posiblemente busquemos causas y efectos de la
ción de que grupos A y B se distinguirán en alguna conducta agresiva. Quizá hayamos presenciado epi-
característica. Por ejemplo: los niños de clase media sodios en los que este tipo de conducta apareció
evitarán con más frecuencia que los de la clase prole- después de circunstancias frustrantes. La teoría in-
taiia las tareas de pintar con los dedos.( 11) Adviér- cluiría entonces la proposición: la frustración pro-
tase que esta afirmación difiere poco de la hipótesis duce agresión.( 13) A partir de esta amplia hipótesis
real, que se formularía así: la conducta de pintar con es posible deducir otras más específicas, tales como:
los dedos depende, en parte, de la clase social. Si si se impide que los niños alcancen las metas que
esta última formulación fuera la hipótesis expresada, estiman convenientes (frustración) se ocasionará
la primera podría considerarse una subhipótesis o una riña entre ellos (agresión); si se les priva del
una predicción específica basada en la hipótesis ori- amor de sus padres (frustración), reaccionarán en
ginal. parte con una conducta agresiva.
Examinemos otra hipótesis de este tipo, pero que El segundo motivo es que las hipótesis son com-
difiere aún más. Las personas que tienen la misma probables y puede demostrarse que probablemente
ocupación o una similar asumirán actitudes pareci- son ciertas o falsas. Sólo se someten a prueba las
das frente a un objeto cognoscitivo relacionado sig- relaciones, según dijimos antes, no los hechos aisla-
nificativamente con ella.( 12) ("Objetos cognosciti- dos. Dado que las hipótesis son proposiciones de
vos" son cualesquiera cosas concretas o abstractas carácterrelacional, ésta es quizá la principal razón
percibidas y "conocidas" por los individuos- de que se usen en la investigación científica. En
personas, grupos, gobierno y educación son ejem- esencia, se trata de predicciones en la forma: ··Si A
plos de tales objetos.) Desde luego, la relación en es cierto, tambiérr lo será B". que expusimos al
este caso se da entre ocupación y actitudes (frente a someter a prueba la relación existente entre A y B.
un objeto cognoscitivo relacionado con la ocupa- Dejamos que los hechos establezcan la probable
ción; por ejemplo, el papel del educador y sus actitu- verdad o falsedad de la hipótesis.
des ante la educación). Para probar esta hipótesis El tercer motivo es que las hipótesis son podero-
sería preciso disponer de dos grupos, cada uno de los sos instrumentos que contribuyen al progreso de la
cuales representaría una ocupación diferente, ciencia, pues permiten al hombre salirse de sus pro-
cuando menos para después comparar sus actitudes. pia'> percepciones. Aunque construidas por efhom-
Así, podríamos tomar un grupo de maestros y com- bre, existen y prescindiendo de sus valores y opinio-
parar sus actitudes hacia la educación digamos con nes, puede demostrarse que son probablemente co:.
las de un grupo de hombres de negocios. Por tanto, rrectas o incorrectas. Ello es tan importante que nos
en su expresión concreta la hipótesis es realmente atrevemos a decir que sin ellas no habría ciencia en el
sentido estricto del término.
Tan importantes como las hipótesis son los pro-
(10) A. Gates y G. Taylor. "An Experimental Study of the Na-
ture of lmprovement Resultíng from Practice in a Mental Func- blemas ocultos tras ellas. Como señala Dewey, la
tion", Journal of Educational Psychology, XVI ( 1925), 583-592. investigación normalmente comienza con un pro-
( 11) T. Alper, H. Blane y B. Adams, "Reactions of Middle and blema, con una situación problemática. Añade que
Lower Class Children to Finger Paints as a Functíon of Class
al inicio hay una situación indeterminada donde las
Differences in Child-Training Practices" .Journal ofAhrwrmal and
Social Psycltoiogy, LI ( 1955), 439-448. ideas son vagas, surgen dudas y el pensador se mues-
( 12) F. Kerlinger, "The Attitude Structure of the Individual: A
Q-Study of the Educational Altitudes of Professors and Laymen". (13) J. Dollard y colaboradoree, Frustration and Aggression.
Genetic Psycho/ogy Monographs, LIII ( 1956). 283-329. New Haven: Yale University Press. 1939.
14 EL LENGUAJE Y EL ENFOQUE DE LA CIENCIA

tra perplejo.( 14) Agrega que el problema no es enun- situación de prueba aminora las puntuaciones acer-
ciado ni puede ser enunciado hasta que no se expe- tadas en una prueba de aprovecharriiento, y los índi-
rimenta esa situación. ces de delincuéncia son más elevados en los ghettos
Pero llega el momento en que la indeterminación que en otras zonas de la ciudad.
debe ser eliminada. Si bien es verdad, como se in- Gracias a los problemas y las hipótesis adquiere
dicó antes, que muchas veces el investigador tiene auge la ciencia, pues ayudan al investigador a con-
sólo una noción general y vaga del problema, tarde o firmar o refutar una teoría. Supongamos que un in-
temprano poseerá una idea bastante precisa de lo vestigador de psicología aplica a algunos sujetos tres
que es el problema. A pesar de que tal afirmación o cuatro pruebas, entre las cuales hay una de ansie-
parece evidente en que la formulación clara y com- dad y otra de aritmética. Luego de calcular sistemá-
pleta de un problema de investigación es una de las ticamente las correlaciones entre las tres o cuatro
cosas más dificiles de hacer. En otras palabras, debe pruebas, se percata de que la correlación entre an-
saber uno lo que trata de descubrir. Cuando final- siedad y aritmética es negativa. Por consiguiente,
mente se logra, podemos decir que ya se ha avan- llega a la conclusión de que cuanto mayor es la
zado bastante en la solución del problema. ansiedad menor será la puntuación en aritmética.
Pero es muy posible que la relació'n sea fortuita y
Ventaj~s de los problemas hasta espúrea. No obstante, si hubiera supuesto la
existencia de la relación basándose en la teoría, ten-
y de las hipótesis
dría mayor confianza en los resultados. En resumen,
Los problemas y las hipótesis ofrecen, pues, no-
el investigador que no supone por adelantado una
tables ventajas. En primer lugar dirigen la investiga-
relación, impide que los hechos demuestren o refu-
ción. Las relaciones expresadas en las hipótesis le
ten algo.( 16)
indican al investigador qué cosa ha de hacer. En
Este uso de la hipótesis se asemeja a un juego de
segundo lugar, como suelen ser afirmaciones rela-
azar. Las reglas del juego se especifican de ante-
cionales generalizadas le permiten deducir específi-
mano, y las apuestas se hacen también por adelan-
cas manifestaciones empíricas, implícitas en dichos
tado. No se permite cambiar las reglas después de un
problemas e hipótesis. Podemos decir, repitiendo lo
resultado, ni las apuestas una vez hechas. Ello no
que afirmaron Allport y Ross, si es verdad que las
sería "limpio". Está prohibido echar el dado y luego
personas de orientación religiosa extrínseca (que
usan la religión) albergan prejuicios, mientras que apostar. Análogamente, si primero se compilan da-
las de orientación religiosa intrínseca (que viven la tos y luego se escoge uno y se llega a una conclusión
religión) carecen de ellos, se deduce que quienes basándose en él, se habrán violado las reglas del
asisten a la iglesia tendrán más prejuicios que quie- juego científico.
nes no asisten. Tal vez tengan también una filosofía Entonces el juego sería "sucio" porque el investi-
al estilo de _la selva: sospecha y desconfianza general gador podría capitalizar fácilmente, por ejemplo,
ante el mundo.(15) dos relaciones importantes entre cinco que fueron
Hay importantes diferencias entre problemas e demostradas. ¿Qué sucede con las tres restantes?
hipótesis. Estas últimas son verificables si se formu- Generalmente se olvidan. Pero en un juego limpio
lan bien. Aunque a veces son demasiado amplias cuenta cada lance. El punto principal, quizá, es que
como para poder demostrarlas directamente, si es el objetivo de Ja hipótesis estriba en dirigir la investi-
una hipótesis "buena" podemos deducir de ella gación. Como dijera Darwin hace mucho tiempo,
otras hipótesis verificables. La cuestión es que ni los todas las observaciones han de ser· a favor o en
hechos ni las variables se someten a comprobación contra de algún punto de vista si se quiere que sean
como tales. Sí, en cambio, las relaciones expresadas útiles.
por las hipótesis. Es importante resolver científica- Se ha expuesto ya un hecho de suma importancia
mente un problema si no se le reduce a la forma de en las hipótesis, pero hay que darle una expresión
hipótesis porque el problema es una pregunta, gene- formal e incluso repetirlo. Las hipótesis encarnan la
ralmente amplia, y no es directamente demostrable. teoría, o parte de ella, en forma demostrable o casi
Las preguntas: ¿Afecta la ansiedad al aprovecha-
miento? ¿Producen delincuencia las condiciones de (16) Las palabras "demostrar" y "negar" no han de tomarse en
vida en el ghetto? No son susceptibles de comproba- su sentido literal ordinario. Recuérdese que una hipótesis nunca se
ción. Se prueban una o más hipótesis contenidas en demuestra ni se refuta. Para ser más precisos debemos decir algo así
ellas. Por ejemplo, Ja ansiedad provocada por una como esto: el peso de los hechos favorece a la hipótesis o arroja
dudas sobre ella. Según Braithwaite: "Por eso, los datos empíricos
del ejemplo nunca demuestran la hipótesis: en casos apropiados
(14) J. Dewey, Logic: The Theoryoflnquiry. Nueva York: Holt, podemos decir que la establecen, dando a entender con ello que
Rinehart and Winston, 1938, pág. 105-107. hacen razonable su aceptación; pero nunca la demuestran en el
(15) G. Allport y J. Ross, "Personal Religious Orientation and sentido de que sea una consecuencia lógica de ellos". (R. Braith-
Prejudice", Journal of Personality and Social Psychology, V waite, Scientific Explanation. Cambridge: Cambridge University
(1967), 432-443. Press, 1955, pág._ 14.)
PROBLEMAS E HIPOTESIS 15

demostrable. Anteriormente se dio un ejemplo de relación. Pero la afirmación fracasa como hipótesis
teoría del reforzamiento en el que se dedujeron hipó- científica porque se vale de dos locuciones o pala-
tesis verificables a partir de un problema general. La bras valorativas ("métodos de enseñanza autorita-
importancia de reconocerles esta función puede rios" y "aprendizaje deficiente"), ninguna de las
probarse entrando por la puerta trasera y utilizando cuales puede definirse para los fines de la medición
una teoría muy difícil, y tal vez imposible, de com- sin suprimir los adjetivos "autoritarios" y "defi-
probar. En la teoría freudiana de la ansiedad figura el ciente". Este último término es evidentemente una
concepto de represión. Ahora bien, por represión palabra valorativa: dénota un juicio de valor. Para
entendía Freud la introducción forzada de ideas in- alcanzar respetabilidad científica, es preciso borrar
aceptables en lo profundo del inconsciente. Para de- la expresión "aprendizaje deficiente" y substituirla
mostrar esa teoría es preciso deducir las relaciones con alguna como "decremento en la resolución de
indicadas en ella. Huelga decir que tales inferencias problemas'', que contiene la posibilidad de medición
deberán incluir la noción de represión, la cual con- mas no un juicio valorativo. En la actualidad, la
tiene el concepto de inconsciente. Con estos concep- expresión ''métodos de enseñanza autoritarios'' no
tos pueden formularse hipótesis; para probar la teo- puede ser reelaborada para hacerla demostrable, si
ría hay que enunciarlas de ese modo. Pero demos- bien su definición es posible. La dificultad estriba en
trarlas es una cuestión más ardua a causa de la ex- que la mera utilización del adjetivo "autoritarios"
trema dificultad de definir términos como ''repre- designa un juicio valorativo, al menos en este caso.
sión" e "inconsciente" en una forma que nos per- Tal como se usa hoy, afirma que tales métodos son
mita medirlos. Hasta la fecha nadie ha logrado defi- "deficientes". Otra dificultad es que aún no sabe-
nirlos sin apartarse demasiado del significado y del mos qué significa "métodos de enseñanza autorita-
empleo que les dio Freud. Así pues, las hipótesis son rios''. Por lo regular parece que nos referimos a las
importantes puentes tendidos entre la teoría y la tendencias docentes personales de quienes los em-
investigación empírica. plean.( 17)
Con frecuencia se formulan, sobre todo en el
campo de la educación, otras clases de aseveracio-
Problemas, valores nes que no son hipótesis o son hipótesis defectuosas.
y definiciones He aquí una: el plan fundamental de estudios es una
A fin de aclarar aún más la naturaleza de los pro- experiencia enriquecedora. Otro t\po demasiado
blemas y las hipótesis se expondrán dos o tres erro- frecuente es la generalización vaga: las aptitudes
res comunes. Primero, los problemas científicos no para la lectura pueden identificarse en el segundo
son cuestiones morales ni éticas. ¿Son malas para grado escolar; la meta del individuo es su propia
los niños las medidas disciplinarias de carácter puni- realización; el prejuicio depende de ciertos rasgos de
tivo? ¿Ha de ser democrático el liderazgo de una la personalidad.
organización? ¿Cuál es la mejor forma de enseñar a Otro defecto común de las expresiones de pro-.
los universitarios? Hacer tales preguntas equivale a blemas se presentan a menudo en las tesis doctora-
formular preguntas de valor y juicio que la ciencia no les: la enumeración de puntos o "problemas" meto-
puede responder. Muchas de las llamadas hipótesis dológicos como subproblemas. Estos puntos poseen
no lo son en absoluto. Por ejemplo: la técnica de dos características que los hacen fáciles de descu-
enseñanza en grupos pequeños es más eficaz que la brir: l) no son problemas substanciales que deriven
técnica expositiva. Este es un enunciado de orden del problema básico, y 2) se relacionan con técnicas
valorativo; es un artículo de fe y no una hipótesis. Si o métodos de muestreo, medición o análisis. Gene-
fuera posible expresar una relación entre las varia- ralmente, no se.exponen en forma interrogativa, sino
bles y definirlas para probar la relación podríamos que contienen las palabras "demostrar", "determi-
tener una hipótesis. Mas no hay manera de demos- nar", "medir", y otras semejantes. "Determinar el
trar científicamente las preguntas relativas a los va- grado de confiabilidad de los instrumentos utilizados
lores. en esta investigación", "Demostrar la importancia
U na forma rápida y relativamente fácil de descu- de las diferencias de los promedios", "Asignar
brir preguntas y expresiones sobre valores es buscar alumnos aleatoriamente a los grupos experimenta-
palabras como "debe", "mejor que" (en vez de les" son formulaciones representativas de esta no-
"mayor que") y vocablos similares que denoten jui- ción ciertamente errónea de los problemas y los
cios o preferencias culturales o personales. Sin em- subproblemas.
bargo, las expresiones de valores son engañosas.
Una afirmación de tipo imperativo ("debe") es sin
duda una expresión de valor, pero otras clases de (17) Un caso poco menos que clásico del uso del término "autori-
afirmaciones no son tan obvias. Tomemos Ja aseve- tario" es la expresión que a veces se oye entre los educadores: el
método expositivo es autoritario. Esto parece significar que no les
ración: los métodos de aprendizaje autoritario dan gusta y que lo juzgan malo. Análogamente, una de las formas más
origen a un aprendizaje deficiente. En ella hay una eficaces de criticar a un maestro es decir que es autoritario.
16 EL LENGUAJE Y EL ENFOQUE DE LA CIENCIA

Generalidad y especificidad importante e interesante que sea, resulta demasiado


de los problemas e hipótesis sutil para una tesis de doctorado. El exceso de espe-
Esta es una dificultad que muchas veces encuen- cificidad es acaso un peligro peor que una generali-
tra el investigador y que a casi todos los estudiantes dad exagerada. En todo caso, debe llegarse a un
que trabajan en una tesis les parece engorrosa. Si el término medio entre ambas. La capacidad de lo-
problema es muy general a menudo es demasiado grarlo es en parte una función de la experiencia y en
vago e indemostrable, de modo que científicamente parte de un intenso estudio crítico de los problemas
resulta inútil aunque sea interesante su lectura. Los de investigación.
problemas e hipótesis excesivamente generales o
vagos son comunes. Por ejemplo: la creatividad es
una función de la autorrealización del individuo; la Naturaleza multivariable
educación democrática refuerza al aprendizaje so- de la investigación
cial y a la ciudadanía; el autoritarismo en el aula y de los problemas conductuales
universitaria inhibe la imaginación creadora de los Hasta ahora el estudio de problemas e hipótesis se
alumnos. Tales problemas son interesantes. pero en ha limitado considerablemente a dos varia:bles,x y y.
su forma presente son menos que inútiles desde el Hemos de apresurarnos a corregir cualquier impre-
punto de vista científico, pues no son demostrables y sión de que tales problemas e hipótesis constituyen
dan una seguridad espuria de que se trata de hipóte- la norma en la investigación de la conducta. Los
sis que "algún día" serán probadas. investigadores de psicología, sociología y demás
Términos como "creatividad", "autorrealiza- ciencias del comportamiento se han dado cuenta
ción", "democracia", "autoritarismo", por lo me- cada vez más de la naturaleza multivariable de la
nos hasta hoy carecen de referencias empíricas ade- investigación del comportamiento. En lugar de de-
cuadas.( 18) Ahora bien, es verdad que podemos de- cir: si se realizap, también se presentará q, muchas
finir la "creatividad'', digamos en forma limitada, veces es más apropiado afirmar: si se realizan p1,
especificando una o dos pruebas de creatividad. pz . . , Pk, ocurrirá q; o: si se realiza p 1, ocurrirá q
Este procedimiento es legítimo. pero al recurrir a él en las condiciones r, s y t.
corremos el riesgo de alejarnos demasiado del tér- Un ejemplo aclarará esta cuestión. En lugar de
mino original y de su significado. Ello ocurre sobre limitarnos a formular la hipótesis: si hay frustración
todo cuando hablamos de la creatividad artística. A se producirá agresión, es más realista reconocer la
veces estamos dispuestos a aceptar el riesgo con tal naturaleza multivariable de los determinantes e in-
de lograr investigar problemas importantes. Sin em- fluencias de la agresión diciendo, por ejemplo: si
bargo, términos como "democracia" son casi impo- alguien posee gran inteligencia, pertenece a la clase
sibles de definir y aunque los definiésemos nos da- media, es varón y está frustrado, será agresivo. O
ríamos cuenta de que hemos destruido su signifi- bien: si hay frustración habrá agresión, si la persona
cado. tiene gran inteligencia, es de clase media y sexo
El otro extremo lo constituye una especificidad masculino. En vez de unax tendremos cuatro. Aun-
desmedida. Todos los estudiantes han oído que es que un fenómeno puede ser de suma importancia
preciso reducir los problemas a dimensiones prácti- porque causa o influye en otro, es poco probable que
cas. Así debe ser, pero desgraciadamente también la mayoría de los fenómenos que interesan al cientí-
podemos reducirlo al punto de anularlo. En general, fico de la conducta sean causados en forma sencilla.
cuanto más específico es un problema o hipótesis. Es más probable que sean causados en forma múlti-
más claras serán las posibilidades de someterlo a ple. Es mucho más probable que la agresión sea el
prueba, tal vez a costa de ser triviales. Al investiga- resultado de varias influencias que actúan en formas
dor le es imposible manejar problemas excesiva- complejas. Por otra parte, también la agresión tiene
mente amplios porque tienden a ser muy vagos para múltiples aspectos. Después de todo, hay distintas
las operaciones de investigación; no obstante, en su clases de ella.
celo por reducirlos a dimensiones prácticas o hallar Por tanto, precisa que los problemas y las hipóte-
un problema manejable a veces los anula, los hace sis reflejen la complejidad multivariable de la reali-
triviales o incoherentes. Por ejemplo, un estudio dad psicológica, sociológic~. y educacional. Aunque
sobre la sencilla relación que existe entre la veloci- en la parte inicial del libro hablaremos de una x y una
dad de lectura y el tamaño del tipo de letra, por y debe entenderse que la investigación del compor-
tamiento, cuyo enfoque solía ser casi exclusiva-
( 18) Si bien se han realizado con gran éxito numere sos estudios mente univariable, se está convirtiendo rápidamente
sobre el autoritarismo, es dudoso que sepamos lo que dicho término en multivariable. (Por ahora, "univariable" significa
significa en la escuela. Por ejemplo, la acción de un maestro. que es una x y una y. En sentido estricto ese adjetivo se
autoritaria en una clase. tal vez no lo sea en otra. La supuesta
conducta democrática exhibida por un maestro quizá sea llamada aplica a y. Si hay más de una x o una y se utiliza el
autoritaria si la realiza otro. Tal elasticidad no es propia de la término "multivariable", por lo menos en este li-
ciencia. bro.) Pronto encontraremos concepciones y pro-
PROBLEMAS E HIPOTESIS 17

blemas multivariables, y en partes posteriores de la Aunque las hipótesis no sean confirmadas, con-
obra nos ocuparemos sobre todo de un enfoque y de servan su poder. Aun siy no covaría conx, la ciencia
una orientación multivariables. avanza. Los hallazgos negativos a veces son tan
importantes como los positivos porque aminoran el
Observaciones finales: poder universo total de ignorancia y en ocasiones desem-
especial de las hipótesis bocan en otras hipótesis y líneas de investigación
A veces se oye decir que las hipótesis son innece- fructíferas. Pero el científico no puede distinguir los
sarias en la investigación, que restringen demasiado datos positivos de los negativos si no se vale de
la imaginación exploradora, que la tarea de la ciencia hipótesis. Es posible efectuar una investigación sin
y de la investigación científica es descubrir cosas y ellas, particularmente en investigaciones explorato-
no insistir en lo obvio, que las hipótesis son obsole- rias. Pero es difícil concebir la ciencia moderna en
tas. Tales afirmaciones resultan muy engañosas, toda su rigurosa y disciplinada fecundidad sin la
pues interpretan erróneamente la finalidad de las potente guía de las hipótesis.
hipótesis.
Casi podemos decir que son el instrumento más Guía de estudio
potente inventado por el hombre para alcanzar co- l. Con las siguientes construcciones hipotéticas es-
nocimientos fidedignos. El hombre observa un fe- criba problemas e hipótesis de investigación: ni-
nómeno y reflexiona sobre sus causas posibles. Na- vel de aspiración, frustración, rendimiento aca-
turalmente, en su acervo cultural existen una multi- démico, raza, inteligencia, aptitud verbal, clase
tud de respuestas que explican la mayor parte de los social, sexo, refuerzo, métodos didácticos, dis-
fenómenos: algunas son correctas, otras incorrec- posición para la lectura, introversión, incentivos,
tas, otras una mezcla de hechos y superstición, algu- antisemitismo, selección ocupacional, toleran-
nas son mera superstición y mitología. El hombre de cia, participación del yo, educación, ingresos,
ciencia tiene la obligación de dudar de gran parte de ambiente de clase, necesidad de éxito, prestigio
las explicaciones dadas a los fenómenos de su social, creencias étnicas.
campo. Sus dudas son sistemáticas. Insiste en some- .2. A continuación se enumeran siete problemas ex-
ter dichas explicaciones a una comprobación empí- traídos de la literatura dedicada a la investiga-
rica controlada. Para ello necesita formular explica- ción. Estúdiense cuidadosamente y constrúyanse
ciones susceptibles de comprobación empírica con- una o dos hipótesis en base a ellos.
trotada, que enuncia en forma de teorías e hipótesis. a) ¿Mejoran los comentarios del maestro el ren-
En realidad, las explicaciones son hipótesis. El cien- dimiento de los alumnos?(I9)
tífico se limita a abordarlas en forma rigurosa escri- b) ¿Se puede transferir a nuevas situaciones el
biendo hipótesis sistemáticas y comprobables. Si aprender a aprender?(20)
una explicación no puede ser expresada en forma de e) ¿Influye más la similitud de creencias que la
hipótesis verificable, se le ha de considerar como raza en la aceptación de los demás?(2I)
una explicación metafísica no susceptible de investi- d) ¿Mejora la práctica de una función mental el
gación científica. En consecuencia, se la debe re- aprendizaje futuro de la misma?(22)
chazar porque carece de interés. e) ¿Cómo influye el status socioeconómico de
Sin embargo, su poder va más allá de esto. La eficiencia administrativa?(23)
hipótesis es una predicción, la cual establece que si f) ¿Produce el acatamiento obligatorio un cam-
ocurrex, ocurrirá también y. Es decir, se predice ay bio en las creencias?(24)
a partir de x. En consecuencia, si se hace que ocurra g) ¿Cómo influye el status socioeconómico de
x (varíe) y se observa que ocurre también y (varíe los negros en la distancia social que los separa
concomitantemente), se confirmará la hipótesis. de los blancos?(25)
Esta es una demostración más poderosa que limi- (19) Page, op. cit.
tarse a observar la covariación de ambas sin hacer (20) Harlow, op. cit.
predicción alguna. Es más poderosa en el sentido del (21) M. Rokeach y L. Mezei. "Race and Shared Belief as Fac-
juego de apuestas que se comentó anteriormente. El tors(22) in Social Choice". Science, CLI (1966), 167-172.
Gates y Taylor, op. cit.
científico apuesta quex conduce ay. Si en un expe- (23) N. Frederiksen, O. Jensen y A. Beaton, Organizational
rimento sucede eso, recogerá el dinero. Ha ganado la C/imates and Administrative Performance, Princeton, N. J.: Edu-
apuesta. No puede simplemente entrar en el juego en cational Testing Service, 1968.
cualquier momento y aprovechar la aparición simul- (24) L. Festinger y J. Carlsmith, "Cognitive Consequences of
Forced Compliance". Journal of Abnormal and Social Psycho-
tánea de x y y, que acaso sea fortuita. Los juegos no logy, LVIII (1959), 203-211; E. Schein, "The Chinese Indoctrina-
se practican de ese modo (al menos en nuestra cul- tion Program for Prisoners of War: A Study of Attempted 'Brain-
tura). washing' ". En E. Maccoby, T. Newcomb y E. Hartley, eds.,
Se juega de acuerdo bajo las reglas, y las reglas Readings in Social Psyc/wlogy, 3a. edición. Nueva York: Holt,
en la ciencia se dictan para reducir al mínimo el error Rinehart and Winston, 1958, 311-334.
(25) Westie y D. Howard, "Social Status Differentials and the
y la falibilidad del hombre. Las hipótesis forman Race Altitudes of Negroes", American Sociological Review, XIX
parte de las reglas del juego. (1954), 584-591.
18 EL LENGUAJE Y EL ENFOQUE DE LA CIENCIA

3. A continuación se transcriben siete hipótesis. f) Los seudoprogresistas valorarán a los maes-


Discuta las posibilidades de someterlas a prueba. tros que exhiben una conducta en apariencia
Luego lea uno o dos estudios originales para ver progresiva (pero que en verdad no lo es). más
cómo el autor o los autores las demostraron. positivamente que a los auténticos progresis-
a) Cuanto más fuerte es la cohesión de un grupo, tas.(31)
mayor deberá ser su influencia en los miem- g) La probabilidad de que se den respuestas au-
bros.(26) menta si éstas van seguidas de expresiones
b) Las personas con prejuicios identifican a los concordantes con la actitud de las respondien-
integrantes de los grupos minoritarios por sus tes.(32)
rostros más fácilmente que las que no tienen 4. Para darle al estudiante una idea preliminar de los
prejuicios.(27) problemas multivariables, a continuación presen-
e) La extensión del conflicto de papeles es una tamos tres de ellos.
función del número y la magnitud de las expec- a) ¿Cómo influyen en el aprovechamiento aca-
tativas incompatibles que sostiene un indivi- démico la aptitud escolar, el rendimiento lo-
duo o que se le imponen.(28) grado en la segunda enseñanza y el nivel de
d) Los tipos deductivos y asociativos del apren- aspiraciones?(33)
dizaje de concepto dependen de la edad de los b) ¿Cuáles son las contribuciones del ambiente
niños y de sus aptitudes para la instruc- familiar a los medios educativos y a las actitu-
ción.(29) des de los escolares hacia el aprovechamiento
e) El aprendizaje y la retención de material ver- verbal de alumnos blancos y negros en las
bal desconocido, pero significativo, se facilita escuelas de educación básica?(34)
gracias a la introducción anticipada de los e) ¿Cómo se relacionan las experiencias tempra-
conceptos más generales relacionados con él nas en el hogar y la autoridad paterna con la
(organizadores).(30) curiosidad hacia las personas por una parte, y
el deseo de entablar relaciones personales es-
(26) S. Schachter y cols., "An Experimental Study of Cohesive- trechas, por la otra?(35)
ness and Productivity", Human Re/ations, IV (1951), 229-238.
(27) G. Allport y B. Krarner, "Sorne Roots of Prejudice", Jour- (31) E. Pedhazur, "Pseudoprogressivism and Assessment of
nal of Psychology, XXII (1946), 9-39. Teacher Behavior", Educational a11d Psychological Measure-
(28) J. Getzels y E. Guba, "Role, Role Conflict, and Effective- ment, XXIX (1%9), 377-386.
ness: An Empírica! Study", American Sociological Review, XIX (32) C. Golightly y D. Byrne, "Attitude Statements as Positive
(1954), 164-175. and Negative Reinforcements", Science, CXLVI (1964), 798-799.
(29) H. Amster, "Effect of Instructional Set and Variety of Ins- (33) Worrell, "Leve! of Aspiration and Academic Success",
tances of Children's Learning", Journal of Educatio11al Psycho- Journal of Educational Psyclio/ogy, Ll ( 1959), 47-54.
logy, LVII ( 1960), 74-85. (34) J. Coleman y cols. Equality of Educational Opportunity.
(30) D. Ausubel, "The Use of Advance Organizers in the Lear- Washington, D.C.: U.S .. Government Printing Office, 1966.
ning and Retention of Meaningful Verbal Material", Journal of (35) A. Roe y M. Siegelman, The Origi11 of llllerests. Washing-
Educational Psychology, LI (1%0), 267-272. ton, D.C.: American Personnel and Guidance Association, 1964.
CAPITULO 3
Construcciones hipotéticas, variables y definiciones

El científico opera en dos niveles: el de teoría- resolver problemas aritméticos, trazar dibujos. Las
hipótesis-construcción hipotética y observación. conductas se reúnen y se expresan en una palabra:
Dicho de manera más exacta, va y viene entre ambos "aprovechamiento", "inteligencia", "agresivi-
niveles. El psicólogo puede decir: "La privación dad", "conformidad" y "honestidad" son concep-
temprana produce deficiencia en el aprendizaje.'' Su tos con que se designan variedades del comporta-
afirmación es una hipótesis que consta de dos con- miento humano que interesan a los científicos.
ceptos: "privación temprana" y "deficiencia en el La construcción hipotética es un concepto, pero
aprendizaje" unidos por una palabra de relación: entraña la connotación adicional de haber sido in-
"produce". En este caso, el científico se encuentra ventado deliberada y conscientemente o adaptado a
en el nivel teoría-hipótesis-construcción hipotética. un propósito científico especial. "Inteligencia" es
Cuando hace afirmaciones de carácter relacional y un concepto, una abstracción de la observación de
utiliza conceptos o construcciones hipotéticas, conductas que se consideran inteligentes y no inteli-
como los llamaremos, obra a ese nivel. gentes. Pero en cuanto a construcción científica, a
Debe operar además en el nivel de la observación. veces posee un significado más o menos extenso de
Necesita recabar datos para probar sus hipótesis. A lo que puede denotar como concepto. Indica que los
tal efecto tiene que pasar en alguna forma del nivel científicos consciente y sistemáticamente la usan en
de las construcciones hipotéticas áJ. de la observa- dos formas. Utilizada en una forma, entra a formar
ción. No puede contentarse con hacer afirmaciones parte de los esquemas teóricos y se relaciona de
sobre la "privación temprana" y la "deficiencia en diversos modos con otras construcciones. Así, po-
el aprendizaje". Es preciso que defina esas cons- demos decir que el aprovechamiento escolar es en
trucciones de modo que permitan hacer observacio- parte una función de la inteligencia y la motivación.
nes. El problema que se trata en este capítulo es el de Usada en otra forma, se define y especifica de ma-
examinar y aclarar la naturaleza de los conceptos o nera que sea observable y mensurable. Podemos
construcciones científicas y la forma en que los es- hacer observaciones sobre la inteligencia de los ni-
tudiosos de la conducta pasan del nivel de la cons- ños aplicándoles una prueba X de inteligencia o po-
trucción hipotética al de la observación; La forma en demos pedir a los maestros que nos digan el grado
que se desplazan de uno al otro. relativo de inteligencia de sus alumnos.

Variables
Conceptos y construcciones Los científicos designan, de manera un tanto
hipotéticas vaga, con el término "variables" a las construccio-
Los términos "conceptos" y "construcciones" nes hipotéticas o propiedades que estudian. Ejem-
tienen significados similares. Pero hay una distin- plos de variables importantes en sociología, psicolo-
ción importante. El primero denota una abstracción gía y educación son: sexo, ingresos, educación,
formada por generalización de casos particulares. clase social, productividad de la organización, movi-
''Peso'' es un concepto: denota numerosas observa- lidad ocupacional, nivel de aspiraciones, aptitud
ciones de objetos que son más o menos "pesados'' o verbal, angustia, afiliación religiosa, preferencias
"ligeros". "Masa", "energía" y "fuerza" son con- políticas, fuerza del yo, orientación en las tareas,
ceptos de que se valen los físicos. Desde luego, son autoritarismo, conformidad, inteligencia, aprove-
mucho más abstractos que conceptos como "peso", chamiento. Podemos afirmar que una variable es una
"altura" y "longitud". propiedad que adquiere distintos valores. Expre-
Un concepto de mayor interés para los lectores de sado esto en forma redundante, diremos que la va-
este libro .es el de "aprovechamiento". Es una abs- riable es una cosa que varía. Si bien todo ello nos da
tracción formada de la observación de ciertas con- una noción intuitiva de lo que son las variables,
ductas en los niños, asociadas con el dominio o necesitamos una definición más general y a la vez
"aprendizaje" de tareas escolares: leer palabras, más precisa.
19
20 EL LENGUAJE Y EL ENFOQUE DE LA CIENCIA

Variable es un símbolo al que se le asignan nume- den definir de dos modos generales. Primero, pode-
rales o valores. Por ejemplo, x es una variable: es un mos definir una palabra mediante otras, cosa que
símbolo al que adscribimos valores numéricos. hace generalmente un diccionario. Para definir la
Puede adoptar cualquier conjunto justificable de va- "inteligencia" diremos que es "intelecto operante",
lores: las puntuaciones en una prueba de inteligencia "agudeza mental" o "capacidad de hacer abstrac-
o en una escala de actitudes. En el caso de la inteli- ciones". Obsérvese que se usan otros conceptos o
gencia le asignamos un conjunto de valores numéri- expresiones conceptuales para substituir la expre-
cos obtenidos por el procedimiento que se siguió en sión que se define.
una prueba específica de inteligencia. Esta serie de Segundo, podemos definir una palabra diciendo
valores, que suele denominarse cociente intelectual, qué acciones o conductas expresa o supone. Para
se anota en una escala ascendente, digamos, de 50 a definir la ''inteligencia'' en esta forma hay que espe-
150. cificar cuáles conductas de los niños son "inteligen-
Pero una variable x puede tener dos valores úni- tes" y cuáles no lo son. Diremos que el niño de siete
camente. Si el sexo es la construcción hipotética que años que lee bien un cuento es "inteligente". Si no
seestudia,x puede ser 1yO;1 para uno de los sexos, puede leerlo, diremos que "no es inteligente". En
y Opara el otro. A pesar de ello no deja de ser una otras palabras, esta clase de definición puede lla-
variable. Otros ejemplos de variables de dos valores marse definición basada en la conducta u observa-
son vivo-muerto, ciudadano-no ciudadano, clase ción. En la vida diaria se usan constantemente las
media-clase trabajadora, maestro-no maestro, definiciones formuladas a partir de ''otras palabras''
republicano-demócrata. Se las conoce con el nom- y de la "observación".
bre de dicotomías o variables dicotómicas. La presente exposición contiene una vaguedad
Algunas de las que se usan en la investigación del que trastornaría al hombre de ciencia. Aunque él
comportamiento constituyen verdaderas dicoto- utiliza los tipos de definición que acabamos de des-
mías; es decir, se caracterizan por la presencia o cribir, lo hace en una manera más exacta y articu-
ausencia de una propiedad: varón-mujer, vivo- lada. Para expresar ese uso precisaremos y explica-
muerto, empleado-desempleado. Algunas variables remos la distinción que traza Margenau entre las
son politomías. Un buen ejemplo lo encontramos en definiciones constitutivas y las operacionales.(2)
la preferencia religiosa: protestante, católico, judío, La definición constitutiva define una construcción
otra.(l) No obstante, no pocas variables son en teo- hipotética por medio de otras. Así, podemos definir
ría capaces de adquirir valores continuos. En la in- el "peso" diciendo que es la "pesantez" de los
vestigación de la conducta ha sido una práctica co- objetos. O podemos definir a la "angustia" como un
mún transformar las variables continuas en dicoto- "temor subjetivado". En ambos casos hemos subs-
mías o politomías. Por ejemplo, la inteligencia, una tituido un concepto por otro. Algunas construccio-
variable continua, ha sido dividida en inteligencia nes de la teoría científica son definibles de ese modo.
alta y baja, o en inti:ligencia alta, media y baja. Torgerson, imitando a Margenau, dice que todas las
Variables como ansiedad, introversión y autorita- construcciones hipotéticas para ser útiles a la ciencia
rismo han recibido un tratamiento análogo. Obsér- han de poseer un significado constitutivo.(3) Signi-
vese que si bien no es posible convertir una variable fica que debe ser posible 1:1sarlas en las teorías.
verdaderamente dicótoma como el sexo en otra con- La definición operacional asigna significado a una
tinua, siempre es posible convertir una variable con- construcción hipotética o a una variable mediante la
tinua en una dicotomía o politomía. Como veremos especificación de las actividades u "operaciones"
después, la conversión puede tener una finalidad necesarias para medirla. Alternativamente, es una
conceptual útil. Pero es una práctica poco aconseja- especificación de las actividades del investigador en
ble en el análisis de datos porque desperdicia infor- la medición de una variable o en su manipulación. La
mación. definición operacional es una especie de instructivo
para él. En efecto, dice: "Haga esta y aquella cosa
Definiciones constitutivas en esta forma." En resumen define o confiere signi-
y operacionales de las construcciones ficado a una variable al especificar lo que el investi-
hipotéticas y de las variables gador debe hacer para medirla.
La distinción que hemos hecho entre "concepto" Un ejemplo muy conocido, aunque extremo, de
Y "construcción hipotética" conduce naturalmente una definición operacional, es éste: la inteligencia
a otra importante distinción: la que.existe entre las (ansiedad, aprovechamiento, etc.) son las puntua-
diversas clases de definiciones de construcciones y
variables. Las palabras o las construcciones se pue- (2) H. Margenau, The Nature ofPhysical Reality. Nueva Y orle:
McGraw-Hill, 1950, caps. 4, 5 y 12. Nuestra explicación se basa
principalmente en la excelente presentación que de esta distinción
(1) A tales dicotomías y politomías se les ha denominado "va- hacen Margenau y Torgerson: W. Torgerson, Theory and Metlwds
. riables cualitativas". La naturaleza controvertible de esta designa- of Sca/ing. Nueva York: Wiley, 1958, págs. 2-5.
ción se comentará en otra parte. (3) Ibid., pág. 5.
CONSTRUCCIONES HIPOTETICAS, VARIABLES Y DEFINICIONES 21

ciones conseguidas en una prueba X de inteligencia, tendiente a lograr una meta, en el momento opor-
o sea que ésta es lo que mide dicha prueba. Adviér- tuno, durante la cadena conductual . . . "(5) Esta
tase que esta definición nos indica qué hemos de definición contiene claras consecuencias para las
hacer para medir la inteligencia, pero nada dice res- manipulaciones experimentales. Barker, Dembo y
pecto al acierto con que se la mide mediante el ins- Lewin, sin duda influidos por la definición de Do-
trumento especificado. (Cabe suponer que se averi- llard y colegas, definieron en forma operacional la
guó la suficiencia de la prueba antes que el investiga- frustración al describir a niños colocados en una sala
dor la aplicase.) En esta acepción, la definición ope- de juegos, donde había "algunos juguetes muy atrac-
racional es una ecuación en la que decimos: ''Sea la tivos, pero inaccesibles".(6) (Los juguetes fueron
inteligencia igual a las puntuaciones conseguidas en puestos detrás de una malla de alambre; los niños
la prueba X de inteligencia." Parece que decimos podían verlos pero no tocarlos.) Más adelante se
también: "El significado de la inteligencia (en esta ofrecerán otros ejemplos de ambas clases de defini-
investigación) lo expresan las puntuaciones obteni- ciones operacionales.
das en dicho test." Los investigadores científicos deben enfrentarse
En términos generales, hay dos clases de defini- tarde o temprano a la necesidad de medir las varia-
ciones operacionales: 1) de medidas y 2) experimen- bles de las relaciones que están estudiando. Algunas
tales. La definición precedente está más estrecha- veces la medición es fácil, otras veces dificil. Medir
mente ligada a las primeras que a las segundas. La el sexo o la clase social es fácil; medir la creatividad,
definición operacional de medida describe cómo se la angustia o la eficacia organizativa es difícil. Es
medirá una variable. Por ejemplo, el aprovecha- imposible exagerar la importancia de las definicio-
miento puede definirse mediante una prueba de nes operacionales; son ingredientes esenciales de la
aprovechamiento estandarizada, por medio de una investigación científica, porque capacitan a los in-
prueba de aprovechamiento elaborada por el maes- vestigadores para medir las variables y porque sir-
tro o mediante calificaciones. Hare definió el con- ven de puente entre el nivel de teoría-hipótesis-
senso de un grupo en estos términos: "El grado de construcción hipotética y el nivel de observación.
consenso en el grupo se mide pidiendo a cada miem- No puede haber investigación científica sin observa-
bro del mismo que clasifique las 1Opiezas del equipo ciones, y éstas son imposibles sin instrucciones cla-
para acampar antes de la discusión, durante ella el ras y específicas sobre qué y cómo observar. Preci-
grupo clasifica el equipo, y de nuevo los miembros samente las definiciones operacionales proporcio-
vuelvan a clasificarlo después de la discusión" .(4) nan tales instrucciones.
En un estudio se puede incluir la variable considera- Aunque indispensables, esta clase de definiciones
ción hacia los demás. Se la puede definir operacio- sólo confieren un significado limitado a las construc-
nalmente por la enumeración de conductas infantiles ciones hipotéticas. Ninguna puede expresar la tota-
que, según se piensa, son de carácter "conside- lidad de una variable. Ninguna definición operacio-
rado", para pedir luego a los maestros que califiquen nal de la inteligencia es capaz de manifestar el rico y
a los niños con una escala de cinco puntos. Tales variado significado de la inteligencia humana. Ello
conductas podrían ser las que realizan los niños al quiere decir que las variables medidas por científicos
decidirse unos a otros: ''lo siento'', o "perdóname''; muestran siempre un sentido limitado específico. La
cuando un niño da un juguete a otro que se lo pide "creatividad" estudiada por los psicólogos no es
(pero no con amenaza de agresión); cuando un niño aquélla a la que aluden los artistas, si bien ambas
ayuda a otro en una tarea escolar. poseen elementos comunes.
Una definición operacional experimental explica Algunos científicos sostienen que esos significa-
en forma clara los detalles (operaciones) de las ma- dos operacionales limitados son los únicos que "sig-
nipulaciones que efectúa el investigador con una nifican" algo, y que todas las demás definiciones son
variable. El refuerzo puede definirse operacional- disparates metafísicos. Sostienen que las discusio-
mente si se, dan los detalles de cómo han de ser nes sobre ansiedad son un absurdo metafisico, si no
reforzados los sujetos (recompensados) o no refor- se dispone de definiciones operacionales adecuadas
zados (no recompensados) al efectuar las conductas y se las utiliza. Este punto de vista es extremista
especificadas. Así, en el estudio de Hurlock, comen- pese a sus aspectos saludables. Insistir en que cada
tado antes, algunos niños fueron elogiados, otros término que utilicemos en el discurso científico se
culpados y otros ignorados. Dollard y colaboradores defina operacionalmente sería demasiado estrecho,
definen la frustración como imposibilidad de alcan-
zar una meta o ". . . inteiferencia en la respuesta
(5) l Dollard y cols., Frustration and Agression. New Haven.:
Yale University Press, 1939, pág. 7.
(4) A. Hare, "A Study of Interaction and Consensus in Diffe- (6) R. Barker, T. Dembo, y K. Lewin, "Frustration and Re-
rent Sized Groups", American Sociologica/ Review, XVII ( 1952), gression". En R. Barker, J. Kounin, y H. Wright, Child Behavior
261-267. and Development. Nueva York: McGraw-Hill, 1943, pág. 443.
22 EL LENGUAJE Y EL ENFOQUE DE LA CIENCIA

o.o.

o.o.

o.o.

Datos observables;
realidad empírico
Fig. 3-1. Construcciones hipotéticas definidas operacionalmente, es decir, conectadas con datos observables en forma
operacional (D.O.): C1, C2, Ca. Construcciones hipotéticas definidas constitutivamente: C1, C2,. .. Cs.

demasiado restrictivo y, según veremos, científica- nado letras minúsculas, se definen constitutiva-
mente erróneo.(7) mente; es decir, C4 se define en cierto modo me-
A pesar de los peligros del operacionismo ex- diante C3, o viceversa. Las líneas dobles representan
tremo, cabe decir con seguridad que esta corriente definiciones operacionales. Las construcciones
ha sido y es todavía una saludable influ~ncia, pues marcadas con C están directamente ligadas a los
según señala Skinner: "La actitud operacional, no datos observables; son los vínculos indispensables
obstante sus deficiencias, es algo bueno en cualquier con la realidad empírica. Pero conviene señalar que
ciencia y especialmente en la psicología, porque en no todas las construcciones hipotéticas de una teoría
ella existe un vasto vocabulario de origen antiguo y científica se definen de manera operacional. De he-
no científico" .(8) Cuando se consideran los térmi- cho, una temía que tenga definidas así todas sus
nos usados en la educación, se ve claramente que construcciones será muy débil.
también ella posee un amplio léxico de términos Construyamos una "pequeña teoría" sobre la
antiguos y no científicos. A continuación citamos falta de aprovechamiento para ilustrar las nociones
algunos: el niño completo, enriquecimiento horizon- anteriores. Supongamos que un investigador piensa
tal y vertical, satisfacción de las necesidades del que que esa falta es en parte una función de los conceptos
aprende, plan fundamental de estudios, ajuste emo- que los alumnos tienen sobre sí mismos. Cree que se
cional y enriquecimiento del plan de estudios. perciben "inadecuadamente", que tienen autoper-
Para aclarar las definiciones constitutiva y opera- cepciones negativas, que tienden a lograr menos de
cional (y también la teoría) fijémonos en la figura 3-1, lo que su capacidad y su aptitud potenciales les
que ha sido adaptada de Margenau y Torgerson. Se permiten. Considera, además, que las necesidades
supone que en ella se ilustra una teoría bien elabo- del yo (las cuales no definiremos ahora) y la motiva-
rada. Las líneas sencillas representan conexiones o ción para el aprovechamiento, a la que llamamos
relaciones teóricas entre las construcciones hipoté- n-apr (o necesidad de aprovechamiento), están liga-
ticas. Estas construcciones, a las que se han asig- das a la falta de aprovechamiento. Naturalmente
conoce además la relación entre aptitud, inteligencia
y aprovechamiento en general. Un diagrama que
(7) Una buena exposición de este punto se encuentra en F. ilustre semejante "teoría" ofrecería el aspecto que
Northrop, The Logic ofthe Sciences and tite Humanities. Nueva muestra la figura 3-2.
York: Macmíllan. 1947, caps. VI y VII. Afirma Northrop, por El investigador carece de una medida directa del
ejemplo: "La importancia de las definiciones operacionales radica
en que permiten la verificación y enriquecen el significado. Pero no concepto de sí mismo, pero supone que puede ex-
agotan el significado científico" (pág. 130). Margenau hace la misma traer inferencias sobre él utilizando el test que con-
observación en su extensa exposición sobre las construcciones siste en dibujar una figura. A continuación define el
hipotéticas de la ciencia. (Véase Margenau, op. cit., pág. 232 y concepto del yo en base a ciertas respuestas a esa
siguientes.)
(8) B. Skinner. "The Operational Analysis of Psychological prueba. Este es probablemente el método más co-
Terms". En H. Feigl y M. Brodbeck. dirs., Readings in tire Philo- mún para medir las construcciones hipotéticas de la
sophy of Science. Nueva York: Appleton, 1953, pág. 586. psicología y la pedagogía. La línea sencilla y gruesa
CONSTRUCCIONES HIPOTETICAS, VARIABLES Y DEFINICIONES 23

entre c1 y C1 indica la naturaleza relativamente di- según se supone, existe entre el concepto del yo y la
recta de la supuesta relación que hay entre el con- motivación para el aprovechamiento. Uno de los
cepto del yo y la prueba. (La doble líneaentreC1 y el objetivos de la ciencia es lograr que estas líneas
nivel de observación indica una definición operacio- discontinuas se conviertan en líneas continuas para
nal, igual que en la figura 3-1.) Análogamente se que establezcan un puente entre la definición opera-
define de manera operacional el aprovechamiento en cional y la medición. En el caso presente, es muy
la adquisición de construcciones hipotéticas (C4), probable que la motivación para el aprovechamiento
como la discrepancia entre la medición del aprove- y el concepto del yo se definan operacionalmente y
chamiento ( C2) y de la aptitud (es). En este modelo se midan en forma directa.
el investigador carece de una medida directa de la En esencia, ésta es la forma en que opera el cientí-
motivación para el aprovechamiento y de una defini- fico de la conducta. Pasa del nivel de teoría-
ción operacional de la misma. En otro estudio puede construcciones hipotéticas al de observación. Para
suponer de modo específico una relación entre apro- ello define operacionalmente las variables de su teo-
vechamiento y motivación para el aprovechamiento; ría que son susceptibles a esa definición y luego
en ese caso intentará definir esta última en forma estima las relaciones entre las variables así definidas
operacional. y las variables medidas. De tales relaciones estima-
La línea continua y sencilla entre conceptos -por das extrae inferencias sobre las que existen entre las
ejemplo, la que une al aprovechamiento.en la adqui- construcciones hipotéticas. En el ejemplo anterior
sición de construcciones hipotéticas (e 4) con la calcula la relación entre e 1 (prueba del dibujo de
prueba de aprovechamiento (C2)- denota una rela- figuras) y C2 (prueba de aprovechamiento) y, si la
ción bastante bien establecida entre el aprovecha- relación es probada en este nivel de observación,
miento postulado y lo que miden las pruebas norma- deduce que hay una relación entre c1 (concepto del
les de aprovechamiento. Las líneas continuas y sen- yo) y C4 (aprovechamiento).
cillas entre C1 y C2 y entre C2 y C3 designan las
relaciones descubiertas entre las puntuaciones de las Tipos de variables
pruebas de estas medidas. (Lar asignada a las líneas Variables independientes y dependientes
entre C1 y C2 y entre C2 y C3 significa "relación" o Después de haber tratado de las definiciones vol-
"coeficiente de correlación".) vemos a las variables, que pueden clasificarse de
Las líneas sencillas discontinuas denotan las rela- diversas maneras. En este libro son importantes tres
ciones postuladas entre las construcciones que no clases en las cuales se hará hincapié: l) variables
están bastante bien establecidas y que son más te- independientes y dependientes, 2) variables activas
nues. Un buen ejemplo de ello es la relación que, y atributivas, 3) variables continuas y categóricas.

/
Concepto de sí mismo
/, \
/ I \
/ \
r;:::::( I \ o.o.
v:.J---'¡-- - --@.
Necesidades del yo
\ Prueba de dibuio
de figuras
(r)
I Motivación para ''-.....
/ el aprovechamiento ''
f
o.o.
I
1 de aprovechamiento

Aprovechamiento

o.o.

Aptitud Observaciones
Fig. 3-2.
24 EL LENGUAJE Y EL ENFOQUE DE LA CIENCIA

La forma más importante y útil de clasificarlas es posibles X variables independientes de donde esco-
dividirlas en independientes y dependientes. Esta ger.
clasificación es muy útil por su aplicabilidad general, Cuando se estudia la relación entre inteligencia y
su sencillez y su gran relevancia en la tarea de con- aprovechamiento escolar, la primera es la variable
ceptualizar y diseñar la investigación y en comunicar independiente y el segundo la variable dependiente.
los resultados. La variable independiente es la su- (¿Podría ser de manera inversa?) Otras variables
puesta causad e la variable dependiente, que sería su independientes susceptibles de ser estudiadas en re-
efecto. La primera es el antecedente; la segunda el lación con la variable dependiente (aprovecha-
consecuente. Cuando decimos: si ocurre A, también miento escolar) son: clase social, métodos de ense-
se realizará B, tenemos la unión condicional de una ñanza, tipos de personalidad, clases de motivación
variable independiente (A) y una variable depen- (recompensa y castigo), actitudes hacia la escuela,
diente (B). atmósfera en el aula escolar, ¡;ntre otras. Cuando se
Ambas designaciones provienen de las matemáti- estudian las posibles causas de la delincuencia, los
cas, donde X es la variable independiente y Y la determinantes tales como condiciones de vida en los
variable dependiente. Seguramente es el mejor barrios pobres, hogares deshechos, falta de amor de
modo de concebirlas, porque no es preciso utilizar la los padres son las variables independientes y, natu-
delicada palabra "causa" ni términos afines, y por- ralmente, la delincuencia (más exactamente la con-
que ese uso de los símbolos se aplica a muchas ducta delictiva) es la variable dependiente. En la
situaciones de investigación. Incluso cabe decir que hipótesis de frustración-agresión, mencionada an-
en la investigación científica se persiguen incesan- tes, la primera es la variable independiente y la se-
temente las relaciones entre X y Y. Además, no hay gunda la variable dependiente. En ocasiones un fe-
restricción teórica en el número de ellas. Cuando nómeno es estudiado por sí mismo, y está implícita
más tarde hablemos del pensamiento y del análisis una variable independiente o una variable depen-
multivariable trataremos con diversas variables in- diente. Ello sucede cuando se estudian las conductas
dependientes y otras dependientes. y características del maestro. La variable depen-
En los experimentos se manipula a la variable diente implícita suele ser el aprovechamiento o la
independiente. Por ejemplo, cuando un investigador conducta del niño en general. Es obvio que también
estudia el efecto de los métodos de enseñanza puede la conducta del maestro puede ser una variable de-
manipular el método, o sea la variable indepen- pendiente.
diente, usando diversos métodos. En la investiga- La relación entre una variable independiente y
ción no experimental, en la cual es imposible la una variable dependiente quizá la comprendamos
manipulación, la variable independiente es la que más claramente si se trazan dos ejes perpendiculares
presumiblemente ha sido "manipulada" antes de ser entre sí, uno de los cuales representa a la primera y el
examinada. Así puede estudiar los supuestos efectos otro a la segunda. (Cuando dos ejes son perpendicu-
que en el aprovechamiento produce una situación lares entre sí, se denominan ejes ortogonales.) Con-
didáctica preexistente y en la que ya se han aplicado forme a la costumbre matemática, X, es la variable
diversos métodos. En este caso, los métodos vienen independiente o el eje horizontal; Y, la variable de-
a ser también la variable independiente. O se puede pendiente, o el eje vertical. (La X se conoce con el
estudiar el efecto de las actitudes de los padres en el nombre de abscisa y la Y con el nombre de orde-
aprovechamiento escolar y entonces tales actitudes nada.) Los valores de X se anotan en el eje identifi-
serían la variable independiente. cado por esta letra, y los valores Y se anotan sobre el
Por supuesto, la variable dependiente es aquella eje respectivo. Una forma muy común y útil de
que se predice, mientras que la variable indepen- "ver" e interpretar una relación consiste en repre-
diente es aquella a partir de la cual se predice. La sentar gráficamente los pares de valores XY, usando
variable dependiente, Y, es el supuesto efecto que los ejes X y Y como marco de referencia. Suponga-
varía concomitantemente con los cambios o varia- mos que en un estudio sobre el desarrollo del niño se
ciones de la variable independiente X, y no se mani- tienen dos conjuntos de medidas: la X mide edad
pula, sino que es observada por si se produce alguna cronológica, la Y mide edad para la lectura:(9)
variación atribuible al cambio de la variable inde-
pendiente. Para predecir la Y a partir de la X, pode-
mos tomar cualquier valor y asignarlo a X, mientras (9) Edad para la lectura es la llamada edad del crecimiento. Las
que el valor de Y que predecimos "depende" del mediciones seriadas de los crecimientos de los individuos (en esta-
valor de X que hayamos escogido. La variable de- !Ura, peso, inteligencia y otras dimensiones) se expresan como la
pendiente suele ser la situación que intentamos ex- edad cronológica media en la que aparecen dentro de la población
plicar. Por ejemplo, la variable dependiente más media. Los datos anteriores fueron tomados de uno de los estudios
del autor: F. Kerlinger, "The Statistics ofthe Individual child: The
común en la educación es el aprovechamiento o Use of Analysis ofVariance with Child Development Data", Child
"aprendizaje". Deseamos entender el aprovecha- Development, XXV ( 1954), 265-275. Este artículo cita las fuentes
miento y para ello disponemos de un gran número de originales de donde se tomaron los datos de crecimiento.
CONSTRUCCIONES HIPOTETICAS, VARIABLES Y DEFINICIONES 25

120

108

96

y 84
72

60

48

72 84 96 108 120 132


X
Fig. 3-3. Y: edad para la lectura (en meses); X: edad cronológica (en meses).

X: edad cronológica Y: edad para la lectura un estudio y la variable dependiente en otro. Un buen
(en meses) (en meses) ejemplo es la variable "cohesión de grupo". Es po-
72 48 sible estudiar sus determinantes e igualmente posi-
84 62 ble estudiar sus resultados. En el primer caso, la
96 69 cohesión es la variable dependiente; en el segundo es
108 71
120 !00 la variable independiente.
132 112 Nada impide considerar al aprovechamiento esco-
lar como una variable independiente, si bien gene-
Estas medidas se representan gráficamente en la ralmente se trata como una variable dependiente.
figura 3-3. Por ejemplo, en estudios sobre el éxito obtenido en
La relación entre la edad cronológica (EC) y la la universidad, se usa a menudo el aprovechamiento
edad para la lectura (EL) puede verse en la gráfica; en la enseñanza secundaria como un pronosticador o
también se puede hacer una comparación aproxi- una variable independiente. Tenemos aquí un caso
mada entre ambas. Obsérvese que según lo previsto interesante en que el aprovechamiento es a veces la
la EC mayor muestra una pronunciada tendencia a variable independiente y a veces la variable depen-
asociarse con la EL más avanzada, la EC media diente -en distintas situaciones pedagógicas, desde
muestra una tendencia considerable a asociarse con luego. La ansiedad ha sido estudiada como una va-
la EL media y la EC menos avanzada con la EL más riable independiente que afecta el aprovechamiento
baja. En otras palabras, la relación que existe entre (la variable dependiente).( !O) Pero la ansiedad
las variables independientes y dependientes, en este puede concebirse y usarse fácilmente como variable
caso entre EC y EL, puede captarse en una gráfica dependiente -por ejemplo si deseamos estudiar la
como ésta. Se ha trazado una línea recta para "mos- eficacia de los tipos de enseñanza, los tipos de apoyo
trar" la relación. Es un promedio aproximado de del maestro o los tipos de pruebas con que se la
todos los puntos de la gráfica. Obsérvese que si se aminora.( 11) Es posible asimismo, aunque se hace
posee un conocimiento de las medidas de las varia- n:my raramente, tratar una variable como indepen-
bles independientes y una relación como la anotada diente en un estudio y como dependiente en otro.
en la figura 3-3, es posible predecir con bastante Hasta podemos dar a una variable este papel en el
precisión las medidas de la variable dependiente. mismo estudio. Dicho de otro modo, la clasificación
Por supuesto, gráficas como la anterior pueden utili- de variables en independientes y dependientes se
zarse con cualesquiera medidas de variables inde-
pendientes y dependientes. (10) Véase a S. Sarason y cols .. Anxíety ín Elementary School
El estudiante debe estar atento ante la posibilidad Chíldren. Nueva York: Wiley, 1960. ,,
de que una variable sea la variable independiente en (11) lbíd., 280.
26 EL LENGUAJE Y EL ENFOQUE DE LA CIENCIA

funda más bien en sus usos que en una distinción tima característica permite investigar las "mismas"
entre distintas clases. relaciones en formas distintas. Un buen ejemplo lo
constituye la variable "ansiedad". Podemos medir
Variables activas y atributivas la ansiedad de los sujetos en un experimento. En este
Una clasificación que será útil en nuestro estudio caso es obviamente una variable atributiva. Pero
del diseño de investigación se funda en la distinción también podemos manipularla e inducir diferentes
que existe entre variables experimentales y medi- grados de ella. Por ejemplo, decimos a los sujetos de
das. Es importante, al planear y ejecutar la investi- un grupo experimental que la tarea a realizar es
gación, distinguir entre ambas. Las variables mani- difícil, que se va a medir su inteligencia y su futuro
puladas se llamarán variables activas, las variables depende de las puntuaciones que logren. A los de
medidas se denominarán variables atributivas. otro grupo experimental se les indica que hagan su
Cualquier variable susceptible de manipulación es mejor esfuerzo pero que no se inquieten, que el
pues, una variable activa. Cualquiera que no se resultado ho es demasiado importante y que no in-
pueda manipular es una variable atributiva. Si se fluirá en su futuro. No podemos suponer que las
aplican distintos métodos de enseñanza, recompen- "ansiedades" medidas (atributivas) y las manipula-
sando a los niños de un grupo y castigando a los del das (activas) sean idénticas. Suponemos que ambas
otro o creando ansiedad con instrucciones aburri- son "ansiedad" en un sentido amplio, aunque cier-
das, se manipuhn activamente las variables "méto- tamente no son iguales.
dos", "refuerzo" y "ansiedad".
Por lo demás, es imposible o al menos difícil mani- Variables continuas y categóricas
pular algunas variables. Todas las que representan Esta distinción especialmente útil en el planea-
características hu manas -inteligencia, ap ti tu d, sexo, miento de una investigación y en el análisis de datos
posición socioeconómica, dependencia del campo, (la de variables continuas y categóricas) ya ha sido
educación, necesidad de aprovechamiento y actitu- introducida, pero su importancia ulterior justifica
des, entre otras- son variables atributivas. Estas una consideración extensa.
variables preexisten en los sujetos que van a ser Una variable continua puede influir en un con-
estudiados (atributos). Están ya manipuladas, por junto ordenado de valores dentro de cierto intervalo.
así decirlo: el medio ambiente inicial, la herencia y Esta definición significa, primero, que sus valores
otras circunstancias han hecho de ellas lo que son reflejan, por lo menos, un orden jerárquico, y que un
actualmente.( 12) Además, la palabra "atributo" es valor mayor de la variable indica que la propiedad en
bastante precisa cuando se aplica a objetos inanima- cuestión se posee en un grado superior. Los valores
dos o referentes. Las organizaciones, las institucio- dados por una escala que mide el dogmatismo, por
nes, los grupos, las poblaciones, las familias y las ejemplo, denotan distintos grados de dogmatismo
regiones geográficas poseen atributos. Es variable la que van desde el alto hasta el bajo paseando por el
productividad de las organizaciones; las institucio- mediano. Segundo, las medidas continuas que se
nes se vuelven obsoletas; los grupos difieren en su utilizan actualmente están contenidas en una escala
cohesión; las regiones geográficas difieren conside- y se asigna a cada individuo una "puntuación" en
rablemente en sus recursos. ella. Una escala para medir el dogmatismo puede
La referida distinción es general, flexible y útil. tener el intervalo de l a 7. Casi todas las que se usan
Veremos que algunas variables por su misma natura- en las ciencias de la conducta poseen también una
leza siempre son atributos, y en cambio otras que tercera característica: hay un conjunto teóricamente
son atributos pueden ser además activas. Esta úl- infinito de valores dentro del intervalo. (Las escalas
de orden jerárquico son algo diferentes; se tratarán
( 12) Tales variables se conocen también con la designación de más adelante.) Es decir, la puntuación de un indivi-
variables organísmicas. Cualquier propiedad de un individuo, duo particular puede ser de 4.72 en vez de simple-
cualquier característica de un atributo suyo, es una variable orga- mente 4 ó 5.
nísmica. Es parte del organismo. En otras palabras, las variables
organísmicas son aquellas características que ya poseen los indivi-
Las variables categóricas, como las hemos lla-
duos en diverso grado cuando llegan a la situación que se investiga. mado, pertenecen a una clase de medición llamada
El término diferencias individuales denota tales variables. nominal que se explica en el capítulo 25. En ellas hay
Otra clasificación afín empleada sobre todo por los psicólogos es dos o más subconjuntos del conjunto de objetos que
la de variable estímulo y variable respuesta. La primera es cual- se mide. Los individuos son clasificados de acuerdo
quier condición o manipulación introducida por el experimentador
en el medio ambiente y que provoca una respuesta en el organismo. a la posesión de una característica que define a cual-
La segunda es cualquier clase de conducta del organis1 io. Se su- quier subconjunto. "Clasificar" quiere decir asignar
pone que cada clase de conducta tiene su estímulo. Así. la cor.Jucta un objeto a una subclase o subconjunto de una clase
del organismo es una respuesta. La clasificación se refleja en la de un conjunto tomando como base el que posea o no
conocida ecuación: R = f(O, E), que se lee: "Las respuestas son
una función del organismo y los estímulos, o 'las variables respues- la característica propia del subconjunto. El indivi-
tas' son una función de las variables organísmicas y de las variables duo por clasificar tiene la propiedad definidora o no
estímulo." la tiene; se trata de una situación de todo o nada. Los
CONSTRUCCIONES HIPOTETICAS, VARIABLES Y DEFINICIONES 27

ejemplos más sencillos son las variables categóricas Construcciones hipotéticas, variables
dicotómicas: sexo, republicano-demócrata, observadas e intermedias
blanco-negro. Las politomías, o sea variables con En gran parte de lo expuesto en este capítulo se ha
más de dos subconjuntos o partes, son bastante fre- dado por descontado que existe una notable diferen-
cuentes, especialmente en sociología y economía: cia entre las construcciones hipotéticas y las varia-
preferencia religiosa, educación (generalmente), na- bles observadas u observables. En efecto, se puede
cionalidad, elección de ocupación para mencionar decir que las construcciones como tales no son ob-
algunas. servables y que las variables, cuando son definidas
Las variables categóricas-y la medición nominal- de manera operacional, son observables. La distin-
tienen requisitos sencillos: todos los miembros de un ción es importante, porque si no nos damos cuenta
subconjunto son considerados iguales y a todos se del nivel del discurso en que hablamos de variables
les da el mismo nombre (nominal) y el mismo nume- tampoco nos daremos cuenta de lo que estamos ha-
ral. Si la variable es preferencia religiosa, por ejem- ciendo.
plo, todos los protestantes son iguales, todos los Las construcciones hipotéticas se han denomi-
católicos son iguales y todos los de "otras religio- nado también variables intermedias.( 14) Variable in-
nes" son iguales. Si un individuo es católico -defi- termedia es un término acuñado para designar los
nido operacional mente en forma apropiada- es asig- procesos psicológicos internos y no observables di-
nado a la categoría "católico" y se le da también un rectamente, que a su vez explican la conducta. Tol-
"l" en dicha categoría. En resumen, se le cuenta man, valiéndose de la pintoresca expresión de Wi-
como "católico". Las variables categóricas son lliam James, dice: " ... el único 'valor en efectivo' ·
"democráticas": no hay orden de rango o jerárquico de los procesos mentales reside . . . en su .::arácter
entre ellas y todos los miembros tienen el mismo de conjunto de procesos funcionales intermedios,
valor: l. que interconectan las causas que dieron origen a la
A veces se ha aplicado la expresión ''variables conducta, por una parte, y la conducta resultante,
cualitativas" a las variables categóricas, en particu- por la otra" .(15) La variable intermedia es una va-
lar a las dicotomías, probablemente en contraste con riable imaginada. No puede ser vista, oída ni tocada.
las "variables cuantitativas" (que en esta obra se Se infiere de la conducta. La "hostilidad" se infiere
denominan variables continuas). Tal costumbre re- de actos a los que se atribuye una naturaleza hostil y
fleja una noción algo deformada de lo que son las agresivá. El "aprendizaje" se infiere, entre otras
variables. Siempre son cuantificables o no serían cosas, de los incrementos en las puntuaciones con-
variables. Six consta únicamente de dos subconjun- seguidas en algún test. La "ansiedad" se infiere de
tos y es capaz de adoptar sólo dos valores, 1 y O, las puntuaciones de una prueba, de las reacciones
éstos no dejan de ser valores y habrá variación. Si x cutáneas, del latido cardíaco, etcétera.
es una politomía, como la preferencia religiosa, El científico que emplea estos términos se da
cuantificamos de nuevo asignando unos y ceros a los cuenta en todo momento de que habla de construc-
individuos. Así, si un individuo dice que es católico ciones inventadas, cuya' 'realidad" ha inferido de la
lo colocaremos en el subconjunto católico y le asig- conducta. Si desea estudiar los efectos de varias
naremos un l. Es extraordinariamente importante clases de motivación debe saber que la "motiva-
comprender esto porque, entre otras cosas, es el ción" es una variable intermedia. una construcción
fundamento para cuantificar muchas variables -in- inventada por el hombre para explicar la conducta
cluidos los tratamientos experimentales y en el análi- designada como "motivada". Debe saber que su
sis complejo. En el análisis de regresión múltiple, co- "realidad" no es sino una realidad postulada. Sólo
mo veremos luego, todas las variables, continuas y puede juzgar que un niño está motivado o no obser-
categóricas, son consideradas como tales en el análi- vando la conducta del pequeño. Sin embargo, para
sis. En el ejemplo del sexo que presentamos antes se estudiar la motivación tiene que medirla. No puede
asjgnó 1 a un sexo y O al otro. Podemos formar una medirla directamente porque es una variable imagi-
columna con unos y ceros de igual modo que forma- nada, una variable intermedia, una entidad inobser-
ríamos una columna con las puntuaciones obtenidas vable. Otros hombres han inventado esa construc-
de cociente intelectual (C.I.) o del dogmatismo, la ción para designar' 'algo'' que según se supone está
columna es la cuantificación de la variable sexo. dentro del individuo, "algo" que le impulsaría a
Aquí no hay ningún misterio. El método se extiende
fácilmente a las politomías.(13)
volumen. Una politomía es una división de los miembros de un
(13) A tales variables se les ha denominado "variables ficticias". grupo en tres o más subdivisiones. El método de "codificación de
Dado que son muy útiles y poderosas e incluso indispensables en el variables" descrito previamente -así como otros métodos- se ex-
moderno análisis de investigación de datos, deben ser claramente plica en el capítulo 36. Véanse también los capítulos 5 y 25.
comprendidas. Véase a F. Kerlinger y E. Pedhazur, Mu/tiple Re- ( 14) E. Tolman, Beltavior and Psycho/ogical Man. Berkeley,
gression Analysis in Behavioral Research. Nueva York: Holt, Ri- Calif.: University of California Press, 1958, págs. 115-129.
nehart and Winston, 1973, caps. 6 y 7. y el capítulo 36 de este (15) lbid., pág. 116.
28 EL LENGUAJE Y EL ENFOQUE DE LA CIENCIA

comportarse en determinada forma. Esto significa parte" .(18) (M) (Los autores aluden a un estudio de
que siempre tiene que medir las posibles manifesta- investigación que describe la construcción y desa-
ciones de la motivación y no la motivación en sí. En rrollo de la escala AP. Es una buena práctica citar
otras palabras, necesita medir cierta clase de con- siempre las fuentes originales de las pruebas y esca-
ducta, sean marcas de papel, palabras habladas o las).
gestos significativos, y luego hacer inferencias sobre Aprovechamiento (escolar, en aritmética, en es-
las supuestas caracteristicas de esas conductas. critura). Para definirlo en forma operacional se suele
citar una prueba estandarizada del aprovechamiento
(por ejemplo, las Pruebas Iowa de Destrezas Básicas
Ejemplos de co11Strucciones hipotéticas para Todos los Alumnos, de Nivel Primario); se
y de definiciones operacionales recurre a los promedios de calificación o a los juicios
Se han dado ya algunas construcciones hipotéti- de maestros.
cas y definiciones operacionales. Para ilustrar y cla- "El criterio de aprovechamiento escolar, es decir,
rificar lo expuesto, sobre todo lo relativo a la distin- el promedio de las calificaciones ... se logró gene-
ción que se hizo entre variables experimentales y ralmente asignando valores de 4, 3, 2, 1 y O a las
medidas, y entre construcciones hipotéticas y varia- calificaciones A, B, C, D y F, respectivamente. Al
bles definidas operacionalmente, a continuación se calcular los promedios de las calificaciones se utili-
presentan diversos ejemplos de dichas construccio- zaron únicamente cursos de las llamadas materias
nes y definiciones. Si una definición es experimental básicas, a saber: matemáticas, ciencias biológicas,
se le designa con (E). Si es medida se le designa ciencias sociales, además, lengua extranjera y
como (M). nacional" .(19) (M)
El estudiante ha de advertir que las definiciones Organización social (de grupos escolares)
operacionales difieren de su grado de especificidad. '' . . . se refiere al agrupamiento y autonomía de los
Algunas están íntimamente ligadas a observaciones. alumnos en un grupo escolar. Un grupo que obtuvo
Son sumamente específicas las que se elaboran a puntuación elevada fue aquel donde era bastante
partir de pruebas; v. gr.: la inteligencia se define común que Jos alumnos se dividiesen en dos o más
como la puntuación obtenida en una prueba X de equipos que trabajaban por separado y en donde los
inteligencia. La definición: "frustración es el impe- maestros hablaban relativamente poco" .(20) (M)
dimento para alcanzar una meta", es muy general y (Adviértase la vaguedad de esta definición, vague-
para hacerla directamente mensurable se requiere dad introducida por las palabras "bastante común"
mayor especificación, como la definición propuesta y "relativamente poco". Pero no es muy dificil evi-
por Barker, Kounin y Wright. tarla.)
Clase social'• ... dos o más órdenes de personas Popularidad. Se define a menudo operacional-
que, según se cree, están en posiciones socialmente mente por el número de elecciones sociométricas
superiores e inferiores y en consecuencia son clasifi- que un individuo recibe de los demás (en su clase, en
cadas de ese modo por los miembros de una comuni- elgrupodejuego, etc.). Se pregunta: "¿Conquiénle
dad".( 16) (M) (Para ser operacional esta definición gustaría trabajar?", "¿Con quién le agradaria ju-
ha de ser especificada mediante preguntas que reve- gar?·", etc. A cada uno se le invita a escoger uno, dos
len las creencias de los individuos relativas a la posi- o más individuos de su grupo en base a esas pregun-
ción de las demás.) tas tipo.
Se trata aquí de una definición subjetiva. Clase "La puntuación de popularidad soc.iométrica
social o posición social se definen más objetiva- (elecciones recibidas) se basa en un criterio de dis-
mente utilizando índices tales como ocupación, in- frute por la participación y la expansividad (eleccio-
gresos y educación, o mediante combinaciones de n es hechas), confianza (elecciones espera-
ellos. Por ejemplo, "Para obtener un índice de la das) ... "(21) (M)
posición socioeconómica (status) combinamos una
medida del nivel de ocupación con el ingreso•· .(17)
(Luego se añaden algunos detalles acerca de la
definición.)(M) (18) l. Samoff y otros, "A Cross-Cultural Study of Anxiety
Ansiedad (ansiedad ante una prueba). "Nuestra among American and English School Children .. ,Journal ofEduca-
medida de este tipo de ansiedad fue una versión tional Psyc/10/ogy, XLIX (1958), 129-136.
revisada y abreviada del Cuestionario de Ansiedad (19) W. Holtzman y W. Brown, "Evaluating the Study Habits
ante una Prueba (AP) que se describe en otra and Altitudes of High School Students .. , Journal of Educational
Psychology, LIX (1968), 404-409.
(20) D. Medley y H. Mitzel, "Sorne Behavioral Correlates of
Teacher Effectiveness", Journal of Educational Psychology,
(16) W. Wamery P. Lunt, TheSocial Lifeofa Modern Commu- L ( 1959) 239-246.
nity. New Haven: Yale University Press, 1941, pág. 82. (21) E. Borgatta, "Analysis of Social Interaction: Actual, Role-
(17) R. Sears, E. Maccoby y H. Levin, Patterns ofChi/d Rea- Playing, and Proyective .. ,Journa/ ofAbnorma/ and Social Psycho·
ring. Nueva York: Harper and Row, 1957, págs. 423-424. /ogy, Ll ( 1955), 394-405.
CONSTRUCCIONES HIPOTETICAS, VARIABLES Y DEFINICIONES 29

Reforzamiento. Sus definiciones se dan en una unaRC en un ensayo dado" .(26) (E-M) (RC significa
variedad de formas. La mayor parte contiene, en una respuesta condicionada.)
forma u otra, el principio de recompensa. Pero ob- Extinción (de aprendizaje o condicionamiento).
sérvese que puede usarse el reforzamiento positivo y " ... la disminución del no refuerzo en la res-
el negativo. puesta" .(27) (E-M)
" ... afirmaciones de acuerdo o paráfrasis" .(22) Disposición reactiva " ... una 'tendencia general
(E) Luego, el autor da definiciones experimentales a concordar o a discrepar con las preguntas del cues-
específicas de refuerzo. Por ejemplo, una vez que se tionario, sin importar su contenido'". (M) Los auto-
expresaba una opinión, el investigador la registraba res hicieron operacional esta definición en diversas
y reforzaba dentro de los 10 minutos siguientes. En formas. He aquí una: "para calcular una puntuación
dos grupos el experimentador coincidió con cada global de acuerdo en cada sujeto (S) se tomó la media
opinión diciendo: 'Sí, tiene usted razón', 'Así es', o de sus respuestas a las 360 preguntas".(28)
algo semejante, o bien manifestó su aprobación con Reputación en la comunidad. Es una variable del
una leve inclinación de cabeza y con una sonrisa, si estudio de Newcomb sobre las actitudes de las estu-
no podía interrumpir" .(23) (E) diantes del Bennington College. Se le definió opera-
" ... al modelo y al niño les fueron presentados cionalmente haciendo que las alumnas expertas es-
alternativamente 12 distintos conjuntos de reactivos cogiesen a otras mediante la aplicación de criterios
tomados de un cuento ... Ante cada uno de los 12 sociométricos. Se usaron 28 criterios. Conforme a
el modelo expresaba constantemente respuestas que cada uno de ellos las jueces eligieron a tres indivi-
contenían juicios contrarios a la orientación moral duos.
del niño ... y el experimentador reforzaba la con- Ejemplos de los criterios:
ducta del modelo con respuestas verbales de apro- 1. Absorbida al máximo por la vida social, fines
bación: 'Muy bien', 'Está bien', y 'correcto'. El niño de semana, etcétera.
fue reforzado de manera similar siempre que adop- 2. Influida al máximo por la autoridad docente.
taba Iosjuicios morales del modelo como respuesta a 3. Mínima probabilidad de intervenir activa-
su conjunto de reactivos" .(24) (E) (A esto se le llama mente en las actividades afines a los intereses
"reforzamiento social".) del colegio.(29)
"Los comentarios emitidos por los estudiantes, Valores. "'Clasifique, según su criterio personal,
cualesquiera que fuesen las diferencias entre ellos y las 10 metas por orden de importancia': 1) éxito
los maestros recibieron como calificación, los co- económico; 2) estimación social; 3) éxito en la vida
mentarios escogidos de antemano que habían sido familiar; 4) capacidad intelectual; 5) vida de acuerdo
designados por una letra, de la manera que se a los principios religiosos; 6) ayuda a los demás; 7)
muestra en seguida: ser normal, equilibrado; 8) cooperar con los demás;
A. ¡Muy bien! Sigue así. 9) hacer un trabajo perfecto; IO) éxito profesio-
B. Bien hecho, sigue así. nal" .(30) (M)
C. Tal vez podrías mejorarlo. Aprobación-desaprobación (de los alumnos por
D. Trata de mejorarlo. parte de los maestros). " ... en un año lectivo se
F. ¡Hay que hacerlo mejor! distribuyeron muestras de las conductas realizadas
Se indicó a los maestros que aplicasen los comenta- en clase ... se clasificaron en dos categorías las
rios 'rápida y automáticamente, tratando de no ad- interacciones entre maestros y alumnos: a) contac-
vertirni siquiera quién es eran los alumnos'" .(25) (E) tos de elogio (el maestro inició las interacciones con
Otras dos situaciones experimentales, las de comen- un alumno en las que verbalmente expresaba su
tario libre y sin comentario, fueron definidas igual- aprobación de cierta conducta que el niño había
mente en forma operacional por el autor. exhibido), y b) contactos de reproche (el maestro
Adquisición (de apr,endizaje o condicionamiento). inició interacciones con un niño en los que expresó
" ... probabilidad de realización, expresada como verbalmente su desaprobación por cierta conducta
el número de ensayos en que un sujeto determinado que había exhibido el niño)" .(31) (M)
produce una RC o el porcentaje de sujetos que dan (26) G. Kimble, Hi/gard and Marquis' Conditioning and Lear-
ning, 2a. ed. Nueva York: Appleton, 1961, pág. 82.
(27) /bid.
(22) W. Verplanck, "The Control of the Content of Conversa- (28) A. Couch y K. Keniston, "Yeasayers and Naysayers:
tion: Reinforcement of Statements of Opinion", Journal of Abnor- Agreeing Response Set as a Personality Variable", Journal of
mal and Social Psychology, LI (1955), 668-676. Abnorma/ and Social Psychology, LX (1960), 151-174.
(23) lbid. (29) T. Newcomb, Personality and Social Change. Nueva York:
(24) A. Bandura y F. McDonald, "Influence of Social Reinfor- Holt, Rinehart and Winston, 1943, págs. 66-67, 184-185.
cement and the Behavior of Models in Shaping Children's Moral (30) T. Newcomb, The Acquaintance process. Nueva York:
Judgments'', Journal of Abnormal and Social Psychology, LXVII Holt, Rinehart and Winston, 1961, págs. 40 y 83.
(1963), 274-281. (31) W. MeyeryG. Thompson, "SexDifferencesintheDistribu-
(25) E. Page, "Teacher Comments and Student Performance: A tion of Teacher Approval and Disapproval among Sixth-Grade
Seventy-Four Classroom Experiment in School Motivation", Children'', Journal of Educational Psychology, XLVII (1956),
Journal of Educational Psycho/ogy, XLIX (1958), 173-181. 385-396.
30 EL LENGUAJE Y EL ENFOQUE DE LA CIENCIA

Honestidad. "Según la Prueba Clapp-Young de manipular las condiciones experimentales. Por


Aritmética, se consideró que un niño era desho- tanto, quÍen escribe informes debe incluir las defini-
nesto' si al corregir el cuestionario de examen el ciones operacionales directa o indirectamente. la
interior del cuaderno de respuestas mostraba: a) que práctica más común, al parecer, consiste en enume-
había cambiado su respuesta encerrando en un cír- rar las variables del estudio al inicio y luego los
culo la respuesta incorrecta y había trazado una x instrumentos empleados al medir las variables, o
sobre la respuesta correcta; b) que había borrado la exponer los procedimientos experimentales con que
respuesta incorrecta y marcado la acertada; c) que se manipularon las variables independientes. Salta a
había marcado la respuesta correcta al revisar el la vista que así las variables son definidas operacio-
cuestionario, puesto que su trabajo ajeno al folleto nalmente. Por ejemplo, un investigador enunciará
de examen no coincidía con su respuesta''. (32) (M) una hipótesis que contiene sus variables: el bajo
Liderazgo. "Hemos decidido medir dos dimen- aprovechamiento está en función de un concepto
siones específicas de la conducta del líder, 'inicia- inadecuado de sí mismo. Es posible que proceda a
dora', y 'consideración'. Con la primera designamos analizar la hipótesis y entonces diga algo acerca de
la conducta que consiste en delinear la relación entre los conceptos de "bajo aprovechamiento" y "con-
él y los miembros del grupo de trabajo y en dedicarse cepto de sí mismo". Pero quizá no los defina opera-
a establecer tipos bien definidos de organización, cionalmente en ese momento. Después, en una sec-
canales de comunicación y métodos de procedi- ción sobre el método o procedimiento, explicará
miento. La segunda se refiere a una conducta indica- cómo intenta medirlos.
tiva de amistad, confianza mutua, respeto y afecto El pensamiento operacional puede aportar gran-
en la relación del líder con los componentes del des beneficios. El operacionismo es a veces llevado
grupo" .(33) (M) (Posteriormente, el autor define las a extremos y entonces es peligroso, porque tiende a
dos dimensiones en forma más precisa y operacio- rechazar la importancia de las construcciones hipo-
nal.) téticas y de las definiciones constitutivas en la teoría
Cohesión. " ... la cohesión del grupo denota el y en la investigación científica, y también porque
grado en que los miembros desean permanecer en tiende a limitar la investigación a problemas quizá
él" .(34) (M) (El autor procede a perfeccionar y hacer triviales. A pesar de ello no cabe duda que es una
operacional la definición.) influencia científica saludable. Como lo expresó
Calidad institucional (excelencia). " ... la capa- Underwóod en uno de sus excelentes capítulos so-
cidad académica media de los estudiantes inscritos, bre las definiciones operacionales:
y los gastos por alumno para 'fines pedagógicos y
generales' (sobre todo se alude a los sueldos para el ... diría yo que el pensamiento operacional produce
profesorado y el personal)" .(35) (M) mejores científicos. El operacionista se ve forzado a
Antes de dar por terminado nuestro estudio de las eliminar lo superfluo de sus conceptos empíricos ...
definiciones operacionales hablaremos de algo que ... el operacionismo facilÚa la comunicación entre
puede intrigar al estudiante. En su lectura de las científicos, porque el significado de Jos conceptos así
definidos no se presta a una interpretación errónea.(36)
obras sobre el tema, las más de las veces no encon-
trará enunciadas explícitamente las definiciones
operacionales como tales. Los investigadores pue- Guía de estudio
den definir explícitamente sus términos o no. Por l. Elabore definiciones operacionales de las si-
supuesto, un buen informe de investigación estará guientes construcciones hipotéticas. Cuando sea
escrito de manera que otro investigador, si lo desea, posible, escribir dos definiciones: una experi-
pueda repetir la investigación. Esto significa que mental y otra de medición.
podrá medir las variables o manipular las condicio-
nes experimentales del mismo modo que lo hizo el tolerancia liderazgo
autor de la investigación. A tal efecto debe conocer refuerzo atmósfera de clase
clara y explícitamente cómo medir las variables o habilidad delincuencia
<le lectura conflicto de las
aprovechamiento organizaciones
(32) Sister M. Gross, "The Effect of Certain Types ofMotivation intereses actitudes
on the 'Honety' of Children", Journal of Educationa/ Research, ante uno mismo
XL (1946), 133-140.
necesidades
(33) A. Halpin, The Leadership Behavior of School Superinten- transferencia y ante los demás
dents. Chicago: Midwest Administration Center, University of de enseñanza conformidad
Chicago, 1956, pág. 4. bajo aprovechamiento
(34) D. Cartwright, "The Nature of Group Cohesiveness". En
D. Cartwright y A. Zander, eds., Group Dynamics, 3a. ed., Nueva
York: Harper and Row, 1968, 91-109.
(35) A. Astin, "Undergraduate Achievement and lnstitutional (36) B. Underwood, Psychological Research. Nueva York: Ap-
'Excellence' ", Science, CLXI (1%8), 661-668. pleton, 1957, pág. 53.
CONSTRUCCIONES HIPOTETICAS, VARIABLES Y DEFINICIONES 31

Adviértase que algunos de estos conceptos o ciología o pedagogía, lea una publicación de psi-
variables -por ejemplo, necesidades y transfe- cología como elJournal ofPersonality and Social
rencia de enseñanza- son difíciles de definir en Psychology. Los que no cursan pedagogía pue-
forma operacional. ¿Por qué? den leer el Joumal of Educational Psychology o
2. Al leer trabajos ajenos a su campo, los especialis- el American Educational Research Journal. Al
tas se instruyen y ensanchan su perspectiva. Esto leer anote los nombres de las variables y compá-
ocurre sobre todo con quienes estudian la inves- relos con los de las variables de su campo. ¿Son
tigación del comportamiento. Se sugiere al que se en su mayoría variables activas y atributivas?
dedica a un campo particular leer dos o tres traba- Observe, por ejemplo, que las variables de la
jos de investigación en alguna de las mejores re- psicología son más "activas" que las de la socio-
vistas de otros campos. Si estudia usted psicolo- logía. ¿Qué consecuencias tiene la naturaleza de
gía lea una publicación de sociología, por ejemplo las variables de un campo para la investigación en
la American Sociological Revíew; si estudia so- esa área?
PARTE 2
Conjuntos, relaciones y varianza
CAPITULO 4
Conjuntos

Los cientlficos trabajan básicamente con concep- conjuntos "normativa" o por regla. Por supuesto,
tos de grupo, de clase o de conjunto. Cuando alguno podríamos señalar en una lista a todas las personas
de ellos se ocupa de eventos u objetos particulares, registradas en los partidos demócrata y republicano
lo hace considerándolos como miembros de un con- para definir así a los dos subconjuntos, pero ello a
junto particular. Sin embargo, esto también es válido menudo es difícil o imposible. Además, sería nece-
en lo que respecta al raciocinio humano, en términos sario, pues suele bastar la norma o regla, que debiera
generales. Decimos "ganso", pero esta palabra ca- ser: es republicanÓ cualquier persona afiliada al par-
rece de significado si no se tiene el concepto del tido con este nombre. Otra regla de esta índole sería:
grupo de aves anserinas llamadas "gansos". Deci- un republicano es toda persona que afirma pertene-
mos "es una belleza" para referirnos a una mujer, cer a ese partido.
aunque realmente lo que buscamos significar es que
ella es miembro de una clase de mujeres bellas a las Subconjuntos
que se hadado el calificativo de "bellezas". Cuando Un subconjunto es la colección que resulta de
nos ocupamos de un niño y sus problemas, inevita- dividir o seleccionar grupos de un conjunto original.
blemente tenemos que hablar de los grupos, clases o Cada subconjunto es parte del conjunto original. En
conjuntos de agregados a los que pertenece, y para forma más suscinta y exacta: "El conjunto B sería
ello presentaremos un ejemplo: un niño (primer con- subconjunto del conjunto A, siempre que todos los
junto), de siete años (segundo conjunto), de segundo elementos que lo integren fuesen también elementos
grado (tercer conjunto), inteligente (cuarto con- del conjunto A''. (2) Identificaremos a los conjuntos
junto) y sano (quinto conjunto). por medio de letras mayúsculas: A, B, K, L, X, Y, y
Un conjunto es un cúmulo bien definido de objetos así sucesivamente. Si B es un subconjunto de A,
o elementos.( l) Se le define bien cuando es posible escribiremos B CA, lo cual significa "B es subcon-
señalar si un objeto dado pertenece o no a un con- junto de A", "B está contenido en A", o "todos los
junto. Los términos como agregados, clase, escuela, miembros de B son también miembros de A''.
familia, congregación y grupo, indican conjuntos. Cuando se muestrea una población, las muestras
Hay dos formas de definir un conjunto: 1) listando son subconjuntos de esta última. Supongamos que
todos los miembros que lo constituyen, y 2) por el un investigador extrae muestras de cuatro grupos de
establecimiento de una regla para determinar si los alumnos de sexto grado elemental que forman parte
objetos pertenecen o no a él. Designaremos a la de todos los grupos de sexto grado de una gran
primera, "definición por lista", y a la segunda "de- escuela primaria. Los cuatro grupos son un subcon-
finición por regla". En investigación, normalmente junto de la población del sexto grado. Cada una de
se utiliza esta última, aunque hay casos en que todos las muestras también pueden ser consideradas como
los miembros de un conjunto se enumeran en una un subconjunto de todos los grupos de ese grado
lista real o imaginaria. Por ejemplo, supongamos que escolar, y también de la población total de alumnos.
estudiamos la relación entre conducta electoral y Todos los infantes de los cuatro grupos pueden divi-
preferencia política. La segunda puede definirse dirse en dos subconjuntos de niños y niñas. Siempre
como el pertenecer y estar registrado en un partido que un investigador fraccione o divida una población
político; v. gr.: el republicano o el demócrata. En o muestra en dos o más subgrupos ''crea" subcon-
este caso tendremos un gran conjunto del total de juntos por empleo de una "norma" o criterio para
personas con preferencias políticas, y dos subcon- hacerlo. Son innumerables los ejemplos: es posible
juntos de menor tamaño: el subconjunto de republi- dividir las preferencias religiosas en protestantes,
canos y el de demócratas. Esta defir:ición sería de los católicos o judíos; la inteligencia en elevada y baja.y
así sucesivamente. Incluso también podría aplicarse
(1) J. Kemeny, J. Snell, y G. Thompson, lntroduction to Finite
Mathematics, 2a. ed., Englewood Cliffs, N. J.: Prentice-Hall, 1966, (2) R. Kershrier y L. Wilcox, The Anatomy of Mathematics.
pág. 58. New York: Ronald, 1950, pág. 35.

34
CONJUNTOS 35

esta norma a las condiciones experimentales. La 8


idea clásica de grupos experimental y testigo, sería
una idea de conjunto y subconjunto. Un grupo de
personas quedaría dentro del grupo experimental, el
que constituiría un subconjunto de toda la muestra.
Todos los demás individuos que participaran en el
experimento (los del grupo testigo) formarían tam-
bién un subconjunto.
Figura 4-1.
Operaciones con conjuntos
Con los conjuntos se hacen dos operaciones bási-
cas: intersección y unión. Se entiende por operación los elementos que integran un estudio o un todo
simplemente hacerle algo a alguna cosa. En aritmé- particular. En ocasiones también se le llama uni-
tica sumamos, restamos, multiplicamos y dividimos. verso de raciocinio o nivel del discurso (muy seme-
"Intersectamos" y "unimos" conjuntos, y también jante a los términos población y universo usados en
los "negamos". la teoría del muestreo). Ello significa que limitamos
La intersección es la superposición de dos o más nuestra discusión a un conjunto fijo de elementos
conjuntos, en los cuales hay elementos comunes (todos ellos), de esta clase fija, U. Por ejemplo, si
compartidos. El símbolo correspondiente a la inter- estudiásemos determinantes de aprovechamiento en
sección es n (que se lee "intersección"). La inter- la escuela primaria, podríamos definir a U como
sección de los conjuntos A y B se escribe A nB, y A todos los alumnos del primero al sexto grados. Como
n B es, en sí, un conjunto; más exactamente, es el otra posibilidad también podríamos definir a U como
conjunto que contiene los elementos de A y B que las puntuaciones en la prueba de aprovechamiento
son comunes a ambos. La intersección también se de estos mismos alumnos. Los subconjuntos de U,
expresa A · B o simplemente AB. que se podrían estudiar por separado, serían las cali-
Supongamos queA={O, l, 2, 3}; y queB={2, 3, 4, ficaciones o puntuaciones de los alumnos de primer
5}. (Nótese que empleamos las llaves, "{}" para grado, las de los alumnos de segundo grado, y así
simbolizar conjuntos.) En esta situación, A n B = sucesivamente.
{2, 3} lo cual se representa en figura 4-1, A n B, o U puede ser grande o pequeño. Si volvemos al
{2, 3} es un nuevo conjunto compuesto de miem- ejemplo de 1afigura4-l,A={O, l, 2, 3} yB={2, 3, 4,
bros comunes a ambos. Adviértase que A n B podría 5}. SiA UB=U, en este caso U={O, l, 2,3,4,5}. En
indicar la relación entre los conjuntos cuyos elemen- este caso U es muy pequeño. Si suponemos que A=
tos son compartidos tanto por A como por B. {Esther, María, Beti, Ana} y B = {Tomás, Juan,
La unión de dos conjuntos se escribe así, A U B. Pablo}, y todos estos individuos comprenden el total
Esta expresión denota un conjunto que contiene a de elementos, nos estaríamos refiriendo a U={Es-
todos Ios..miembros de A y a todos los de B. Los ther, María, Beti, Ana, Tomás, Juan, Pablo}. Por
matemáticos definen a A U B como un conjunto que supuesto, U=A UB. Esteesotroejemplode U. En la
contiene los elementos que pertenecen a A, a B, o a investigación los diversos conjuntos universales
ambos. En otras palabras, "añadimos" los elemen- suelen ser grandes. Si extraemos muestras de escue-
tos de A a los de B, para formar un nuevo conjunto A las de un gran condado, entonces todas las escuelas
U B. Si retomamos ei ejemplo de figura 4-1, A in- del condado constituirían a U que sería bastante
cluyó0,l,2y 3;B incluyó2,3,4y 5.A U B = {0,l,2,3, grande. También podría denotar a todos los niños o
"4,5}. Obsérvese que la unión de A y B en la figura 4-1 todos los maestros de estas escuelas, y su valor sería
está indicada por el área total de los dos círculos. todavía mayor.
También nótese que no contamos dos veces los En la investigación es importante conocer la U ba-
miembros de A n B, {2, 3}. jo estudio. Toda la ambigüedad (que por desgracia)
Ejemplos de la "unión" en investigación sería es común en la definición de U, puede llevar a con-
juntar en un solo grupo varones y mujeres, VU M, o clusiones erróneas. Si se estudian las características
republicanos y demócratas, R U D. Supongamos de los maestros, es indispensable definir con la ma-
que A representa a todos los niños de las escuelas yor precisión posible lo que para nosotros significan
primarias, y B a los niños de 1as escuelas secundarias los "maestros". Los maestros de enseñanza prima-
de un distrito escolar X. En este caso A UB sería el ria y secundaria pueden diferir notablemente en al-
conjunto de todos los niños en edad escolar de ese gunas características. Por ejemplo, Tyans, en su
distrito. estudio de las características de un maestro, separó a
Conjuntos universales y vacíos los de enseñanza primaria, de los de la secundaria.
De hecho, definió dos U.(3) Por supuesto, es posible
y negación de conjuntos .
El conjunto universal que se expresa por medio de (3) D. Ryans, Characteristics of Teachers. Washington, D.C.:
la letra U, es la agrupación o congregación de todos American Council on Education, 1960.
36 CONJUNTOS, RELACIONESY VARIANZA

La negación o complemento del conjunto A se


escribe-A, lo cu al denota a todos los miembros de U
'VA
que no están en A. Si suponemos que A= todos los

o
Figura 4-2.
u
varones, que U=todos los seres humanos, en conse-
cuencia-A= todas las mujeres (los no varones). La
dicotomización simple parece ser la base fundamen-
tal del pensamiento humano. Para pensar se necesita
establecer categorías (categorizar): en primer lugar,
en el nivel más elemental, es necesario separar obje-
tos y definir a los que pertenecen a un conjunto dado
y a los que no pertenecen a él. Debemos diferenciar
entre varones y no varones, entre el yo y el no yo,
entre lo temprano y no temprano, y entre lo bueno y
decir que U estuvo ¡;onstituido por todos los maes- lo no bueno.
tros de escuela primaria y secundaria, y que según Si U={O, 1,2, 3,4}, yA={O, l}-A={2, 3, 4}.A y-
esto, U estaba dividido en dos subconjuntos, o las A son subconjuntos de U. Otra propiedad importante
propias características formarían una U, aunque se- de los conjuntos y su negación se puede expresar en
ría una enorme tarea definir a U, en este caso. la negación de conjuntos: A U -A= U. Apréciese
Al igual que todos los conjuntos, U se define por también que A n -A= E.
"lista" o por normas. En el caso de los maestros del
ejemplo señalado, probablemente convendría usar Diagramas de conjuntos
una definición "normativa". En el comienzo de su En este punto, por medio de diagramas, resumi-
estudio, Ryans limitó el U de los maestros de ense- remos e ilustraremos las ideas básicas sobre los con-
ñanza primaria a los de los grados tercero y cuarto. juntos. Estos pueden representarse por medio de
Más tarde definió U para incluir a los maestros desde diversas figuras, pero por lo regular se emplean rec-
el primero hasta el sexto grados.(4) En el caso de tángulos y círculos, adaptados del sistema creado
grandes U, suele referirse a las definiciones ''norma- por John Venn. En este texto usaremos rectángulos,
tivas", porque una lista seria una tarea tan formida- círculos y óvalos. En la figura 4-2, U está represen-
ble, que casi no podríamos hacerla en la práctica. tado por el rectángulo. Todos los miembros del uni-
El conjunto vacío es aquel que no tiene miembros, verso en estudio están contenidos en U. Dentro de U
y se designa por la letra E. También ha recibido el se ha aislado un conjunto A; y sus miembros consti-
nombre de sistema o conjunto nulo. El estudiante tuyen un subconjunto de U. Todos los miembros de
posiblemente se sienta desconcertado de que inclu- U que no pertenecen aA forman otro subconjunto de
yamos conjuntos sin miembros, pero la noción es U: - A. Obsérvese de nuevo que A U- A = U y
muy útil e incluso indispensable. Gracias a ella po- también que A n- A =E, esto es, que A y -A no
dernos expresar algunas ideas en forma concisa y comparten miembros en común.
precisa. Por ejemplo, para indicar que no existe rela- En seguida, en la figura 4-3 mostramos dos con-
ción alguna entre dos conjuntos de datos, escribimos juntos,A y B, ambos subconjuntos de U. Si analiza-
la ecuación A n B=E, que simplemente señala que la mos el diagrama podremos advertir que A n B=E.
intersección de los conjuntos A y B está vacía, y que Adoptaremos una regla convencional: cuando de-
ningún miembro deA es miembro deB, y viceversa. seemos indicar que se trata de un conjunto o su bcon-
Supongamos que A= { 1, 2, 3}, y queB= {4, 5, 6}. junto, dibujaremos rayas horizontales, verticales o
En consecuencia A n B =E. Sin duda, no existen diagonales. En la figura 4-3 hemos "sombreado"
miembros comunes entre A y B. El conjunto de con rayas el conjunto A U B.
posibilidades de que los candidatos que postulan los
partidos demócrata y republicano para la presiden-
cia de la república, ganen ambos las elecciones a
nivel nacional, es vacío. Por lo expuesto, el conjunto
vacío es otra fQrma de expresar la falsedad de las
proposiciones. En este caso, podemos decir que la
frase "llover sin nubes" es falsa. En el lenguaje de
los conjuntos, esto puede expresarsePn-Q=E, en
el cual Pes el conjunto de todas las ocasiones en que
llueve; Q el conjunto de todasJas ocasiones en que
hay nubes, y ":::.Q", el conjunto de todas las ocasio-
u
nes en que no hay nubes. AuB
(4) Jbíd., pág. 63. Figura 4-3.
CONJUNTOS 37

La intersección, que posiblemente sea en este li-


bro la noción más importante sobre conjuntos, está
indicada por la fracción rayada en la figura 4-4.
B
Puede expresarse la situación por medio de la ecua-
ción A n B # E, y advertimos que la intersección de
los conjuntos A y B, no está vacía.
Cuando los dos conjuntos A y B son iguales, tienen
los mismos elementos o miembros. El diagrama de {}
Venn mostraría dos círculos congruentes, en U,
pero de hecho sólo aparecería un círculo. Cuando A= AcB
B, en consecuencia, A n B =A U B =A= B.
En la representación esquemática A C B, A es un Figura 4-5.
subconjunto de B, en la figura 4-5. B se ha "som-
breado" horizontalmente, y A se muestra con líneas
verticales. Nótese que A UB=B (la zona sombreada
completa) y A n B=A (área con rayas horizontales y
verticales). Todos los miembros deA también lo son
de B, o dicho en otra forma, todas las a también son
b, si hacemos que a= cualquier miembro de A y b =
cualquier miembro de B.

Operaciones con más {}


de dos conjuntos
Las operaciones de conjuntos no se limitan a los AnBnC
dos subconjuntos de U. Supongamos que A, B y C
son tres subconjuntos de U, y que la intersección de Figura 4-6.
los mismos no está vacía, como se muestra en la
figura 4-6. La zona con rayado triple muestra A n B
n C. Obsérvese que existen cuatro intersecciones subconjuntos que no agotan por completo a U (salvo
cada una con rayas de orientación diferente: A n B, que empleemos negación de conjuntos). Por otra
A ne, Bnc, yAnBnc. parte, U puede ser fraccionado en subconjuntos que
Es posible representar en un diagrama cuatro o no se intersecan y agotan todo U. El proceso en este
más conjuntos, pero este método es difícil, y no es caso recibe el nombre de partición.
fácil de dibujar ni de analizar. Sin embargo, no hay La partición fracciona un conjunto universal en
razón alguna para no aplicar simbólicamente a cua- subconjuntos disjuntos o incompatibles, y que ago-
tro o más conjuntos, las operaciones de intersección tan el conjunto universal. En el lenguaje de los con-
y unión. juntos, supongamos que U es un universo y que A y
B son los subconjuntos de U, y particiones del
Particiones y particiones mismo. Califiquemos a sujetos de A en esta forma:
cruzadas A1, A2, ... , Ak y a los de B: Bi, B2, ... , Bk.
Es evidente que U puede dividirse en subconjun- Supongamos ahora que [A1, Az] y [B1, B2],(5) por
tos que se intersecan. También puede ser dividido en ejemplo, son particiones si:

A1UA2=UyA1nA2=E
B1UB2=UyB1 nfü=E

Si expresamos lo anterior en un diagrama, el con-


cepto quedará más claro. La partición de U repre-
sentada por un rectángulo, separado en subconjun-
tos Ai y Az yB1 y B2, se muestra en la figura 4-7.
Obsérvese que ambas particiones se hicieron en el
mismo U. E.n la práctica hallamos muchos ejemplos
{} de estas particiones: clase media-clase obreta; in-
greso alto-ingreso bajo; introversión-extroversión;
AnB
(5) Para denotar las particiones suelen usarse corchetes [J y para
Figura 4-4. los conjuntos y subconjuntos, llaves {}.
38 CONJUNTOS, RELACIONES Y VARIANZA

lJ lJ
Figura 4-7.

demócrata-republicano; dependencia de campo- Por supuesto, es posible hacer más de dos parti-
independencia de campo; éxito-fracaso; apro- ciones con este procedimiento. En vez de dicoto-
bación-desaprobación, y así sucesivamente. Al- mías podemos obtener politomías, y en Jugar de
gunas de éstas son dicotomías verdaderas y otras dividir un universo en éxito y fracaso, por ejemplo,
son variables continuas. podemos subdividirlo en éxito, en éxito parcial y
Es posible reunir las dos particiones en una parti- fracaso. En teoría puede dividirse una variable en
ción cruzada. Se conoce con este nombre a una cualquier número de subconjuntos, aunque en Ja
nueva partición que surge al fraccionar sucesiva- práctica suele haber limitaciones. No hay una limi-
mente el mismo conjunto U, mediante la formación tación teórica en el número de variables en la parti-
de todos Jos subconjuntos de la formaAnB. En otras ción cruzada, pero para fines prácticos se suele limi-
palabras, se hará la partición A, después la B del tar su número a tres o cuatro subdivisiones.
mismo U, o del mismo cuadrado. En Ja figura 4-8 se Un ejemplo de partición cruzada mayor y más
muestra este procedimiento. Cada rectángulo o compleja se expresa gráficamente en la figura 4-9.
celda de la partición es una intersección de los dos Hemos asignado nombres de variables a las letras de
subconjuntos A y B. En un capítulo ulterior señala- los conjuntos de la partición cruzada 2 x 3 x 2.
remos que esta partición cruzada es de enorme im- Supongamos que U está constituido por todos Jos
portancia en el diseño experimerital y en los análisis niños de cuarto grado en un sistema escolar X, y que
de datos. · ' se hace una partición simple y otra cruzada, con base
En anticipación de estudios ulteriores, señalare- en las tres variables, A, B y C, de las cuales A es el
mos un ejemplo de investigación en que se usa la sexo, B, la inteligencia, y C la motivación. Permita-
partición cruzada. Estos ejemplos reciben el nombre mos que'U sea dividido, en primer lugar, en A i y A 2,
de divisiones cruzadas. Estas divisiones constituyen esto es, varones y mujeres, y después enB1,B2 y 83,
el procedimiento más elemental para demostrar una esto es, divisiones según el nivel de inteligencia, en
relación entre dos variables. Hemos tomado el alta, media y baja.(7) Por último, dividiremos el uni-
ejemplo del estudio que Miller y Swanson hicieron verso U en C1 y C2, que son la motivación fuerte y la
de las prácticas o costumbres en la crianza de niños. motivación débil (para hacer las tareas escolares).
U na de las tablas elaboradas por ellos, muestra una Realicemos la división cruzada A i y A 2 y Bi, Bz
división cruzada en la cual las variables son la clase y fü, mediante la formaeión de subconjuntos con ba-
social (clase media y clase obrera), y periodo del se en las intersecciones de A y B, como A inBi,
destete (temprano y tardío). Los datos transforma- A1nB2, ... ,A2nB3. Hacemos lo mismo, con
dos en porcentajes por el autor, aparecen en el cua- A y C y B y C. En realidad no es necesario efectuar
dro 4-1.(6) Las frecuencias registradas por dichos todo este procedimiento. Lo que hacemos después
autores están en Ja esquina inferior derecha de cada de establecer Jos subconjuntos A 1nB1, ... A2nfü,
celda o rectángulo. Sin duda existe relación entre la es hacer una partición cruzada de estos subconjun-
clase social y el momento del destete. Las madres de tos intersecados con C1 y C2, obtenemos subcon-
clase media tienen una tendencia a destetar a sus juntos triples, A 1nB1nC1, A 1nB1nC2,
hijos antes que las de clase más baja. Se cumplen las ... A2nB3nC2. (En aras de la sencillez, escri-
dos condiciones de "desunión" o incompatibilidad, bamos estos subconjuntos en el diagrama: A iB1C1,
y exhaustividad o agotamiento del universo. La in- A 1B1C2, y así sucesivamente.) De esta manera, ob-
tersección de cualquiera de las dos celdas está vacía, tenemos 2 x 3 x 2 = 12 cuadrángulos o celdas cada
por ejemplo, (A1nB1)n(A2nfü)=E. Y las celdas una de las cuales representa la intersección de tres
o cuadrángulos agotan todos los casos: (A1nB1)U conjuntos .
. . . U(A2nfü) =U. (7) Naturalmente es necesario que el investigador cuente con un
sistema perfectamente definido para establecer o fijar las catego-
(6) D. MiUer and G. Swanson, Inner Conj/ict and Defense. rías. Estos sistemas se comentarán cuando estudiemos el diseño de
Nueva York: Holt, Rinehart and Winston, 1960, pág. 426. investigación.
40 CONJUNTOS, RELACIONES Y VARIANZA

81
C1 C2 C1 C2 e, C2

A1B 1c1 A181C2 A¡ B2C1 A182C2 A183C1 A183C2

Az81C1 Az81C2 Az82C1 Az82C2 Az83C1 Az83C2

"
Figura 4-9.

estamos realizando. Existen.dos niveles o universos verso. Si los elementos del universo son personas,
de discurso (dos U): personas y aves. Cuando co- será imposible constituir un subconjunto con ele-
mentamos las consecuencias democráticas de la se- mentos que no sean seres humanos. (A pesar de que
gregación racial, no debemos cambiar repentina- el investigador puede tener el conjunto A de perso-
mente y hablar de problemas religiosos, salvo que, nas y el conjunto - A de "no personas", esto, en
por supuesto, en alguna forma relacionemos lo pri- forma lógica equivale a que U abarca solamente
mero con lo segundo. De otro modo, perderemos personas. De todos modos, "no personas" es una
nuestro universo original de discurso o posiblemente clase en la dimensión de "personas", por definición
no podremos asignar los objetos de ese nivel (reli- o convención.)
gión) al nivel previo, que es la enseñanza de los niños El concepto de conjuntos es fundamental en el
negros. raciocinio humano. Esto probablemente se debe a
En la investigación, de manera similar, no debe- que todo el pensamiento humano depende de la asig-
mos mezclar o desviarnos de nuestro universo de nación de cosas a categorías, y de la denominación o
discurso. Pensar en términos de conjuntos nos es útil connotación, como hemos señalado. Lo que hace-
para evitar estas confusiones o mezcolanzas y des- mos es agrupar clases de objetos, esto es, cosas,
viaciones. Como un ejemplo extremo, supongamos personas, fenómenos, en términos generales, y dar-
que un investigador decide estudiar la enseñanza del les un nombre. En consecuencia, estos nombres son
control de los esfínteres (mediante el cual el niño conceptos, "etiquetas" que ya no necesitamos
aprende a controlar la micción y la defecación), el aprender de nuevo y que podemos usar para un
autoritarismo, la aptitud musical, la creatividad, la raciocinio eficaz.
inteligencia, el aprovechamiento en la lectura y el La teoría de conjuntos es un procedimiento gene-
aprovechamiento escolar general de niños de sexto ral, aplicable al pensamiento conceptual y analítico.
grado. Deestegrupodevariables podríamos obtener Sus aplicaciones más importantes en la metodología
alguna relación o relaciones pero es más práctico e investigación probablemente sean el estudio de las
admitir que, como están expresadas, constituyen un relaciones, la lógica, la obtención de muestras, la
"embrollo intelectual". En todo momento hay que probabilidad, la medición y el análisis de datos. Sin
recordar la utilidad de los conjuntos. Convendría embargo, los conjuntos también se aplican a otras
que el investigador se preguntara lo siguiente: ¿per- áreas y problemas que no son considerados como
tenecen a algún conjunto o conjuntos los objetos de técnicas, en el sentido en que se consideran la pro-
que me ocupo o que comentaré en mi discurso ac- babilidad y la medición. Por ejemplo, Piaget ha em-
tual? En caso de que así sea, él estará en un nivel de pleado el álgebra de conjuntos para explicar el pen-
discurso, pero si no lo está, en su "discurrimiento" samiento de los niños.(8) Hunt ha aplicado conjun-
intervendrán otro conjunto o grupo de conjuntos. Si tos a su estudio del aprendizaje de conceptos.(9)
esto ocurre inadvertidamente, surgirá confusión. En Coombs presentó su importante teoría de datos, co-
resumen, convendría formularse la siguiente pre- mentada en gran parte en términos de conjuntos.( 10)
gunta: "¿Cuál es mi universo (U) y cuáles sus sub-
conjuntos?"
Además, hay que definir con toda precisión el (8) J. Piaget, Logic and Psychology. Nueva York: Basic Books,
conjunto universal. "Precisión" significa establecer 1957. También, B. Inhelder y J. Piaget, The Growth of Logical
una norma clara que indique a todo mundo cuándo Thinking from Childhood to Adolescence. Nueva York: Basic
Books, 1958.
un objeto es miembro de U y cuándo no lo es. De (9) E. Hunt, Concept Learning. Nueva York: Wiley, 1962.
manera similar, hay que definir los subconjuntos de ( 10) C. Coombs, "A Theory of Data," Psycho/ogical Review,
U y los subconjuntos de los subconjuntos del uní- LXVII ( 1960), 143-159.
CONJUNTOS 39

Para clasificar a cualquier individuo, averiguamos 8


si es varón o mujer, y si su inteligencia es alta, media
o baja, y si su motivación es fuerte o débil. Hacemos
esto para cada persona hasta que todos los indivi-
duos o miembros de U han sido clasificados en forma A1
precisa, y asignados a las celdas adecuadas. Nues-
tras normas iniciales establecían que: l) las celdas A
deben estar "disjuntas" o ser "incompatibles", por
ejemplo, [(A1nBinC2)n(A2nB1nC3) =E], y2) que
la unión de todas las celdas debe ser igual al universo
[(A1nB1nC1)U(A1nB1nC2) u ... u (A2nfünC2)
= U]; por estas razones el individuo debe estarenuna Figura 4-8.
celda, esto es, ninguno debe estar en varias, y habrá
que asignar a cada individuo a una casilla. Presenta-
remos uno o dos ejemplos para aclarar este punto. Si
uno de los niños es de sexo femenino, tiene inteli- Muchas definiciones "normativas" o por reglas, es-
gencia alta y poca motivación, se le colocará en la pecialmente matemáticas, son más sucintas; por
casilla A zB 1C 2, en tanto que un niño de inteligencia ejemplo:
media y gran motivación se le clasificará en la casilla
AiB2C1. C={x 1 x es un "rango", y l ~ x :s; 10{
lo cual indica que Ces un conjunto de "rangos", o
Definición de conjuntos categorías ordenadas,x;, endondei = 1,2, ... , 10.
Hay algunas formas simbólicas para definir o es-
pecificar conjuntos. Hemos mencionado las defini-
ciones "por listas", en las cuales simplemente se Niveles de discurso*
enumeran por lista los miembros de un conjunto. Por Cuando nos ocupamos de algún asunto lo hace-
ejemplo, A ={Opus 101, Opus 106, Opus 109, Opus mos dentro de un contexto o marco de referencia.
110, Opus 111}, que es el conjunto de las últimas Las expresiones contexto o marco de referencia
cinco sonatas de Beethoven, para piano. Las defini- guardan relación íntima con U como universo de
ciones por reglas o normas son más interesantes y discurso. Este último debe incluir a todos los objetos
prácticas porque casi todos los conjuntos, en espe- de los que nos ocupamos y hablamos. Si pasamos a
cial en investigación, son muy grandes y difíciles de otro U -esto es, otro nivel de discurso-, el nuevo
enumerar por lista. Una definición normativa sería nivel no incluirá a todos los objetos, e incluso pu-
la siguiente: diera carecer de ellos. Por ejemplo, si hablamos de
personas, no comenzamos a hablar sobre aves y sus
A= {a 1 a es una de las últimas cinco sonatas costumbres (y en realidad no debiéramos hacerlo),
de Beethoven para piano} salvo que en alguna forma establezcamos alguna
relación entre las aves y sus hábitos, con las de las
(El signo "I"
se lee "tal que". Otra definición, por personas, y señalemos con claridad la operación que
regla, sería:
• N. del T.: En este contexto emplearemos el vocablo discurso
B= {b 1 bes una alumna de cuarto año del sistema como equivalente de oración, o conjunto de palabras con que se
escolar de Berkeley, California) expresa un concepto cabal.

Cuadro 4-1. Cuadro de divisiones cruzadas: relación entre la clase social y el destete,
en el estudio de Miller y Swanson

Destete

Temprano (B1) Tardío (fü)

Clase media 60% 403


Clase (A1) (33) (22)
social
Clase trabajadora 353 653
(A2) (17) (31)
CONJUNTOS 41

Warr y Smith, con notable ingenio y compenetra- circunstancias dicho diagrama tendría signifi-
ción, emplearon la teoría de los conjuntos para pro- cado en la investigación?
bar diferentes modelos de inferencia acerca de ras- 2. Consideremos la siguiente partición cruzada:
gos de la personalidad, con resultados sorprenden-
tes.( 11) Más adelante definiremos la medición por Republicano (Bi) Demócrata(fü)
una ecuación teórica de un solo conjunto. Además, Varón (A 1)
esperamos que los conjuntos y la teoría de los mis- Mujer (A2)
mos esclarezcan algunos principios básicos de ob- ¿Cuál es el significado de los siguientes con-
tención de muestras, análisis y de diseño de investi- juntos, esto es, en qué forma podríamos nombrar
gación. Por desgracia, casi todos los sociólogos y a un objeto en los conjuntos?
pedagogos aún no se percatan de la aplicación gene- a) (A1nB1); (A2nfü)
ral, fuerza y flexibilidad como una forma de pensa- b) A1; Bi
miento. Sin embargo, podemos anticipar con toda e) (A1nB1)U(A1nfü)U
seguridad que los investigadores de las ciencias so- (A2nB1J U<A2 n füJ
ciales y la enseñanza, obtendrán más y más utilidad d) (A1nB1)U(A2nB1)
de la teoría de conjuntos y dicha forma de pensar, al
estructurar con base en los conceptos sobre los con- 3. Con los siguientes conjuntos haga una partición
juntos, sus problemas teóricos y de investigación. cruzada: puntajes de pruebas de inteligencia del
niño de tercer año escolar; antecedentes socio-
Guías de estudio económicos, y sexo.
l. Dibuje dos círculos que se superpongan en un 4. ¿En qué circunstancias la siguiente ecuación de
área, dentro de un rectángulo. Identifique las si- conjuntos sería verdadera?
guientes partes: el conjunto universal U, los sub-
conjuntos A y B, la intersección de A y B y la n(A U B)=n(A) + n(B)
unión de A y B.
a) Supongamos que el lector trabaja en un pro- [Nota: n(A) significa el número de objetos en el
blema de investigación con niños de quinto conjunto A.]
año.¿ Qué parte el diagrama indicaría los niños 5. Supongamos que un sociólogo investigador desea
de los cuales usted podría extraer muestras? estudiar la influencia del sexo y la raza en la
b) ¿Qué representarían los conjuntos A y B? ocupación de las personas. ¿En qué forma podría
e) ¿Qué significado tendría la intersección de A y conceptualizar el problema en términos de con-
B? junto? (Nota: supongamos que A = sexo, B =
d) ¿En qué forma podría cambiarse el diagrama clase social y C =estado ocupacional; estúdiese
para representar el conjunto vacío? ¿En qué la figura 4-9.)
6. ¿En qué forma guardan relación los conjuntos
(11) P. Warr y J. Smith, "Combining Information about People:
con las variables? ¿Podemos hablar de partición
Comparisons ·Between Six Models," Joumal of Persona/ity and de variables?¿ Tiene algún significado hablar de
Social Psychology, XVI (1970), 55-65. subconjuntos y variables? Explíquese este punto.
CAPITULO 5
Relaciones

Las relaciones son la base de la ciencia. Según una cosa con otra, una relación o una alianza, Y si
Cohen, " ... la ciencia no es el conocimiento de proseguimos en nuestra tarea de definir cada tér-
simples datos particulares, sino de la forma en que se mino que surge, advertiremos que tales definiciones,
relacionan las clases".(!) Sabemos que las cosas aunque son útiles intuitivamente, son demasiado
grandes lo son sólo en comparación con otras de ambiguás para su uso científico.
menor tamaño. De este modo, establecemos las re-
laciones "mayor que" y "menor que". Un peda- Relaciones como conjuntos
gogo puede "saber" lo referente al aprovecha- de pares ordenados
miento sólo si lo estudia en relación con la falta de Las relaciones en las ciencias serán siempre entre
apróvechamiento, y con otras variables. En sí y por clases o conjuntos de objetos. Es imposible ··cono-
sí no hay un "aprovechamiento" como hecho ais- cer" la relación entre la clase social y el aprovecha-
lado. Las relaciones entre inteligencia y aprovecha- miento escolar, si se estudia a un solo niño. El "co-
miento, entre presiones de grupo, y conformidad, nocimiento'' de la relación se logra sólo al abstraer o
entre aptitud y motivación, son "hechos", una vez aislar la relación obtenida de conjuntos de niños o,
que se han establecido en forma comparativa. con mayor exactitud, de conjuntos de características
La naturaleza relacional del conocimiento hu- de niños. Examinemos algunos ejemplos de relacio-
mano se puede apreciar con toda claridad incluso nes para captar intuitivamente el significado real de
cuando analizamos ''hechos'' al parecer obvios. ¿Es este término.
un hecho que una piedra es dura? Para señalar la Supongamos que A es el conjunto de todos los
verdad o falsedad de esta declaración, en primer padres y B el de todos los hijos. Si hacemos parejas
lugar debemos exarí1inar conjuntos y subconjuntos de cada padre con su hijo o hijos, estábleceremos la
de distintos tipos de piedras. Una vez hecho lo ante- relación "padre-hijo". De.esta manera también po-
rior, después de definir '"duro" en forma operacio- dríamos llamar a esta relación "paternidad", aun-
nal, comparamos la "dureza" de las piedras con la que no hayamos considerado a las hijas. De manera
dureza de otros materiales. En el análisis final los semejante, podemos hacer pares entre los padres
hechos "más sencillos" no lo son tanto. Northrop, (elementos de A, en el cual cada pareja de progenito-
al comentar conceptos y hechos, señaló: "la única res se considera como un elemento) con sus hijos de
forma de lograr el conocimiento de hechos puros, uno y otro sexos. Esto sería la relación de "paterni-
independientemente de todos los conceptos y las dad" o tal vez de "familia".
teorías, es simplemente contemplarlos o examinar- Supongamos que A es el conjunto de todos los
los y sin más, callar para siempre ... "(2) esposos y Bel de todas las esposas. Los conjuntos de
Los diccionarios nos señalan que una relación es pares o parejas definirían la relación "matrimonio''.
un vínculo, un enlace, o un parentesco. Para muchas En otras palabras, se forma un nuevo conjunto que
personas esta definición es suficiente, pero si exa- es el de esposos varones, que siempre aparecen en
minamos con mayor detalle: ¿qué significan "vín- primer lugar en las listas, y el de esposas, en segundo
culo", "enlace" o "parentesco"? De nuevo, el dic- lugar, y en el que cada esposo está pareado sólo con
cionario nos señala que un vínculo es una unión o su propia esposa.
atadura de una persona o cosa con otra y que un Supongamos que el conjunto A consta de puntua-
enlace es, entre otras cosas, una unión o conexión de ciones de un grupo especificado de niños obtenidas
en pruebas de inteligencia, y que el conjunto B está
formado por las puntuaciones de una prueba de
{ 1) M. Cohen, A Preface to Logic. Nueva York: Meridian. 1957, aprovechamiento. Si hacemos pares (pareamos) con
pág. 170. los datos del cociente intelectual de un niño y su
(2) F. Northrop, The Logic ofthe Sciences and the Humanities.
Nueva York: Macmillan, 1947, pág. 317. Ver también, M. Cohen y
puntuación de aprovechamiento, definiremos una
E. Nagel. An lmroductíon ro Logic ami Scientífic Method. Nueva relación entre inteligencia y logro escolar. Obsér-
York: Harcourt, 1934,págs. 217-219. vese que no pod.emos asignar tan fácilmente un
42
RELACIONES 43

nombre como "paternidad" o matrimonio a esta como señalamos, que los miembros de cada par
relación. Supongamos que los conjuntos de puntua- siempre aparecen en un orden determinado. Si los
ciones son estos: miembros de los conjuntos A y B son pares o están
Cociente intelectual (CI) Aprovechamiento pareados, en tal caso debemos especificar si los
miembros de A o de B aparecen primero en cada
136 55 pareja. Por ejemplo, si definimos la relación del ma-
125 57 trimonio, especificamos el conjunto de pares orde-
ll8 42 nados en los cuales colocaremos siempre en primer
110 48 lugar al esposo, en cada pareja. En otras palabras, el
100 42 par (a, b) no es el mismo que el par (b, a). Los pares
97 35 ordenados se expresan dentro de un paréntesis: ( ).
90 32 Un conjunto de pares ordenados sería: {(a, k), (b, /),
(c, m)}.
Consideremos a los dos conjuntos como un conjunto
Hemos superado la ambigüedad de las definicio-
de pares o parejas; este últímo conjunto es una rela- nes del diccionario. La definición de relación como
ción. conjunto de pares ordenados, a pesar de que lepa-
Si representamos gráficamente a los dos conjun- rezca al estudiante un poco extraña e incluso cu-
tos de puntuaciones en las abscisas y las ordenadas, riosa, es directa, esto es, carece de ambigüedad, y es
como hicimos en el capítulo 3 (fig. 3-3), será más fácil
general. Aún más, el científico, en la misma forma
apreciar a simple vista la relación, lo cual se ha
que el matemático, puede trabajar con ella.
hecho en la figura 5- l. Cada punto está definido por
dos calificaciones. Por ejemplo se define el punto
más a la derecha ( 136, 55), y el punto más a la Determinación de relaciones
ízquierda (90. 32). Las gráficas, como la que aparece en la investigación
en la figura 5-1, son formas convenientes de expresar Hemos evitado la ambigüedad en la definición de
relaciones. relaciones, pero no hemos aclarado la definición y,
En este momento ya estamos preparados para en especial los problemas prácticos, de la determi-
definir formalmente lo que es una ''relación": es un nación de relaciones. Hay otra forma de definir esta
conjunto de pares ordenados. Cualquier relación es relación, que nos puede ser útil. Supongamos que A
un conjunto o un tipo especial del mismo: un con- y B son dos conjuntos. Si "pareamos" a cada miem-
junto de pares ordenados. Un par ordenado está bro individual de A con su correspondiente de B,
constituido por dos objetos o un conjunto de dos obtendremos todos los pares posibles entre los dos
elementos que aparecen en un orden fijo. En reali- conjuntos. Esto recibe el nom~bre de producto carte-
dad hablamos de pares ordenados lo cual significa, siano de los dos conjuntos, que designaremosA x B.

60
o { 125,57)
55 0
(136,55)

50
o(ll0,48)
45
y o
(100,42) o ( 118,42)
40

35 o (97,35)
0 (90,32)
30

25.__~'----'~-..i..~-'-~-'-~-'-~-'-
80 90 IOO 110 120 130 135 140
X
Fig. 5-1. La ordenada (Y) denota el aprovechamiento y la abscisa (X) el cociente intelectual (CI).
44 CONJUNTOS, RELACIONES Y VARIANZA

A señalaremos aquí que muchos de los posibles sub-


conjuntos de pares ordenados de A x B, natural-
mente, "no tienen sentido". También es posible
advertir que en otros, dicho ordenamiento sí tiene
sentido, lo principal es que nuestra definición de
relación es directa, carece de ambigüedad, y es to-
talmente general. No importa cuáles conjuntos de
pares ordenados escojamos, cada uno constituye
Figura S-2. una relación. De nosotros depende decidir si los
conjuntos que elegimos tienen "congruencia" o sen-
tido científico, con base en las condiciones o exigen-
En este caso podemos ya definir la relación de un cias de los problemas que buscamos resolver y las
subconjunto de A x B, esto es, cualquier subcon- hipótesis que sometemos a prueba. Sin embargo, no
junto de pares ordenados extraídos de A x B.(3) debemos excluir automáticamente las relaciones
Para ilustrar esta idea en forma sencilla, supon- porque a primera vista no parezcan tener sentido.
gamos el conjunto A= {a 1, a2, a3} y el conjuntoB= El lector puede preguntarse por qué hemos dedi-
{b1, b2, ba}.(4) En este caso podemos representar cado tanto espacio a definir las relaciones. En primer
esquemáticamente, como en la figura 5-2, el pro- lugar, como señalamos, la definición de par orde-
ducto cartesiano A x B, esto es, generamos nueve nado es directa, y carece de ambigüedad. En se-
pares ordenados: (a1, b1), (a2, b2), ... , (aa, ba). Si gundo lugares válida y aplicable, en forma general, a
trabajáramos con conjuntos grandes habría muchos situaciones de investigación y, de este modo, es un
pares, de hechomn, endondem y n son el número de instrumento intelectual útil que nos ayudará a unifi-
elementos de A y B, respectivamente. car diversos tipos de relaciones, en diversas situa-
Lo anterior posiblemente no tenga mayor interés, ciones de investigación. En tercer lugar, nos indica
cuando menos en el contexto presente. ¿Qué debe- de hecho lo que debemos hacer para estudiar empíri-
mos hacer para determinar o "descubrir" una rela- camente las relaciones: de algún modo debemos es-
ción? Con base en algún criterio, determinamos en tudiar pares ordenados y hallar procedimientos y
forma empírica los elementos de A que correspon- formas para diferenciar y distinguir los pares orde-
den o "van con" los elementos de B. Es obvio que nados de interés, de los que no lo tengan en lo que
hay muchos subconjuntos de pares A x B la mayoría respecta a un problema particular de investigación.
de los cuales no "tienen sentido", o no nos intere-
san. Kershner y Wilcox señalan que una relación es Reglas de correspondencia
un "método para diferenciar unos pares ordenados, y trazo de mapas
de otros. Se traza un esquema para separar o aislar Todo objeto: personas, granos de café, números,
algunos pares, del resto" .(5) Con base en el criterio vagones de ferrocarril, resultados de un juego de
de calificar las relaciones, por ejemplo, la relación de azar, puntos en el espacio, símbolos, etc., pueden
"matrimonio" es un método o procedimiento para pertenecer a conjuntos y ser relacionados en pares
diferenciar a las parejas casadas, de todas las parejas ordenados. Es posible decir que los miembros de un
posibles de varones y mujeres. En esta forma incluso conjunto guardan una correlación en un mapa (car-
podemos pensar en la religión como una relación. Si tográfica o "mapeo") con los miembros de otro con-
A= {a1, a2, ... ,an} es el conjunto de todos los junto, por medio de una regla de correspondencia.
habitantes de Estados U nidos y B={ católico, protes- Esta regla es una fórmula o regla que nos indica la
tante, judío, etc. } es el conjunto de religiones, si en forma de relacionar, cómo poner en un mapa, los
cada caso ordenamos por parejas a cada persona con objetos de un conjunto con los de otro. En forma
su religión, tendremos la "relación" de la religión, y sucinta nos indica la forma en que se establecen las
posiblemente con mayor precisión la "afiliación o correspondencias entre los miembros de los conjun-
credo religioso". tos.
Es posible que el lector se sienta todavía un poco Para ilustrar las nociones de mapeo y correspon-
intranquilo con el hecho de definir una relación dencia, estudiaremos la figura 5-3 en la que se apre-
como un subconjunto de A x B; para su tranquilidad cia un i::apa sencillo, a la izquierda, y los nombres de
los objetos, a la derecha. En este caso tenemos un
(3) Consúltese R. Kershner y L. Wilcox, The Anatomy of Mat- mapa de objetos gráficos reales o sus nombres (o
hematics. Nueva York: Ronald, 1950, cap. 5, donde aparece un viceversa). Esto, sin duda, es una relación, un con-
excelente comentario sobre las relaciones. junto de pares ordenados, en el que se aprecia que
(4) Los subíndices enteros simplemente designan y distinguen cada objeto geográfico corresponde al nombre con
miembros individuales de conjuntos. No suponen un orden. Ad-
viértase también que no siempre hay números iguales de miembros que se le designa y parea.
en los dos conjuntos. En una relación, los dos conjuntos cuyos objetos
(5) Kershner y Wilcox, op. cit., pág. 46. guardan correspondencia, reciben el nombre de do-
RELACIONES 45

Dominio Rango

Figura 5-3.

minio y extensión (o rango) deD y R. D siempre es el miembro del dominio {Rocío, Arturo, Miguel, Al-
conjunto de los primeros elementos y R el de los berta, Ruth} se asigna uno y sólo un miembro de la
segundos. Supongamos que tenemos un grupo de extensión o rango {O, !}.
niños y niñas, y deseamos estudiar la relación entre Las funciones' se expresan por escrito en diversas
el sexo y otra variable. Asignamos el número 1a los formas. Entre las más frecuentes están y= f(x). En
varones y Oa las mujeres. En la figura 5-4 se puede este caso, x representa a los objetos del dominio; y
observar una representación gráfica de las relacio- f(x) denota a los objetos que se asignan a las x del
nes de esta índole, en la cual a cada miembro del dominio. Con ello,ftx) representa a los objetos del
dominio, o sea, el primer grupo, se le asigna adecua- "rango". Estos objetos reciben el nombre def dex;
damente un número de la extensión o rango. D = y= f(x) suele leerse como "y es función de x". Por
{Rocío, Arturo, Miguel, Alberta, Ruth}, y R={O, 1}. desgracia, esto tiende a confundirse con el empl~o
La i;egla de correspondencia sería: si el objeto de D corriente del vocablo "función": el aprovecha-
es una mujer, se le asignará un O, y si es varón, un l. miento escolar está en función de la inteligencia.
En otras palabras, los objetos, y en especial los Este uso parece significar que una cosa depende de
números, se asignan a otros como son personas, la otra, o es causada por ella. Este no es el signifi-
sitios, números y así sucesivamente con base en cado que pretendemos darle en este apartado;y=.f(x)
normas. El proceso varía notablemente en sus apli- se lee mejor: "y es igual al objeto (o miembro de un
caciones, pero su concepción es simple. Esta es la conjunto) que corresponde ax".
razón por la que insistimos tanto en el concepto de Otra forma de describir funciones, apropiada para
los conjuntos, en este texto: tienen aplicación gene- los fines de este capítulo, es la ecuación:! ={(x, y); x
ral y su concepción es sencilla. En lugar de concebir es un número, y y=x + 2}. Si lo expresáramos con
por separado todas las formas diversas de expresar palabras, sería: "La función! o la regla de corres-
relaciones, nos damos cuenta que son conjuntos de pondencia, es igual al conjunto de pares ordenados
pares ordenados, y que los objetos de un conjunto
guardan correspondencia gráfica y directa con los
objetos del otro. Todas las diversas formas de ex-
presar relaciones como los "mapas" corresponden-
cias, ecuaciones, conjuntos de puntos, tablas o índi-
ces estadísticos, pueden reducirse a conjuntos de
pares ordenados.

Funciones
Unafunción es una regla de correspondencia que
suele designarse por las letrasf, g, Fu otras, la cual
asigna a un miembro particular de un dominio, otro
miembro del segundo conjunto (extensión o rango). Dominio Rango
Todas las funciones son relaciones y conjuntos de
pares ordenados. Lafigura5-4esunafunción: a cada Figura 5-4.
46 CONJUNTOS, RELACIONES Y VARIANZA

son funciones y, por supuesto, relaciones. La rela-


ción en estos casos se establece entre el tiempo o
práctica, que es la variable independiente (o domi-
nio) y las respuestas correctas o incorrectas, que
serían las variables dependientes (extensiones o
rangos). El estudiante, que entra por primera vez en
contacto con las teorías del aprendizaje, tendría difi-
cultades si desconoce lo referente a relaciones y
funciones.
Un número cada vez mayor de científicos usa ya
conjuntos, relaciones y funciones, en su trabajo. Es
posible que a la persona inexperta, las expresiones
o matemáticas le parezcan complejas e inescrutables,
Figura 5-5. pero por fortuna se basan en ideas bastante sencillas
y precisas, que mostramos en estos capítulos. Son
herramientas muy útiles para comprender las bases
(x, y), de tal modo que x es un número, y cada y del pensamiento, la investigación científica y los
correspondiente (también un número),es igual ax+ medios auxiliares para descubrir y probar relacio-
2." En resumen, a un valor de x, por ejemplo 4, le nes.
añadimos 2, para obtener ''y'', que en este caso es 6.
La regla es F que está dada explícitamente por la Formas de demostrar relaciones
expresión del miembro derecho de la ecuación. Anteriormente señalamos que las relaciones pue-
Como se señaló en líneas anteriores, todas las den expresarse en diversas formas. En los comenta-
funciones son relaciones. Sin embargo, conviene rios previos ilustramos algunas de ellas. Un método
señalar que no todas las relaciones son funciones. Es consistía simplemente en ordenar en listas y por
posible, en lo que respecta a una función, que se pares a los miembros de los conjuntos, lo cual se
haya asignado a cualquier miembro de su dominio, ilustró en las figuras 5-2 a 5-6. Otra forma de repre-
sólo un miembro de su "rango" o extensión. Si al sentar una relación es a base de gráficas. La figura
disponer en pares a los hijos y a los padres coloca- 5-1 constituye un ejemplo. Otra forma más, es ha-
mos en primer lugar a los hijos, tendremos una fun- cerlo con ecuaciones.
ción y, por consiguiente, una relación. A cada hijo se Las tablas suelen ser métodos convenientes para
le ha asignado sólo un padre. Esto se indica en la demostrar relaciones. La situación indicada en la
figura 5-5, en la que cinco hijos se "relacionaron" figura 5-4 podría expresarse en una tabla o cuadro.
con tres padres. Obsérvese que cada objeto del do- En seguida presentamos un cuadro que muestra cla-
minio tiene sólo un objeto del rango relacionado con ramente los pares ordenados:
él, y que cada hijo tiene sólo un padre.
La figura 5-6 expresa la situación inversa. Los X Rocío Arturo Miguel Albert a Ruth
padres han sido colocados en primer término, y des- y o 1 1 o o
pués a los hijos. Adviértase que F2 y Fa tienen dos
líneas que los unen con objetos de R. De esta ma-
nera, la figura 5-6 ilustra una relación, pero no una Este es un ejemplo sencillo de una investigación
función. real. Newcomb, al estudiar las formas y métodos del
Es importante que el futuro investigador sepa, por
lo menos, lo que es una función. En la literatura
sobre este tema aparecen frecuentemente, funcio-
nes, expresiones de funciones y leyes de funciones.
Aún de mayor importancia, es que una de las metas
básicas de la ciencia es descubrir y expresar leyes
"funcionales" de la índole: "si tenemos p, entonces
tendremos q'', que pueden expresarse q=j{p).
Además de descubrir relaciones, la tarea del cien-
tífico incluiría expresar leyes de funciones matemá-
ticas precisas que puedan utilizarse para hacer de-
ducciones y predecir variables dependientes, a par-
tir de variables independientes. Por ejemplo, los teó-
ricos del aprendizaje desde hace mucho han em-
pleado ecuaciones funcionales. Las llamadas curvas
de aprendizaje y las ecuaciones en las que se basan, Figura 5-6.
RELACIONES 47

Cuadro 5-1. Relación entre la necesidad de afiliación y el cambio de actitud,


según el estudio NewcombB

Cambio de actitud Sin cambio de actitud


Gran necesidad de afiliación 6 o
Poca necesidad de afiliación 2 6
ªLos números corresponden a personas que mostraron ambas caracteristicas indicadas por las variables en los
subtítulos y la primera columna de este cuadro. Por ejemplo, dos personas con poca necesidad de afiliación, mostraron
cambio de actitud.

conocimiento y establecimiento de relaciones, pre- símbolos, haciendo que R denote la relación R={(l,
senta una tabla que compendia la relación entre la !), (2, l), (2, 2), (3, 3)}.
necesidad de afiliación y el cambio de actitud.(6) En El método anterior es impreciso, aunque con él a
este punto no nos ocuparemos de los detalles de este menudo obtenemos una idea aproximada de la di-
tema, pues nos interesan más las tablas como un rección y grado de la relación, al analizar, a simple
medio conveniente para demostrar las relaciones. El vista, listas de pares ordenados. Las gráficas como
cuadro 5-1 es parte de la tabla de Newcomb. las de las figuras 5-1 y 5-7 son más ilustrativas. En
La tabla es, por supuesto, una partición o división ellas se puede apreciar con mayor facilidad que los
cruzada. En realidad, condensa un conjunto de 14 valores de X "corresponden" o acompañan a los
pares ordenados, cuyos primeros miembros son in- valores de Y: los valores más altos de Y acompañan a
dividuos y los segundos, unos y ceros. La regla para valores más altos de X, y los valores menores de Y,
formar el mapa o regla funcional (mapa) se encuentra acompañan a valores correspondientes de X. En este
en la intersección de los subconjuntos (las cuatro caso, la relación o co1Telación, como suele llamár-
celdas y sus compuestos). Por ejemplo, la casilla sele, es positiva. Si tuviéramos la ecuación: R={( 1,
inferior izquierda es A 2 n Bt, si empleamos norma 3), (2, !), (2, 2), (3, !)}, la relación sería negativa.
convencional adoptada en el capítulo 4; A 2 es "poca (Conviene que el estudiante exprese en una gráfica
necesidad de afiliación" y B1 es "cambio de acti- estos valores, y se percate de que esta relación no es
tud". Las dos personas que cumplan con estas dos una función, porque el valor 2 de X tiene dos valores
condiciones (parte de la regla o norma), serán trasla- diferentes de Y, "pareados" con él. Esto se aprecia
dadas (en forma de mapa) desde su dominio (que fácilmente en la gráfica. Una función no puede tener
contiene 14 individuos) hastaA2 n Bt, que es parte nunca más de un valor de Y, con cada valor de X.)
del rango de cuatro intersecciones (casillas). En Si la ecuación fueseR={(l, 2), (2, !), (2, 2), (3, 2)},
forma similar, se hace una traslación ("mapeo") de la relación sería Oo nula, lo que se expresa gráfica-
las otras 12 personas. En este caso tenemos una mente en la figura 5-8. También puede notarse que
relación que también constituye una función. En un los valores de Y no "corresponden" a los valores de
capítulo ulterior nos ocuparemos de divisiones cru- X, en forma sistemática, lo cual no significa que "no
zadas semejantes, y de otros tipos de tablas o cua- exista" relación. Por definición siempre existe una
dros que expresan relaciones y funciones. relación, pues hay un conjunto de pares ordenados.
Resulta provechoso examinar medidas estadísti- Sin embargo, a menudo se dice que no hay relación
cas de relación junto con las gráficas. Supongamos
que tenemos dos conjuntos, X y Y, constituidos por
puntuaciones obtenidas en dos pruebas por las mis-
mas personas. Las puntuaciones son:
X y
3 o (3,3)
1
2 y 2 o (2,2)
2 2
3 3 0
(1:1)' (2,1)
Los dos conjuntos forman un grupo de pares or-
denados. Este conjunto es, indiscutiblemente, una
relación (cabría preguntar si en verdad se trata de o 2 3
una función). También podría ser expresado con
X
(6) T. Newcomb, The Acquaintance Process. New York: Holt.
Rinehart y Winston, 1961. pág. 140. Figura 5-7.
48 CONJUNTOS, RELACIONES Y VARIANZA

Cuadro 5-2. Tres conjuntos de pares ordenados en que se aprecian direcciones


y grados diferentes de correlación

(I) r = 1.00 (11) r=-1.00 (III) r=O


X y X y X y

1 1 1 5 l 2
2 2 2 4 2 5
3 3 3 3 3 3
4 4 4 2 4 l
5 5 5 l 5 4

alguna. Sería más exacto decir que la relación es mente, y también los valores X y Y de II, pero en
cero o nula. dirección contraria. En el conjunto III no existe
Los sociólogos suelen calcular índices de rela- relación entre los órdenes jerárquicos. En 1 y II es
ción, que suelen denominarse como coeficientes de posible predecir con toda exactitud de ·x a Y, pero en
correlación, entre conjuntos de pares ordenados, III no es posible calcular los valores de Y, a partir de
para así obtener estimaciones más precisas de la X. Los coeficientes de correlación rara vez son 1.00
dirección y grado de las relaciones. Si se calcula un ó O y, por lo regular, ocupan valores intermedios.
índice de este tipo, que es el coeficiente de correla-
ción producto-momento o r para los pares ordenados Guías de estudio
delafigura5-7, se obtiener = .85. En los pares deR= 1. La siguiente lista contiene fichas bibliográficas de
{(!, 3), (2, 1), (2, 2), (3, I)}, se ha calificado la libros que contienen comentarios excelentes so-
relación como negativa, esto es, r= -.85. Para los bre conjuntos, relaciones y funciones.
pares de la figura 5-8, el grupo de pares que mostró Kershner, R., y Wilcox, L., The Anatomy ofMat-
una relación nula o O, r = 0.(7) hematics. Nueva York: Ronald, 1950, págs.
Por lo expuesto, los coeficientes de correlación 41-60. El más resumido y, en muchas formas,
producto-momento y otros conexos, se basan en la el más satisfactorio de todos. Es digno de se-
variación concomitante de los miembros del con- ñalar su tratamiento riguroso de conjuntos,
junto de pares ordenados. Si cavarían -esto es, va- relaciones y funciones. Este texto se reco-
ríanjuntos y en forma correspondiente, por ejemplo, mienda para estudiantes avanzados.
valores altos con valores altos, medios con medios, Report of the Commission on Mathematics. Ap-
y bajos con bajos, o valores altos con bajos y así pendices. Nueva York: College Entrance
sucesivamente-se dice que existe una relación posi- Examination Board, 1959. Este es un libro
tiva o negativa, según el caso. Si no muestran cova- excelente, con una exposición clara y sencilla.
riación se dice que "no hay" relación. Los índices Se recomienda en especial el capítulo 2 y el 9.
más útiles de este tipo varían de+ 1.00, pasando por 2. Presentamos cinco ejemplos de relaciones, fun-
O, hasta - 1.00, + 1.00 indica una posible relación ciones o ambas. Supongamos que el conjunto que
perfecta en tanto que - 1.00 una relación negativa aparece en primer lugar es el dominio y el se-
perfecta, y Odenota que no hay relación discernible.
Algunos índices van únicamente de O a + 1.00, en
tanto que otros pueden comprender otros valores.
Casi todos los coeficientes de correlación indican
la similaridad que existe entre los órdenes por ran-
gos, de dos conjuntos de mediciones. El cuadro 5-2 3
presenta tres ejemplos que ilustran esta correspon-
dencia de los órdenes jerárquicos o por rangos. Se y o o o
2
presentan los coeficientes de correlación de cada
uno de los conjuntos de pares ordenados. El grupo I
y II son bastante obvios: los órdenes por rangos de o
los valores X y Y de I. se corresponden perfecta-

o 2 3
(7) Los métodos para calcular estas r y otros coeticientes de
correlación se comentan en textos de estadística en los cuales X
también se explica, con mayor detalle, la interpretación de los
coeficientes de correlación. Figura 5-8.
RELACIONES 49

gundo el rango. ¿Por qué son relaciones? ¿Cuáles problemas técnicos o filosóficos y es mejor es-
son funciones? quivarlas. Además, no existe una necesidad real
a) Páginas de un libro y número de páginas. de pensar en términos causales, en la ciencia.(8)
b) Número de capítulos y páginas de un libro. Todo lo que se necesita realmente es usar las
e) Encabezados o categorías en tablas de pobla- afirmaciones condicionales del tipo que hemos
ciones y cifras de población en un censo. señalado en páginas anteriores: ''si p ocurre, en-
d) Niños de tercer grado escolar y sus "puntua- tonces habrá q". Sin embargo, si un científico
ciones" en aritmética en una prueba estanda- desea emplear la palabra "causa", como muchos
rizada. lo hacen, cabría preguntar: ¿qué condición básica
e) y=2x deben cumplir estas relaciones? Esto es, ¿qué
fJ y >5 - x (Nota: substituyax y y por valores, y tipo de relación se necesita incluso para poder
exprese gráficamente algunos puntos.) considerar el empleo de la palabra" causa''?¿ Por
3. Un investigador pedagógico ha estudiado la rela- qué? Sugerencia: Elabore una o dos figuras
ción entre ansiedad y aprovechamiento escolar. como las que aparecen en las figuras 5-5 y 5-6,
Exprese dicha relación en lenguaje de conjuntos. pero utilice números para representar los valores
4. En este libro se usarán con parquedad las expre- de las variables X y Y.
siones "causa" y relaciones causales. Se evita- (8) Al final del capítulo 22, se puede hallar una breve exposición
rán en la medida de lo posible, no porque sean de las ideas sobre la causalidad en la investigación científica y sobre
"malas o equivocadas", sino porque originan la posición que se adopta al respecto en este libro.
CAPITULO 6
Varianza

Para estudiar problemas científicos y dar res- M= 1+2+3+4+5 =_!1= 3


puesta a preguntas en este campo, debemos estudiar 5 5
las diferencias dentro de los fenómenos. Sin tales
diferencias, o sin la variación, no habria forma de La media del conjunto X es 3.
precisar relaciones entre las variables. Por ejemplo, El cálculo de la varianza es fácil si bien no es tan
si deseamos estudiar la relación entre la raza y el sencillo como encontrar la media. La fórmula es:( 1)
aprovechamiento o éxito, estaríamos imposibilita-
dos para hacerlo si sólo tenemos medidas de aprove- lx2
chamiento de niños de raza blanca. Es necesario V=- (6.2)
11
contar con medidas de aprovechamiento de niños de
varias razas. En resumen, las razas varían; y al ha- La letra V significa varianza; n y 2 son iguales que en
cerlo muestran lo que conocemos como va1ianza. Es la ecuación 6.1. lx' recibe el nombre de suma de
necesario explorar la noción de varianza, en forma cuadrados y convendría hacer alguna explicación
analítica y en detalle, y para hacerlo de manera ade- sobre ella. Los valores se listan en columna.
cuada, también necesitamos entender claramente
los conceptos básicos de la estadística. X X x2
Es engorroso y de poco provecho, éstudiar con- l -2 4
juntos de números, tal como son. A menudo es nece- 2 -1 l
sario reducir los conjuntos, en dos formas: 1) por o
cálculo de promedios o medidas de "tendencia cen-
3 o
4 1 l
tral'', y 2) por cálculo de las medidas dé variabilidad.
5 2 4
La medida de tendencia central utilizada en este
libro es la media y la de variabilidad es la varianza. ~X: 15
Ambos tipos de mediciones resumen conjuntos de M: 3
puntuaciones o valores, pero en formas distintas. ~x2: 10
Ambos son "resúmenes" de conjuntos completos
de "puntuaciones", "sumarios" que expresan dos En esta ecuación, x es una desviación a partir de I?
facetas importantes de los conjuntos señalados: su media. Se le define:
tendencia central o "promedio", y su variabilidad.
Es casi imposible resolver problemas de investiga- x=X-M (6.3)
ción sin estas medidas. Comenzaremos nuestro es-
tudio de la varianza con algunos cálculos sencillos. Por lo expuesto, para calcular x, simplemente res-
tamos a X la media de todas las puntuaciones. Por
Cálculo de medias y varianzas
ejemplo,cuandoX=I,x=l - 3 = - 2;cuandoX=4,x
Tomemos el conjunto de números X= { l,2,3,4, =4 - 3 = 1, y así sucesivamente. Esto fue lo que
5}. La media se define por: hicimos en la columna correspondiente ax. Sin em-
M=IX (6.1)
n (1) ''V'' se empleará en este libro para denotar la varianza. Otros
símbolos muy usados son u' y s 2 • No es necesario profundizar
n= el número de casos en el conjunto de valores; 2 sobre su uso. En este textoN corresponde al número de casos en U,
significa ''sumatoria de'' o suma de. X designa cual- en tanto que n denota el número de casos en un subconjunto o
quiera de estas puntuaciones o valores, esto es, cada muestra de U. Cuando sea necesario se añadirán subíndices y se
valor o puntuación, es una X. La fórmula podría explicarán conforme convenga. Por ejemplo, si deseamos indicar el
número de elementos en el conjunto A, un subconjunto de U,
leerse de este modo "sumar todas las puntuaciones y
podemos escribir nA ona. De manera similar, colocamos subíndices
dividirlas por el número de casos en el conjunto". x, V y otras letras. Cuando se emplean dobles subíndices comorxy,
De este modo, quedaria: por lo regular ya se conoce su significado.

50
VARIANZA 51

bargo, la ecuación 6.2 señala que es necesario elevar tengax•, y después sumar todas lasx•. Por último, se
al cuadrado cadax, cosa que también se hizo (recor- obtiene el promedio de lasx2 al dividir~• por n, que
demos que el cuadrado de un número negativo es es el número de casos. ~ 2 , que es la suma de cua-
siempre positivo). En otras palabras, ¡x2 nos indica drados, es una cifra estadística de enorme importan-
restar la media de cada puntuación para obtener x, cia que usaremos con frecuencia.
elevar al cuadrado cada x; de tal forma que se ob- La varianza en el caso presente es:

V= (-2)2+(-1) 2 +(0) 2 +(1) 2 +(2) 2 =4+1+0+1+4=10= 2


5 5 5
La varianza también recibe el nombre de media de tulo y otros de este libro, analizaremos diversos
los cuadrados (cuando se calcula en una forma dis- aspectos del empleo de la varianza.
tinta, tema que se expondrá en un capítulo ulterior).
Recibe este nombre porque es, obviamente, el pro- Tipos de varianza
medio de todas lasx 2 • Sin duda, no es difícil calcular La varianza se manifiesta en diversas formas. Si el
la media y la varianza.(2) lector revisa la literatura de investigación y técnica,
Surge la pregunta: ¿por qué calcular la media y la frecuentemente se topará con él término con un adje-
varianza? Es fácil hallar la razón para calcular la tivo calificativo, y a veces sin él. Para comprender la
media. En la investigación se comparan las medias literatura de esta índole es necesario tener una idea
de diferentes grupos experimentales, para estudiar precisa de las características y fines de las diferentes
relaciones. Por ejemplo, podríamos someter a varianzas; y para hacer un diseño de investigación y
prueba la relación entre ambientes organizacionales ponerlo en la práctica, es necesario un conocimiento
y productividad. Es posible que se empleen tres muy minucioso del concepto de varianza, así como
tipos de ambientes y que nos interese el problema de un dominio considerable de las nociones y manipu-
dilucidar cuál de ellos tiene el máximo efecto sobre laciones estadísticas de la varianza.
la productividad. En estos casos, suelen compararse U na parte importante de la estadística comprende
sistemáticamente las medias. Por ejemplo, cabría la comparación de varianzas. Para obtener respues-
preguntar, de tres grupos, cada uno de los cuales tas a preguntas de investigación, para probar las
opera en uno de los tres climas; A 1, A 2 y A :i, hipótesis, se comparan diferentes tipos de varian-
¿cuál sería la media máxima en algún índice de pro- zas. Señalaremos un ejemplo sencillo: un maestro
ductividad? tiene dos grupos de alumnos de los cuales sabe que,
La base para calcular y emplear la varianza en la en cuanto a capacidad para operaciones aritméticas,
investigación es más difícil de explicar. En el caso son aproximadamente iguales, esto es, los prome-
normal de puntuaciones comunes, la varianza es una dios de cada grupo son aproximadamente iguales.
medida de la dispersión del conjunto de puntuacio- Sin embargo, él piensa que uno y otro grupos difie-
nes. Nos señala la "dispersión" de dichas puntua- ren mucho en cuanto a variabilidad. El puede com-
ciones. Si un grupo de alumnos fuera muy heterogé- probar fácilmente su sospecha al calcular las varian-
neo en su aprovechamiento en la lectura, la varianza zas de uno y otro grupos, y después dividir la va-
de sus calificaciones en lectura sería grande, en rianza mayor, entre la varianza menor. Si la cifra
comparación con Ja varianza de un grupo que fuese resultante de esta operación es grande (por grande se
homogéneo en este aspecto. Según lo anterior, la entiende mucho mayor que !), su creencia estará
varianza es una medida de la dispersión de las pun- bien fundamentada. Si la proporción es pequeña, su
tuaciones, y describe el grado en el cual las puntua- creencia no tendrá fundamento. De este ejemplo
ciones difieren entre sí.(3) En el resto de este capí- sencillo inicial, cabe hacer notar que la comparación
de las varianzas es un procedimiento complejo,
(2) El método usado en este capítulo para calcular la varianza como apreciaremos más adelante.
difiere de los métodos que normalmente se emplean. En efecto, el
método expuesto antes es impracticable en la mayoría de los casos.
Nuestro propósito no es aprender la estadística como tal. Más que Varianzas de la población y de muestras
eso, intentamos dar las ideas básicas. Los ejemplos, los métodos de
computación y las demostraciones, han sido construidos, para ayu- La varianza de la población es la correspondiente
dar a exponer estas ideas básicas. En consecuencia, el estudiante a U, el universo o población de mediciones. Si se
debe aprender los métodos de computación dados en este capítulo. conocen todas las medidas de un conjunto universal
(3) Para fines descriptivos, en general se utiliza la raíz cuadrada definido, U, entonces se conoce su varianza. Sin
de la varianza, que se denomina desviación estándar. No obstante,
debido a ciertas propiedades matemáticas, la varianza es más útil en embargo, es muy probable que no se tengan todas las
investigación. Se sugiere que el lector complemente esta exposi- medidas de U. En estos casos la varianza se estima al
ción con los capítulos o partes correspondientes de un texto ele- calcular la varianza de una o más muestras de dicho
mental de estadística, ya que no es posible presentar en este libro universo. Este problema importante ha acaparado
todas las facetas del significado e interpretación de medias, varian-
zas y desviaciones estándar. Un texto adecuado a estos fines es el gran parte del interés de los estadísticos. Puede sur-
de A. Edwards, Statistical Analysis, 3a. ed. Nueva York, Holt, gir una pregunta: ¿qué tanta variación muestra la
Rinehart y Winston, 1969. inteligencia de los ciudadanos estadounidenses?
52 CONJUNTOS, RELACIONES Y VARIANZA

Esta es una pregunta acerca de una población o saldrán con mayor frecuencia algunos números. De
universo. Si hubiera una lista completa de los millo- manera similar, las cartas marcadas y la ruleta "ma-
nes de estadounidenses (y también una lista com- nipulada" mostrarán varianza sistemática.
pleta de las cifras obtenidas en pruebas de inteligen- Existen muchísimas causas de este tipo de va-
cia de estas personas), la varianza podría calcularse rianza. El científico busca aislar las causas por las
con cierta sencillez, aunque con gran esfuerzo. Por que se interesa, de las que no se interesa. Y debe
desgracia, no existe una lista de esta índole. En esta también separar de sus vatianzas sistemáticas, la
situación, las muestras (que esperamos sean repre- causada por el azar. En realidad, la investigación
sentativas) de los estadounidenses se someten a puede definirse desde el punto de vista estricto y
prueba y se calculan las medias y las varianzas. Las técnico, como un estudio controlado de varianzas.
muestras se emplean para estimar la media y la va-
rianza de toda la población. Varianza intergrupos (experimental)
La varianza de las muestras (de muestreo) es la Un tipo importante de varianza sistemática en la
correspondiente a los estadígrafos obtenidos de las investigación es la llamada "intergrupos" o experi-
muestras. Las medias de cuatro muestras extraídas mental. Como su nombre lo indica, es la varianza
en forma aleatoria de una población, mostrarán dife- que refleja las diferencias sistemáticas entre grupos
rencias Si el muestreo se hizo en forma aleatoria y de mediciones. La varianza comentada antes corno
las muestras son suficientemente grandes, las me- varianza de puntuaciones, refleja las diferencias en-
dias no variarán demasiado. Es decir la varianza de tre los individuos dentro de un grupo. Por ejemplo,
las medias debe ser relativamente pequeña.(4) podernos decir que,.con base en los datos y pruebas
actuales, la varianza de inteligencia de una muestra
Varianza sistemática aleatoria de niños estadounidenses de 11 años es de
Es posible que la forma más general de clasificar 225 puntos (cociente intelectual).(5) Esta cifra es un
las varianzas sea como varianza sistemática y como dato estadístico que nos indica el grado o magnitud
varianza del error. La primera es la variación en los con que los individuos difieren entre sí. La varianza
resultados de mediciones, por influencias conocidas experimental, por otra parte, es la causada por dife-
o desconocidas que "hacen" que los valores se in- rencias entre grupos de individuos y, por esta razón,
clinen más hacia una dirección, que hacia otra. Toda en ocasiones se le llama varianza "intergrupos". Si
influencia natural o artificial que haga que los hechos se mide el aprovechamiento de niños del norte y del
ocurran en alguna forma predecible, constituye la sur que asisten a escuelas semejantes, habrá dife-
influencia sistemática. Las puntuaciones en pruebas rencias entre ambos grupos. Los grupos y también
de aprovechamiento de los niños en una escuela los individuos varían y es posible y adecuado calcu-
suburbana de población acomodada (rica), tenderán lar la varianza entre dichos grupos.
a ser sistemáticamente mayores que las puntuacio- La varianza intergrupos y la de tipo experimental
nes de niños de una escuela situada en un barrio fundamentalmente son iguales. Surgen de diferen-
pobre. cias entre los grupos. La varianza intergrupos es un
La enseñanza impartida por maestros expertos término que cubre todos los casos de diferencias
puede influir sistemáticamente en el aprovecha- sistemáticas entre los grupos, tanto de tipo experi-
miento de niños, en comparación con el aprovecha- mental como no experimental. La primera suele es-
miento de niños enseñados por maestros inexpertos. tar asociada con la varianza engendrada por la mani-
Al echar un dado saldrán con igual frecuencia los pulación activa de variables independientes, por
números 1a6. Por otra parte, un dado "cargado" se parte de experimentadores. En este texto usaremos
inclinará sistemáticamente hacia una dirección y con mayor frecuencia el término "intergrupos". El
lector podrá deducir del contexto si se llevó a cabo o
( 4) Por desgracia, en gran parte de la investigación real sólo se no alguna manipulación experimental.
cuenta con una muestra, y a menudo ésta es pequeña. Sin embargo, Presentamos un ejemplo sencillo de varianza in-
podemos estimar la varianza del muestreo de las medias al emplear
la llamada varianza estándar, de la media o medias (suele em-
tergrupos, en este caso de tipo experimental. Su-
plearse el término "error estándar de la media", que es la raíz pongamos que un investigador somete a prueba la
cuadrada de la varianza estándar de la media). La fórmula es eficacia relativa de tres métodos distintos de enseñar
un ejercicio de educación física. Después de enseñar
a tres grupos de niños, cada uno por un método
diferente, calcula las medias de los grupos. Supon-
en la cual VM es la varianza estándar de la media, J:S es la varianza gamos que ellas son 30, 23 y 19. La media de las tres
de la muestra y ns el tamaño de la muestra. medias es 24, y calculamos la varianza entre las
De esta ecuación puede llegarse a una conclusión importante. Si medias o entre los grupos.
se aumenta el tamaño de la muestra, disminuirá JM. En otras
palabras, para tener mayor confianza en que la muestra se acerca a (5) Esta cifra se obtiene al elevar al cuadrado la desviación
la media de la población, conviene agrandar n. Por lo contrario, estándar señalada en un manual de test. La desviación estándar del
cuanto menor sea la muestra, la estimación de la media conllevará Test California de madurez mental para un niño de 11 años de edad
un riesgo mayor de que no se acerque a la media de la población. es de 15, aproximadamente y 15 2 = 225.
VARIANZA 53

X x2 grupos experimental y de control, es que por medio


de control cuidadoso y manipulación, las medidas de
30 6 36 los resultados del grupo experimental (llamadas
23 -1 1 también medidas de criterio) se hacen variar siste-
19 -5 25 máticamente, sea en sentido ascendente o descen-
~X: 72 dente, en tanto que las mediciones del grupo de
M: 24 control se conservan de ordinario en el mismo nivel.
~x2: 62 Por supuesto, la varianza creada es la que está entre
los dos grupos, esto es, se hace que ambos difieran
62 entre sí. Por ejemplo, en un experimento interesante
vb =T= 20.67 sobre aptitud para la aritmética en niños de educa-
ción preescolar, Koenker manipuló los grupos expe-
rimentales al someterlos a un programa enriquecido
En otras palabras, las tres medias se tratan como tres con operaciones y conceptos aritméticos.(?) Con-
puntuaciones, y se calcula su varianza como se se- servó constantes sus grupos de control al no some-
ñaló anteriormente. Esta varianza entre grupos (Vi) terlos a un programa de preparación y dejar que
es un índice de la variabilidad o variación de las tres siguieran el programa preescolar ordinario sin "en-
medias de los grupos y la variabilidad de los tres riquecimiento". En términos estadísticos, trató de
grupos, en forma global. Más adelante apreciaremos incrementar la varianza entre los grupos (y tuvo
la forma en que se usa ~ . éxito en su intento).
En el ejemplo citado es posible que los métodos Este punto es claro y fácil de apreciar en los expe-
tiendan a "desviar" las puntuaciones obtenidas con rimentos. En la investigación que no es experimen-
el ejercicio, en una forma u otra. Esto por supuesto tal, es decir, en aquélla en que se estudian diferen-
es lo que busca el experimentador: digamos que cias ya existentes entre los grupos, no siempre es tan
desea que aumenten con el método A todas las pun- claro y fácil de apreciar que se está estudiando la
tuaciones de habilidad desarrollada al hacer el ejer- varianza intergrupos. Sin embargo, la idea es la
cicio, en un grupo experimental. Se podria pensar misma. El principio puede expresarse de manera
que el método B no tendrá efecto alguno en la habili- diferente: cuanto mayores sean las diferencias entre
dad para realizar el ejercicio, y que él método c los grupos cabe suponer que han participado o ac-
tendrá un efecto depresor. Si está en lo cierto, todas tuado en mayor grado, una o más variables indepen-
las puntuaciones obtenidas con el método A tende- dientes. Por otra parte, si hay poca diferencia entre
rán a ascender, esto es, a ser mayores, en tanto que los grupos, se puede suponer que no participó nin-
las obtenidas con el método c tenderán a descender guna variable o variables independientes, que sus
o ser menores. De este modo, las puntuaciones de efectos fueron demasiado débiles como para ser
los grupos, tomadas en forma global y, por supuesto, apreciados, o que hubo anulación mutua en su ac-
sus medias, diferirán sistemáticamente. Los méto- ción o influencia. Por medio de la varianza intergru-
dos empleados constituyen una variable activa que pos, juzgamos los efectos de variables independien-
es aquella que el experimentador manipula delibera- tes que han sido manipuladas o que actuaron en el
damente con el intento consciente de que las pun- pasado. No importa si las variables independientes
tuaciones "sigan una tendencia" diferencial, esto fueron o no manipuladas, pues el principio de opera-
es, se desvían unas en un sentido y otras en otro. ción es el mismo.
Por lo expuesto, toda variable manipulada por un Para ilustrar dicho principio, retornemos al ejem-
experimentador guarda relación íntima con la va- plo de la ansiedad y el aprovechamiento escolar que
rianza sistemática. Cuando Bennett y colaboradores antes comentamos. Es posible "manipular" la an-
sometieron a sus grupos de ratas de experimentación siedad al crear dos grupos experimentales e inducir
a grados diferentes de experiencia temprana, como ansiedad en uno y no producirla en el otro. Esto
complejidad del ambiente y adiestramiento (expe- puede hacerse al someter a cada grupo a la misma
riencias enriquecidas), condición de control (el es- prueba, con instrucciones diferentes. Podemos indi-
tado normal de la colonia de ratas) y reducción o car a los miembros de un grupo que la aprobación
empobrecimiento de la experiencia (aislamiento), escolar final dependerá totalmente de la prueba. A
deliberadamente intentaban introducir varianza sis- los miembros del otro grupo se les puede indicar que
temática en las medidas de los resultados (peso, la prueba no tiene trascendencia alguna, y que sus
grosor y actividad química del cerebro).(6) resultados no afectarán la calificación escolar final.
La idea en que se basa el famoso "diseño clásico" Por otra parte, también puede estudiarse la relación
de investigación científica en la cual se emplean los entre ansiedad y aprovechamiento, al comparar gru-

(6) E. Bennet y col., "Chemical and Anatomical Plasticity of (7) R. Koenker, "Arithmetic Readiness at the Kindergarten Le-
Braín", Science, CXLVI (1964), 610..619. ve!," Journal of Educational Psychology, XLII (1948), 218-223.
54 CONJUNTOS, RELACIONES Y VARIANZA

pos de personas en quienes se supone que han ac- Muchos fenómenos y acontecimientos no pueden
tuado circunstancias ambientales y psicológicas dis- ser explicados. Gran parte de la varianza queda
tintas para generar ansiedad (por supuesto, el i.nves- fuera de toda posible identificación o control. Esta
tigador no supondrá que sean idénticas la ansiedad es una varianza de error, cuando menos hasta donde
producida por medios experimentales de la que ya no podamos ejercer dominio alguno en su identifica-
existe, esto es, la variable de estimulación y la varia- ción y control.
ble organísmica). Sarnoff y colaboradores(8) hicie- Aunque parezca un poco insólita e incluso rara,
ron un estudio para probar la hipótesis de que dife- esta forma de razonamiento es útil, siempre y
rentes circunstancias ambientales y psicológicas cuando recordemos que parte de la varianza de error
producían niveles distintos de ansiedad. Los inves- del presente, pudiera no ser la misma del futuro.
tigadores anticiparon que como resultado de los Supongamos que emprendemos un experimento so-
exámenes 11 +, que se aplican en los planes escola- bre métodos de_ enseñanza para la solución de pro-
res de Inglaterra, los escolares ingleses mostrarían blemas en el cual asignamos a los alumnos en forma
una mayor ansiedad en la prueba que los escolares aleatoria a tres grupos. Después de terminar el expe-
estadounidenses. En lo que concierne a la varianza, rimento estudiamos las diferencias entre los tres
los investigadores supusieron que existía una va- grupos para apreciar si la enseñanza produjo algún
rianza intergrupos mayor de la que podía esperarse efecto. Sabemos que las puntuaciones siempre pre-
por el solo azar, por las diferencias entre el am- sentarán fluctuaciones pequeñas, en dirección nega-
biente, la enseñanza y el medio psicológico entre los tiva o positiva, que probablemente nunca podremos
niños ingleses y estadounidenses (hipótesis que se controlar. Alguna cosa u otra, hace que fluctúen
comprobó). estas puntuaciones uno, dos o tres puntos de más o
de menos. Desde este punto de vista que se comenta,
Varianza de error no fluctúan sin alguna razón, es decir, es probable
Posiblemente sea válido decir que el tipo más co- que no exista "aleatoriedad absoluta". Si supone-
mún de varianza en la investigación es la llamada mos que existe el determinismo, debe haber alguna
varianza de error, que es la fluctuación y variación causa o causas que originen las fluctuaciones. Y en
de medidas, causada por el azar. La varianza de verdad, podemos extraer alguna enseñanza de ellas,
error es una varianza aleatoria; es una variación en y tal vez llegar a controlarlas. No obstante, cuando
las medidas debida a fluctuaciones, por lo regular se hace esto, es que existe una varianza sistemática.
pequeñas y autocompensatorias, de las medidas. Por ejemplo, descubrimos que el sexo "ha.ce" que
Por ejemplo, la varianza de muestreo que comenta- las puntuaciones fluctúen, pues los niños y las niñas
mos al principio de este capítulo, es de tipo aleatorio están mezclados en los grupos experimentales (por
o de error.(9) supuesto, esto es un ejemplo figurativo porque es
Podemos señalar que la varianza de error es la obvio que el sexo en sí no hace que una puntuación
variación de las mediciones, que depende de nuestra fluctúe). Con esta base, emprendemos el experi-
ignorancia. Imaginémonos un gran diccionario que mento y controlamos lo referente al sexo, em-
definiera en detalle minucioso todo lo que existe en pleando varones únicamente. Las puntuaciones se-
el mundo, esto es, todos los fenómenos, hechos, o guirán fluctuando, aunque en grado un poco menor.
cosas, pequeñas o grandes. Para saber que ha suce- Eliminamos otra supuesta causa de perturbaciones:
dido cualquier hecho que ocurre en.el presente o que Ja inteligencia. Las puntuaciones aún fluctuarán,
ocurrirá, todo lo que se necesita es consultar el dic- aunque en grado todavía menor. Seguimos en la
cionario. Con esta obra no habría posibilidad de tarea de eliminar otros elementos que producen va-
fenómenos aleatorios o al azar, pues todo estaría rianza. De este modo, controlamos la varianza sis-
previsto. En resumen, no habría varianza de error, temática y también poco a poco identificamos y con-
pues todo sería varianza sistemática. Por desgracia o trolamos cada vez más, la varianza desconocida. •.
por fortuna, no contamos con una obra de tal índole. El lector observará que antes que controláramos o
elimináramos esta varianza sistemática, antes in-
(8) l. Sarnoff y col., "A Cross-Cultural Study of Anxiety among cluso que "supiéramos" de ella, tuvimos que desig-
American and English School Children," Journa/ of Educational narla como varianza de error, en parte porque no
Psychology, XLIX (1958), 129-136. Información presente también disponíamos de otro término para calificarla, y en
en S. Sarason y col., Anxiety in Elementary School Chi/dren. parte por la incapacidad de poder hacer algo con esta
Nueva York: Wiley, 1960, págs. 151-157.
(9) En este capítulo y en el siguiente tendremos que emplear la varianza. Podríamos continuar y todavía hallaría-
noción de "aleatorio" o "aleatoriedad". En el capítulo 8 detalla- mos una cierta varianza. Finalmente, tendríamos
remos más los criterios sobre estos términos. Sin embargo, en este que ceder, en algún momento admitiríamos que' 'no
punto, aleatoriedad significa que no hay forma conocida que pueda sabemos" más, y hemos hecho todo Jo posible. Aún
expresarse en palabras, para describir o explicar los eventos o sus
resultados. En otras palabras, los eventos aleatorios no pueden así quedaría algo de varianza. De acuerdo con esto
predecirse. Una muestra aleatoria es un subconjunto de un uni- podemos enunciar una definición práctica: la va-
verso, cuyos miembros tienen la misma posibilidad de ser elegidos. rianza de error es aquella que persiste en un con-
VARIANZA 55

junto de mediciones después de que se eliminan Simplemente tratamos a las dos medias como si fue-
todas las causas conocidas de varianza sistemática. ran valores individuales, y seguimos con el cálculo
Esto es tan importante que presentaremos un ejem- normal de la varianza. La varianza intergrupos V1>
plo numérico. es, en este caso, de 2.25. Una pmeba estadística
adecuada demostraría que la diferencia entre las
Ejemplo de varianza sistemática y de error medias de los dos grupos es lo que recibe el nombre
Supongamos que un maestro desea saber si el de diferencia "estadísticamente significativa" (en
escribir comentarios críticos en los ensayos litera- otro capítulo nos ocuparemos del significado de este
rios de los estudiantes, además de la calificación, es término).(!!)
un método más eficaz para mejorar la redacción de Si colocamos las 10 puntuaciones en una columna
un estudiante que la simple asignación de califica- y calculamos la varianza, obtendremos:
ciones.( 10) Designaremos, en este caso, por medio X X x2
de la variable A al conjunto formado por "comenta-
rios" y "sin comentarios", que se representaría di- 6 1.5 2.25
vidido en las particiones A 1yA2, respectivamente. 5 .5 .25
El maestro asigna 10 estudiantes en forma aleatoria a 7 2.5 6.25
dos grupos, y en la misma forma asigna los trata- 8 3.5 12.25
mientos A 1 y A2. Pide a los dos grupos una tarea de 4 - .5 .25
escritura, y sigue el procedimiento indicado. Una 3 -1.5 2.25
semana más tarde les encomienda una tarea similar y
5 .5 .25
utiliza el mismo procedimiento. Entonces procede a
1 -3.5 12.25
calificar.* Las puntuaciones son estas:
4 - .5 .25
Ai A2 2 -2.5 6.25
6 3 M: 4.5
5 5 lx 2 : 42.50
7 1 V _ 42.50 _ 4 ~
8 4 t-10-. 2:J
4 2 Esta es la varianza total, V, , que en este caso tiene
M: 6 3 un valor de 4.25, y abarca a todas las fuentes de
variación en las puntuaciones. Sabemos que una de
A 1 es el gmpo en el cual se hicieron comentarios ellas es la varianza intergrupos, Vi = 2.25. Calcule-
críticos a los trabajos además de calificarlos, y A2 es mos ahora otra varianza. Para ello calculamos pri-
el grupo en el cual únicamente se calificó. Las me- mero la varianza de A 1 y despuésladeA2, finalmente
dias son distintas, es decir, varían. Por lo tanto, se se obtiene el promedio de las dos.
puede decir que hay varianza intergrupos. Si la cal- A1 x x2 A2 x x2
culamos como hicimos en un ejemplo anterior obte-
nemos: 6 o o 3 o o
X x2 5 -1 l 5 2 4
7 l 1 l 2 4
6 l.5 2.25 8 2 4 4 1 1
3 -1.5 2.25 4 -2 4 2 -1 1
M: 4.5 lX: 30 15
lx 2: 4.50 M: 6 3
vb = 4
·;º = 2.25
lx 2 :
10
10
10
10

En otras palabras, calculamos la varianza intergru- V,¡ 1 =s=2 VA2=5=2


pos como hicimos con las cinco cifras l, 2, 3, 4, y 5.
( 11) El método de cómputo usado en este caso no es el más
conveniente para determinar la significación estadística. Lo em-
(!O) Este ejemplo es un experimento en miniatura que se tornó de
plearnos únicamente con fines pedagógicos. Conviene que el lector
un experimento mucho mayor realizado por Page: E. Page ... Tea-
advierta también que se incluyeron muy pocos casos y números
cher Cornrnents and Student Performance: A Seventy-Four Class-
pequeños en !Os ejemplos dados, sólo para hacer más sencilla la
roorn Experirnent in School Motivation," Journa/ of Education
demostración. Los datos reales de investigación, por supuesto,
Psyclzology, XLI X (1958), 173-181.
suelen ser más complejos y se necesitan muchos más casos. En el
* N. del R. En el original en inglés el autor no indica qué proce- análisis real de la varianza, la expresión precisa para la suma de
dimiento se empleó para obtener las puntuaciones. Es conveniente cuadrados es ss,, = n!.x,,~ (Véase la nota 12 del pie de página en
señalar que a esto podría deberse la diferencia de calificaciones capítulo 13.) Sin embargo, por sencillez pedagógica conservaremos
entre la primera y la segunda semana. :ü,,; y más será substituido por ss1,.
56 CONJUNTOS, RELACIONES Y VARIANZA

Vt
Figura 6-1.

La varianza de A 1 es 2, y ladeA2 es 2. Por lo tanto, el tragrupos? Una vez que hemos identificado en la
promedio es 2. Cada una de estas varianzas se cal- varianza total una fuente conocida de varianza, que
culó por separado y después se promedió y por esta es la varianza intergrupo, suponemos que lo que
razón llamamos a la varianza promedio "varianza queda de varianza depende de factores azarosos o
intragrupos". La identificaremos por medio de la aleatorios y, por ello, la denominamos varianza de
literal Vw. En este caso Vw sería igual a 2. Es im- error. Sin embargo, el lector seguramente dirá que
portante señalar que esta varianza no es modificada existen otras fuentes de varianza. ¿Qué podríamos
por la diferencia entre las dos medias.(12) decir de diferencias individuales como la inteligen-
Ahora escribimos la ecuación: Vt = Vb + Vw, cia, el sexo y otras? Aquí el maestro asignó en forma
que nos señala que varianza total está compuesta de aleatoria los estudiantes a los grupos experimenta-
varianza intergrupos y la varianza intragrupos. Ca- les, y por esta razón suponemos que estas fuentes de
bría preguntar si realmente esto es cierto. Substitu- varianza están distribuidas en forma igual (o casi
yamos en la ecuación anterior los valores numéri- igual) entre A 1yA2, y precisamente por la asignación
cos: 4.25 = 2.25 + 2.00. Nuestro método sí funciona aleatoria no podemos aislar ni identificar ninguna
y nos demuestra también que estas varianzas son otra fuente de varianza. Así que llamamos varianza
aditivas (como se ha calculado). de error a la varianza restante aunque sabemos per-
Las ideas expuestas sobre la varianza posible- fectamente que quizá haya otras fuentes de va-
mente se comprendan mejor por medio de un es- rianza, pero suponemos, y esperamos que nuestra
quema. En la figura 6-1 aparece un círculo dividido suposición sea correcta, que está distribuida por
en dos partes. Hagamos que su área total represente igual entre los dos grupos.
a la varianza total de las JO puntuaciones o Vr . La
porción mayor con rayas representa la varianza in- Demostración substractiva: elimi11ar la varianza
tergrupos o V¡, , y la pequeña porción la varianza de intergrupo de la varianza total
error o Vw o Ve . Con base en este diagrama pode- Demostraremos los principios expuestos ante-
mos ver que V, =Vi + Ve (nótese la similaridad entre riormente, eliminando la varianza intergrupo del
esta expresión, los conceptos de conjuntos y la conjunto original de puntuaciones mediante un pro-
operación de unión). cedimiento sencillo de resta. En primer lugar haga-
La medida de todas las fuentes de varianza se mos que las medias de A 1 y A 2 sean iguales a la media
representa por V, , y JI¡, es una medida de la varianza total. La media total es de 4.5 (véanse líneas anterio-
intergrupos {o medida del efecto del tratamiento ex- res donde se calculó la media de las IO puntuacio-
perimental). Evidentemente la adición de comenta- nes). En segundo lugar, ajustamos cada puntuación
rios críticos en los ensayos del grupo A 1 "ocasionó'' individual de A 1 y A 2 al restar o sumar, según el caso,
que las calificaciones en los trabajos subsecuentes una constante apropiada. Puesto que la media de A ,
de los miembros de este grupo, aumentaran. Sin es 6, 6 - 4.5 = 1.5 es la constante que se debe restar a
embargo: ¿qué significa Vw, que es la varianza in- cada puntuación de A 1. La mediadeA2 es 3 (4.5 - 3
= 1.5) y por esta razón, sumamos 1.5 a cada una de
( 12) Este punto se demuestra fácilmente al restar una constante
de 3, de las puntuaciones de A 1, con lo cual la media de A 1 da 3.
las puntuaciones de A 2.
Después, si se calcula la varianza de A 1 será la misma que antes: 2. Estudiemos ahora las puntuaciones "corregi-
Obviamente la varianza intragrupo será la misma: 2. das". Al compararlas con las puntuaciones origina-
VARIANZA 57

les, notamos que varían menos que antes; lo cual es una porción importante de la varianza total. La va-
natural, y que eliminamos la varianza entre grupos, rianza que queda es la parte de la varianza total

Corrección: -1.5 + 1.5


A1 Az
6- 1.5 = 4.5 3 + 1.5 = 4.5
5- 1.5 = 3.5 5 + 1.5 = 6.5
7- 1.5 = 5.5 1+1.5 = 2.5
8- 1.5 = 6.5 4 + 1.5 = 5.5
4- 1.5 = 2.5 2 + 1.5 = 3.5
lX: 22.5 22.5
M: 4.5 4.5

causada supuestamente por el azar. Calculamos de A 1, A 2 y el total, y observamos estos resultados


ahora la varianza de las puntuaciones "corregidas" sorprendentes:

Ai X x2 A2 X x2

4.5 o o 4.5 o o
3.5 -1 6.5 2 4
5.5 1 2.5 -2 4
6.5 2 4 5.5
2.5 -2 4 3.5 -1 1
lX: 22.5 22.5
M: 4.5 4.5
lx2: 10 10
10 10
vá1 =-s=2 VA2 =-s= 2

La varianza intragrupos es la misma que antes. La A1 A2


operación de corrección no la alteró. Obviamente, la
varianza entre los grupos ahora es cero: ¿qué ocurrió 6 3
con la varianza total, Vt ? Al calcularla obtenemos 5
¡.., 2 = 20 y Vr = 20/10 = 2. De este modo, la varian- 7 4
za intragrupos es igual a varianza total. El lector debe 4 2
estudiar este ejemplo con cuidado, hasta que haya 8 5
entendido por completo lo que sucedió y por qué.
Tal vez sea suficiente el ejemplo anterior para M: 6 3
exponer los puntos esenciales, pero se puede refor-
zar el conocimiento del estudiante sobre estas ideas Nótese que la única diferencia entre este arreglo y
básicas de la varianza, si ampliamos el ejemplo al el anterior es que .. el igualamiento" por pares ha
introducir y substraer otra fuente de varianza. Re- hecho que covaríen las puntuaciones: las medidas de
cuerde el lector que antes señalamos que la varianza A 1.y A 2 ahora tienen casi el mismo orden jerárquico
intragrupos incluía a la causada por diferencias indi- (de rango). De hecho, el coeficiente de correlación
viduales. Supongamos ahora que, en vez de asignar entre los dos conjuntos de puntuaciones es de O. 90.
aleatoriamente a los estudiantes a los dos grupos, el Tenemos en este caso otra fuente de varianza: la
maestro aparea a los estudiantes en cuanto a inteli- producida por diferencias individuales en la inteli-
gencia, y que este factor estaba relacionado con la gencia, que se refleja en el orden por rangos, de los
medida de criterio; esto es, incluyó dentro de los dos pares o parejas de medidas de criterio (en otro capí-
grupos a miembros de pares con un CI aproximada- tulo nos ocuparemos de la relación precisa entre el
mente igual. Los resultados del experimento podrían orden por rangos y las ideas de "igualamiento" y sus
ser: efectos en la varianza. Por el momento, el lector
58 CONJUNTOS, RELACIONES Y VARIANZA

debe aceptar que los métodos de igualamiento por ción adicional. En primer lugar igualemos las medias
pares originan varianza sistemática). de A 1 y Az, y "corrijamos" las puntuaciones como
Esta varianza puede calcularse y extraerse como ya lo hicimos anteriormente, con lo que se
en párrafos anteriores, pero se necesita una opera- obtiene

Corrección: -1.5 +I.5


A.1 A2

4.5 4.5
3.5 2.5
5.5 5.5
2.5 3.5
6.5 6.5

M: 4.5 4.5

En segundo lugar, al igualar las filas horizontales (al "corregir" las puntuaciones obtenidas) obtenemos
hacer que la media de cada fila sea igual a 4.5 y los siguientes datos:
Original Corregida
Corrección: Ai A2 Medias Medias

o 4.5 +o =4.5 4.5 +o =4.5 4.5 4.5


+ 1.5. 3.5 + 1.5 = 5.0 2.5 + 1.5 = 4.0 3.0 4.5
- 1.0 5.5 - 1.0 = 4.5 5.5 - 1.0 = 4.5 5.5 4.5
+ 1.5 2.5 + 1.5 = 4.0 3.5 + 1.5 = 5.0 3.0 4.5
-2.0 6.5 - 2.0 = 4.5 6.5 =
- 2.0 4.5 6.5 4.5
M: 4.5 4.5 M 1 =4.5

Las cifras con doble corrección mostrarán ahora lar, el sexo fuera la fuente sistemática de varianza, la
muy poca varianza. La varianza de las 10 cifras con variable "sexo" tenderá a actuar en forma tal que las
doble corrección es de O. IO, en verdad, muy pe- puntuaciones de aprovechamiento de las niñas ten-
queña. No hay varianza intergmpos (columnas) o drán tendencia a ser mayores que las de los niños.
entre individuos (filas horizontales) que haya que- Por otra parte, las fuentes de error aleatorio, tienden
dado en las medidas. Después de la corrección do- a hacer que las medidas fluctúen en una dirección u
ble, la varianza total corresponde a la de error(como otra. En otras palabras, los errores aleatorios "son
advertiremos más adelante, al hacer una operación autocompensatorios" pues tienden a compensarse o
de extracción de la varianza de columnas e hileras a cancelarse recíprocamente.
horizontales, aunque con un método más rápido y En cualquier experimento o estudio, la variable o
eficiente, no queda varianza intragrupos). variables independientes son una fuente de varianza
Esta ha sido una operación larga. Pudiera ser útil sistemática (o, cuando menos, debieran serlo). El
resumir brevemente los puntos principales. Cual- investigador" desea" que los grupos experimentales
quier conjunto de medidas tiene una varianza total. difieran sistemáticamente. Por lo regular busca lle-
Si las medidas con las cuales se calculó la varianza se var al máximo dicha varianza, en tanto controla o
obtuvieron de respuestas de seres humanos, siempre lleva al mínimo otras fuentes de varianza sean siste-
habrá, cuando menos, dos causas de varianza. Una máticas o de error. El ejemplo experimental men-
de ellas provendrá de las causas sistemáticas de cionado ilustra la idea adicional de que estas varian-
variación, como son las diferencias individuales de zas son aditivas y que, debido a esta propiedad, es
los sujetos cuyas caracteristicas o aprovechamiento posible analizar un conjunto de puntuaciones, para
se han medido, y diferencias entre los grupos o sub- identificar la va1ianza sistemática y la de error.
grupos que participaron en la investigación. La otra
será causada por azar o error aleatorio y fluctuacio- Componentes de la varianza
nes de medidas que no se pueden identificar. Las Lo expuesto hasta este punto, posiblemente con-
fuentes de varianza sistemática tienden a hacer que venció al estudiante de que la varianza total posee lo
las puntuaciones se inclinen en una dirección u otra, que llamariamos "componentes". Sin embargo, el
y esto se refleja en diferencias entre las medias. Por caso recién considerado incluyó una componente
ejemplo, si en un estudio de aprovechamiento esco- experimental, A 1 y A 2; una componente producida
VARIANZA 59

por diferencias individuales, y una tercera debida al Y= {O, 2, 4}. Por lo expuesto, X y Y son fuentes
error aleatorio. Estudiaremos ahora el caso de dos conocidas de varianza. Suponemos una situación
componentes de la varianza experimental sistemá- experimental ideal en que hay dos variables inde-
tica. Para hacer esto, sintetizamos las medidas expe- pendientes que actúan concertadamente para pro-
rimentales obteniéndolas a partir de las componen- ducir efectos en una variable dependiente, Z. Esto
tes conocidas de la varianza. En otras palabras, es. cada puntuación de X "opera" con cada puntua-
procederemos al revés como comenzar con fuentes ción Y, para producir una puntuación de variable
"conocidas" de varianza, a partir de puntuaciones dependiente, Z. Por ejemplo, la puntuación X, O, no
"conocidas", no habrá error en las puntuaciones tiene influencia alguna. La puntuación X, I, opera
sintetizadas. con Yen esta forma:{(!+ 0), (1 + 2), (1 + 4)}. De
Tenemos una variable X con tres valores. Supon- manera semejante la puntuación X, de 2, opera con
gamos que X={O, 1,2}. Tambiéncontamosconotra Y: {(2 + 0), (2 + 2), (2 + 4)}. Todo esto es más fácil
variable Y, que tiene tres valores. Supongamos que de apreciar si obtenemos Z en forma clara:
y z
o 2 4 o 2 4
o o+o 0+2 0+4 o o 2 4
X 1
2
l+O
2+0
1+2 1+4 = 1
2
1
2
3
4
5
2+2 2+4 6

El conjunto de puntuaciones de la matriz 3 x 3 pero lo único que hacemos es esperar que sean efica-
(por matriz se entiende cualquier conjunto rectangu- ces, aunque pudieran no serlo. En otras palabras,
lar o arreglo de números) es el conjunto de puntua- nunca conoceremos los conjuntos X={O, 1, 2} ni Y=
ciones Z. Advertiremos la finalidad de este ejemplo {O, 2. 4} en esta forma. Lo mejor que podemos hacer
si recordamos que en la práctica desconocemos las es estimar su influencia, mediante la estimación del
puntuaciones de X y Y; solamente sabemos las pun- grado de varianza en Z producida por X y por Y.
tuaciones de Z. En las situaciones experimentales Los conjuntos X y Y tienen las varianzas siguien-
reales. manipulamos o fijamos los valores de X y Y, tes:

X X y y y2

o -1 l o -2 4
l o o 2 o o
2 4 2 4
lX: 3 6
M: 2
lx 2 : 2 8

El conjunto Z tiene esta varianza: Ahora bien, .67 + 2.67 = 3.34, ó V,, = V,, + i-;.,
z % z2 dentro de los errores por redondeo.
o -3 9 Este ejemplo ilustra que en algunas circunstancias
2 -1 las varianzas tienen una acción aditiva, para produ-
4 1 1 cir las cifras o medidas experimentales que analiza-
l -2 4 mos. Si bien el ejemplo es "demasiado teórico" y en
o o consecuencia, no realista, no está fuera de lo razo-
3
nable. Es posible considerar a X y Y como variables
5 2 4
independientes. Estas podrian ser el nivel de aspira-
2 -1 l
ción y la actitud del educando, y Z el aprovecha-
4 1 1 miento verbal, como variable dependiente. La idea
~ 3 9 fundamental no se altera aunque las puntuaciones
lX: 27 reales no se" comporten·' exactamente como hemos
M: 3 señalado, porque lo hacen en una forma muy apro-
lx2: ximada. Planeamos la investigación en forma tal que
este principio se realice tanto como sea posible y
analizamos los datos como si fueran verdaderos. El
60 CONJUNTOS, RELACIONES Y VARIANZA

lector podrá apreciar, para su sorpresa, que esto aprovechamiento entre los mismos niños, pero no en
funciona. el mismo orden. Supongamos que R es un conjunto
de pares ordenados de los elementos de X y Y, y que
la regla de apareamiento es: se agrupan por pares las
Covarianza medidas de actitud y aprovechamiento de cada indi-
La covarianza no es nada realmente nuevo. Re- viduo, colocando primero las cifras de actitud. Su-
cordemos que en un comentario anterior de conju n- pongamos que los resultados sonR;= {(O, 2), ( 1, 1), (2,
tos y correlación señalamos que la relación entre dos 3), (3, 4)}. Por nuestra definición de relación, este
o más variables es análoga a la intersección de con- conjunto de pares ordenados es, sin duda, una rela-
juntos. Supongamos que X es {O, 1,2,3}, un conjunto ción, en este caso, la relación entre X y Y. Los
de medidas de actitud de cuatro niños. Supongamos resultados del cálculo de la varianza de X y de la de
que Y es{!, 2, 3, 4}, un conjunto de medidas de Y, son:

X X x2 y y y2

o -I.5 2.25 2 .5 .25


l - .5 .25 l -1.5 2.25
2 .5 .25 3 .5 .25
3 I.5 2.25 4 1.5 2.25
lX: 6 10
M: 1.5 2.5
lx2: 5.00 5.00
5 5
va:=-¡= 1.25 v11 =-¡=1.25

Establezcamos ahora un problema. (Obsérvese X y xy


cuidadosamente que vamos a trabajar con desvia-
ciones de la media, x y y, y no con las puntuaciones -1.5 .5 .75
originales "brutas".) Hemos calculado las varianzas - .5 -1.5 .75
de X y Y en líneas anteriores, por medio de lasx y las .5 .5 .25
y, esto es, las desviaciones de las medias respectivas 1.5 1.5 2.25
de X y Y. Pero si podemos calcular la varianza de
cualquier conjunto de puntuaciones, ¿podremos
~xy = 4.00
calcular la relación entre dos conjuntos de puntua-
ciones en forma similar? ¿Es concebible que poda-
mos calcular la varianza de los dos conjuntos, simul-
táneamente? Y de poderlo hacer: ¿será esto un ín- Si calculamos la varianza de estos productos sim-
dice de la varianza unificada de los dos conjuntos? bolizados por Vxy o CoVxy - como antes se indicó
¿Será también esta varianza una medida de la rela- obtendremos 1.00. Esta cifra entonces, puede to-
ción entre los dos conjuntos? marse como índice de la relación entre los dos pun-
Lo que intentamos hacer es utilizar alguna opera- tos. Sin embargo, es un índice insatisfactorio, por-
ción estadística análoga a la operación de intersec- que su magnitud fluctúa con los rangos de valores y
ción de los conjuntos, X n Y. Para calcular la va- escalas de diferentes X y Y, esto es, podría ser de
rianza de X, o de Y, elevamos al cuadrado las desvia- 1.00 en este caso y de 8.75 en otro, lo cual dificulta y
ciones desde la media (las.ro las y), y las sumamos y entorpece las comparaciones de un caso a otro.
promediamos. U na solución natural a nuestro pro- Antes de seguir adelante demos nombre a lxy y
blema se1ía hacer una operación análoga con lasx y y V\)' . La primera recibe el nombre de producto cru-
juntas. zado, o suma de los productos cruzados, y la se-
Para poder calcular la varianzaXhicimos primera- gunda de covarianza. Escribiremos Co V con subín-
mente esto: (xi ·x1), ... , (x-1 ·x-1)=x1; ... , .r.i~En dices adecuados. Volviendo al problema, necesita-
este caso cabría preguntar, ¿por qué no lo seguimos mos una cifra o medida que sea semejante, de un
haciendo con las x y y multiplicando los pares orde- problema a otro. Dicha medida (que suele ser exce-
nados, de esta manera: (x1 · y1), . . . , (x.1 · y.i)? En lente) se obtiene simplemente al escribir una frac-
este caso, en vez de escribir í:x 2 o l;y 2 , escribi- ción o proporción: la covarianza CoJl,y, dividida
remos lxy, de este modo: por un promedio de las varianzas de X y Y. El pro-
VARIANZA 61

medio que por lo regular se toma, es la raíz cuadrada Este índice. que suele identificarse por r. puede va-
del producto de V, y ¡;-;.. La fórmula completa para riar desde+ 1.00, pasando por O. hasta - 1.00. como
nuestro índice de relación sería: advertimos en el capítulo 5.
Así tenemos otra fuente importante de variación
en los conjuntos de puntuaciones, a condición de
que los elementos del conjunto, esto es, las X y Y,
hayan sido ordenadas en pares después de transfor-
marlas en puntuaciones de desviación. La variación
Esta es una forma del conocido coeficiente de corre- ha recibido correctamente el nombre de covarianza.
lación producto-momento. Si la aplicamos a nuestro y es un índice o medida de la relación entre los
problema obtendremos: conjuntos de puntuaciones.
Puede advertirse que la definición de relación
como un conjunto de pares ordenados, conduce a
R= 1.00 = 1.00 = SO varias formas de definir la relación del ejemplo ante-
V(l.25)(1.25) 1.25 . rior:

R = {(x, y); x y y son números, x siempre se antepone}


xRy = igual que en el caso anterior, o "x se relaciona con y"
R ={(O, 2), (1, 1), (2, 3), (3, 4)}
R = {(-1.5,-.5), (-.5-1.5), (.5,.5), ( 1.5, 1.5)}
R = CoVx 11 = 1.00 = SO
:r¡¡ VVx · V 11 1.25 .

Varianza de factor común elevar al cuadrado este número negativo, obtenemos


El comentario previo de covarianza y correlación un número positivo (- l .0) 2 = 1. Supongamos ahora
nos lleva a otra expresión empleada extensamente quer =.OO. Enestecasoobviarnentenohayvarianza
en estadística e investigación: la varianza de factor común entre las dos vaiiables. Si hacemos que V(A)
común, que es la que comparten dos o más variables. sea igual a la varianza del conjuntoA, y V(B) igual a
El término factor es una construcción hipotética la varianza del conjunto B, V(A n B) será igual a la
empleada para indicar una entidad o influencia co- varianza común a los dos conjuntos o variables. En
mún, presente en diversas variables. En suma, un este caso V(A n B)=O, o A n B=E, que es el conjunto
factor es una fuente de varianza que es común a dos vacío.
o más variables, y esta varianza común la simboliza- Los diagramas que ilustranr=.00 y r=l.00 mostra-
remos por Veo. Si se estudian únicamente dos varia- rían las posibilidades extremas de la intersección de
bles, A y B, y se hacen algunas operaciones, la conjuntos. En el caso de r·=.00, los dos conjuntos no
varianza de factor común sería la covarianza. Las se intersecan y no habrá superposición o área co-
operaciones en estos casos obligarían al empleo de mún, esto es, A y B no compartirían varianza alguna.
innumerables procedimientos estadísticos, de tal En el caso der=I.OO(or=- 1.00), los dos conjuntos
forma que abordaremos el problema de otro modo. muestran intersección total, esto es, hay una super-
Si se ha calculado un coeficiente de correlación, la posición completa o área común, lo cual denota una
varianza de factor común sería dicho coeficiente identidad virtual. Las varianzas deA y B son una y la
pero elevado al cuadrado. Al elevar al cuadrado el misma.
coeficiente obtenido en la sección anterior, por Ahora analicemos el caso anterior, en el cual rxy =
ejemplo obtenernos .802 = .64, cifra que tiene un .80 y r 2.t)· = .64, ó 64 por l OO. Intentaremos demostrar
significado directo, esto es, que 64 por 100 de la el porcentaje de varianza que es compartido (esto
varianza de Bes compartida con A o viceversa.( 13) es, común), por dos variables (fig. 6-2).(14) Sir= .90,
Supongamos quer = 1.00. (CarnbiarnosR porr que
es el símbolo usual del coeficiente de correlación.) ( 14) Debe señalarse que los círculos por lo regular no representan
Después lo elevarnos al cuadrado, r 2 = l.00 y toda la áreas reales, y son representaciones esquemáticas de abstracciones
que a veces no son percibidas e interpretadas literalmente. No
varianza de los conjuntos A y Bes varianza de factor obstante, en la exposición siguiente, los círculos se emplean para
común. Lo mismo es válido sir= - 1.00, pues al representar áreas (aproximadas), lo cual es un caso especial cuando
consideramos que cada variable representada por un círculo es
igual a uno. En términos estrictos, el empleo señalado de las ideas
(13) El coeficiente de correlación elevado al cuadrado recibe el teóricas sobre conjuntos no es congruente con el uso exacto de la
nombre de coeficiente de determinación. Si las dos variables corre- teoría de los coajuntos; al igual que ocurren en otros párrafos de
lacionadas son A y B, indica el porcentaje de varianza B que se este libro, esperamos que la necesidad pedagógica justifique el uso
relaciona con la varianza A o que es "determinado por ella". bastante laxo de ideas matemáticas y de otra índole.
62 CONJUNTOS, RELACIONES Y VARIANZA

a) Calcule las medias y varianzas de A 1 y A 2 por


medio del método descrito en el texto.
b) Calcule la varianza entre los grupos o inter-
grupos v¡, y la varianza dentro de cada grupo
intragrupo V,v.
e) Disponga las JO cifras en una columna y cal-
cule la varianza total, v;:
d) Substituya los valores calculados obtenidos
en b) y e), en la ecuación: Vi = Vb + v;, ..
r=0.80; r 2 =0.64 Interprete los resultados.
Figvra 6-2. (Soluciones: a) v,; 1 = 4.8; v,; 2 -= 2.8; b) V¡,= 1.0;
Vw = 3.8; e) Vi = 4.8.)
2. Agregue dos puntos a cada una de las puntuacio-
en este caso r 2 = .81, 81 por 100 (fig. 6-3). Por otra nes de A 1 del primer ejemplo anterior, y calcule
parte, mostraremos un caso totalmente diferente de Vr , Vb y V.v. ¿Cuál de estas varianzas cambió?
poca varianza compartida, esto es, r=.30 y r1=.09ó 9 ¿Cuál permaneció igual? ¿Por qué?
por 100 (fig. 6-4). (Soluciones: Vr = 7.8; V¡, = 4.0; Vw = 3.8.)
Este razonamiento puede aplicarse a más de dos 3. Iguale las medias de A 1 y A2 del primer ejemplo,
variables. Supongamos que tenemos tres variables, al añadir una constante de dos a cada una de las
A, B y C, y que éstas están representadas por los puntuaciones de A2. Calcule Vi, Vb y Vw. ¿Cuál
conjuntosA, By C. Todavíamás,ra¡,=.70,rac=.60y es la diferencia principal entre estos resultados y
l"JJc = .60. En estos casos r ab = .49, r 2 ac = .36 y r2 ac = los del primer ejemplo anterior? ¿Por qué?
2

.36, como se ve, en forma aproximada, en figura 6-5. 4. Supongan10s que un investigador sociológico ob-
Consideremos los conjuntos A y By A n B, exac- tuvo cifras de conservadurismo(A), actitud hacia
tamente como lo hicimos antes. Obsérvese que la religión (B) y antisemitismo (C) de 100 indivi-
aproximadamente la mitad de las áreas de los círcu- duos. Las correlaciones entre las variables fue-
los A y B están compartidas, esto es, son comunes ron: r ab = .70; rae = .40; rbc = .30. ¿Qué significan
(r 2ab = .49). Consideremos ahora A y C y A n C por estas correlaciones? (Sugerencia: eleve al cua-
separado. En este caso Ja zona compartida es de 36 drado las r antes de interpretar estas relaciones y
por 100. Los conjuntos B, C y B n C son interpreta- también piense en ellas como pares ordenados.)
dos de la misma manera. Si tuviéramos únicamente *5 .Nota especial: desde el inicio del curso los estu-
los conjuntos (variables) A y B, la varianza de factor diantes de investigación deben conocer y emplear
común sería A n B, y de manera similar para A y C, la computadora digital. Por tanto, a partir de este
considerados independientemente de B, y B y C momento, insistiremos en su empleo. Al final de
considerados sin incluir a A. Sin embargo, ahora los capítulos, las sugestiones para estudio en las
tenemos un área de los círculos que es común a las cuales se use la computadora se señalarán con
tres variables (la zona con triple rayado, de la fig. asteriscos y pueden omitirse sin perder la conti-
6-5), que representa la va1ianza de factor común, o nuidad. Para comenzar, el estudiante debe leer el
en términos de conjunto: V(A n B n C). En otras apéndice C. En él advertirá la sencillez de las
palabras, V(A n B n C), o Veo, representa todo lo operaciones estadísticas si usa programas de
que las tres variables o mediciones comparten en computación y las instalaciones existentes en su
común. En los últimos capítulos de este libro usare- escuela. Por ejemplo, todas las instalaciones tie-
mos de nuevo estas ideas. nen programas para calcular medias y desviacio-

Guías de estudio
1. Un psicólogo social ha hecho un experimento en
el cual al grupo A 1 se le asigna una tarea que debe
realizar ante un auditorio, y otro grupo A 1, se le
asigna la misma tarea, pero sin el auditorio. Las
puntuaciones de los dos grupos, en cuanto a la
tarea, una medida de destreza digital, fueron:
A, A2
5 3
5 4
9 7 r=0.90 ¡ r 2 =o.al
8 4
3 2 ,Figura 6-3.
VARIANZA 63

nes estándar y para generar números aleatorios.


La sugerencia presente será muy útil desde A
ahora.
Con la sugestión que hemos señalado, intenta-
mos dar al estudiante una idea intuitiva de la
variabilidad de las estadísticas simples, como la r0 c=0.60
relación entre población y varianzas de muestras rbc= 0.60
y las varianzas entre grupos y de error. Se señalan
las oportunidades que tienen de conocer la forma
de programar, para los que las desconocen, y
también para los que cuentan con una computa-
dora y para quienes no cuentan con ella. Conven-
dría que el lector produjera 20 conjuntos de 100 Figura 6-5.
números aleatorios entre O y 99, ó O y 100, e
hiciera que la computadora calcule sumas, me-
dias y varianzas de cada uno de los 20 conjuntos
de números, así como la suma, media y varianza
de los 2 000 números. (Convendría hacer un plan a) Disponga las 20 medias y varianzas en orden
escrito de un programa para todo lo anterior, y por rangos. desde el mayor hasta el menor. (Si
usar un programa local. Para quienes no cuentan tiene el lector algún amigo que sea programa-
con computadora. el apéndice D contiene 40 con- dor. él podrá fácilmente escribir un plan senci-
juntos de 100 números aleatorios, del Oal 100 con llo en el programa básico para este fin. o bien,
operaciones estadísticas calculadas. Simple- el estudiante puede obtener el método para
mente se pueden tomar 20 de estos 40 conjuntos y hacer lo anterior en la cita bibliográfica de
de preferencia al azar.) McCracken colocada al final del apéndice C.
págs. 70-7 l.) ¿Difieren notablemente las me-
dias máxima y mínima y las varianzas de la
media y varianza total del grupo de 2 000 nú-
X meros? En general, ¿difieren mucho las me-
dias y las varianzas de la media y varianza
generales?
b) Calcule la varianza de las 20 medias, la cual,
por supuesto, también es la varianza entre los
grupos Vb. Calcule la varianza de error con la
fórmula: Ve = Vi- Vb. Ahora, substituya las
varianzas obtenidas en la ecuación: ~ = V¡, +
r =0.30; r2 =0.09 Ve.
e) Comenta el significado de los resultados des-
Figura 6-4. pués el e repasar lo expuesto en el texto.
PARTE 3
Probabilidad, aleatoriedad y muestreo
CAPITULO 7
Probabilidad

La probabilidad es un tema que puede ser sencillo, vertido e interesante: Simon Laplace,(2) y en ella se
y obvio o complejo y desconcertante. Es un tema del señala que la probabilidad de que ocurra un evento
que se sabe mucho o nada. Lo pueden estudiar tanto se calcula al dividir el número de casos favorables
los párvulos en edad preescolar, como los filósofos. entre el número total de casos (igualmente posibles),
Es una materia que puede ser monótona o muy inte- esto es, p=fl(f +u), donde p es la probabilidad,! el
resante. Tales contradicciones constituyen la esen- número de casos favorables y u el número de casos
cia de la probabilidad. desfavorables. El método para calcular la probabili-
Analicemos la expresión "leyes del azar". La ex- dad, que está implícito en la definición, es de tipo a
presión en sí es contradictoria, pues la aleatoriedad o priori, porque señala que la probabilidad está ya
el azar, por definición son la ausencia de ley alguna. dada y que podemos detenninar las probabilidades
Si los eventos pueden explicarse por leyes, ya no son de los eventos antes de la investigación empírica.
aleatorios. En esta situación cabría preguntar por Esta definición es la base de la probabilidad matemá-
qué usamos la expresión de "leyes del azar''. La tica teórica.
respuesta también es contradictoria, en apariencia. La definición a posteriori o de frecuencia, es de
Es posible obtener conocimientos de la ignorancia, tipo empírico, e indica que en una serie real de prue-
si consideramos a la aleatoriedad como ignorancia, bas, la probabilidad es la proporción entre el número
Esto se debe a que los eventos azarosos en su con- de veces en que ocurre un evento, y el número total
junto, ocurren en forma ordenada con regularidad de intentos o pruebas. Con esta definición, aborda-
monótona. Del desorden de la aleatoriedad, el cientí- mos la probabilidad en forma empírica, mediante la
fico extrae el orden de la predicción y el control ejecución de una serie de pruebas, en las que se
científicos. cuenta el número de veces en que ocurre un deter-
No es fácil explicar estas afirmaciones desconcer- minado tipo de evento, para calcular después la pro-
tantes. En realidad, los filósofos disienten en las porción. El resultado del cálculo es la probabilidad
respuestas. Por fortuna no hay desacuerdo en los de que ocurra cierto tipo de "evento".
hechos probabilísticos empíricos o, cuando menos, Un ejemplo breve y sencillo nos permitirá aclarar
es muy poco. Casi todos los científicos y filósofos esta diferencia. La probabilidad a priori de que salga
coincidirán en que si se arrojan dos dados en diver- el número seis al arrojar un dado, es de 1/6, pues el
sas ocasiones probablemente aparecerá más veces el dado tiene seis lados y cada uno de ellos tiene igual
número siete que el dos o el doce. También estarán probabilidad de caer arriba. (Adviértase que en la
de acuerdo en que es muy poco probable encon- última parte de la afirmación anterior se usa la supo-
trarse por casualidad en la calle un billete de 100 sición importante de equiprobabilidad, la cual no
dólares, o ganar el premio mayor de una lotería. siempre es justificada.) Es decir, de seis resultados
posibles sólo hay uno que es "favorable''. Por lo
Definición de probabilidad tanto,p= 1/6. De manera semejante si arrojamos dos
¿Qué es probabilidad? Al formular esta pregunta dados, la probabilidad a priori de que salgan 12 pun-
planteamos un problema desconcertante. Los filóso- tos (dos veces seis), es de 1/36, pues existen 36
fos no llegan a un acuerdo sobre su respuesta.( l) posibilidades(6+6,6+5, ... , 6+ 1, ... , 5+5,
Esto, en apariencia, se debe a que existen dos defini- 5 + 4, ... , 1 + 1) y entre ellas solamente una (6 +
ciones generales, entre otras, que parecen ser irre- 6) da como resultado 12 puntos.
conciliables: la definición a priori y la definición a (2) Se puede hallar un comentario breve de Laplace y su obra, en
posteriori. La primera es obra de un genio contro- el libro de J. Newman, The World of Mathematics, vol. 2. Nueva
York: Simon and Schuster, 1956, págs. 1316-1324. Respecto a la
definición de probabilidad que formuló Laplace, véase la misma
(1) Respecto a los comentarios sobre la falta de concordancia obra, págs. 1325-1333. Margenauenlaobracitada,enelcapítulo 13,
véase J. Kemeny, A Philosopher Looks at Science. Nueva York: comenta los dos tipos de definiciones. (Laplace fue famoso por usar
Van Nostrand Reinhold, 1959, cap. 4, 1J. Margenau, The Nature of la expresión exasperante que a veces emplean los matemáticos
Physical Reality, Nueva York: McGraw-Hill, 1950, cap. 13. estadísticos, "es fácil advertir que ... ")

66
PROBABILIDAD 67

Figura 7-1.

Por otra parte, las mismas muestras con una defi- el conjunto U, que es el espacio muestra/ o universo
nición a posteriori o de frecuencia nos llevarían a de resultados posibles. Dicho espacio incluye todos
lanzar un dado un gran número de veces y a contar los posibles resultados de un "experimento", que
en cuántas ocasiones aparece el seis, para obtener la sean de interés para el experimentador. Los elemen-
probabilidad de que salga este número en cualquier tos primarios de U reciben el nombre de elementos o
jugada particular. Si arrojamos un dado 60 veces, la puntos de muestreo. En este caso escribimos U={ l,
definición a priori nos señala que el seis debe apare- 2, 3, 4, 5, 6}, y aplicamos en este capítulo la exposi-
cer 10 veces o aproximadamente ese número de ción y el método sobre conjuntos que se vieron en la
veces. (En realidad, esto no es exacto, ya que habría segunda parte. Sihacemosquexi=cualquierpuntoo
que hacer muchísimos lanzamientos. ¿Cuántos? Un elemento de la muestra en U, escribiremos U= {x1,
número infinito.) En este punto una persona toma un x2, ... , xn }. Entre los ejemplos de diferentes U
dado y lo agita lo mejor posible dentro del cubilete están: 1) todos los resultados pºosibles al arrojar dos
antes de cada lanzamiento, 60 en total. Supongamos dados (véase más adelante); 2) todos los párvulos en
que en este conjunto de jugadas el seis salió ocho edad preescolar en determinado sistema escolar, y 3)
veces. La interpretación de probabilidad basada en todos los votantes elegibles en el condado X.
la frecuencia, nos diría que la probabilidad de que el En ocasiones es fácil determinar el espacio de
seis aparezca es de 8/60, lo cual recibe el nombre de muestreo, y otras es difícil. El problemaguarc(.aana-
frecuencia relativa. Con un número pequeño de lan- logía directa con la definición de conjuntos, dada en
zamientos, obviamente esta no sería una definición el capítulo 4: los conjuntos se pueden definir elabo-
adecuada de probabilidad. rando una lista de todos los miembros del mismo o al
En términos prácticos y para nuestros fines, no es aplicar una norma para la inclusión de elementos en
imprescindible la diferenciación entre las definicio- dicho grupo. En la teoría de la probabilidad, se em-
nes a priori y a posteriori. De acuerdo con Marge- plean los dos tipos de definiciones. ¿Cuál es el uni-
nau,juntamos las dos al decir que un enfoque a priori verso (U) en el lanzamiento de dos monedas? Hace-
da una definición de probabilidad de tipo "constitu- mos una lista de todas las posibilidades: U={(H, H),
tivo", en tanto que el enfoque a posteriori propor- (H, T), (T, H), (T, T)}, lo cual es una definición "por
ciona una definición operacional de la misma.(3) lista" de U. Una definición "por regla", aunque no
Será necesario usar ambos enfoques y complemen- la usaríamos, sería: U= {x; x constituye todas las
tarlos mutuamente. combinaciones de H y T}. En este caso U es el
producto cartesiano. SupongamosqueA1={H1, T1},
Espacio muestral, puntos es la primera moneda; y que A2 = {H2, T2}, es la
de muestreo y eventos segunda. Si recordamos que un producto cartesiano
Para calcular la probabilidad de obtener cualquier de dos conjuntos es el conjunto de todos los pares
resultado, primero se debe determinar el número ordenados cuyo primer dato es un elemento de un
total de resultados posibles. Con un dado, tales re- conjunto y cuyo segundo dato es un elemento del
sultados serían I, 2, 3, 4, 5, 6. Llamemos a lo anterior otro, podemos trazar un diagrama de la génesis del
producto cartesiano, en este caso A 1 x A 2, como en
(3) Margenau, op. cit., pág. 264. la figura 7-1. Observemo&que hay cuatro líneas que
68 PROBABILIDAD, ALEATORIEDAD Y MUESTREO

Primero monedo Segundo monedo

Inicio

Figura 7-2.

unen aA 1 y A2. De este modo, hay cuatro posibilida- plearse tres, cuatro o más monedas. El único pro-
des: {(H1, H2), (H1, T2), (T1, H2), (T1, T2)}. Este blema es que el método es tedioso, por el gran nú-
procedimiento y modo de pensar pueden emplearse mero de alternativas. En la figura 7-3 se ilustra el
para definir muchos espacios muestrales de los uni- diagrama de árbol correspondiente a tres lanza-
versos (U), si bien en la práctica puede ser monó- mientos de monedas. Hay ocho alternativas posi-
tono. bles, resultados o puntos de muestreo: U =
En el caso de que se usen dos dados, cabría pre- {(H1, H2, Ha), (H1, H2, Ta), ..• , (T1, T2, Ta)}.
guntarnos cuál sería U. Si pensamos en el producto (Los elementos de este conjunto también reciben el
cartesiano de dos conjuntos, la respuesta se encuen- nombre de terna o tríada ordenada.)
tra con poca dificultad. Sea A 1 los resultados o pun- Es posible que al lector le parezcan un poco con-
tos del primer dado: { l, 2, 3, 4, 5, 6}, y Az los del fusos los puntos de muestreo de un espacio muestra!
segundo dado. En este caso U=A 1 x A2 = {(1, 1), (l, porque hemos comentado dos tipos de puntos, sin
2), ... , (5, 6), (6, 6)}. Podemos hacerun esquema diferenciarlos. Esta posible confusión puede escla-
como el que trazamos en el ejemplo de la moneda, recerse empleando otro término. Un evento es un
pero el contar las líneas sería más difícil, pues hay subconjunto de U, y todo elemento de un conjunto
muchas. Podemos saber el número de posibles resul- {!S también subconjunto del mismo. Recordemos que
tados simplemente al multiplicar el 6 x 6 = 36, o en en el caso del conjunto A ={a 1, a2}, por ejemplo,
una fórmula mn, en la cual m es el número de posi- {a1} y {a2} son subconjuntos de A, así como {a1,
bles resultados del primer conjunto, y n los del se- a2}, y { } (el conjunto vacío). De manera idéntica,
gundo. todos los resultados de las figuras 7-2 y 7-3, por
A menudo se resuelven los problemas difíciles de ejemplo, (H1, Tz), (T1, H2), y (T1, H2, Ta), son sub-
probabilidad por empleo de diagramas de árbol, y conjuntos de sus universos respectivos (U). Por lo
con ellos se pueden definir espacios muestrales, po- tanto, son por definición eventos. Pero en el uso
sibilidades lógicas, con claridad y precisión. Un dia- común los eventos resultan más amplios que los
grama de árbol señala todas las alternativas o resul- puntos.
tados posibles de combinaciones de conjuntos, al Todos los puntos son eventos (subconjuntos), pe-
establecer rutas y puntos de muestreo. Esta defini- ro no todos los eventos son puntos o, dicho de otra
ción es un poco engorrosa, y es mejor ilustrarla. manera, un punto o resultado es un tipo especial de
Tomaremos el ejemplo de la moneda, y lo ilustrare- evento, es el más sencillo. Siempre que formulamos
mos en la figura 7-2 con un diagrama de árbol hori- una proposición, describimos un evento. Por ejem-
zontal. plo, preguntamos: "Si se arrojan dos monedas:
Para determinar el número de alternativas posi- ¿cuál es la probabilidad de que aparezcan dos veces
bles, simplemente contamos el número de alternati- "caras"? Las "dos caras" constituyen un evento.
vas o puntos en la "copa" del árbol. En este caso En este caso ocurre también que es un punto de
hay cuatro alternativas. Para indicar o nombrar cada muestreo. Pero supongamos que preguntamos:
una de ellas, "rastrearemos" los puntos que dieron ¿cuál es la probabilidad de que salga cuando menos
origen a cada punto final. Por ejemplo, la primera una "cara"? "Cuando menos una cara" es un
alternativa es (H1, H2). Es obvio que pueden em- evento, pero no un punto de muestro, porque in-
PROBABILIDAD 69

Primer lanzamiento Segundo lonzomiento Tercer lanzamiento


(primero monedo) (segundo monedo} (tercero monedo) p

1
___--H 1/8

__.,..,HC:::::::I
..!..........-- 2----TV"l/8
~l 1 __.----HVl/8
l/
2
2
----r<i
<
2---r 1/8
~ ,_...-- HV~

1
2 ""-.. ------H <2 l
"r<~
1
2----T 1/8

z-..............r<Í-H 1/8

2----T 1/8
Figura 7-3.

cluye en este caso tres puntos de muestreo: (H 1, H 2), la probabilidad de que aparezcan dos cruces y una
(H1, Tz), y (Ti, Hz). (Véase fig. 7-2.)* cara.
Las probabilidades de todos los puntos en un es-
Cálculo de probabilidades pacio muestra[ deben sumar 1.OO. De ello se deduce
con monedas que las probabilidades son siempre positivas. Si ela-
Supongamos que arrojamos al aire tres veces una boramos un diagrama de árbol que exprese las pro-
moneda nueva. Escribimos p(H) = 1/2yp(T)=1/2, lo babilidades en el experimento con tres monedas, se
cual significa que la probabilidad de que aparezca asemejará al de la figura 7-3. Cada ruta completa o
''cara" es de 1/2, cifra que es igualmente válida para rama de este diagrama (desde el comienzo hasta el
la ·'cruz". En este caso suponemos que hay equi- tercer lanzamiento de monedas), es punto de mues-
probabilidad. El espacio de muestreo de los tres tra. Todas las rutas comprenden el espacio muestra!.
lanzamientos de una moneda (o un lanzamiento de A cada sección final de las rutas se asigna una proba-
tres monedas) es: U={(H, H, H), (H, H, T), (H, T, bilidad, y en este caso todas ellas poseen 1/8 del
H), (H, T, T), (T, H, H), (T, H, T), (T, T, H), (T, T, total. Esto nos lleva, naturalmente, al planteamiento
T) }.Adviértase que si no prestamos atención al or- de un principio básico: si los resultados en los dife-
den en que aparecen las "caras" y "cruces", obte- rentes puntos en el diagrama de árbol, esto es, en el
nemos en una ocasión tres caras, en otra, tres cru- primero, segundo y tercer lanzamiento de las mone-
ces; tres veces dos caras y una cruz, y tres veces dos das, son independientes entre sí (es decir, si un resul-
cruces y una cara. La probabilidad de que aparezca tado no incluye absolutamente en otro), la probabili-
cada uno de los ocho resultados es, sin duda, 1/8. De dad correspondiente a cualquier punto de muestreo
este modo, la probabilidad de que salgan tres caras (HHH tal vez) es el producto de las probabilidades
es de 1/8, y de que aparezcan tres cruces es de 1/8. de resultados separados, esto es, es el resultado de
Por otra parte, la probabilidad de que caigan dos multiplicar entre sí las probabilidades de los distin-
caras y una cruz es de 3/8, y de la misma manera para tos resultados. Por ejemplo, la probabilidad de que
se obtengan "tres caras" es 1/2 x 1/2 x l/2 = 1/8.
Otro principio es: para obtener la probabilidad de
* N. del T.: Conviene que el lector recuerde que en estas frases cualquier evento, se necesita sumar las probabili-
hemos usado el vocablo "cara,. como el anverso de la moneda, que
lleva la efigie, para diferenciarlo del reverso, que sería la cruz. En
dades de los puntos de muestreo que lo constituyen.
lengua inglesa estas dos acepciones reciben el nombre de "head" Por ejemplo: ¿cuál sería la probabilidad de que en
(cabeza) Y "tail" (cola), y esta es la razón por la cual aparecen las tres lanzamientos de una moneda obtuviéramos dos
iniciales H y T en este texto. caras y una cruz? Si analizamos las rutas del dia-
70 PROBABILIDAD, ALEATORIEDAD Y MUESTREO

Cuadro 7-1. Matriz de resultados posibles en el lanzamiento de dos dados

Segundo dado
1 2 3 4 5 6

l 2 3 4 5 6 7
2 3 4 5 6 7 8
Primer dado 3 4 5 6 7 8 9
4 5 6 7 8 9 JO
5 6 7 8 9 10 ll
6 7 8 9 10 11 12

grama de árbol correspondiente a este evento, esto tes. El juego con dos dados (seven-eleven)* se basa
es, dos caras y una cruz, notaremos que existen tres en estas diferentes expectativas de frecuencia.
de ellas(se presentan en la figura 7-3). De es te modo, Para resolver el problema de la probabilidad a
1/8 + 1/8 + 1/8 = 3/8. En lenguaje de conjuntos priori, en primer lugar debemos definir el espacio
definimos los subconjuntos (eventos) de U y obser- muestra!: V={(l, l), (1, 2), ( l, 3), ... , (6, 4), (6, 5),
vamos sus probabilidades. El subconjunto de U co- (6, 6)}. Esto es, formamos pares (pareamos) de cada
rrespondiente a' 'dos caras y una cruz'', con base en número del primer dado, con los del segundo (de
el diagrama de árbol o la definición previa de U, es nuevo, el producto cartesiano). Lo anterior puede
{(H, H, T), (H, T, H), (T, H, H)}. Designaremos a apreciarse fácilmente si adaptamos este procedi-
este conjuoto por A i; en consecuencia, p(A 1) = 3/8. miento en una matriz (ver cuadro 7-l). Supongamos
El método anterior puede aplicarse al experi- que deseamos conocer la probabilidad de que ocurra
mento con 100 lanzamientos de moneda, pero im- un evento (uno muy importante), como que "salga
plica demasiado trabajo. En vez de ello, para cono- un siete". Simplemente contamos el número de sie-
cer por medio del cálculo las expectativas teóricas, tes en el cuadro o tabla y apreciamos que seis de ellos
simplemente multiplicamos el número de lanzamien- están dispuestos exactamente en la diagonal que
tos por la probabilidad de que ocurra cualquiera de cruza en el centro de la tabla. Hay 36 puntos de
ellos: 100 x 1/2 = 50, y así obtenemos el número muestra en U, obtenidos por algún método de enu-
esperado o calculado de caras (o cruces), procedi- meración como hemos señalado, o por el empleo de
miento que puede hacerse porque todas las probabi- la fórmula mn que indica: multiplicar el número de
lidades son iguales. U na interrogante importante se- posibilidades del primer objeto o hecho, por el nú-
ría: ¿obtendremos en un experimento real en el que mero de posibilidades del segundo. Este método se
se lancen 100 monedas exactamente 50 caras? La define de este modo: cuando existen m formas de
respuesta es negativa, y en la realidad esto ocurriría obtener un algo, A, y n formas deobtenerotracosau
sólo unas ocho veces por cada 100 experimentos de objeto B, en este caso, si las n formas de hacer B son
este tipo, cosa que puede expresarse de esta manera: independientes de las m formas de hacer A, existen
p = 8/100 ó 0.08. (Las probabilidades pueden expre- m · n formas de hacer A y B.(4)
sarse en forma fraccional o decimal, aunque se hace Aplicado al problema de los dos dados, mn= 6 x 6
con mayor frecuencia en forma decimal.) = 36. Si suponemos de nuevo que existe equiposibi-
lidad, la probabilidad de que aparezca cualquier re-
sultado aislado, es de l/36. La probabilidad de que
Un experimento con dados aparezca un 12 (6 + 6), por ejemplo, es de l/36, pero
Un sujeto arroja dos dados nuevos 72 veces, en la probabilidad de que aparezca un 4, es distinta, ya
circunstancias cuidadosamente controladas. Si
suma el número de puntos que muestran ambos da- ( 4) Este principio puede extenderse a más de dos cosas, objetos o
dos en los 72 lanzamientos, obtendrá un conjunto de hechos. Por ejemplo, si hay tres objetos A, By C, la fórmula sería
sumas de 2a 12. Algunos de estosresultados(sumas) mnr.
aparecerán con mayor frecuencia que otros simple- • N. del T. El juego con dos dados que menciona el autor del
mente porque hay más maneras de que así suceda. texto y del cual se han presentado algunos ejemplos, es el llamado
Por ejemplo, hay solamente una combinación para seven-eleven (siete-once), en el cual se tiran dos dados y si la suma
que la suma sea 2 ó 12: 1 + l y 6 + 6, pero hay tres de los puntos es siete u once, eljugador ¡¡ana la jugada; la pierde si la
suma es dos, tres o doce, u obtieneunpuntosila tirada es de cuatro,
para que salga el número cuatro en la suma: l + 3, 3 cinco, seis, ocho, nueve y diez, situación en la cual sigue jugando
+ l y 2 + 2. Si esto es verdad, entonces las probabi- hasta que gana al lanzar los dados y obtener la misma puntuación
lidades de obtener sumas distintas deben ser diferen- que tuvo, o pierde cuando obtiene un total de siete puntos.
PROBABILIDAD 71

que el cuatro aparece tres veces en la tabla señalada, bujemos un diagrama de árbol, similar al de la figura
debemos sumar las probabilidades de cada uno de 7-3, pero ahora ambos tipos de eventos, esto es, los
estos elementos del espacio de muestreo: l/36 + 1/36 resultados de los lanzamientos de dados o monedas,
+ 1/36 = 3/36. De este modo, p(4) = 3/36 = 1/12. deben aparecer en el diagrama.
Como hemos visto, la probabilidad de que la suma de Los eventos compuestos son más interesantes que
puntos sea siete, es p(7) = 6/36 = 1/6. La probabili- los sencillos o únicos y más útiles en la investiga-
dad de que aparezca ocho, esp(S) = 5/36. Nótese que ción. Por medio de ellos podemos estudiar relacio-
también podemos calcular las probabilidades de nes. Analicemos el siguiente ejemplo hipotético.
combinaciones de eventos. Los jugadores a menudo Supongamos que 100 personas responden a dos pre-
apuestan con base en estas combinaciones. Por guntas, una sobre los métodos de permitir el aborto,
ejemplo: ¿cuál es la probabilidad de que aparezcan y otra sobre la protección de la propiedad privada. Si
un cuatro o un 10? En el lenguaje de conjuntos es un suponemos que no hay relación alguna entre las dos
problema de unión: p(4 U 10). Conviene contar el preguntas (probablemente una suposición cuestio-
número de cuatros y dieces en la tabla; se apreciará nable) y que 60 por 100 de las personas responderán
que hay tres cuatros y tres dieces. Con base en lo "sí" a la primera pregunta y 70 por 100 "sí" a la
anterior, p( 4 U 10) = 6/36. segunda, la probabilidad de un evento compuesto
Después de contar en el cuadro 7-1, las probabili- "sí" a ambas preguntas, será de .60 x .70 = .42.
dades de cada tipo de resultado, elaboramos una ¿Qué utilidad tendría lo anterior en una investiga-
tabla de frecuencias esperadas lfe) para 36 jugadas. ción real? Si deseamos saber si existió alguna rela-
Entonces simplemente duplicamos estas frecuen- ción entre las actitudes expresadas en las dos pre-
cias para obtener las frecuencias esperadas (a priori) guntas, entonces podríamos comparar el porcentaje
para 72 lanzamientos. Yuxtaponemos estas frecuen- compuesto obtenido en los datos reales con el 42 por
cias esperadas contra las frecuencias obtenidas al 100, dado que esta última cifra es el porcentaje que
arrojar en realidad los dos dados 72 veces. De este se presentaría si hubiese una relación de cero entre
modo, aparecen claramente las diferencias absolu- las dos preguntas. Por ejemplo, supongamos que
tas entre las frecuencias esperadas y las obtenidas. obtuvimos realmente un porcentaje conjunto de 55;
Los resultados se presentan en el cuadro 7-2. entonces parecería que la respuesta a la primera
Las diferencias no son grandes. De hecho, por una pregunta está relacionada con la respuesta a la se-
prueba estadística real, no difieren significativa- gunda. La investigación real explora constante-
mente de los resultados esperados por azar. El mé- mente las probabilidades que tienen los eventos
todo a priori parece tener utilidad. compuestos de determinar la existencia de relacio-
nes entre conjuntos de eventos. Pronto analizare-
mos con mayor detalle lo expresado.
Eventos compuestos Hasta este punto hemos basado la mayor parte de
Es posible hacer experimentos compuestos y cal- nuestros comentarios en la suposición de equipro-
cular las probabilidades de eventos compuestos. Por babilidad. Sin embargo, en muchas situaciones no se
ejemplo, si arrojamos un dado y una moneda: ¿cuál justifica esta suposición. Obsérvese lo absurdo que
es la probabilidad de que ocurra el evento "4" (del sería un razonamiento como: la probabilidad de fa-
dado) y cruz? Cualquier combinación particular de llecer mañana es de la mitad (50 por 100). ¿Qué
cara de un dado y de un lado de una moneda, tiene la explicación se da de esto? Que el día de mañana una
probabilidad de 1/12, dado que, por ejemplo, p(T)= persona fallecerá o simplemente no fallecerá. Como
1/2 y p(4) = 1/6 y 1/2 x 1/6 = 1/12. En este caso existen dos posibilidades, cada una tiene un 50 por
cabría preguntar: ¿cuál es la probabilidad de que 100 de probabilidad de ocurrir. Si las compañías de
salgan números pares en el dado, y "caras" de la seguros trabajaran en base a la suposición anterior,
moneda? (La probabilidad es de 1/4, ¿por qué?) Di- irremediablemente habrían fracasado. Supongamos

Cuadro 7-2. Frecuencias esperadas y obtenidas de las sumas de las puntuaciones


de dos dados arrojados 72 veces

Suma de los dados 2 3 4 5 6 7 8 9 10 11 12

f 6(36) 1 2 3 4 5 6 5 4 3 2 l
f 6 (72) 2 4 6 8 10 12 10 8 6 4 2
f0 (72) 4 2 6 6 10 15 7 11 6 4 l

Diferencia 2 2 o 2 o 3 3 3 o o l
72 PROBABILIDAD, ALEATORIEDAD Y MUESTREO

que un científico especializado en política estudiara asignados a cada elemento de U( U constituye todos
entre otras cosas la relación entre las preferencias los resultados), son 1/8 por igual. La suma de todas
políticas y las preferencias religiosas. Si supone que las funciones ponderales, w(x), es 1/8 + 1/8 + · · · +
son iguales las probabilidades de que un católico sea 1/8 = 1. En la teoría probabilística, la suma de los
demócrata o republicano, erraría gravemente. Como elementos del espacio de las muestras debe ser
dato obvio, los investigadores deben tener conoci- siempre igual a 1.
mientos mínimos acerca de los fenómenos que estu- Es fácil obtener, a partir de los pesos, la medida de
dian. Antes de intentar algún procedimiento; antes un conjunto. Dicha medida se define de este modo:
de aplicar la teoría de la probabilidad, es necesario La medida de un conjunto es la suma de pesos de los
revisar y comprobar las suposiciones que se usan, elementos del conjunto:(6)
tarea que no siempre es fácil.
2; w(x) o 2; w(x)
Algunos elementos de teoría formal xenU xenA
Tenemos espacio muestra/ U con los subconjun-
Escribimos m(A), cuyo significado es "la medida del
tos A,B, ... Los elementos de U - y de A,
conjunto A". Esto simplemente quiere decir, la
B, ... - son ai,bi, ... , esto es, a1,a2, ... , an y
suma de los pesos de los elementos presentes en el
b1,b2, ... , bn y así sucesivamente. A, By demás
elementos constituyen eventos. En realidad, a pesar conjunto A.
Como ejemplo, supongamos que escogemos al
de que a menudo hablamos de la probabilidad de una
azar 400 niños del cuarto grado de un sistema esco-
sola ocurrencia de un evento lo que intentamos de-
lar. El universo U son los 400 niños, y cada pequeño
notar es la probabilidad de que suceda un tipo de
es un punto de muestreo de U. Cada escolar es unax
acontecimientos. Por ejemplo, cuando hablamos de
en U. La probabilidad de elegir al azar a un niño es de
la probabilidad de cualquier evento aislado que sea
parte de U, únicamente lo hacemos porque conce- 1/400. Supongamos queA=los varones en U, y B=las
bimos que cualquier miembro particular de U es niñas en U. Existen 100 niños y 300 niñas. A cada
representativo de todo el universo U, planteamiento varón se asigna el peso 1/400 y a cada niña, 1/400.
que, de manera similar, hacemos con las probabili- Supongamos que deseamos muestrear, en conjunto,
dades de los subconjuntos A, B, ... , K, de U. La 100 escolares. Lo que cabe esperar es que de la
probabilidad de U es 1 y la probabilidad de E, el muestra sean 25 niños y 75 niñas. La medida del
conjunto vacío, es cero, o dicho de otra forma,p(U) conjunto A, m(A), es la suma de los pesos de todos
los elementos en A. Existen !OOniños en U y por eso
= 1.00; p(E) =O. Paradeterminarlaprobabilidadde
que ocurra cualquier subconjunto de U, hay que sumamos los 100 pesos: 1/400 + 1/400 + · · · +
1/400 = 100/400 = 1/4, o
asignar una medida al conjunto. Para asignar dicha
medida, debemos asignar un peso a cada elemento
de U, y de este modo, a cada elemento de los subcon- m(A) = :¿ w(x) =¡1
juntos de U. El peso se define como:(5) x en A

Un número positivo que se asigna a cada ele- De manera similar,


mentox, en el universo U, y que se escribe w(x),
de tal modo que la suma de todos estos pesos m(B) = :¿ w(x) = ¡3
kW(x), es igual a l. xen B

Para el conjuntoB, las niñas, sumamos 300 "pesos",


Esta es una noción de función: w recibe el nombre
cada uno de ellos con valor de 1/400. En resumen, la
defunción de peso o ponderación. Es una norma o
regla que asigna pesos a los elementos de un con- suma de los pesos son las probabilidades, es decir, la
medida de un conjunto es la probabilidad que tiene
junto, U, en forma tal que la suma de los pesos es
un miembro del mismo de ser elegido. Por esta ra-
igualal;estoes,w1+w2+w3+ · · · +wn = l.OOy
w¡ = 1/n. Los pesos son iguales, si suponemos que
zón, podemos decir que la probabilidad de que un
existe equiprobabilidad. Cada peso es una fracción miembro de la muestra de 400 niños sea varón, es
1/4, y la probabilidad de que el miembro elegido sea
con 1 en el numerador y el número de casos n en el
niña, es de 3/4. Para registrar las frecuencias calcu-
denominador. En el experimento señalado de los
ladas multiplicamos simplemente el tamaño de la
lanzamientos de una moneda (fig. 7-3), los pesos
muestra por estas probabilidades: 1/4 x 100 = 25, y
J/4 X 100 = 75.
(5) El enfoque usado aquí se tomó hasta cierto punto de J. Ke-
meny, J. Snell y G. Thompson, lntroduction to Finite Mathema-
tics, 2a. ed. Englewood Cliffs, N. J.: Prentice Hall, 1966, cap. 4 y J. (6) Obsérvese que la suma de los pesos en el subconjunto A de U
Kemeny, H. Mirkil, J. Snell y G. Thompson,Finite Matliematicai no tiene por qué ser igual a l. De hecho, suele ser menor de esta
Structures. Englewood Cliffs, N. J.: Prentice-Hall, 1959, cap. 30. cifra.
PROBABILIDAD 73

La probabilidad tiene tres propiedades fundamen- año escolar. Si no hay superposición entre ambos
tales: conjuntos, A n B = E, en este caso es válida la
ecuación siguiente:
1. La medida de cualquier conjunto, como antes se
definió, es mayor o igual a O, y menor o igual a 1. n(A U B) =n(A)+n(B) (7.1)
En resumen, las probabilidades (medidas de con-
juntos) son O, 1 o alguna cifra intermedia entre Oy Recordemos que antes dimos la definición de proba-
l. bilidad, con base en la frecuencia:
2. La medida de un conjunto m(A) es igual a O, sólo
si no existen miembros en A, esto es, A está f (7.2)
p= f+u
~·vacío''.
3. Sean A y B dos conjuntos. Si A y B están desuni-
dos, esto es, A n B=E; entonces: en la cualf es el número de casos favorables, y u el
número de casos desfavorables. El numerador es
m(A U B) = m(A) +m(B) n(F) y el denominador n(U), que es el número total
de todos los casos posibles. De manera similar, divi-
Esta ecuación simplemente señala que cuando no dimos ambos términos de la ecuación 7 .1 por n(U):
hay miembros de A y B, comunes, la probabilidad de
A, B o ambos, es igual alas probabilidades combina-
n(A U B) = n(A) + n(B) (7.3)
das de A y B.
n(U) n(U) n(U)
No hay necesidad de presentar un ejemplo para Esto reduce las probabilidades, de manera análoga a
ilustrar el punto (1). Hemos ya señalado algunos en la ecuación 7.2:
líneas anteriores. Para ilustrar (2), supongamos que,
en el ejemplo de los niños y las niñas, queremos p(A U B) =p(A)+p(B) (7.4)
saber la probabilidad de extraer a un maestro en la
muestra. Pero U, el universo, no incluyó maestros. Con el ejemplo de los 100 niños, y si substituimos las
Supongamos que C sea el conjunto de maestros de cantidades en la ecuación 7.3, obtenemos
cuarto año. En este caso, el conjunto C está vacío y
m(C) =O. Usemos el mismo ejemplo para ilustrar el
punto(3). Supongamos que A es el conjunto de niños
y B el conjunto de niñas. En este caso m(A U B) = lo cual, daría en la ecuación 7.4:
m(A) + m(B). Sinembargo,m(A UB) = 1.00,porque
fueron los únicos subconjuntos de U; sabíamos que 1.00 = .60+ .40
m(A) = 1/4 y m(B) = 3/4. ·
En este caso es evidente que la ecuación queda En muchos casos, dos o más conjuntos en los que
comprobada. estamos interesados no están desunidos (o "disjun-
tos"); más bien se superponen. En esta situación
resultaría A n B,PE, lo cual haría quen(A U B)=n(A)
Eventos compuestos + n(B) no fuese cierto. Analicemos la figura 7-4.
y sus probabilidades En este caso, A y B son subconjuntos de U y los
En este punto es necesario examinar los eventos puntos de la figura indican los puntos de la muestra.
compuestos y sus probabilidades. En primer lugar, El número de puntos de la muestra en A es 8; y en B
examinemos algunos problemas de conteo y las for- es 6. Hay dos puntos de la muestra en A n B. De este
mas en que se relacionan con la teoría de conjuntos y modo, ya no es válida la ecuación que presentamos
la de probabilidades. Se verá que si el lector entiende antes. Si calculamos todos los puntos enA U B con la
la teoría básica, podrá aplicar con mayor facilidad la ecuación 7.1, obtenemos 8 + 6 = 14 puntos. Pero
teoría de la probabilidad a problemas de investiga- existen sólo 12 puntos. Habría que modificar la
ción; además, introducirá menos error en la interpre- ecuación hasta darle una forma más general que sea
tación de los datos. válida para todos los casos:
Supongamos que se ha estudiado a un grupo de
niños de sexto grado, y que el grupo comprende en n(A U B) = n(A) +n(B)-n(A n B) (7.5)
conjunto 100 niños, de los cuales 60 son varones y 40
mujeres. Una función útil es lafunción numérica que Debe aclararse que el error cuando se usa la ecua-
asigna a cualquier conjunto el número de miembros ción 7.1 se origina al contar dos veces los dos puntos
incluidos en él. El número de miembros en A esn(A). deA n B. Por esta razón, restamosn(A n B) una vez,
En este caso n(V) = 100, n(A) = 60y n(B) = 40~ en el lo cual corrige la ecuación y de este modo, cubre y se
cual A es el conjunto de niños y B el de niñas, ambos adapta a cualquier posibilidad. Por ejemplo, si n(A
subconjuntos de U, que son los 100 niños de sexto n B)=E, el conjunto vacío, la ecuación 7.5 se reduci-
74 PROBABILIDAD, ALEATORIEDAD Y MUESTREO


• •

• •
• ..

• •
• lJ

Figura 7-4.

ría a la ecuación 7. l. Esta última es un caso especial los miembros de la junta dan un voto afirmativo
de 7.5. Al calcular el número de puntos de la muestra sobre un punto particular: ¿haría esto que lógica-
en A U¡B, de la figura 7-4, obtendríamos: n(A U B)=8 mente fuese imposible que dieran otro voto afirma-
+ 6 - 2 = 12. Si después dividimos la ecuación 7.5 tivo para el siguiente punto?'' Es posible que la
entre n(U), como en 7.3: pregunta más importante que se formule el investi-
gador sea: "Si unajunta toma una decisión particu-
p(A U B) =p(A)+p(B)-p(A n B) (7.6) lar: ¿tendrá influencia en su acción, o al tomar cual-
quier otra decisión?
Al substituir el número de puntos gráficos o puntos Después de mencionar los términos exhaustivi-
de la muestra, encontramos que dad, exclusión mutua e independencia, los definire-
mos con mayor detalle y los utilizaremos en ejem-
12 8 6 2
plos de probabilidad.
24 = 24 + 24 - 24 Supongamos que A y B son subconjuntos de U .
.50 = .33 + .25 - .08 Nos formulamos las preguntas: ¿existen otros sub-
conjuntos de U (distintos del coajunto vacío)? ¿Ago-
En una muestra aleatoria de U, las probabilidades de
tan A y B el espacio muestra!? ¿Están incluidos
que un elemento sea miembro de A, B, A n B, y A
todos los puntos de la muestra, del espacio muestra!
U B, respectivamente, son .33, .25, .08, y .50.
U en A o en B? Un ejemplo sencillo sería: suponga-
mos que A= {H, T}, y queB={I, 2, 3, 4, 5, 6}. Si
Independencia, exclusión arrojamos al aire una moneda y un dado simultá-
mutua y exhaustividad neamente, ¿cuáles serían las posibilidades? Salvo
Pensemos en las siguientes preguntas de las cuales que se agoten todas las posibilidades, no podremos
cualquier investigador debería formular alguna va- resolver el problema de probabilidad. Existen 12
riante. ¿Impide el acaecimiento de un evento A, la posibilidades (2 x 6). Los conjuntosA y B agman el
posibilidad de que ocurra otro evento E? ¿Influye el espacio de las muestras. (Esto, desde luego, es ob-
acaecimiento del evento A en el evento E? ¿Guardan vio, pues A y B generaron el espacio de las mues-
alguna relación entre sí los eventos A, B y C? tras.) Pongamos ahora un ejemplo más real. Supon-
Cuando ha ocurrido A, ¿influye en los resultados gamos que un investigador estudia preferencias reli-
posibles de B y posiblemente de C? ¿Agotan todas giosas y establece el siguiente sistema para dividir a
las posibilidades los eventos A, B, C y Do existen tal las personas: {protestantes, católicos, judíos}. Lo
vez otras posibilidades E, F, y así sucesivamente? que ha hecho implícitamente, es constituir un uni-
Supongamos, por ejemplo, que un investigador es- verso U= todas las personas (con preferencias reli-
tudia las decisiones de un consejo académico y su giosas o sin ellas) y subconjuntos de U, esto es A=
relación, digamos, con la preferencia política, con la protestantes, B =católicos, C= judíos. La pregunta
preferencia religiosa, con la educación, y otras va- que surge es: ¿A U BU C=U? ¿El investigador agotó
riables. Para establecer relaciones de estas variables todas las preferencias religiosas? ¿Por qué no in-
con las decisiones de la junta, debe contar con algún cluyó a los budistas, a los ateos, etcétera?
método para clasificar las decisiones. Una de las Según lo expuesto, la exhaustividad, significa
primeras preguntas que debe plantearse es: "¿He simplemente que los subconjuntos de U ocupan todo
agotado todas las posibilidades, en mi sistema de el espacio muestra!, y lo agotan, esto es, A U B
clasificación?" También debe plantear estas inte- U · · ·UK=U, en que A, B, ... , K son subconjun-
rrogantes: "Si la junta toma algún tipo de decisión: tos de U, el espacio muestra!. En el lenguaje de la
¿impedirá que se tome otro tipo de decisión?" "Si probabilidad, esto significa: p(A UB U·· ·UK)=
PROBABILIDAD 75

1.00. Salvo que se agote el espacio muestra! U, por desgracia, este modelo claro y sencillo no siempre es
así decirlo, será imposible calcular adecuadamente válido en situaciones de experimentación.
las probabilidades. Por ejemplo, en el caso anterior La noción común o popular de la llamada "ley de
de preferencias religiosas, supongamos que pensa- promedios" es totalmente errónea, pero ilustra con
mos que A U B U C =U, pero hubo un gran número claridad la incomprensión de la independencia. Es-
de personas sin preferencia religiosa particular. De tablece que cuando un evento ha ocurrido un gran
este modo, en realidad la ecuación sería A U BU C número de veces disminuye la probabilidad de que
U D= U, en la cual D es el subconjunto de personas ocurra en el siguiente intento. Supongamos que arro-
sin preferencia religiosa. Las probabilidades calcu- jamos al aire una moneda, y han aparecido sucesi-
ladas con base en esta ecuación serían muy diferen- vamente cinco veces "cara". La noción corriente de
tes de las que se basaron en el supuesto de la primera la "ley de promedios" haría que el investigador cre-
ecuación. yera que existe una mayor posibilidad de que el
La "exclusividad" o exclusión mutua es un con- siguiente lanzamiento fuera "cruz", pero no es así.
cepto más fácil de entender. En forma suscinta, dos La probabilidad sigue siendo 1/2, puesto que cada
eventos A y B son mutuamente excluyentes cuando lanzamiento es un evento o hecho independiente.
están separados, o cuando A n B=E, esto es, cuando Pongamos otro ejemplo.
la intersección de dos o más conjuntos da por resul- Supongamos que los estudiantes de una clase de
tado conjunto vacío, o cuando dos conjuntos no educación superior se someten a un examen. Traba-
tienen elementos en común, en cuyo caso se dice que jan en las circunstancias corrientes de no comuni-
los conjuntos son mutuamente excluyentes. Sería lo carse entre sí, no ver la prueba de otro compañero, y
mismo que decir, de nuevo en el lenguaje de la pro- así sucesivamente. Puede considerarse que la res-
babilidad, que p(A n B) =O. Para el investigador es puesta de cada estudiante es independiente de las de
más conveniente que los eventos sean mutuamente otros: ¿podría considerarse que las respuestas a
excluyentes, ya que puede sumar las probabilidades cada reactivo de la prueba son independientes? Su-
de los eventos. Señalemos un principio en términos pongamos que la respuesta a un reactivo dado en la
de conjuntos y probabilidad: si los eventos (conjun- parte final de la prueba está comprendida dentro de
tos) A, B, y C son mutuamente excluyentes, enton- otro que apareció al principio de la misma. La pro-
ces p(A U BU C) = p(A) +p(B) +p(C). Este es el babilidad de responder por azar correctamente la
caso especial del principio más general que comen- pregunta al final de la prueba es de 1/4. Pero el hecho
tamos en el apartado anterior. (Véanse las ecuacio- de que la respuesta haya sido presentada al principio
nes 7.1, 7.4, 7.5 y 7.6 y el comentario que hicimos en del examen puede cambiar dicha probabilidad. En el
líneas anteriores.) caso de algunos estudiantes puede llegar a ser in-
Uno de los propósitos principales del diseño de cluso de 1.00. Lo que resulta importante para el
investigación es establecer condiciones de indepen- investigador es darse cuenta de que la independencia
dencia de los eventos, en tal forma que puedan estu- suele ser difícil de lograr, y que la omisión, cuando
diarse adecuadamente las condiciones de dependen- las operaciones de investigación asumen indepen-
cia entre l9s mismos. Dos eventos, A y B, son esta- dencia, puede alterar notablemente la interpretación
dísticamente independientes si concuerdan con la de los datos.
siguiente ecuación, esto es, si se verifica que: Supongamos que clasificamos por rangos o "je-
rarquíás'' las hojas de examen, y después asignamos
p(A n B) = p(A) · p(B) (7.7) calificaciones con base en los rangos. Este es un
método perfectamente legítimo y útil. Pero debemos
que señala que la probabilidad de que ocurran A y B notar que las puntuaciones que se asignan en el
es igual a la probabilidad de A multiplicada por la método de orden por rangos, no son independientes
probabilidad de B. Los lanzamientos de dados y (si es que alguna vez lo han sido). Tomemos cinco
monedas son ejemplos más sencillos y claros de hojas de prueba. Después de leer una, la clasifica-
eventos independientes. Si A es el evento del lanza- mos como la primera (la mejor); después. la se-
miento de un dado y Bel de una moneda yp(A)=l/6y gunda, y así hasta completar las cinco hojas. Asig-
p(B)=l/2,entoncessip(A) · p(B)=l/6 · 1/2= 1/12,A namos el número 1 a la primera hoja, el 2 a la se-
y B son independientes. Si arrojamos al aire 1Oveces gunda, 3 a la tercera, 4 a la cuarta y 5 a la quinta.
una moneda, un lanzamiento no influirá en el otro. Después de utilizar el número 1 para la primera
Cada lanzamiento es independiente, y también lo prueba, nos quedan solamente 2, 3, 4, y 5; después
son los lanzamientos de los dados. De manera simi- de usar el número 2 para la segunda, sólo nos quedan
lar, cuando arrojamos simultáneamente un dado y 3, 4, y 5 y cuando asignamos 4, obviamente debemos
una moneda, los eventos de arrojar el dado A y la asignar 5 a la última hoja. En resumen, la asignación
moneda B, son independientes. Los resultados del del 5 fue influida por la asignación del 4 y 'ésta a su
lanzamiento del dado no influyen en forma alguna en vez por el 1, 2, y 3. Los eventos de asignación no son
los del lanzamiento de la moneda, y viceversa. Por independientes. Cabría la pregunta: "¿Esto tiene
76 PROBABILIDAD, ALEATORIEDAD Y MUESTREO

Cuadro 7-3. Ejemplos de datos que muestran posible omisión de la independencia,


con base en el estudio de Hebb 8

Machos (n = 8) Hembras (n = 22)


Casi agresión, y agresión posterior' 37 o
Conducta amigable seguida de agresión o 15

ªLas cifras de este cuadro representan los números de actos de los chimpancés machos y hembras, en cuanto a los tipos
de conducta indicados por los letreros de la izquierda.

alguna importancia? Supongamos que tomamos los infligidos por hembras. En esta situación, Hebb y
rangos, los tratamos como puntuaciones, y hacemos Thompson tuvieron la idea interesante, aunque des-
inferencias de las diferencias de las medias entre los concertante, de tabular el número de actos agresi-
grupos, entre dos clases, por ejemplo. La prueba vos, en dos formas: 1) cuando dichos actos eran
estadística usada para la operación anterior proba- precedidos por una "casi agresión", esto es, signos
blemente se basa en el paradigma entre la moneda y premonitorios de advertencia de ataque, y 2) cuando
los dados, con su prístina independencia. Pero no los actos agresivos eran precedidos por conducta
hemos seguido este modelo, pues una de sus suposi- amistosa. Las cifras resultantes de conducta se seña-
ciones más importantes, la independencia, fue igno- lan en el cuadro 7-3, y los resultados parecen indicar:
rada. "¡Cuidado con las hembras que demuestren con-
Cuando los eventos de una investigación carecen ducta amistosa!"
de independencia, las pruebas estadísticas carecen Los datos del cuadro no pueden ser analizados
de cierta validez. Por ejemplo, una pruebax 2 (chi al estadísticamente, en forma válida, ya que las cifras
cuadrado) supone que los eventos, esto es, respues- indican la frecuencia de dos tipos de actos. Sin em-
tas de personas a una pregunta de entrevista, con- bargo, los 37 actos de los machos pudieron haber
signadas en las casillas de un cuadro de divisiones sido realizados por uno o dos de ellos. Si un solo
cruzadas, son independientes entre sí. Si los eventos antropoide hubiera cometido los 37 actos, esto indi-
registrados no son independientes entre sí, en este caría claramente que no hubo independencia entre
caso estarán falseadas las bases de la prueba es ta dís- los actos. Tal vez el mono simplemente estaba de
tica y también las inferencias que se extraigan de mal genio, y este hecho notoriamente hace que no
ella. haya independencia en los actos de los animales o
Será útil ilustrar este comentario de independen- bien de los humanos.
cia con algunos ejemplos de investigación reales e El segundo ejemplo es hipotético. Supongamos
hipotéticos. Hebb y Thompson en su fascinante des- que un investigador decide muestrear 100 decisiones
cripción de la investigación sobre la conducta agre- de consejos de educación y tiene diversas formas
siva de los antropoides, presentaron los datos del para hacerlo. Puede extraer muchas decisiones de
cuadro 7-3.(7) El problema que se planteó consistió unos cuantos consejos, extraer muchas decisiones
en establecer la relación entre el sexo y agresión. Se de muchos o utilizar ambos métodos. Si desea tener
hicieron muestras de la conducta de 30 chimpancés la seguridad de la independencia de las decisiones,
adultos, en un esfuerzo por estudiar las diferencias tendrá que extraer y muestrear muchas decisiones
individuales de su temperamento. Sin entrar en deta- de muchos consejos de enseñanza. En teoría, debe-
lles, podemos señalar que un análisis de las observa- ría tomar una sola decisión de cada consejo y así
ciones señaló que los machos y hembras mostraron tendría seguridad en cuanto a la independencia,
conducta amistosa casi con la misma frecuencia, cuando menos en la medida de que dicha seguridad
pero que los machos eran más agresivos. Los datos sea posible. Sin duda, su muestra podría incluir dos
de Hebb y Thompson sobre esta observación pare- distritos vecinos, uno de las cuales observó las deci-
cen indicar: "¡Cuidado con los machos!" Pero, siones de otro antes de tomar las propias. No obs-
como señalan los autores, esto no concuerda con la tante, esto es muy poco probable. Sin embargo, tan
experiencia de los cuidadores de monos, pues preci- pronto como el investigador elige más de una deci-
samente de cada 20 cortaduras y rasguños, 19 fueron sión de la misma junta, debe entender y suponer que
las decisiones del tipo A pueden influir en las del tipo
B. Por ejemplo, la decisión A puede influir en la de-
(7) D. Hebb y W. Thompson, "The Social Significance of Ani-
mal Studies. "En G. Lindzey, dir. Handbook of Social Psychology, cisión B porque los miembros de la junta pudieran
vol. l. Reading, Mass.: Addison-Wesley, 1954, págs. 532-562. El tener el deseo de parecer coherentes. Ambas deci-
cuadro aparece en la pág. 546. siones pueden entrañar gastos para equipo de ense-
PROBABILIDAD 77

ñanza, y dado que la junta en A adoptó una política En segundo lugar, la fórmula puede voltearse, por
liberal, también debe adoptar una política liberal en así decirlo, e indicar al investigador lo que debe
B. hacer para obtener las ventajas de probabilidad mul-
Supongamos que un investigador calculó la pro- tiplicativa. De ser posible, él debe planear su inves-
babilidad de que un resultado, por ejemplo, la dife- tigación de tal forma que los eventos sean indepen-
rencia entre dos medias, fuese producto del azar. dientes cosa más fácil de decir que de hacer, lo cual
Esta probabilidad fue 5/100 ó .05, lo cual significa se apreciará nítidamente antes del final de este libro.
que hubo aproximadamente cinco posibilidades en
100, de que su resultado dependiera del azar. Esto Probabilidad condicional
es, si él repitiera la situación experimental 100 veces En investigación, y tal vez en especial en la inves-
sin la manipulación experimental, aproximadamente tigación sociológica y pedagógica Jos eventos a me-
en cinco de estas ocasiones podría obtener diferen- nudo no son independientes. Consideremos Ja inde-
cia entre las medias, de la misma magnitud de la que pendencia bajo otro ángulo. Cuando dos variables se
obtuvo con la manipulación experimental. Sintién- relacionan no son independientes. Nuestro comen-
dose inseguro de los resultados (después de todo tario anterior de Jos conjuntos Jos señala con clari-
existen cinco posibilidades en 100 de que éstos pu- dad: si A n B=E, en este caso no habrá relación (con
dieran haber dependido del azar) repitió con todo mayor precisión, una relación cero), o bien, A y B
cuidado el experimento. Obtuvo substancialmente son independientes; si A n B.,;:E,. en este caso existe
el mismo resultado(¡ qué suerte!). Después de haber una relación, o A y B no son independientes. Cuando
controlado todas las variables para tener la seguri- los eventos no son independientes, los científicos
dad de que los dos experimentos eran independien- pueden afinar sus inferencias probabilísticas. El sig-
tes, calculó la probabilidad de que los dos resultados nificado de la afirmación anterior puede explicarse
se debieran al azár. Esta probabilidad fue aproxima- de cierta manera mediante el estudio de la probabili-
damente de .02. Por lo anterior podemos notar uno dad condicional. Además, el estudiante tendrá un
de los beneficios de la independencia en la experi- mejor conocimiento de la probabilidad y los proble-
mentación, y la importancia de duplicar o reproducir mas científicos de muestreo y predicción.
los resultados.(8) Cuando los eventos no son independientes, habrá
Por último, advirtamos que la fórmula para calcu- que alterar el enfoque o la forma de concebir la
lar la independencia actúa de dos maneras. En pri- probabilidad. Presentamos un ejemplo sencillo.
mer lugar, si los eventos son independientes y cono- ¿Cuál es la probabilidad de que en cualquier matri-
cemos sus probabilidades por separado, la fórmula monio escogido al azar, ambos cónyuges sean repu-
no dará la probabilidad de que ambos eventos ocu- blicanos? En primer lugar, suponiendo que hay
rran por azar. Si una persona observa que repetidas equiprobabilidad y que todos los demás aspectos son
veces los dos dados sumas 12 puntos (6 + 6) proba- iguales, el espacio muestra! U (todas las posibilida-
blemente están cargados. Si unjugador advierte que des) será {RR, RD, DR, DD}, en el cual el esposo
otro gana siempre, por supuesto, empezará a sospe- aparece en primer término en cada posibilidad o
char. Las probabilidades de ganar continuamente en punto muestra!. De este modo, la probabilidad de
un juego ·'limpio" o un juego relativamente limpio, que el esposo y su esposa sean republicanos es de
$On pequeñas. Por supuesto, pudiera suceder pero p(RR) =l/4. Pero supongamos que sabemos que sólo
es muy poco probable. En la investigación existe uno de ellos es republicano. ¿Cuál sería la probabili-
poca probabilidad de que una persona obtenga dos o dad ahora de que ambos sean republicanos? U dis-
tres resultados significativos, por azar. Quizá esté minuyó a {RR, RD, DR}. La consideración de que
actuando algo distinto del azar -el investigador de- sólo uno de ellos es republicano, elimina la posibili-
searía que fuera la variable independiente. dad DD, y de este modo reduce el espacio muestra!.
Por lo anteriormente expuesto, p(RR) = 1/3. Supon-
gamos que contamos con nueva información de que
(8) El método de calcular estas probabilidades combinadas fue
expuesto por Fisher y descrito por F. Mosteller y R. Bush, "Selec-
la esposa es republicana. En este punto: ¿cuál sería
ted Quantitative Techniques." En G. Lindzey, ed., Handbook of la probabilidad de que ambos esposos fuesen repu-
Social Psychology, vol. l. Reading, Mass.: Addison-Wesley, 1954, blicanos? Ahora V={RR, DR}. De este modop(RR)
págs. 328-331. El estudiante astuto pudiera preguntarse por qué el =1/2. Las nuevas probabilidades son, en este caso,
priÍlcipio de conjuntos aplicado a la probabilidad,p(A n B) =p(A) · "condicionales" en relación con el conocimiento o
p(B), no es aplicable en este caso. Esto es: ¿por qué no calcular .05
x .05 = .0025? Mosteller y Bush explicaron este asunto. Es un hechos previos.
problema difícil y discutible, y por eso no lo incluimos en este libro.
Lo que necesita recordar el lector es que la probabilidad de obtener Definición
una diferencia substancial, digamos, entre medias en la misma
dirección en experimentos repetidos, es muchísimo menor que
de la probabilidad co11dicio11al
obtener dicha diferencia una sola vez. De este modo, el investiga-
Supongamos que A y B son los eventos en el
dor debe tener mayor seguridad de sus propios datos y conclusio- espacio de muestreo U, como antes. La probabilidad
nes, con igualdad de otros factores. condicional se expresa: P(A 1 B), que se lee: "La
78 PROBABILIDAD, ALEATORIEDAD Y MUESTREO

Cuadro 7-4. Matriz de probabilidades que muestra las probabilidades conjuntas


de dos eventos independientes

Segundo lanzamiento

H2 T2
1h
Primer lanzamiento * * 1h
* *
1h 1h
H = Cara; T = cruz.
probabilidad de' A, dado B". Por ejemplo, podernos
decir, "la probabilidad de que el esposo y la esposa
sean republicanos, dado. que el esposo Jo sea" o
como algo más dificil de resolver, aunque más inte-
resante, "la probabilidad de lograr gran eficacia en la El resultado concuerda con nuestro razonamiento
enseñanza universitaria, a condición de que se tenga anterior más sencillo. Si hacernos un poco más com-
el grado de doctor". Por supuesto podernos escribir plejo el problema, la fórmula tal vez sea más útil.
p(B 1A). La fórmula para la probabilidad condicional Supongamos de algún modo que la probabilidad que
que comprende dos eventos es:(9) saliera cara en el segundo lanzamiento aumentó a .60
en vez de .50 y que los eventos son aún independien-
(A 1B) = p(A n B) tes: ¿este cambio modifica la situación? La nueva
(7.8)
p p(B) situación se expresa en el cuadro 7-5. (La cifra de .30
de casilla H 1 n H2 se calcula con base en las proba-
La fórmula simplemente torna una noción anterior bilidades de los márgenes: .50 x .60 = .30, cosa
de probabilidad y la modifica para que actúe en una permisible, pues sabemos que los eventos son inde-
situación de probabilidad condicional. Recordemos pendientes. Si no fuesen independientes, no podrian
que en los problemas de probabilidad el denomina- resolverse los problemas de probabilidad condicio-
dor debe ser el espacio muestral. La fórmula antes nal sin el conocimiento de uno de los valores, cuando
señalada cambia el denominador de la proporción y, menos.) La fórmula nos da:
de este modo, modifica el espacio muestra/. Este
espacio, por medio del conocimiento, ha sido redu- .30 = 60
cido de U a B. Para demostrar lo anterior conside- .50 .
remos dos ejemplos, uno de independencia o proba-
bilidad simple, y el otro de dependencia o probabili- Sin embargo, la cifra de .60 es la misma que la
dad condicional. probabilidad simple deH2. Cuando los eventos son
Lancemos dos veces una moneda al aire. Ambos independientes, tenemos los mismos resultados. Es
eventos son independientes. ¿Cuál es la probabili- decir en este caso:
dad de que el segundo lanzamiento salga "cara" si
apareció cara en el primero? Sabernos ya que las p(H2 I H1) = p(H2)
probabilidades son 1/2. Calculemos la probabilidad y en el caso general:
mediante la ecuación 7.8. En primer término escri-
bimos una matriz de probabilidad (ver cuadro 7-4). p(A 1 B) = p(A) (7.9)
Respecto a las probabilidades de que salga cara(H) y
cruz (T) en el primer lanzamiento, leamos los datos Tenemos otra definición o ''condición'' de indepen-
marginales del lado derecho de la matriz. De manera dencia. Si la ecuación 7.9 es válida, los eventos son
semejante, en lo que respecta a las probabilidades independientes.
del segundo lanzamiento, leamos las indicaciones
que están en la parte inferior de la matriz. Con base Un ejemplo académico
en lo anterior p(H1) = 1/2, p(H2) =1/2, y p(H2nH1) Hay ejemplos más interesantes de probabilidad
= 114. Por lo expuesto: condicional que los lanzamientos de monedas y
otros artificios de azar. Consideremos el problema
interesante, aunque frustrante, de predecir el éxito
(9) La teoría se extiende a más de dos eventos, pero no entrare- de los estudiantes que aspiran a obtener el doctorado
mos en detalles al respecto. en la escuela de posgraduados. ¿Pueden emplearse
PROBABILIDAD 79

Cuadro 7-5. Matriz de probabilidades conjwttas de dos eventos independientes, con probabilidades
desiguales de eventos

Segundo lanzamiento
H2 T2
H1 .30 .20 .50

Primer lanzamiento Ti .30 .20 .50

.60 .40 1.00

H = Cara; T = Cruz.
los modelos obtenidos para las monedas y dados en de 65, determinen las proporciones que aparecen en
esta situación compleja? La respuesta es afirmativa el cuadro 7-6.
siempre que se cumplan algunas condiciones, y en La prueba MA T divide al grupo que obtuvo éxito,
determinadas .circunstancias. Por desgracia, estas por mitad (.20 y .20), pero diferencia netamente al
circunstancias o condiciones son de difícil arreglo. grupo que fracasó(. lO y .50). En este punto formula-
No obstante, existe una posibilidad de éxito limi- remos estas preguntas: ¿cuál es la probabilidad de
tado. El modelo puede ser muy útil, a condición de que un candidato alcance el grado doctoral si obtiene
que se cuente con alguna información empírica. Su- una puntuación de 65 o más en la prueba MA T?
pongamos que los administradores de un colegio ¿Cuál es la probabilidad de que un candidato alcance
para posgraduados están interesados en predecir el el grado doctoral si obtiene una puntuación MA T
éxito de sus estudiantes de doctorado. Les preocupa menor de 65? Los cálculos son:
el bajo rendimiento de muchos de sus graduados, y
desean establecer un sistema de selección. La es- Sl>-65) =p(S n :;;::65) = .20 = 67
cuela sigue admitiendo a todos los solicitantes que p( ~ p(;;,:65) .30 .
desean hacer el doctorado, como en épocas pasadas,
= p(!(~ 6~~ ) = :~~ =
pero para los siguientes tres años todos los estudian- 5
tes de nuevo ingreso deben resolver la Prueba de p(S 1 <65) .29
Analogía de Miller (MAT), que según se ha apre-
ciado, puede predecir con bastante exactitud las po- Podemos apreciar con CÍaridad que la prueba MA T
sibilidades de alcanzar éxito en el doctorado. Se puede predecir satisfactoriamente los éxitos en el
eligió una puntuación bruta de 65 como punto arbi- programa, esto es, a quienes alcanzarán el grado
trario de "corte". doctoral. Ahora conviene tener cuidado con lo que
Los administradores escolares advierten que el 30 ocurre en estos casos. Cuando escribimos p(A 1B) en
por 100 de todos los candidatos durante el período de vez dep(A), en efecto' 'dividimos" o disminuimos el
tres años, tienen una puntuación de 65 o mayor. Se espacio de muestreo de U a B. Analicemos el ejem-
asigna la clasificación de "éxito" (s) o fracaso (.f) a plo señalado. La probabilidad de éxito sin tener
cada estudiante. El criterio es sencillo: ¿El candi- otros datos a la mano, es un problema que abarca a
dato o candidata alcanzará el grado doctoral? En todo el espacio muestra! U. Esta probabilidad es de
caso de que lo alcance, se define como éxito. Se .40. No obstante, si conocemos las puntuaciones de
observa que 40 por 100 del número total de estudian- la prueba MAT, el espacio de muestras se divide y
tes alcanza el éxito. Para precisar la relación entre la disminuye de U a un subconjunto de U, ;;¡,, 65. Por
puntuación en la prueba MAT y el éxito o el fracaso, supuesto, el número real de acaecimientos del
las autoridades, de nuevo, con un punto de ''corte'' evento" éxito" no cambia, pues el mismo número de

Cuadro 7-6. Probabilidades conjuntas en el problema de estudiantes de posgrado

Exito(s) Fracaso(f)
~65 .20 .10 .30
<65 .20 .50 .70

.40 .60 1.00


80 PROBABILIDAD, ALEATORIEDAD Y MUESTREO

Sucesos Follas

0.30

0.70

< 65 0.20

0.40 0.60 1.00


Figura 7-5.

personas terminaron con éxito su ciclo de posgrado. bilidad de cualquiera de dos rectángulos al sumar las
Sin embargo, la fracción de probabilidad tiene un medidas de los conjuntos; por ejemplo, la probabili-
nuevo denominador. En otras palabras, la estima- dad de éxito es .20 + .20 = .40.
ción de probabilidad es más fina al conocer los sub- Estas medidas (o probabilidades) se definen con
conjuntos "pertinentes" de U. En este caso ;;: 65 y base en toda el área U= l.00. La probabilidad de
< 65 son subconjuntos "pertinentes" de U, y con éxito es igual a .40/1.00. Sabemos cuáles son los
dicho término intentarnos denotar que la variable en resultados de los rendimientos de los estudiantes
cuestión o implícita, guarda relación con la variable después de resolver la prueba MA T. Las zonas que
del criterio establecido, esto es, éxito y fracaso. Índican las probabilidades propias de ;;: 65 y .:;;;65,
Si expresarnos el problema anterior en forma grá- están indicadas por los rectángulos en el cuadrado,
fica, el lector podrá tener una idea más clara del el superior con doble rayado, y el inferior vacío. La
asunto. La figura 7-5 muestra una interpretación probabilidad sencilla de;¡,, 65 es igual a .20 + . IO =
gráfica y por áreas del problema de los estudiantes .30, o .30/l.OO. Toda la zona superior del cuadrán-
de posgrado. En este esquema se emplea la idea de gulo, que comprende el rectángulo con doble rayado
una medida de un conjunto. Recordemos que la y el rectángulo con rayado sencillo a la derecha,
medida de un conjunto o subconjunto es la suma de indica esta probabilidad. Las áreas de los "éxito" y
los pesos del conjunto o subconjunto. Los pesos se "fracaso'' están indicadas por líneas gruesas que los
asignan a los elementos del conjunto o subconjunto. separan en el cuadro.
La figura 7-5 es un cuadrado dividido en 10 partes Nuestro problema de probabilidad condicional es:
iguales de cada lado. Cada parte es igual a 1/10 ó .10. "¿cuál es la probabilidad de éxito si conocemos las
El área total del cuadrado es el espacio muestra! U, y puntuaciones de MA To si conocemos ;;: 65 (podrian
la medida de U, m( V) es igual a l.00, lo que simple- ser < 65, por supuesto)? Contamos con un nuevo
mente significa que todos los pesos asignados a ele- espacio muestra! más pequeño, indicado por toda la
mentos del cuadrado, suman l.00. Se han introdu- zona rayada en la parte superior del cuadrado. De
cido las medidas de los subconjuntos: m(F) = .60, hecho, U ha sido reducido a este espacio menor
m(o:;;; 65) = .70, m(S n ;¡,, 65) = .20. La medida de porque sabemos "la verdad" del espacio menor. En
estos subconjuntos se calcula al multiplicar la longi- vez de permitir que este espacio menor sea igual a
tud de sus lados. Por ejemplo, el área de la casilla .30, supongamos ahora que es igual a 1.00. (Cabría
superior izquierda (con doble rayado) es .5 x .4 = decir que se ha vuelto un nuevo U.) En consecuen-
.20. Recordemos que la probabilidad de cualquier cia, habrá que calcular nuevamente las medidas de
conjunto (o subconjunto) es la medida del conjunto los rectángulos que constituyen el nuevo espacio de
(o subconjunto), y en base a esto, la probabilidad de muestras. Por ejemplo, en vez de calcularla probabi-
cualquiera de los rectángulos de la figura 7-5 corres- lidad p(;¡,, 65 n S) = .20 (porque es 2/IO del área de
ponde a la que se indica. Podemos calcular la proba- todo el cuadro), debemos calcular-puesto que ahora
PROBABILIDAD 81

sabemos que los elementos del conjunto ~ 65 tienen


puntuaciones MA T superiores o iguales a 65- la
probabilidad con base en el área de ~ 65 (toda el área
sombreada en el extremo superior del cuadrado).
Una vez hecho esto, tenemos .20/.30 = .67, que es u
exactamente el resultado que obtuvimos cuando
empleamos la ecuación 7.8. Figura 7-6.
Lo que ocurre es que los nuevos conocimientos
hacen que U deje de ser importante como espacio
muestra!. Todas las expresiones de probabilidad se
relacionan con el espacio muestra/. En este caso, la y 10 mujeres. ¿A qué conclusiones llegaría
cuestión es definir adecuadamente dicho espacio. usted?
En el primer problema, de los esposos y esposas, [Respuesta: a) 1/250; b) 120/250; 130/250; c) l.]
formulamos la pregunta: ¿Cuál es la probabilidad de 2. Se lanza al aire una sola vez una moneda y se
que ambos cónyuges sean republicanos? El espacio arroja a un lado: ¿Cuál es la probabilidad de que
de muestreo fue U= {RR, RD, DR. DD}, pero salga cara en la moneda y el número 6 en el dado?
cuando agregamos el conocimiento de que uno de Dibuje un esquema de árbol para mostrar todas
ellos sin duda era republicano y formulamos la las posibilidades. Anote en las ramas del árbol los
misma pregunta, de hecho hicimos que el universo pesos o probabilidades adecuadas en este punto,
original U perdiera importancia para el problema. Se y formule algunas preguntas. ¿Cuál es la probabi-
necesita ahora un nuevo espacio muestra!, quepo- lidad de que aparezca:
demos llamar U'. En consecuencia, la probabilidad a) Cruz, y los números l, 3 ó 6 en el dado?
de que ambos esposos sean republicanos, es dife- b) Cara, y los números 2 ó 4 en el dado?
rente cuando introducimos nuevos datos. c) Cara o cruz y el 5 en el dado?
Podemos calcular otras probabilidades en forma d) Cara o cruz y los números 5 ó 6 en el dado?
semejante. Supongamos que deseamos saber la pro- [Respuestas: a) 1/4; b) 116; c) 116; d) 113.]
babilidad de fracaso del estudiante cuando al resol- 3. Lance la moneda al aire y arroje el dado 72 veces.
ver la prueba MA T obtiene una puntuación menor Escriba los resultados de lado a lado en una hoja
de 65. Consultemos la figura 7-5. La probabilidad rayada, conforme aparezcan. Compare las fre-
que buscamos es la que se expresa en el rectángulo cuencias obtenidas con las frecuencias teóricas
de la esquina inferior derecha, marcado con .50. esperadas. Después, compare su solución con
Sabemos que la puntuación es < 65, y por esta cada una de las preguntas del problema núm. 2 de
razón, usamos este dato para establecer un nuevo esta sección. ¿Los resultados obtenidos son simi-
espacio de muestreo. Los dos rectángulos inferiores lares a los resultados esperados? (Por ejemplo,
cuya área es igual a .20 + .50 = .70representan este supongamos que usted calculó una posibilidad
espacio de muestreo. Con esta base calculamos la dada de 2(a), en el ejemplo anterior. Ahora cuente
nueva probabilidad: .50/.70 = .71. La probabilidad el número de veces que apareció una cruz con un
de que un estudiante no alcance el doctorado si su 1, un 3 o un 6. ¿La fracción obtenida fue igual a la
puntuación en la prueba MA Tes menor de 65, es de fracción esperada?)
.71. 4. Estudie la figura 7-6. Hay 20 elementos en U, de
los cuales 4 están en A, 6 en B y 2 en A n B. Si
Guías de estudio usted elige al azar un elemento, ¿cuál es la proba-
l. Supongamos que usted ··muestrea" a escolares bilidad de que:
de noveno grado, con fines de investigación. a) ¿esté dentro de A?
Existen 250 niños de noveno grado en el sistema b) ¿esté dentro de B?
escolar, de los cuales 130 son varones y 120 muje- c) ¿esté en A n B?
res. d) ¿esté en A o B? [Recomendación: recuerde la,
a) ¿Cuál es la probabilidad de que se seleccione a ecuación:p(A UB) =p(A)+p(B)-p(A nB).]
un escolar cualquiera? e) ¿no esté en A ni en B?
b) ¿Cuál es la probabilidad de seleccionar a una j) ¿que esté en B pero no en A?
niña?, ¿y a un varón? 5. Consideremos la figura 7-7. Existen 20 elementos
c) ¿Cuál es la probabilidad de seleccionar a un en U de los cuales 4 están en B y 8 en A. Si se
varón o a una niña? ¿En qué forma expresaría selecciona al azar un elemento de U: ¿cuáles
usted este problema mediante símbolos de serán las probabilidades de que esté dicho ele-
conjuntos? (Recomendación: ¿Es equivalente mento en:
a la intersección o unión de conjuntos?) a) ¿A?
d) Supongamos que usted extrajo una muestra de b) ¿B?
100 niños y niñas de los cuales 90 son varones c) ¿A n B?
82 PROBABILIDAD, ALEATORIEDAD Y MUESTREO

b) Conocemos A: ¿cuál será la probabilidad de


B?
[Respuestas: a) 113; b) 1/2.]
8. Suponga que una persona se somete a una prueba
V de elección múltiple en la que tiene que escoger
dos entre cuatro reactivos, que están identifica-
Figura 7-7. dos por las letras a, b, e y d. Las respuestas
correctas son precisamente los reactivos e y a.
a) Exprese gráficamente el espacio de muestras.
(Dibuje un diagrama de árbol; véase la fi-
d) ¿AUB? gura 7-3.)
e) ¿U? b) ¿Cuál es la probabilidad de que cualquier per-
[Respuestas: a) 215; b) 115; e) 1/5; d) 215; e) l.] sona resuelva correctamente los dos reacti-
6. Después de analizar la figura 7-7, resuelva las vos, por simple conjetura o suposición?
siguientes preguntas: e) ¿Cuál es Ja probabilidad de que Ja persona
a) Si conocemos A (sabiendo que un elemento responda correctamente, o cuando menos uno
"muestreado" provino de A): ¿cuál es la pro- de los reactivos, por conjetura?
babilidad de B? d) ¿Cuál es la probabilidad de que responda inco-
b) Si conocemos B: ¿cuál es la probabilidad de rrectamente a los dos reactivos, por suposi-
A? ción, esto es, fracase en los dos?
[Respuestas: a) 112; b) l.] e) Si sabemos que Ja persona resolvió correcta-
7. Después de analizar la figura 7-6, conteste las mente el primer reactivo, ¿cuál es Ja probabi-
siguientes preguntas: lidad de que resuelva correctamente el se-
a) Si conocemos B: ¿cuál será la probabilidad de gundo reactivo por suposición?
A? [Respuestas: b) 1116; e) 7116; d) 9/16; e) 1114.]
CAPITULO 8
Muestreo y aleatoriedad

Imaginemos las diversas situaciones en que de- Muestreo, muestreo aleatorio


seamos saber algo respecto a personas, eventos o y representatividad
cosas. Por ejemplo, para saber algo acerca de las La extracción de muestras o muestreo, consiste
personas, escogemos algunas cuantas conocidas (o en tomar cualquier parte de una población o uni-
desconocidas), y las estudiamos. Después de nues- verso que sea representativa de la misma. Esta defi-
tro "es tu dio" , llegamos a ciertas conclusiones sobre nición no implica que la muestra extraída (al decir de
ellas a menudo sobre "la gente en general". Gran los investigadores) sea representativa, sino más bien
parte de la sabiduría popular se basa en este método. que se toma una parte de la población y se considera
Las observaciones basadas en el sentido común res- que es representativa. Cuando un administrador es-
pecto a personas, sus motivos y conductas, son pro- colar visita algunos salones de clase en un sistema,
ducto, en su mayor parte, de observaciones y expe- "para palpar en vivo el sistema", muestrea una serie
riencias con un grupo pequeño de ellas. Hacemos de grupos escolares que sigan ese sistema en su
afirmaciones como' 'los adolescentes son delincuen- totalidad. Probablemente supone que si visita "al
tes''; ''la gente de esta época ha perdido e 1sentido de azar" de 8 a 10 grupos escolares de un total de .40,
los valores morales", "los políticos son corruptos'' tendrá una noción bastante exacta de las caracterís-
y "los alumnos de escuelas públicas no aprenden ticas de la enseñanza que se imparte bajo tal sistema.
materias elementales como lectura, escritura y arit- O bien, puede visitar el mismo grupo escolar de un
mética". maestro dos o tres veces para "muestrear" su téc-
Las bases para hacer dichas afirmaciones son nica pedagógica. En este último caso "muestrea"
simples. Las personas, casi todas, según su expe- conductas (en este ejemplo particular, pedagógicas),
riencia limitada, llegan a algunas conclusiones sobre del universo de todas las conductas posibles de los
otras y su ambiente. Para llegar a tales conclusiones maestros. Este muestreo es necesario y legítimo.
deben muestrear sus "experiencias" sobre otras El muestreo aleatorio es el procedimiento para
personas. En realidad, toman muestras relativa- obtener una parte (o muestra) de una población del
mente pequeñas de todas las experiencias posibles. universo, en tal forma que cada miembro de la po-
El término "experiencia" en este contexto se ha blación o universo tenga igual oportunidad de ser
usado en sentido general. Puede denotar experien- elegido. Esta definición tiene la utilidad de que se
cia directa con otras personas, por ejemplo, inter- puede entender fácilmente. Por desgracia, no es to-
acción directa con alemanes o judíos, o puede deno- talmente satisfactoria, porque es limitada. Una me-
tar experiencia indirecta: al haber oído algo sobre jor definición sería: el muestreo aleatorio es el mé-
alemanes o judíos, dicho por amigos, conocidos, todo que consiste en extraer una parte (o muestra) de
parientes y otras personas. En este momento no nos una población o universo, de tal forma que todas las
importa si la experiencia es directa o indirecta. Su- muestras posibles de tamaño fijo n tengan la misma
pongamos que toda la experiencia comentada es di- probabilidad de ser seleccionadas.(l) Esta defini-
recta. Un individuo cree "que sabe" algo acerca de ción es general y por tanto, más satisfactoria que la
los judíos y dice que tienen espíritu de tribu o anterior.
"clan", porque ha tenido experiencia directa con Supongamos que el universo que vamos a estudiar
algunos de ellos. Incluso puede señalar: "Algunos está formado por todos los niños de cuarto grado en
de mis mejores amigos son judíos, y sé que ... '' El un sistema escolar X, y que en total son 200 niños.
hecho es que sus conclusiones se basan en una mues- Seleccionamos al azar un niño de dicha población.
tra de judíos, una muestra de la conducta de los La probabilidad de que (él) o (ella) sean selecciona-
judíos, o en ambos factores. Nunca podrá "cono- dos es de 1/200, si el procedimiento de muestreo se
cer" a todos los judíos; y en el análisis último, de- hace al azar. De modo semejante, se seleccionan
pende de las muestras. De hecho, casi todo el cono-
cimiento del mundo se basa en muestras que suelen (1) W. Feller, An Introduction to Probability Theory and Its
ser inadecuadas. Applications, 2a. ed. Nueva York: Wiley, 1957, pág. 29.

83
84 PROBABILIDAD, ALEATORIEDAD Y MUESTREO

otros niños. Supongamos ahora que después de se- clase trabajadora, que la población total. Cuando
leccionar al niño, lo devolvemos (o el símbolo que le extraemos una muestra aleatoriamente esperamos
asignamos) a la población. En estas circunstancias, que sea representativa, y que estén presentes en la
la probabilidad de seleccionar otro niño es también muestra las caracterÍsticas más sobresalientes ·de la
l/200. (Si no devolvemos al primer niño a la pobla- población en una forma aproximadamente igual a
ción, la probabilidad que tendrá cada uno de los como están en dicha población. Sin embargo, nunca
niños restantes de ser seleccionado será de 1/199, podemos tener la certeza de que ocurra así, y no hay
método que se llama muestreo sin reposición o resti- ninguna garantía en este sentido.
tución. Cuando Jos elementos de la muestra se de- Como Stilson señala, dependemos más bien del
vuelven a la población de Ja que se extrajeron, el hecho de que las caracteristicas típicas (intrínsecas o
método se llama muestreo con reposición.) "propias") de una población son las más frecuentes
Supongamos que de la población de 200 escolares y, por consecuencia, existe mayor probabilidad de
de cuarto año en un sistema escolar X decidimos que estén presentes en cualquier muestra particular
extraer aleatoriamente una muestra de 50 niños. extraída aleatoriamente.(2) Cuando la extracción se
Esto significa que al ser tomada al azar esta muestra, hace de manera aleatoria, es predecible la variabili-
todas las muestras posibles de 50 niños tienen la dad de muestreo. Por ejemplo, en el capítulo 7,
misma probabilidad de ser seleccionadas, lo que aprendimos que si lanzamos dos dados cierto nú-
constituye un número grandísimo de muestras posi- mero de veces, la probabilidad de que salga un 7 es
bles. Para hacer más comprensibles las bases teóri- mayor que la de un 12. (Véase cuadro 7-1.)
cas de esta maniobra, supongamos que una pobla- Una muestra extraída aleatoriamente no es "ten-
ción consta de cuatro niños, a, b, e y d, y que al azar denciosa" ni prejuiciada (es imparcial), en cuanto a
extraemos una muestra de dos niños. En este caso, que ningún miembro de la población tiene mayor
la lista de todas las posibilidades o espacio muestra!, oportunidad o posibilidad de ser elegido que otro.
será: (a, b), (a, e), (a, d), (b, e), (b, d), (e, d). Existen Tenemos una democracia, en la cual todos los
seis posibilidades. Si se extrae aleatoriamente una miembros son iguales antes de ser elegidos. En vez
muestra de dos niños, la probabilidad de cada par de usar monedas o dados usemos un ejemplo de
será de 1/6. Cada par tiene la misma probabilidad de investigación. Supongamos que tenemos una pobla-
ser extraído. Se necesita este tipo de razonamiento ción de 100 niños que difieren en inteligencia, que es
para resolver muchos problemas de .investigación, una variable importante para nuestro estudio. De-
pero por lo regular nos limitaremos a la idea más seamos conocer el cociente intelectual medio (l Q) de
sencilla del muestreo, derivada de la primera defini- la población, pero por alguna causa sólo podemos
ción. En esta circunstancia, la primera definición es muestrear 30 de los 100 niños. Si extraemos mues-
un caso especial de la segunda definición general; tras aleatoriamente habrá un gran número de mues-
esto es, el caso especial en el que n =l. tras posibles de 30 niños. Las muestras tienen igual
Por desgracia, nunca tendremos la seguridad ab- probabilidad de ser elegidas. Las medias de casi
soluta de que una muestra extraída al azar sea repre- todas las muestras serán muy semejantes a la media
sentativa de la población de la cual se extrajo. Re- de la población, pero algunas no lo serán tanto. La
cordemos que toda muestra particular de tamaño n probabilidad de elegir una muestra con una media o
tiene la misma probabilidad de ser elegida, que otra promedio cercana a la media de la población, en esta
muestra del mismo tamaño. En consecuencia, una situación, es mayor que la probabilidad de elegir una
muestra particular pudiera no ser representativa en muestra con una media que no se acerque a la media
absoluto. Debemos saber lo que significa• 'represen- de la población (el muestreo se hizo de manera alea-
tativa". En el lenguaje corriente significa que es toria).
típica de una población, esto es, que ejemplifica las Sin embargo, si no extraemos nuestra muestra por
caracteristicas de la misma. Desde el punto de vista el método aleatorio, algún factor o factores que des-
de la investigación, hay que definir con mayor exac- conocemos nos pueden predisponer a seleccionar
titud lo que significa el término "representativo", una muestra "tendenciosa" o "prejuiciada", en este
aunque es difícil ser preciso en estos casos. Debe- caso posiblemente una muestra con una media que
mos preguntamos: ¿de qué caracteristicas estamos no se acerque a la media de la población. Este co-
hablando? Por lo expuesto, en investigación, una ciente intelectual promedio de la muestra será, se-
"muestra representativa" denota que la muestra gún lo expuesto, una estimación "prejuiciada" o
reúne aproximadamente las características de la po- tendenciosa(sesgada) de la media de la población. Si
blación que son importantes para la investigación conociéramos a los 100 niños, tenderiamos incons-
que se planea. Sí el sexo y la clase socioeconómica cientemente a seleccionar a los más inteligentes. No
son variables (características) importantes para la es tanto lo que podríamos hacer sino lo que nos
investigación, la muestra representativa en este caso
incluirá aproximadamente la misma proporción de (2) D. Stilson, Probability and Statistics in Psycho/ogical Re-
varones y mujeres e individuos de clase media y search and Theory. San Francisco: Holden-Day, 1966, pág. 35.
MUESTREO Y ALEATORIEDAD 85

permiten hacer nuestros métodos. Los métodos de pecta a la aleatoriedad y eligen con gran cuidado
selección aleatoria no permiten que operen nuestros muestras aleatorias, y planean métodos aleatorios.
propios prejuicios o tendencias, y otros factores de Puede adoptarse la posición de que nada ocurre al
selección sistemática. El método es objetivo, total- azar, pues para cada hecho hay una causa. En ese
mente alejado de nuestras predilecciones. contexto la única razón por la que el científico usa la
El muestreo aleatorio tiene otra virtud que por el palabra azar es que todavía no sabe lo suficiente
momento no detallaremos, porque para ello se nece- sobre el tema. Para un ser omnisciente nada ocurre
sitarían mayores conocimientos de estadísticas. Sin por azar. Supongamos que exista un ser omnisciente
embargo, las mencionaremos de modo suscinto. La dueño de un periódico. Tal diario sería un gigantesco
teoría moderna de la estadística se basa en el mues- periódico que registraría con enorme cuidado todo
treo aleatorio y su definición. Recordaremos que en evento hasta su último detalle, para mañana, el día
una muestra obtenida aleatoriamente, cada ele- siguiente, y los siguientes días, hasta el infinito.(3)
mento de la población tiene igual probabilidad de ser Nada desconocería y por supuesto no existiría el
seleccionado. Para estimar los valores de población, azar. De acuerdo con este criterio, la aleatoriedad,
a partir de valores de las muestras o estadísticos (a de hecho, equivale a ignorancia.
los valores de las muestras, a semejanza de las me- Tomando como base este argumento, podemos
dias, se les da el nombre de estadísticos), se necesi- definir el azar, a la inversa. Decimos que los eventos
tan estimaciones de la variabilidad de los valores de ocurren al azar si no podemos predecir sus resulta-
la muestra. Estrictamente hablando, la aplicación de dos. Por ejemplo, no hay una forma conocida para
la teoría estadística, que comprende en gran parte la ganar en eljuego conocido de arrojar una moneda al
estimación de la variabilidad de los valores de las aire. Siempre que no exista sistema alguno en un
muestras, es posible sólo cuando se conoce la pro- juego, que asegure que lo ganaremos (o perdere-
babilidad de selección de los elementos de la pobla- mos), calificamos al hecho y a los resultados del
ción. En un punto ulterior de nuestra exposición juego como azarosos. De manera más formal, alea-
entenderemos mejor este concepto. toriedad significa que no hay una ley conocida que
Es posible que el lector experimente una vaga pueda ser expresada en palabras, que describa con
sensación de incomodidad y tal vez de insatisfac- exactitud o explique eventos y sus resultados.(4) En
ción. Si no tenemos la seguridad de que las muestras una palabra, cuando los eventos son aleatorios no
aleatorias son representativas: ¿cómo podemos te- podemos predecirlos individualmente. Sin embargo,
ner confianza en los resultados de nuestra investiga- por extraño que parezca, los podemos predecir con
ción y su aplicabilidad alas poblaciones de las cuales gran exactitud en conjunto, esto es, podemos prede-
extrajimos nuestras muestras? ¿Por qué no selec- cir los resultados de un gran número de eventos. No
cionar sistemáticamente las muestras en tal forma podemos predecir si al arrojar una moneda al aire
que sean representativas? La respuesta es compleja. saldrá cara o cruz, pero si arrojamos la moneda 1 000
En primer lugar, insistimos en que no existe seguri- veces podemos anticipar con bastante precisión el
dad absoluta. En segundo lugar, es posible que tas número total de caras y cruces que aparecerán.
muestras aleatorias incluyan características típicas
de la población, si éstas son frecuentes en ella. En la
Un ejemplo de muestreo aleatorio
investigación real extraemos muestras aleatorias
Para que el lector tenga una idea de la aleatoriedad
siempre que podemos, y esperamos y suponemos
y las muestras aleatorias, haremos un experimento
que son representativas. Aprendemos a vivir con la
mediante una tabla de números aleatorios. Una tabla
incertidumbre, pero siempre que podemos, tratamos
de esta índole contiene números obtenidos mecáni-
de reducirla exactamente como hacemos en la vida
camente, de tal forma que en ellos no se sigue un
diaria, pero en forma más sistemática y con un cono-
orden o sistema discernible. Antes se dijo que si los
cimiento considerable del muestreo aleatorio y los
resultados aleatorios. Por fortuna, nuestra falta de eventos son aleatorios, no es posible predecirlos.
certidumbre no entorpece la buena marcha de nues- Pero ahora predeciremos la naturaleza general de
tra investigáción. los resultados de nuestro experimento. Selecciona-
mos de la tabla de dígitos aleatorios 10 muestras de
10 dígitos cada una. Puesto que los números son
aleatorios, cada muestra debería ser represeRtativa
Aleatoriedad del universo de dígitos. El universo puede definirse
La noción de aleatoriedad es la base de los méto-
en diversas formas y lo definiremos como el con-
dos modernos de probabilidad en las ciencias natura-
les y de la conducta. Sin embargo, es difícil definir el junto completo de dígitos de la tabla Rand Corpora-
"azar", "lo aleatorio". En este caso no es muy útil
la noción de los diccionarios de lo irregular, acciden- (3) Consúltese J. Kemeny, A Philosopher Looks at Science.
tal o de lo que carece de meta o dirección. De hecho, Nueva York: Van Nostr.ind Reinhold, 1959, pág. 39.
los científicos son muy sistemáticos en lo que res- (4) Ibid., págs. 68-75.
86 PROBABILIDAD, ALEATORIEDAD Y MUESTREO

Cuadro 8-1. Diez muestras de números aleatorios

1 2 3 4 5 6 7 8 9 10

9 o 8 o 4 6 o 7 7 8
7 2 7 4 9 4 7 8 7 7
6 2 8 1 9 3 6 o 3 9
7 9 9 1 6 4 9 4 7 7
3 3 1 1 4 1 o 3 9 4
8 9 2 1 3 9 6 7 7 3
4 8 3 o 9 2 7 2 3 2
1 4 3 o o 2 6 9 7 5
3 1 8 8 4 5 2 1 o 3
2 1 4 8 9 2 9 3 o
Media: 5.0 3.9 5.3 2.4 5.7 3.8 5.2 4.4 5.0 4.9 Media total = 4.56

tion de dígitos aleatorios.(5) Estos dígitos son O, l, 2, son estimaciones "satisfactorias" de la media de
3, 4, 5, 6, 7, 8, 9. Procedemos al extraer muestras de población de 4.5, y una (2.4) no lo es.
la tabla. Las medias de las 10 muestras, por su- Mediante el cambio del problema de muestreo,
puesto, serán diferentes, pero deben fluctuar dentro podemos definir el universo para que conste de nú-
de límites relativamente estrechos y casi todos ellos meros nones y pares. Supongamos que en el uni-
se acercarán mucho a la media de los 100 números. verso total hay un número igual de ambos. En nues-
La media teórica de la población total de números tra muestra de 100 números debe haber unos 50
aleatorios y el número de cifras pares en cada mues- números pares y 50 nones, aunque en realidad hay 54
tra de l Odebe ser aproximadamente igual al de cifras nones y 46 pares. Una prueba estadística muestra
nones -aunque, de nuevo, habrá fluctuaciones, al- que la desviación de cuatro puntos para los nones y
gunas tal vez extremas, pero casi todas comparati- cuatro para los pares no se aparta significativamente
vamente pequeñas. Las muestras se presentan en el de los resultados que se esperarían por el azar.(6)
cuadro 8-l. De manera similar, si hacemos muestras de seres
Debajo de cada muestra aparecen las medias de humanos, los números de varones y mujeres en cada
las mismas. La media de U, que es la media teórica muestra deberán guardar una proporción aproxi-
de la población total de los números aleatorios de la mada entre el número de varones y mujeres de la
compañíaRand {O, l, 2, 3, 4, 5, 6, 7, 8,9} es 4.5. La población (si el muestreo se hizo aleatoriamente y
media de 100 números, que puede ser considerada las muestras tienen tamaño suficiente para estas
como una muestra de U, es 4.56, lo cual se acerca operaciones). Si medimos la inteligencia de una
mucho a la media de U. Puede advertirse que la muestra, y el cociente promedio de inteligencia de la
media de las 100 muestras varía alrededor de 4.5, la población es 100, la media de la muestra deberá
menor es 2.4, y la mayor, 5.7. Solamente dos de acercarse a 100. Por supuesto, siempre debemos
estas medias difieren de 4.5, en más de una unidad. recordar la posibilidad de seleccionar una muestra
La prueba estadística (más tarde expondremos sus "desviada", por ejemplo una muestra con una me-
fundamentos) muestra que las 10 medias no difieren dia de 80 o menos, o 120 o más. En la práctica se
significativamente entre sí. La expresión "no difie- presentan muestras' 'desviadas", pero tienen menor
ren significativamente entre sí" significa que las di- probabilidad de aparecer. El razonamiento es simi-
ferencias no son mayores que las que ocurrirían por lar al que se siguió en las demostraciones del lanza-
azar, y por otra prueba estadística, nueve de ellas miento de una moneda. Si arrojamos al aire tres
veces una moneda, habrá menor probabilidad de que
salgan tres caras o tres cruces en ese orden, que si
(5) Los números aleatorios se obtuvieron de: Rand Corporation, salieran dos caras y una cruz o dos cruces y una cara,
A Mil/ion Random Digits With 100 000 Normal Deviates. Nueva
porque U= {HHH, HHT, HTH, HTT, THH, THT,
York: Free Press, 1955. Esta es una gran tabla de números aleato-
rios elaborada con enorme cuidado. Sin embargo, existen otras que
tienen la suficiente calidad para casi todos los fines prácticos. Los
textos actuales de estadística las incluyen. En el texto de A. Rosan- (6) La naturaleza de estas pruebas estadísticas así como los razo-
der. Elementary Principies of Statistics. Nueva York: Van Nos- namientos en que se basan, se explicarán en detalle en la Parte IV.
trand Reinbold, 1951, págs. 681-683, pueden obtenerse tablas ú ti1 es El lector no debe preocuparse en este punto si no comprende en
de números aleatorios no repetidos. El apéndice D al final de este forma exhaustiva las ideas estadísticas que expresamos. Indiscuti-
libro, contiene unos 4 000 números aleatorios obtenidos de compu- blemente uno de los fines de este capítulo es introducir algunos de
tadoras. los elementos básicos de tales ideas.
MUESTREO Y ALEATORIEDAD 87

TTH, TTT}. Hay solamente una combinación HHH con su famoso ejemplo de la dama y su taza de té.(7)
y otra TTT, en tanto que hay tres combinaciones a Según esta ilustración la dama afirmaba que podía
base de dos H y una T y tres con dos T y una H. decir sí en la taza se había colocado en primer lugar
la leche o el té. Fisher mostró la forma de someter a
prueba su afirmación, mediante el empleo de la teo-
Aleatorización ría de probabilidad y nociones de aleatoriedad. En
Supongamos que un investigador desea poner a todo caso uno de los progresos intelectuales de nues-
prueba la hipótesis de que el servicio de orientación tra época es el concepto de asignación aleatoria y lo
vocacional reporta beneficios a los alumnos de que podría llamarse el principio de este procedi-
aprovechamiento bajo. Desea establecer dos grupos miento. Nunca se insistirá lo bastante en la impor-
de personas con aprovechamiento deficiente, a uno tancia de la idea y las medidas prácticas que surgie-
de los cuales se dará consejo y al otro no. Como cosa ron de ella, para mejorar la experimentación y las
natural, también desea que todos los grupos sean deducciones con base en los resultados obtenidos.
iguales en cuanto a otras variables independientes Es posible definir mejor la asignación aleatoria, en
que pudieran tener un posible efecto en el aprove- dos o tres formas: por el establecimiento del princi-
chamiento. Una forma en que puede hacer esto, pio de la asignación aleatoria; al describir la forma en
consiste en asignar aleatoriamente a los niños a uno que el investigador usa este procedimiento en la
u otros grupos, digamos, arrojando la moneda una práctica y al demostrar los mecanismos por los que
vez por cada niño, a fin de asignarlo a un grupo, si opera, en objetos y números. La importancia de este
sale cara, o al otro si sale cruz. (Obsérvese que si el método justifica que se traten los tres puntos.
experimentador formó tres grupos probablemente El principio de la aleatorización puede estable-
no use la moneda; podría usar un dado.) También cerse como sigue: dado que en los métodos aleato-
puede emplear una tabla de números aleatorios y rios todo miembro de la población tiene igual posibi-
asignar a los niños de esta manera: si sale un número lidad de ser elegido, la selección de miembros con
par, asignará a un niño al primer grupo, y si sale un algunas características distintivas, sea varón o mu-
número non, lo asignará al otro grupo. Ahora puede jer, de alta o baja inteligencia, republicano o demó-
suponer que los grupos son aproximadamente igua- crata, dogmático o no, etc., probablemente será
les en relación con todas las variables independien- "equilibrada", a la larga, por la selección de otros
tes posibles. Cuanto mayores sean los grupos, será miembros de la población con características cuanti-
más segura la suposición. Sin embargo, nada garan- tativas o cualitativas "opuestas" a las característi-
tiza que la muestra no sea "desviada", como comen- cas distintas. Se puede decir que este es el principio
tamos, ni que los grupos sean iguales o incluso apro- práctico de lo que normalmente acontece y no po-
ximadamente iguales, en lo que respecta a todas las demos calificarlo como ley natural. Es simplemente
posibles variables independientes. No obstante, una afirmación de lo que suele ocurrir cuando se
puede decirse que el investigador ha empleado la usan métodos aleatorios. ,
asignación aleatoria para igualar sus grupos, o dicho Se dice que los sujetos son asignados aleatoria-
de otro modo, para controlar las influencias en la mente a grupos de experimentación, y que los trata-
variable dependiente que son diferentes de las de la mientos experimentales se asignan también de ma-
variable independiente manipulada. nera aleatoria a los grupos. Pongamos por caso, en el
Un experimento "ideal" sería aquél en que se ejemplo antes citado sobre un experimento para
controlaran todos los factores o variables que pue- probar la eficacia de la asesoría en el aprovecha-
den modificar o alterar los resultados del experi- miento escolar, los sujetos podrían ser asignados a
mento. Si conociéramos con anterioridad todos es- los dos grupos en forma aleatoria, bien por medio de
tos factores, en primer lugar, y pudiéramos contro- números aleatorios, o por el lanzamiento al aire de
larlos, en segundo lugar, tendríamos un experimento una moneda. Una vez que los sujetos han sido asig-
ideal. Pero, por desgracia, nunca sabemos ni cono- nados con este procedimiento, los grupos pueden ser
cemos todas las variables pertinentes ni las podemos designados también aleatoriamente en forma de gru-
controlar, aunque las conozcamos. A pesar de estas pos de experimentación y de control, por empleo de
limitaciones, la asignación aleatoria es útil para el un método similar. En nuestra exposición en este
investigador. texto nos encontraremos diversos ejemplos de asig-
La aleatorización (o asignación aleatoria) es la nación aleatoria.
asignación de objetos (sujetos, tratamientos o gru-
pos) de un universo a subconjuntos del propio uni- Demostración de la aleatorización
verso, en forma tal que para cualquier asignación, a
Para demostrar la forma en que opera el principio
un subconjunto, cualquier miembro del universo
de asignación aleatoria (aunque de momento no nos
tiene la misma probabilidad de ser asignado. La idea
de la aleatorización parece haber sido descubierta e (7) R. Fisher, The Design. of Experiments, 6a. ed. Nueva York:
inventada por Sir Ronald Fisher, quien ilustró la idea Hafner, 1951, págs. l l y sigs.
PROBABILIDAD, ALEATORIEDAD Y MUESTREO

Cuadro 8-2. Tres grupos de un total de 86 senadores, elegidos aleatoriamente, según


su afiliación política, partido, región y el voto que emitieron sobre dos asuntosª

I PP R 1 5 II PP R 5 III PP R 5

34 D s o 1 60 D s o o 4 D N O o
35 R s o 1 42 D s 1 o 38 D N O o
50 D s o o 66 D N O o 75 D N o
15 R N O 1 98 D N O o 37 D N l 1
86 D s o 1 41 D s o o 30 D s o o
29 D s o 1 51 D s o o 31 D N l o
79 D N 1 o 9 R N O 1 65 D s o l
16 D N 1 o 1 R N 1 l 13 D N O o
21 D N 1 o 46 R N O 1 7 D N O o
17 R N 1 1 40 D N O o 67 D N l o
76 D N O o 53 R N 1 2 R N O 1
87 R N O 32 D s o 1 85 R N 1 1
8 R N 1 1 93 R N 1 1 78 R N O l
92 D s o 1 89 D s o 1 12 D s o o
57 R N 1 1 90 D s 1 o 84 R N O 1
52 D s o 1 64 D N 1 o 20 D N Oo
26 D N 1 1 63 R N O 1 44 D s o o
11 D s o 1 43 R N O 1 23 R N O 1
36 D s o o 80 D s o o 73 D N O o
96 D s o o 3 D N O o 72 R N O
ª PP = partido político; R = región de origen::Q =demócrata; R =republicano (siglas en el interior del cuadro); 1 y 5 =
cuestiones uno y cinco. Consúltese el texto para mayores explicaciones.

ocupemos del por qué), presentaremos un ejemplo teriór, asignamos números del 1 al 98 a los senadores
de muestreo y un diseño experimental. Los registros en la tablad el Times (después de omitir a los senado-
de votación de l 00 senadores del LXXXVI Congreso res de Hawaii) y seleccionamos 60 de ellos para el
Estadounidense sobre 12 puntos importantes, fue- experimento, en bloques de 20, por medio de tres
ron publicados en el New York Times el 20 de sep- páginas independientes de una gran tabla de núme-
tiembre de 1959. Con excepción de dos senadores ros aleatorios, después de que dichas páginas han
por Hawaii (que sólo votaron en dos de los puntos), sido seleccionadas en forma aleatoria, tomando
tenemos una población de 98 senadores, de la cual cualquier parte de una tabla entera y escogiendo tres
podemos extraer muestras. De esta población hay 64 números aleatoriamente.
demócratas y 34 republicanos, 65 senadores prove- Desde la primera página escogemos 20 números
nientes del norte y 33 provenientes del sur. Cada de dos dígitos y limitamos nuestra selección a núme-
senador votó en los 12 puntos anotados sí o no, ros que van del l al 98. Después, usamos la segunda
excepto cuando votaron en pro o en contra de un y tercera páginas y seguimos un método similar. Los
asunto, o estaban ausentes. Con base en lo anterior, tres grupos de 20 números se muestran en el cuadro
contamos con una población de senadores que 8-2,junto con la afiliación política y el origen (norte-
puede ser dividida en subpoblaciones de: republica- sur) de cada senador. Además, para un propósito
nos y demócratas, norteños y sureños, "los que que mencionaremos más adelante, anotamos los vo-
votaron Sí y los que votaron No". tos que los senadores emitieron sobre las cuestiones
Suponga que llevamos a cabo un experimento con uno y cinco, y asignamos un punto (1) si el senador
tres grupos de 20 senadores cada uno. La naturaleza votó afirmativamente, y cero si votó en forma nega-
del experimento no tiene gran importancia en este tiva.
contexto, pero nos interesa en este caso probar la ¿Qué tan "iguales" son los grupos? En una pobla-
eficacia de una película cinematográfica que muestra ción total de 98 senadores, 64 son demócratas y 34
los horrores de una guerra nuclear, para cambiar las republicanos, o sea, 65 por 100 y 35 por 100. En la
actitudes de los senadores en favor de la prohibición muestra total de 60, hay 41demócratasy19 republi-
de las pruebas atómicas. Queremos que los tres gru- canos, o sea 68 por 100 y 32 por 100, una diferencia
pos de senadores sean aproximadamente iguaJes en de 3 por 100, únicamente. Se tienen 65 norteños y 33
todas las características posibles. Para lograr lo an- sureños en la población, o sea 66 por 100 y 34 por
MUESTREO Y ALEATORIEDAD 89

Cuadro 8-3. Frecuencias obtenidas y esperadas en relación con el partido político


(demócrata) y región (norte) en muestras de 20 senadores"

Grupos

I II III Total
pp R PP R pp R pp R

Frecuencia obtenida 14 10 13 12 14 16 41 (683) 38 (633)


Frecuencia esperada 13 13 13 13 13 13 39 (653) 39 (663)
Desviación l 3 o 3 2 1

ªEn este cuadro solamente mostramos datos del mayor de los dos subgrupos producidos al dividir el grupo original en
demócratas y republicanos, que es el demócrata, y de manera semejante, sólo indicamos los norteños. PP = partido
político; R = región. Las frecuencias esperadas han sido redondeadas en la cifra superior unitaria.

100. En la muestra de 60, hay 38 norteños y 22 manera similar, al multiplicar 60 por .30 y por .51 se
sureños o sea 63 por 100 y 37 por 100, de nuevo con obtienen las frecuencias esperadas de 18 y 31. El
una diferencia de 3 por 100. Calculemos las frecuen- cuadro 8-4 incluye los resultados de este análisis.
cias para los tres grupos de 20 senadores cada uno. Todas las desviaciones obtenidas de las frecuencias
En el cuadro 8-3 aparecen los datos sobre la afilia- esperadas son pequeñas (con una excepción posible:
ción política y la región de origen. Puede apreciarse el Grupo I, punto cinco). No se desvían mucho de las
que las frecuencias obtenidas en cada muestra en expectativas debidas al azar.
base a las dos variables, se acercan a las frecuencias
esperadas o calculadas.(8) En la muestra total de 60
cabria esperar 39 demócratas y 39 norteños. En Asignación aleatoria
nuestra muestra obtuvimos 41 demócratas y 38 nor- En vez de considerar esta demostración como un
teños. Estas diferencias son sólo fluctuaciones por problema de muestreo, podemos tomarla como un
azar. Sin duda, pudimos "igualar" los grupos en problema de asignación experimental. Supóngase
cuanto a partido político y región de origen. Ade- que disponemos de 60 senadores para realizar nues-
más, la muestra total de 60 y las tres muestras de 20 tro experimento. No interesa tanto el conjunto de los
parecen ser representativas de la población total de 60 senadores como una muestra aleatoria de todo el
98 personas, cuando menos en lo que respecta a senado; sólo nos interesa probar la eficacia de la
estas dos variables. cinta cinematográfica señalada, para cambiar las ac-
Ahora revisemos los votos de los senadores. Para titudes en favor de la prohibición de armas atómicas.
hacerlo, empleamos los puntos 1 y 5. Simplemente En otras palabras, en el experimento contamos con
contamos los números 1 (respuestas afirmativas) en 60 senadores que podemos manejar: no constituyen
cada columna, y comparamos los totales con el nú- una muestra aleatoria del grupo de 98 senadores.
mero esperado de unos ( 1), esto es, se cuentan res- Esta situación experimental se asemeja a muchas
puestas afimrntivas sobre cada punto y se calcula la otras en las que necesitamos trabajar con grupos en
proporción de respuestas afirmativas correspon- su forma original, esto es, intactos. Debemos tomar-
dientes en cada muestra de 20 y en la muestra total de los como son, clases intactas de escolares de quinto
60. Por ejemplo, en el grupo total de 98 senadores, 29 y sexto grado, uno o dos grupos de alumnos de
votaron afirmativamente en cuanto a la cuestión segundo grado universitario, una asociación de pa-
uno, y 50 afirmativamente por la cuestión cinco, o dres y maestros bien dispuesta, y así sucesivamente.
sea proporciones de 29/98 = .30 y 50/98 = .51. Si En estos casos podemos usar asignación aleatoria a
multiplicamos 20 x . 30 y por .51, obtenemos 6 y JO, grupos.
respectivamente, como el número de votos afirmati- Para asignar a los 60 senadores a los tres grupos,
vos esperados para las cuestiones uno y cinco. De necesitamos numerarlos del 1 al 60 y extraer los
números del 1 al 60 de una tabla de números aleato-
(8) Las frecuencias esperadas se calculan de esta forma: 'de la rios, en alguna forma especifica. Los primeros 20
población total de 98 personas se extraen las proporciones de números extraídos (y los senadores correspondien-
demócratas, republicanos, norteños y sureños y se emplean estas tes a dichos números) constituyen un grupo; los
proporciones o porcentajes para calcular las frecuencias esperadas segundos 20 números constituyen otro grupo, y los
en las muestras de 20. Por ejemplo. 64 senadores son demócratas;
en consecuencia, 64/98 = .65. En el grupo de 20: 20 x .65 = 13, que terceros corresponden también al tercer grupo de
es el número de demócratas que cabe esperar en cada una de las personas. (En esta situación asignmíamos los trata-
muestras de 20 personas. mientos experimentales en forma aleatoria a los tres
90 PROBABILIDAD, ALEATORIEDAD Y MUESTREO

Cuadro 8-4. Frecuencias obtenidas y esperadas de votos afirmativos y negativos


de los senadores, sobre las cuestiones 1 y 5 8

Grupos
I II III Total

1 5 5 5 5

Frecuencia obtenida 7 13 6 9 5 8 18 30
Frecuencia esperada 6 10 6 10 6 10 18 31
Desviación 1 3 o 1 l 2 o 1

ªSi un senador emitió un voto afirmativo se contó como frecuencia. Las cifras del cuadro se leerían, por ejemplo
(primera columna): en la primera muestra de 20 senadores (l), siete votaron afirmativamente, en tanto que se esperaba que
seis lo hicieran así, lo cual produjo una diferencia de un punto.

grupos.) La operación anterior recibe el nombre de que debe formularse es: ¿cuánto error puede haber
"asignación aleatoria", y guarda relación estrecha en los datos estadísticos calculados a partir de mues-
con la extracción aleatoria de muestras. Ambas se tras de tamaños diversos? La curva de la figura 8-1
basan en el principio de•• aleatorización". De hecho, expresa de manera somera las relaciones entre el
podemos considerar la asignación aleatoria como tamaño de la muestra y el error, entendido como
una extracción aleatoria d·e muestras. En este caso desviación o divergencia a partir de los valores de la
seria el muestreo aleatorio de los 60 senadores, con- población. La curva señala que cuanto menor sea la
siderados como una población. Es decir, cada uno muestra, mayor será el error, y cuanto mayor sea la
de los grupos de 20 senadores constituye una mues- muestra menor será el error.
tra aleatoria del grupo total de 60 (no es una muestra Analicemos el siguiente ejemplo extremo de 10
aleatoria de los 98 senadores). En resumen, hacemos conjuntos de dos números cada uno, seleccionados
una asignación aleatoria de los sujetos, para contar por medio de una tabla de números aleatorios, de
con grupos de experimentación que suponemos una población de 293 mediciones del cociente inte-
iguales, dentro de los límites del azar, en cuanto a lectual, elaborada por Tate. Estas cifras del cociente
todas sus caracteristicas posibles. intelectual fueron por sí mismas una muestra de una
Podemos ahora emprender nuestro experimento población mucho mayor del cociente intelectual.
en el supuesto de que los tres grupos son "iguales", Las consideramos como población de la cual pode·
lo cual puede no ser cierto. A semejanza de las mos extraer nuestras pequeñas muestras. Conviene
muestras "prejuiciadas" obtenidas de poblaciones, que el lector analice el cuadro 8-5. Advertirá que las
también podemos hacer una asignación prejuiciada. medias de las muestras divergen muy extensamente:
Sin embargo, las probabilidades están a nuestro fa- los límites o "rangos" oscilan entre 84.5 y 108.5, o
vor. Como hemos advertido, el método puede fun-
cionar adecuadamente. Nuestra revisión de las ca-
racteristicas de los senadores en los tres grupos mos-
tró que los grupos estaban bastante "igualados" en Grande
cuanto a preferencia política, región de origen y
votos afirmativos o negativos. Sobre esta base po-
demos tener mayor confianza de que si los grupos se
tornaran desiguales en las actitudes respecto a la
prohibición de pruebas atómicas, las diferencias
Error
probablemente se deberían a nuestra manipulación
experimental y no a diferencias que existían entre los
grupos antes de que comenzáramos.

Tamaño de la muestra Pequeña


U na regla general útil para los estudiantes novatos
en investigación es: emplear las muestras más gran- Pequeña Grande
des posibles. Cuando se calcula una media, un por- Tamaño de la muestra
centaje u otra cifra estadística a partir de una mues-
tra, se estima un valor de la población. Una pregunta Figura 8-1.
MUESTREO Y ALEATORIEDAD 91

=
Cuadro 8-5. Muestras (n 2) del cociente intelectual de una población de 293
cifras (cociente intelectual) de niños de cuarto gradoª

Muestras
117 85 84 92 83 82 83 96 93 101
75 84 107 103 87 96 100 121 103 79
Media: 96.0 84.5 95.5 97.5 85.0 89.0 91.5 108.5 98.0 90.0
Media de los totales = 93.55

ªTomado de M. Tate, Statistics in Education. Nueva York: Macmillan, 1955, págs. 537-545.

sea, 24.0 puntos de cociente intelectual. La media de cipio de asignación aleatoria o la simple aleatoriedad
las 20 puntuaciones es de 93.55. Con muestras muy pueda "operar", para hablar en sentido antropo-
pequeñas como las comentadas no podemos depen- mórfico. Se puede hallar un ejemplo más patente de
der demasiado de cualquier media o estimación de la lo que intentamos explicar en los datos del cuadro
cifra de la población, pero al parecer, podemos de- 8-2. Analicemos la afiliación política de los primeros
pender mucho más de la media total (calculada a IO casos del grupo III, y advertiremos que todos son
partir de las 20 cifras de cociente intelectual) como demócratas. Supongamos ahora que hemos elegido
una estimación de esta índole. (La media de la po- "trabajar" experimentalmente sólo con dos grupos
blación de 293 cifras de cociente intelectual es 95.0.) de IO personas, uno de los grupos incluía a esos IO
Con base en los datos de Tate se extrajeron aleato- demócratas y el otro, los 10 casos restantes del grupo
riamente otras cuatro muestras de 20 cifras del co- III. Si nuestro experimento guardara relación con la
ciente intelectual cada una. Las cinco medias (in- preferencia política, los resultados estarían total-
cluida la media de la muestra de 20 cifras de IQ del mente "prejuiciados". Sin embargo, con grupos de
cuadro 8-5) fueron: 93.55; 90.20; 97.50; 94.80 y 20 personas este peligro es menor.( 10)
90.50. La media de las 100 cifras de cociente intelec-
tual fue 93.3 l. Tipos de muestras
Ahora estamos en posición de contestar algunas Hastá el momento hemos limitado esta exposición
preguntas. En primer lugar, las estimaciones esta- sobre el muestreo, al muestreo aleatorio simple, con
dísticas calculadas en base a muestras grandes son el fin de que el estudiante comprenda los principios
más precisas, siempre que los demás factores sean fundamentales. Para ello hemos insistido en la idea
iguales, que las calculadas a partir de muestras pe- del muestreo aleatorio simple, sobre el cual des-
queñas. Los rangos de las medias de muestras de 20 cansa gran parte de los criterios, ideas y métodos de
datos fueron 90.20 a 97.50 ó 7.30 puntos de IQ, un la investigación actual. Sin embargo, el lector debe
rango relativamente pequeño cuando se considera la percatarse de que además de este tipo de muestreo
variabilidad de las cifras de IQ (los límites del rango hay otros que se usan en la investigación actual, y
van de 54 a 125). Por otra parte, los límites de oscila- que el uso del muestreo simple es poco frecuente,
ción de las medias de las 10 muestras de dos cocien- cuando menos para describir características de po-
tes intelectuales, cada uno, fueron de 84.5 a !08.5 ó blaciones y relaciones entre tales características. No
24.0 puntos de cociente intelectual. Las medias de obstante, es el modelo en el cual se funda toda la
nuestras muestras de 20 mediciones también atesti- extracción científica de muestras.
guan la mayor precisión de las muestras grandes. Por Otros tipos de muestras pueden clasificarse en
lo regular se acercan más a la media de población, forma general, en muestras probabilísticas y no pro-
que es 95 .O, que las medias de las muestras de dos babilísticas y en algunas formas mixtas. Las mues-
mediciones. tras probabilísticas emplean alguna forma de ex-
El lector debe advertir con claridad por qué el tracción aleatoria en una o más de sus etapas. Las
principio de investigación y obtención de muestras muestras no probabilísticas no emplean la extrac-
es: usar muestras grandes.(9) No se recomienda el ción aleatoria, por lo que carecen de las característi-
empleo de las muestras grandes porque un gran nú- cas antes comentadas. Aún así. a menudo son nece-
mero de objetos o sujetos sea satisfactorio y por sí sarias e inevitables. Sus deficiencias pueden ser
mismo. Se le recomienda más bien para que el prin- compensadas en cierto grado por el empleo de cono-

(9) La situación es más compleja de lo que indica esta afirmación. ( 10) Esta serie de 10 demócratas es rara. Muy pocas veces ha
Las muestras que son demasiado grandes pueden ser peligrosas, y aparecido en la práctica en toda la extracción aleatoria de muestras
explicaremos en un capítulo ulterior las causas de este problema. que el autor ha hecho. Pero puede ocurrir. y de hecho ocurre.
92 PROBABILIDAD, ALEATORIEDAD Y MUESTREO

cimientos, experiencias y cuidado para elegir las forma aleatoria a partir de los números 1hastak, y se
muestras, y por la "replicación" de estudios, con eligen los elementos subsecuentes a intervalos da-
diferentes muestras.( 1I) dos (intervalos k). Por ejemplo si el elemento que se
Una forma de muestreo no probabilístico es el elige al azar del 1 al 10 es el 6, los elementos siguien-
llamado muestreo por cuota, en el cual se utilizan tes serán 16, 26, 36, y así sucesivamente. Por su-
conocimientos de los estratos de la población -sexo, puesto, el estudiante que se dedique a investigación
raza, región u otros- para seleccionar muestras de debe conocer más a fondo estos métodos y consultar
miembros que sean representativos, "típicos'' o algunos de Jos textos excelentes de consulta.(12)
adecuados para algunos fines de investigación. El Como indicamos en líneas anteriores, los grandes
muestreo por "cuota" deriva su nombre de la prác- progresos en la investigación científica se han ba-
tica de asignar' 'cuotas'' o proporciones de clases de sado en la aleatoriedad, la aleatorización, y la ex-
personas a los entrevistadores. Este muestreo se ha tracción aleatoria de muestras. Si bien puede ha-
empleado mucho en encuestas de opinión pública. cerse la investigación sin emplear la aleatoriedad, es
Otra forma de muestreo no probabilístico es el lla- difícil concebir la forma en que se obtendrá viabi-
mado intencional, que se caracteriza por el empleo lidad y validez, cuando menos en casi todos los
del criterio y de un esfuerzo deliberado para obtener aspectos de la investigación de la ciencia del com-
muestras representativas mediante la inclusión de portamiento. Por ejemplo, las nociones actuales so-
áreas típicas o grupos supuestamente típicos en la bre el diseño de investigación, muestreo e inferen-
muestra. El llamado muestreo accidental, que es la cia, no serían concebibles si no contáramos con el
forma más deficiente de muestreo, probablemente concepto de la aleatoriedad. Una de las paradojas
sea también el más frecuente. De hecho, aprovecha más interesantes es que por medio de la aleatoriedad
las muestras disponibles: grupos de alumnos en la o "desorden", podemos lograr control sobre las
escuela secundaria; alumnos de segundo grado en complejidades a menudo sorprendentes de los fe-
cursos universitarios; una muestra conveniente de la nómenos psicológicos, sociológicos y pedagógicos.
asociación de padres y maestros, y otros grupos. Es El científico impone orden al aprovechar sus cono-
difícil defender este sistema. Sin embargo, empleado cimientos sobre la conducta de Jos conjuntos de
con conocimiento y cuidado razonables, probable- eventos aleatorios. Su asombro es perpetuo ante lo
mente no sea tan malo como se ha dicho. La reco- que podría llamarse la belleza estructural de la pro-
mendación más juiciosa parece ser: evitar las mues- babilidad, el muestreo y la teoría del diseño y por la
tras accidentales de modo que no se cuente con otras enorme utilidad que tienen para resolver problemas
muestras -las muestras aleatorias suelen ser caras y difíciles de diseño y planeación de investigación, y
en términos generales difíciles de obtener-y en caso análisis e interpretación de datos.
de emplearlas se ha de tener enorme cautela en el Antes de cerrar el tema, retomaremos la noción de
análisis e interpretación de los datos. aleatoriedad que mencionamos al principio del capí-
El muestreo probabilístico incluye diversas for- tulo. Para un ser omnisciente no existiría la aleato-
mas; las más generales son el muestreo estratificado riedad. Por definición, él "sabría" la ocurrencia de
y el muestreo por "grupos". En el muestreo estrati- todo evento, con certidumbre absoluta.( 13) Como
ficado la población se divide en estratos, por ejem- Poincaré señala, enfrentarse a dicho ser en un juego
plo, varones y mujeres, personas de raza negra y de azar sería una aventura perdida de antemano. De
raza blanca, y así sucesivamente, y de esta pobla- hecho, no sería un juego de azar. Si se lanzara al aire
ción se extraen las muestras aleatorias. El muestreo una moneda 10 veces, el ser omnisciente predeciría
por grupos, que es el método más usado en las en- el número de veces en que aparecería cara o cruz,
cuestas, consiste en la extracción sucesiva y aleato- con certidumbre y precisión absolutas. Si se arroja-
ria de unidades, conjuntos o subconjuntos. Por ran los dados conocería infaliblemente de antemano
ejemplo, en Ja investigación pedagógica pueden todos los resultados. Incluso podría predecir cada
muestrearse aleatoriamente los distritos escolares número en una tabla de cifras aleatorias y, sin duda,
de un estado o condado, después, escuelas, después no tendría necesidad de la investigación ni de la
grupos de clases y, por último, alumnos. Otro tipo de ciencia. Según este contexto parece que estamos
muestreo por probabilidad (si es que se le puede afirmando que el azar es sinónimo de la ignorancia.
llamar así), es el llamado muestreo sistemático. En Si, a semejanza del ser omnisciente, supiéramos to-
él, el primer elemento de la muestr,a se escoge en
(12) Véase el pie de nota 11. Uno de los mejores textos especial-
(11) Consultar l. Chein, "An lntroduction to Sampling.'' En C. mente en lo que se refiere al muestreo de encuestas es: L. Kish,
Selltiz y col., Researclt Metltods in Social Relations. ed. rev. ""Selection of the Sample." En L. Festinger y D. Katz, dir .. Re-
Nueva York: Holt, Rinehart and Winston, 1959. págs. 509-545. search Metltods in 1he Behavioral Sciences. Nueva York: Holt.
Este libro constituye una buena introducción sobre los métodos de Rinehart and Winston, 1953, págs. 175-239.
muestreo. También puede encontrarse una exposición clara de los ( 13) Para una exposición elocuente de este tema, conviene leer el
tipos distintos de muestreo en la obra de F. Stcphany P. McCarthy, ensayo de Poincaré sobre la casualidad. H. Poincaré, Science and
Sampling Opinions. Nueva York: Wiley. 1963 ( 1958), cap. 3. Metlwd. Nueva York: Dover, 1952, págs. 64-90.
MUESTREO Y ALEATORIEDAD 93

das las causas que contribuyen a los efectos y fenó- entre 50. ¿La media es semejante o se apro-
menos, no habria azar. La belleza de este asunto, xima a la cifra esperada o calculada por azar?
como señalamos, radica en que el ser humano usa (Sugerencia: para obtener la cifra esperada
esta "ignorancia" y la transforma en conocimiento. por azar, recuerde los límites de la población.)
La forma en que lo realiza se apreciará con claridad 2. Este es un ejercicio y demostración en la clase.
en el transcurso de nuestra exposición. Asigne arbitrariamente números a todos los
alumnos de la clase, desde 1 hastaN, y N será el
Guías de estudio número total de miembros del grupo. Utilice una
Se recomienda al lector que practique diversos tabla de números aleatorios y comience las ope-
experimentos con eventos azarosos como: juegos raciones en cualquier página. Haga que algún
con monedas, dados, cartas, ruletas y tablas de nú- alumno con los ojos cerrados elija con un lápiz
meros aleatorios. Si analiza con cuidado estos jue- cualquier página de la tabla. En el número de la
gos, podrá compenetrarse en forma notable en las página que indique el lápiz, elija un número dado
nociones fundamentales de la investigación cientí- de cifras de dos dígitos entre 1 y N (desechando
fica actual, estadística, probabilidad y, por su- los números mayores de N y los números repeti-
puesto, aleatoriedad. En las Guías de Estudio si- dos), al recorrer las columnas hacia abajo (o cual-
guientes señalamos algunas formas de abordar los quier otro método especificado de antemano). N
problemas. Conviene que en este punto y en otros es el numerador de la fracción n!N, que depende
del libro, el lector no se sienta desalentado por la del número de personas que integran el grupo
aparente laboriosidad de estos ejercicios. En algu- (tamaño de la clase). Por ejemplo, si N = 30,
nos problemas es necesario y a veces útil seguir el supóngase que n = 10. Repita esta maniobra dos
sistema señalado. Después de trabajar y resolver los veces en otras páginas de la tabla de los números
problemas señalados, conviene que elabore algunos aleatorios. Ahora tiene usted tres grupos iguales
por cuenta propia. Si puede crear problemas inteli- (si N no es divisible entre tres, elimine una o dos
gentes, ya habrá avanzado notablemente en la com- personas al azar). Escriba los números aleatorios
prensión de estos asuntos. en un pizarrón, en tres grupos. Pida a cada
l. Con base en una tabla de números aleatorios, alumno que señale su altura en pulgadas o centí-
extraiga 50 números, del cero al nueve. (Puede metros. Escriba estas cifras en el pizarrón, sepa-
usar la tabla de números aleatorios del Apéndice radas de los números, pero divididas en los mis-
D, si así lo desea.) Colóquelos en columnas de 10 mos tres grupos. Sume los tres conjuntos de nú-
cifras cada una. meros de cada uno de los grupos escritos en el
a) Conviene que cuente el número total de cifras pizarrón, los números aleatorios y las cifras de
nones y también el número total de cifras pa- estaturas. Calcule la media de los seis conjuntos
res. ¿Qué resultados cabría esperar por azar? de números y también la media del total de los
Compare los totales obtenidos, con los totales conjuntos.
esperados. a) ¿Qué tanto se aproximan entre sí las medias de
b) Cuente el número total de veces en que apare- cada grupo de números? ¿Qué proximidad
cen las cifras cero, uno, dos, tres, cuatro, y guardan las medias de los grupos con la media
también los números cinco, seis, siete, ocho y del total de grupos?
nueve. ¿Cuántas de las cifras del primer b) Cuente el número de varones y mujeres en
grupo, esto es, cero, uno, dos, tres y cuatro, cada grupo. ¿Están distribuidas de modo uni-
obtuvo? ¿Y del segundo grupo? Compare las forme en los tres grupos las personas de u no y
cifras que obtuvo, con las expectativas por otro sexos?
azar. ¿Qué tanto difieren de las cifras calcula- e) Comente esta demostración. En su opinión,
das? ¿qué importancia o significado tiene en la in-
e) Cuente los números nones y pares de cada vestigación?
grupo de 10. Cuente los dos grupos de núme- 3. En el capítulo 6 sugerimos que el estudiante ela-
ros, esto es, cero, uno, dos, tres y cuatro, y borara 20 grupos de 100 números aleatorios entre
después los cinco, seis, siete, ocho y nueve en el cero y el 100, y que calculara las medias y las
cada grupo de 10. ¿Los totales difieren mucho varianzas. Si el lector hizo este ejercicio, podrá
de las cifras esperadas por azar? emplear los números y las cifras estadísticas en
d) Sume las columnas de los cinco grupos de IO las recomendaciones que ahora daremos. Si no lo
números cada uno, y divida el total entre 10. hizo, conviene que emplee los números y cifras
(Simplemente mueva el punto decimal un lu- estadísticas que aparecen en el Apéndice D,
gar hacia la izquierda.) ¿Qué resultado cabría al final del libro.
esperar como a la media de cada grupo si so- a) ¿Qué tan cerca están las medias de las 20
lamente interviniese el· azar? ¿Qué obtuvo? muestras, de la media de la población? ¿Al-
Haga las cinco sumas y divida el resultado guna de las medias se ha ''desviado" o es
94 PROBABILIDAD, ALEATORIEDAD Y MUESTREO

al calcular la desviación estándar de las me- e) Escoja la media del tercero, quinto y noveno
dias, y sumar y restar dos desviaciones están- grupos. Suponga que se han asignado aleato-
dar, a la media total.) riamente 300 personas a los tres grupos, y que
b) Con base en el inciso a, el criterio del lector: esas fueron las puntuaciones de alguna medida
¿son "representativas las muestras? ¿Qué de importancia para un estudio que usted pla-
significado tiene el término representa- nea hacer. Con base en las tres medias: ¿a qué
tivo? conclusiones podría usted llegar?
PARTE 4
Análisis, interpretación, estadística e inferencia
CAPITULO 9
Principios del análisis y de la interpretación

El investigador analista divide los datos en sus dio y sus datos. Esto constituye el empleo más limi-
partes constitutivas, para dar respuesta a preguntas tado y frecuente del término interpretación, pues en
de investigación y someter a prueba las hipótesis de este caso la interpretación y el análisis se entrelazan,
experimentación. Sin embargo, el análisis de los da- así se hace la interpretación automáticamente
tos por sí mismo no proporciona las respuestas a las cuando se hace el análisis. Es decir, cuando se cal-
preguntas de investigación. Se requiere la interpre- cula, por ejemplo, un coeficiente de correlación. se
tación de los datos. Interpretar es explicar, hallar el infiere casi de inmediato la existencia de una rela-
significado. A menudo, es difícil o imposible expli- ción, y se deduce su importancia en relación con el
car datos "brutos", y lo primero que debe hacerse es problema de investigación, conforme se ordena, se
analizarlos y después interpretar los resultados del dividen y manipulan los datos.
análisis. En segundo lugar, el investigador busca el signifi-
Analizar significa establecer categorías, ordenar, cado más amplio de Jos datos de investigación. Esto
manipular y resumir los datos, para obtener respues- se logra al comparar los resultados de la inferencia
tas a las preguntas de investigación. Con el análisi,· extraídos de los datos, con la teoría y con otros
se busca reducir los datos a una forma inteligible e resultados de la investigación. Se busca el signifi-
interpretable, de tal forma que se puedan estudiar y cado e implicaciones entre los resultados de la pro-
poner a prueba las relaciones de los problemas en pia investigación y las conclusiones, sean propias o
investigación. Por ejemplo, una de las metas básicas de otros investigadores.( 1) Y lo que es más impor-
de la estadística es manipular y resumir datos numé- tante, el investigador compara los resultados pro-
ricos, y comparar los resultados obtenidos con los pios con las exigencias y expectativas de la teoría.
resultados esperados por azar. Un investigador Un ejemplo que puede ilustrar estas ideas es la
plantea la hipótesis de que los estilos de "liderazgo" investigación sobre la percepción de las característi-
afectan o influyen la participación de los miembros cas de un maestro.(2) Con base en la llamada teoría
de un grupo en determinadas formas. Para probarla, del estado directivo y de la percepción social,(3) se
planea un experimento, lleva a cabo el plan y obtiene predijo que las percepciones o juicios de caracterís-
datos de sus sujetos. Después. debe ordenar, dividir ticas deseables en los maestros eficaces. estarían en
y manipular los datos que puedan contestar la pre- parte determinadas por las actitudes que tenían ha-
gunta: ¿cómo afectan los estilos de "liderazgo" la cia la educación las personas que hacían los juicios.
participación de los miembros de un grupo? Debe Supongamos que tenemos medidas de las ac:itudes
advertirse que este enfoque de análisis significa que hacia la educación y medidas de las percepciones o
la categorización, el ordenamiento y el resumen de
los datos, deben planearse al inicio de ·1a investiga- ( 1) Esta distinción se debe a M. Jahoda, M. Deutsch y S. Cook.
ción. El investigador debe establecer paradigmas o Research Metlwds in Social Re/ations, Nueva York: Holt, Ri-
modelos de análisis, incluso cuando trabaje en base a nehart and Winston, 1951, Vol. 1, págs. 252 y sigs.
un problema e hipótesis. Sólo en esta forma podrá (2) F. Kerlinger y E. Pedhazur. "Educational Altitudes and Per-
ceptions of Desirable Traits of Teachers," American Educational
entrever, incluso de manera algo imprecisa, si Researc/1 Jouma/, V ( 1968), 543-560.
sus datos y su análisis pueden y podrán resol- (3) La teoría del estado directivo es una teoría general de la
ver las preguntas formuladas en la investigación. percepción, que señala que nuestras percepciones de objetos ase-
En la interpretación el investigador toma resul- quibles al conocimiento, están teñidas por nuestras emociones,
necesidades, deseos, motivos, actitudes y valores. Por así decirlo,
tados del análisis, hace inferencias pertinentes a las estos últimos son estados "directivos" dentro del individuo, que
relaciones bajo estudio en la investigación, y extrae influyen en sus percepciones y juicios. Ver J. Bruner, "Social
conclusiones sobre tales relaciones. El investigador Psychology and Perception."' En E. Maccoby, T. Newcomb, y E.
que interpreta los resultados de una investigación los Hartley, dirs., Readings in Social Psyclw/ogy, ed. rev. Nueva
York: Holt, Rinehart and Winston, 1958, págs. 85-94. En la obra de
busca y estudia en cuanto a su significado e implica- F. Allport, Theories of Perceptio11 and the Concept of Structure.
ciones, cosa que hace de dos formas. En primer Nueva York: Wiley, 1955, caps. 13, 14, 15, el lector hallará un
lugar, se interpretan las relaciones internas del estu- comentario más completo sobre este tema.

96
PRINCIPIOS DEL ANALISIS Y DE LA INTERPRETACION 97

juicios sobre las caracteósticas de lo que constituye les: frecuencias y medidas continuas. Es obvio que
un maestro eficaz. Correlacionamos los dos conjun- las medidas continuas están relacionadas con las
tos de mediciones; se advierte que la correlación es variables continuas, y las frecuencias con las varia-
importante. Este es el análisis. Los datos han sido bles categóricas. Aunque ambos tipos de variables y
subdivididos en los dos conjuntos de medidas, que medidas pueden resumirse bajo el mismo marco de
después se comparan por medio de un método esta- referencia de las mediciones, en la práctica es útil e
dístico. incluso necesario diferenciarlas.
Ahora debe interpretarse un coeficiente de corre- Las frecuencias son simplemente el número de
lación que es el resultado del análisis: ¿cuál es su objetos en los conjuntos y subconjuntos. Suponga-
significado? De manera más específica: ¿cuál es su mos que U es el conjunto universal que incluye N
importancia dentro del estudio? ¿Cuál es su signifi- objetos. En este caso, N es el número de objetos en
cado más general a la luz de los hallazgos previos, U. Ahora imaginemos que U puede ser dividido en
relacionados con la investigación e interpretación? A 1, A2 . .. , Ak, y supongamos que n1, nz ... , nk
¿Cuál es el significado como confirmación o falta de constituyen el número de objetos en A 1,
confirmación de la predicción teórica? Si la predic- A2 ... , A;. En este caso n 1, n2 ••• , n;reciben el
ción "interna" es válida, entonces se relaciona el nombre de frecuencias.
dato con otros hallazgos de investigación que pudie- Es conveniente considerar lo anterior como una
ran ser o no congruentes con el hallazgo presente. función. Supongamos que X es un conjunto cual-
En este ejemplo la correlación fue importante. Por quiera de objetos cuyos miembros son {x1,
esta razón, en el contexto del estudio, el dato de x2, ... , x11 }. Deseamos medir un atributo de los
correlación concuerda con la expectativa teórica. La miembros del conjunto, al que designaremos por M.
teoóa del estado directivo señala que los estados Supongamos que Y={O, l}. Describiremos la medi-
centrales influyen las percepciones. La actitud es un ción como una función:
estado central y, en cónsecuencia, influye en la per-
cepción. La deducción específica es que las actitu- f es un miembro del conjunto
= {(x, y); x
des hacia la educación influyen las percepciones de X, y y es 1 ó O, según si el conjunto
un maestro eficaz. Medimos ambas variables y co- de las x tiene o no M}
rrelacionamos las cifras obtenidas. Con base en el Lo anterior se lee así: f, una función o regla de
coeficiente de correlación efectuamos un salto de- correspondencia es igual al conjunto de pares orde-
ductivo hasta llegar a la hipótesis: dado que la corre-
nados (x, y), de tal formaquex es unmiembrodeX, y
lación es substancial, como se predijo, la hipótesis
es l ó Oy, así sucesivamente. Six poseeM (determi-
queda apoyada por la evidencia. Después intenta-
nado en alguna forma empírica), se le asignará l. Si x
mos relacionar el hallazgo con otra investigación y
no posee M, le asignaremos O. Obviamente, lo ante-
otra teoría. De nuevo, en este caso, el hallazgo es
rior funciona en forma satisfactoria con variables
congruente con gran parte de la investigación sobre
como sexo, preferencia religiosa, pertenencia a una
la teoría del estado directivo y la percepción social, clase social, etc. También puede adaptarse a medi-
aunque pudiera diverger muchísimo de los experi- ciones continuas, por definición y convención. Para
mentos del laboratorio sobre percepción del tamaño apreciar la frecuencia de objetos con la caracteós-
de monedas y percepción de alimentos, de las medi- ticaM, contaremos el número de objetos a los que se
ciones de actitudes pedagógicas y las percepciones ha asignado el número l.
deseables de las caracteósticas de un buen maestro. En el caso de las medidas continuas, la idea básica
es la misma, y solamente cambian la regla de corres-
Medidas de frecuencia pondencia!, y los numerales asignados a los objetos.
y medidas continuas La regla de correspondencia es más complicada y los
numerales suelen ser O, l, 2, ... y fracciones de los
En el capítulo 3 se hizo una distinción entre las
mismos. En otras palabras, escribimos una ecuación
variables categóricas y las variables continuas. La de medición:
variable continua es aquélla capaz de incluir un con-
junto ordenado de valores dentro de un cierto rango, f ={(x, y); x es un objeto y
en tanto que una variable categórica es aquella que y= cualquier numeral}
contiene dos o más subconjuntos del conjunto de
objetos bajo medición, que son distintos e indepen- que es la forma general de la función.( 4) Esta disgre~
dientes, que no están ordenados, y de los que se síón es importante porque nos ayuda a apreciar la
piensa que cualquiera de sus miembros tiene el semejanza básica del análisis de frecuencia y el aná-
mismo valor en cuanto a la variable, que cualquier lisis de mediciones continuas.
otro miembro de este subconjunto. Puede estable-
cerse una diferencia similar en lo que respecta a los ( 4) Esta ecuación y las ideas que la fundamentan se explicarán en
datos cuantitativos que se dan en dos formas genera- detalle en el capítulo 25.
98 ANALISIS, INTERPRETACION, ESTADISTICA E INFERENCIA

Reglas de categorización las parroquiales y públicas, así como un númeron de


La primera etapa en cualquier análisis es la cate- niños de cada sistema escolar y medimos su honesti-
gorización. En el capítulo 4 señalamos que todo dad. Supongamos que lo mejor que podemos hacer
análisis se basa en la partición o división. Aquí anali- es calificar a cada niño como honesto o deshonesto.
zaremos las razones de tal aseveración. La categori- El paradigma para el análisis de frecuencias, sería:
zación es simplemente un sinónimo de partición, es
decir, una categoría es una partición o subdivisión. Honesto Deshonesto
Si se "categoriza" por algún método un conjunto de
objetos, lo único que en• realidad se hace es una Parroquial
partición de acuerdo a una regla. De hecho, la regla Frecuencias
indica la forma de asignar objetos del conjunto, a
Pública
particiones y subparticiones. Si esto es cierto, las
reglas de partición que estudiamos serán válidas
para los problemas de categorización. Sólo necesi- Si tuviéramos medidas continuas para la variable
tamos explicarlas, relacionarlas con los propósitos honestidad, el paradigma sería diferente:
básicos del análisis, y utilizarlas en situaciones prác-
Parroquial (1) Pública (2)
ticas de análisis.
En seguida se presentan cinco reglas para el esta-
blecimiento de categorías. Dos de ellas, (2) y (3), son
las reglas de "exhaustividad" y disyunción (incom- Medidas Y
patibilidad) comentadas en el capítulo 4. Otras dos
reglas; la(4) y la(5), en realidad pueden deducirse en
las reglas fundamentales (2) y (3). Sin embargo, las
colocamos en forma independiente, por razones Es claro que ambos paradigmas guardan relación
prácticas. directa con la hipótesis: los dos permiten al investi-
gador poner a prueba la hipótesis, aunque en formas
l. Las categorías se establecen con base en el problema y muy diferentes. El asunto es que, de hecho, el para-
propósito de la investigación. digma analítico es otra forma de plantear un pro-
2. Las categorías son exhaustivas. blema, una hipótesis o una relación. El hecho de que
3. Las categorías son mutuamente excluyentes e inde- en un paradigma se usen frecuencias en tanto que en
pendientes.
4. Cada categoría (variable) se deriva de un principio de el otro se utilicen medidas continuas, no altera de
clasificación. ninguna manera la relación que se pone a prueba. En
5. Todo esquema de categorización debe estar en un solo otras palabras, ambas formas de análisis son simila-
nivel del discurso. res en lo que respecta al aspecto lógico: ambas some-
ten a prueba la proposición de que el tipo de ense-
La primera regla es la más importante. Si las cate- ñanza afecta la honestidad. Difieren en los datos que
gorías no se establecen de acuerdo a las exigencias emplean, en las pruebas estadísticas, y en su sensibi-
del problema de investigación, no se podrá dar res- lidad y potencia.
puesta a las preguntas formuladas. Constantemente Existen varias cosas que podría hacer un investi-
preguntamos: ¿mi paradigma de análisis coincide gador y carecen de importancia para el problema. Si
como el problema de investigación? ¿El esquema de incluyó una, dos o tres variables en el estudio, sin
análisis me permite poner a prueba adecuadamente una razón teórica o práctica para hacerlo, entonces
mi hipótesis? Supongamos que la hipótesis es: "la el paradigma de análisis, cuando menos en parte,
enseñanza religiosa aumenta o mejora las caracterís- sería irrelevante para el problema. Para tomar un
ticas morales de los niños". La educación religiosa ejemplo extremo, supongamos que un investigador
ha sido definida como la "educación escolar bajo la reunió datos de una prueba de aprovechamiento de
influencia de una comunidad parroquial", como ca- ambos tipos de escuelas, y sometió a prueba las
racterística moral podríamos mencionar la honesti- diferencias en aprovechamiento, lo cual probable-
dad. La hipótesis, por consiguiente, es: "los niños mente no tendría relación alguna con el problema,
que asisten a escuelas de religiosos son más hones- pues a él le interesaban las diferencias morales y no
tos que los niños que asisten a escuelas laicas (públi- las diferencias de aprovechamiento entre los dos
cas)". (Ignoramos el problema para diseñar una tipos de escuelas y, por supuesto, entre la enseñanza
prueba adecuada para esta hipótesis y otras cone- religiosa y la enseñanza laica (no religiosa). Podría
xas.) Todo dato que se reúna, todo análisis que se introducir otras variables en el contexto de su expe-
emplee, deberá guardar relación directa con esta rimento que no guarden relación alguna con el pro-
hipótesis. blema, o si la guardan sea muy pequeña; por ejem-
El tipo más sencillo de análisis es el de frecuen- plo, diferencias en la experiencia y preparación del
cias. Escogemos muestras aleatoriamente de escue- maestro, o proporciones entre maestros y alumnos.
PRINCIPIOS DEL ANALISIS Y DE LA INTERPRETACION 99

Si por otra parte, él pensó que algunas variables cada sujeto), sea asignado a una casilla y solamente a
como el sexo, formación religiosa familiar y tal vez ella en el paradigma de análisis. Esto es una función
variables de la personalidad, interactuarían con la de la definición operacional. Las definiciones de las
enseñanza religiosa para producir diferencias, en- variables deben ser claras y precisas, de tal forma
tonces tendría justificación para introducir dichas que sea improbable asignar un sujeto a más de una
variables en el problema de investigación y, en con- casilla. Si la preferencia religiosa es la variable por
secuencia, en el paradigma de análisis.(5) definir, la definición para asignar los sujetos a los
La regla 2 de la exhaustividad, significa que hay subconjuntos Protestante, Católico y Judío, debe ser
que "agotar" a todos los sujetos (todos los miem- clara y precisa. Puede ser ''miembro registrado de
bros del universo de U). Todos los individuos del una iglesia", o bien creado dentro de una religión.
universo deben poder asignarse a las casillas del Puede ser simplemente la aceptación e identificación
paradigma analítico. En el ejemplo recién conside- de la persona como protestante, católica o judía. Sea
rado, cada niño o va a la escuela parroquial o va a la cual sea la definición debe permitir que el investiga-
escuela pública. Si de algún modo el muestreo hu- dor asigne a toda persona o sujeto, a una y sólo a una
biese incluido niños que acuden a escuelas privadas de las tres casillas.
se habría violado la regla, porque habría un número El requisito de independencia señalado por la ter-
de niños que no podrían ser incluidos en el para- cera regla suele ser difícil de satisfacer, en especial
digma 2 x 2. Si el problema de investigación incluía con medidas continuas, y a veces con las frecuen-
necesariamente alumnos de escuelas privadas, en- cias. La independencia denota que la asignación de
tonces habría sido necesario cambiar el paradigma 2 un sujeto a una casilla no afecta la asignación de otro
x 2,porunparadigma3 x 2, y añadir a las categorías objeto a la misma casilla o a otra. Por supuesto, la
de escuela parroquial y escuela pública, la categoría asignación aleatoria, a partir de un universo infinito
de escuela privada. o grandísimo, satisface esta regla. Sin asignación
No siempre es fácil satisfacer el criterio de ex- aleatoria, tendríamos problemas. Cuando se asignan
haustividad. Con algunas variables categóricas no objetos a las casillas en base a las características que
hay problema. Si el sexo es una de las variables, toda ellos poseen, la asignación de un objeto en un mo-
persona ha de ser varón o mujer. No obstante, su- mento dado puede afectar a la asignación de otro
pongamos que la variable en estudio fuera la prefe- objeto, más tarde.
rencia religiosa y que hubiéramos elaborado un pa- La cuarta regla, que establece que cada categoría
radigma que incluyera protestantes, católicos y ju- (variable) debe ser derivada de un principio de clasi-
díos. Ahora supongamos que algunos sujetos son ficación, a veces es transgredída por el neófito. Si la
ateos o budistas. Claramente el esquema de catego- persona tiene una idea firme de lo que es la partición,
rías viola la regla de exhaustividad: algunos sujetos este error puede evitarse fácilmente. La regla señala
no podrían ser asignados a las casillas. De acuerdo que al establecer un diseño de análisis, cada variable
con el número de casos y el problema en investiga- tiene que ser tratada por separado, porque cada una
ción, cabría añadir otra categoría, es decir, otra a la de ellas constituye una dimensión diferente. No se
cual asignaríamos a toda persona que no fuese pro- deben colocar dos o más variables en una categoría o
testante, católica o judía. Otra solución, en especial en una dimensión dada. Si, por ejemplo, estudiára-
cuando el número de "otras" personas es pequeño, mos las relaciones entre clase social, sexo y adicción
consiste en eliminarlas del estudio, y otra más, en a las drogas, no sería adecuado colocar en la misma
colocar a estas "otras personas", si es posible, en dimensión la clase social y el sexo. Si se estudiaran
alguna de las rúbricas ya existentes. Otras variables, las relaciones entre métodos pedagógicos, tipos de
en las cuales surge este problema, son las preferen- motivación y aprovechamiento escolar, el investi-
cias políticas, clases sociales, tipos de educación, gador no debe colocar juntos en una dimensión los
tipos de preparación del maestro, etc. métodos pedagógicos y los tipos de motivación. Di-
La regla 3 a menudo es motivo de preocupación cho error podría adoptar la siguiente forma.
para los investigadores. El requisito de que las cate-
gorías sean mutuamente excluyentes, como hemos Método l Método 2 Tipo a Tipo b
señalado, obliga a que cada objeto de U, cada sujeto
de investigación (en realidad la medida asignada a
PUNTUACIONES
DE APROVECHAMIENTO
(5) En el siguiente capítulo consideraremos someramente lo refe-
rente al análisis de frecuencia con más de una variable indepen-
diente. En capítulos ulteriores se prestará mayor atención al análi-
sis de medidas de frecuencia y continuas, con variables indepen- Es evidente que este tipo de paradigma transgrede
dientes. No es necesario que el lector comprenda a fondo los
la regla: tiene una categoría derivada de los princi-
ejemplos como los que hemos presentado en este apartado y los de
las figuras 9-1 y 9-2, pues más adelante se darán explicaciones pios de clasificación. Los paradigmas precisos de-
aclaratorias. ben ser semejantes al de la figura 9:1 (análisis de
100 ANALISIS, INTERPRETACION, ESTADISTICA E INFERENCIA

Métodos

Tipos

Aprovechamiento FRECUENCIAS

Figura 9-1.

frecuencia) o figura 9-2 (análisis de medidas conti- de la inferencia estadística, y la relación de ambas
nuas). Si el estudiante usa letras diferentes para cada con la investigación. En esta sección comentaremos
variable A, B, C, ... , con subcategorías A i, brevemente las principales formas de análisis esta-
A 2, • • • , Bi, B2, ... , posiblemente no cometa dístico para que el lector tenga un conocimiento
este error. general del tema. Sin embargo, se comentan sólo en
La regla 5 es la más difícil de explicar porque el la relación que guardan con la investigación. Se su-
término "nivel de discurso" es dificil de precisar. En pone que el lector tiene conocimientos elementales
un capítulo previo lo definimos como el conjunto que de estadística descriptiva. Si carece de ellos, puede
contiene todos los objetos que intervienen en un hallarlos en textos elementales.(7)
discurso. Si empleamos la expresión "universo de
discurso", enlazaremos la idea con las ideas sobre Distribuciones de frecuencia
los conjuntos. Cuando nos ocupamos de U1, no Las distribuciones de frecuencia se emplean bási-
conviene pasar a U2 sin una buena razón y sin antes camente con propósitos descriptivos, pero pueden
d~jar claro lo que se está haciendo.(6)
emplearse para otras finalidades en investigación.
En el análisis de investigación, por lo regular se Por ejemplo, el investigador puede probar que dos o
analizan las medidas de la variable dependiente. más distribuciones son lo suficientemente semejan-
Consideremos el problema de las relaciones entre tes como para fusionarlas. Supongamos que se estu-
los métodos, la inteligencia y el aprovechamiento. dia el aprendizaje verbal en niños y niñas de sexto
Las variables independientes son "métodos" e "in- grado de educación primaria. Después de obtener un
teligencia", y la variable dependiente, el aprove- gran número de puntuaciones sobre el aprendizaje
chamiento. Los objetos del análisis son las medidas verbal, el investigador puede comparar y someter a
de aprovechamiento. Las variables independientes prueba las diferencias entre las distribuciones de
y sus categorías se utilizan en realidad para estructu- niños y niñas.(8) Si dicha "prueba" demuestra que
rar el análisis de la variable dependiente. El universo las distribuciones son iguales, y se cumplen otros
de discurso U es el conjunto de medidas de la varia- criterios, existirá la posibilidad de que puedan com-
ble dependiente. Las variables independientes pue- binarse para otros análisis.
den concebirse como los principios de partición que Las distribuciones observadas también pueden
se emplean para dividir o partir las medidas de las compararse con distribuciones teó.icas. De tales
variables dependientes. Si de repente cambiásemos comparaciones la más conocida es la llamada distri-
a otro tipo de medidas de la variable dependiente, bución normal. Puede resultar importante saber que
posiblemente tendríamos que cambiar a otros nive- las distribuciones obtenidas tienen forma normal, o
les o universos de discurso. que si no lo son, se apartan de la normalidad en
ciertas formas especificables. Dichos análisis pue-
Tipos de análisis estadístico den ser útiles en la investigación teórica y aplicada.
Existen muchos tipos de análisis y presentaciones En el estudio teórico de las habilidades es impor-
estadísticos que no detallaremos en este libro. Los tante saber si éstas tienen, en efecto, una distribu-
comentarios posteriores sobre ciertas formas más ción normal. Se ha apreciado que diversas caracte-
avanzadas de análisis estadístico tienen como fin
(7) Por ejemplo A. Edwards, Statistica/ Ana/ysis, 3a. ed. Nueva
que se conozcan los fundamentos de la estadística y York: Holt, Rinehart and Winston, 1969; P. Lohnes y W. Cooley,
Introduction to Statistical Procedure: With Computer Exercises,
(6) Se puede encontrar un comentario de los niveles de discurso y Nueva York: Wiley, 1968. Este último libro es especialmente útil
relevancia, en F. Kerlinger, "Research in Education." En R. Ebel, porque integra el uso y programación de computadoras en los
V. Noll, y R. Bauer, dir., Encyclopedia of Educationa/ Research comentarios.
4a. ed. Nueva York: Macmillan, 1969, págs. 1127-1144, especial- (8) Consúltese: W. Hays. Statistics. Nueva York: Holt, Rinehart
mente la pág. 1131. and Winston, 1963, págs. 580 y sigs.
PRINCIPIOS DEL ANALISIS Y DE LA INTERPRETACION 101

rísticas del ser humano muestran una distribución Métodos


normal,(9) y sobre estas bases, los investigadores
pueden formular preguntas importantes en cuanto a
"nuevas características por investigar".
Otro uso más interesante de las distribuciones en
la investigación seria el estudio de los prejuicios en Tipos
PUNTUACIONES DE
diferentes regiones y dentro de grupos distintos. Por APROVECHAMIENTO

ejemplo, además de preguntar si las puntuaciones o


Figura 9-2.
medidas de antisemitismo siguen una distribución
normal (lo que sería un hallazgo teórico y práctico
importante), podríamos plantearnos la forma en que
difieren las distribuciones de dichas puntuaciones. mica XYY.(11) (La fórmula XYY denota un patrón
Si hallamos una distribución relativamente normal genético; X y Y son cromosomas, y los jóvenes con
en la zona noreste 'de Estados Unidos y una curva la fórmula señalada muestran una tendencia a tener
muy inclinada o bastante plana de la zona del medio un tamaño mayor al de la generalidad, y también se
oeste, ello constituirla una información importante piensa que muestra un grado mayor de delincuencia.
de posible trascendencia teórica. En este caso, sería La pregunta que planteaba la investigación era si la
necesario profundizar sobre las supuestas causas de talla por sí sola influye en el grado de delincuencia o
las diferencias en las distribuciones. bien influye en otros factores. Para someter a prueba
El estudio cuidadoso de las distribuciones de inte- esta idea, los investigadores antes mencionados
ligencia, actitud y puntuaciones de aprovecha- compararon las distribuciones de tamaños de jóve-
miento puede ser utilizado con ventaja en la investi- nes de raza blanca y negra en dos instituciones de
gación pedagógica aplicada de tipo valorativo. Por conducta antisocial, con las distribuciones publica-
ejemplo, ¿es concebible que un programa pedagó- das de la talla de niños sanos, blancos y negros. Si los
gico innovador cambie las distribuciones de las pun- jóvenes con la fórmula cromosómica XYY llegaban
tuaciones de aprovechamiento de los alumnos de a tener gran tamaño y mostraban una conducta anti-
tercero y cuarto grados? ¿Los programas masivos de social por su talla, deberla haber un número de jóve-
enseñanza preescolar pueden modificar la forma de nes muy altos, mayor del esperado, en instituciones
las distribuciones y también los niveles generales de de internamiento para jóvenes con conducta antiso-
las puntuaciones? cial. Por otra parte, si los jóvenes se volvían antiso-
El estudio de Allport, sobr.e el conformismo o ciales por su fórmula cromosómica XYY (y no por la
"adaptabilidad" social, demostró desde hace mu- talla) no debía haber una representación excesiva y
chos años que incluso un fenómeno conductual un número muy grande de jóvenes con gran talla, en
complejo como el "conformismo" puede ser estu- la muestra de jóvenes con la fórmula XYY. Esto es,
diado provechosamente por medio del análisis de la talla en sí se excluye como factor importante, y se
distribuciones.( 10) Allport pudo demostrar que di- usan las distribuciones conocidas, con las cuales se
versas conductas sociales como detenerse en una comparan las contribuciones de los sujetos. (Los
esquina con luz roja de un semáforo, violaciones en investigadores encontraron que la gran talla, por sí
el área de estacionamiento, cumplimiento de prácti- misma, no era la causa exclusiva de la frecuencia de
cas religiosas y otras, estaban distribuidas en una actos delictivos entre personas con la fórmula cro-
curva con forma de J en la cual casi todas las perso- mosómica XYY.)
nas mostraban "conformidad" o "cumplimiento", Las distribuciones, al igual que las gráficas que
pero había un número menor y predecible de perso- consideraremos en la siguiente sección, probable-
nas que no cumplían las normas señaladas, en grados mente han sido poco usadas en las ciencias de la
diversos. conducta y en la pedagogía. Normalmente el estudio
Hook y Kim sometieron a prueba la noción de que de las relaciones y el sometimiento a prueba de las
la gran talla de los jóvenes contribuía a la conducta hipótesis se asocian casi de manera automática, con
delincuente en personas con la fórmula cromosó- correlaciones y comparaciones de promedios, pero
el empleo de las distribuciones se considera con
mucha menor frecuencia de lo que sería conve-
(9) A. Anastasi, Individual Differences, 3a. ed. Nueva York:
Macmíllan. 1958. págs. 26 y sigs. Los estudiantes de investigación niente. Sin embargo, algunos problemas de investi-
en pedagogía, psicología y sociología deben revisar la notable con- gación pueden ser resueltos mejor si .se usa el análisis
tribución de Anastasi. a nuestro mejor conocimiento de las diferen- de distribuciones. Los estudios de cambios patoló-
cias individuales. El libro de esta autora también contiene muchos . gicos y otros trastornos raros, tal vez puedan encau-
ejemplos de distribuciones de datos empíricos.
(10) F. Allport, "The J-Curve Hypothesis ofConforming Beha-
zarse mejor si se usa una combinación de análisis de
vior." En T. Newcomb y E. Hartley, eds., Readings in Social
Psychology. Nueva York: Holt, Rinehart and Winston, 1947, págs. (11) E. Hook y D. Kim, "Height and Anti-Social Behavior in
55-67. XY y XYY Boys," Science, CLXXII (1971), 284-286.
102 ANAUSIS, INTERPRETACION, ESTADISTICA E INFERENCIA

Edad Edad Edad


(a) (b) (e)
Figura 9-3.

distribución y nociones probabilísticas. Por ejem- como variable dependiente en niños de clase media
plo, en el estudio de Hook y Kim: ¿cuál sería la (A) y en niños de clase obrera (B). Estas representa-
probabilidad de que muchos jóvenes de enorme talla ciones podrían denominarse como gráficas de cre-
estuviesen incluidos por casualidad en esta distribu- cimiento. El eje horizontal es la abscisa, que se
ción? Aún más, el análisis de distribución puede dar emplea para indicar la variable independiente o X; el
al investigador una imagen más completa del fenó- eje vertical es la ordenada, que se usa para indicar la
meno en estudio, que otros métodos. variable dependiente o Y. La gráfica (a) muestra la
misma relación positiva entre la edad y el aprove-
chamiento verbal, con las muestras A y B. La gráfica
Gráficas (b), sin embargo, muestra que ambas relaciones son
U no de los medios más poderosos de análisis es la positivas, pero que con el transcurso del tiempo se
gráfica que es una representación bidimensional de incrementa el aprovechamiento de los niños del
una o más relaciones. La gráfica muestra conjuntos grupo A en mayor grado que el de los niños del grupo
de pares ordenados en una forma que no podría B. Este parece ser el tipo de fenómeno que Coleman
hacerse mediante otro método. Si en un conjunto de y sus colaboradores observaron cuando compararon
datos existe una relación, la gráfica no sólo la mos- el aprovechamiento verbal de niños de grupos socia-
trará con toda claridad, sino también señalará su les mayoritarios y minoritarios del tercer, sexto,
naturaleza, esto es, positiva, negativa, lineal, cua- noveno y duodécimo grados escolares.( 12) La grá-
drática, etc. Si bien es cierto que se han empleado fica C es más compleja. Muestra que los niños del
muchísimo las gráficas en las ciencias de la con- grupo A fueron superiores a los del grupo B desde
ducta, con ellas ocurre lo mismo que con las distri- temprana edad, y esta superioridad persistió en eta-
buciones; probablemente no se les ha usado lo sufi- pas ulteriores, pero los niños B que comenzaron en
ciente. Existen formas objetivas de resumir y probar un punto más bajo, progresaron y continuaron avan-
relaciones, como son los coeficientes de relación, las zando con el tiempo hasta que sobrepasaron a los
comparaciones de medias y otros métodos estadísti- niños del grupo A. Este tipo de relación es poco
cos, pero ninguno de ellos las describe con tanta probable en el caso del aprovechamiento verbal,
nitidez y precisión como la gráfica. pero puede ocurrir con otras variables.
Analicemos de nuevo las gráficas del capítulo 5 El fenómeno que se muestra en las gráficas (b) y
(figs. 5-1 y 5-7), en ellas podremos obseJVar la forma (c) se conoce como interacción. En resumen, denota
en que señalan la naturaleza de las relaciones. Más que dos o más variables interactúan en su "efecto"
tarde, utilizaremos gráficas en una forma más intere- sobre una variable dependiente, en este caso, la edad
sante para mostrar la naturaleza de las relaciones y el status de grupo interactúan con el aprovecha-
complejas entre las variables. Para que el estudiante miento verbal. En otras palabras, la interacción sig-
tenga una idea de la riqueza e interés de dicho análi- nifica que la relación de una variable independiente
sis anticiparemos comentarios ulteriores, y de hecho con otra dependiente es distinta en diferentes grupos
trataremos de mostrar una idea compleja por medio como en este caso, o a niveles diferentes de otra
de las gráficas. variable independiente. Veremos esto con más deta-
Las tres gráficas de la figura 9-3 muestran tres (12) J. Coleman y col.; Equality of Educational Opportunity,
relaciones hipotéticas entre la edad, como variable Washington, D. C. Govt. Printingüffice, 1966. Véanse en especial,
independiente, y el aprovechamiento verbal (V A) las páginas 20, 220 y sigs.
PRINCIPIOS DEL ANALISIS Y DE LA INTERPRETACION 103

lle cuando estudiemos el análisis de varianza y el criptivos, pero también puede ser útil en la investi-
análisis de regresión múltiple. gación, para estudiar las características de poblacio-
Aunque las medias constituyen una de las mejores nes y relaciones. Supongamos que se aplicó una
formas de reportar datos complejos, es muy dificil prueba de aptitud matemática a todos los jóvenes de
confiar por completo en ellas. Casi todos los casos recién ingreso en un colegio que había comenzado a
de diferencias significativas de medias entre grupos admitir libremente a sus educandos, y que la distri-
también van acompañadas de una superposición im- bución de puntuaciones fue bimodal. Supongamos,
portante de sus distribuciones. Anastasi dio ejem- todavía más, que se calculó únicamente una media,
plos claros que indican la necesidad de prestar aten- en comparación con las medias de años anteriores, y
ción a la superposición, y da ejemplos y presenta se advirtió que el resultado era considerablemente
gráficas con distribución por sexos, entre otras.(13) menor. La conclusión simple de que la aptitud ma-
En resumen se recomienda a los estudiantes de in- temática promedio de los jóvenes de recién ingreso
vestigación que se habitúen, desde el comienzo de era considerablemente menor que en años anterio-
sus estudios, a prestar atención y a conocer la distri- res, oculta el hecho de que por la norma de admisión
bución de variables, así como a expresar gráfica- libre, se admitió a muchos jóvenes aspirantes cuya
mente las relaciones entre las variables. preparación básica en matemáticas era deficiente. Si
bien éste es un ejemplo obvio, escogido precisa-
Mediciones de la tendencia central mente por eso, permite advertir que puede ser más
y la variabilidad ingenioso "borrar" u obscurecer fuentes importan-
Existe poca duda de que las mediciones de ten- tes de diferencia. En otras palabras, en ocasiones es
dencia central y variabilidad son los instrumentos más útil calcular medianas y modas, además de las
más importantes en el análisis de datos conductua- medias. Las distribuciones multimodales manifies-
les. Gran parte de este libro se ocupará de estas tan la posible participación de variables que no se
mediciones, y de hecho, incluye una sección llamada toman en consideración.(15)
"análisis de varianza"; por estas razones, en este Las principales medidas de variabilidad son la
punto sólo definiremos los promedios y las varian- varianza y la desviación típica o estándar. Ya fueron
zas. Los tres promedios principales o medidas de comentadas en páginas anteriores y también nos
tendencia central, que se emplean en investigación, ocuparemos de ellas en otros capítulos. Por esta
la media, la mediana y la moda, son compendios de razón, no entraremos en detalles en este apartado,
los conjuntos de medias a partir de las cuales se excepto para señalar que las publicaciones de inves-
calcularon. Los conjuntos de medidas son muchos y tigación siempre incluyen medidas de variabilidad.
muy complejos, como para comprenderlos fácil- Nunca deben señalarse las medias si no se acompa-
mente. Se "representan" o resumen mediante me- ñan de las desviaciones estándar (y de N, el tamaño
didas de tendencia central. Ellas nos indican los de las muestras), porque si no se cuenta con índices
tipos de medidas que "son semejantes", en prome- de variabilidad, será prácticamente imposible que el
dio; pero también se pueden comparar para probar lector haga una interpretación adecuada de la inves-
relaciones. Más aún, las puntuaciones individuales tigación. Otra medida de variabilidad que en años
pueden compararse de manera útil con ellas, para recientes ha adquirido mayor importancia es el
valorar el estado del individuo. Por ejemplo, pode- rango, entendido en este caso como la diferencia
mos decir que la puntuación del individuo A se entre la cifra mayor y la menor, de un conjunto de
aparta determinada distancia, por arriba de la media. medidas. Ha sido posible, especialmente en el caso
Aunque la media es el promedio más usado en de muestras pequeñas con un número de unidades
investigación y tiene propiedades convenientes que constituyentes de 20, 15 ó menos, emplear el rango o
justifican la gran importancia que se le concede, la rangos en pruebas de significación estadística.
mediana -que es la medida más central de un grupo
de medidas- y la moda -que es la medida más fre- Medidas de relaciones
cuente- en ocasiones son útiles en la investigación. Existen otras medidas útiles de relaciones: el co-
Por ejemplo, la mediana, además de ser una medida eficiente de correlación producto-momento (r); el
descriptiva importante, puede usarse en pruebas de coeficiente de correlación por orden de rangos (o
significación estadística, donde la media sería inade- jerarquías) (rho, p), y la medida de distancia (D), el
cuada.( 14) La moda se usa más bien con fines des- coeficiente de contingencia (C), el coeficiente de
( 13) Anastasi, op. cit., págs. 453 y sigs. correlación múltiple (R), y así sucesivamente. Casi
(14) Consultar: S. Siegel,Nonparametric Statisticsforthe Beha- todos los coeficientes de relación, independiente-
vioral Sciences, Nueva York: McGraw-Hill, 1956, págs. 111-116y mente de su origen, aspecto, cálculo y empleo diver-
179-184. Los tipos de medias y otras medidas de tendencia central se sos, sirven esencialmente para el mismo fin: expre-
comentan con detalle excepcional en la obra de M. Tate. Statistics
in Educa/ion. Nueva York: Macmillan, 1955, cap. 11. Tate también san la extensión o grado en el cual pares de conjuntos
presenta diversos ejemplos adecuados de distribuciones y gráficas
de diversos tipos. Aunque es una obra antigua, es muy valiosa. ( 15) Ibid., págs. 79 y sigs.
104 ANALISIS, INTERPRETACION, ESTADISTICA E INFERENCIA

de pares ordenados, varian de modo concomitante. mayor complejidad se logrará la transferencia hacia
En efecto, indican al investigador la magnitud y, por preferencias musicales, y sobre esta base integra
lo regular, la dirección de la relación. Algunos de tres grupos de experimentación, uno de los cuales se
ellos varian en valor desde -1.00, pasando por O, somete a una manipulación de mayor compleji-
hasta + 1.00, y en esta progresión -1.00 y 1.00 dad.( 16) Se obtienen las diferencias predichas entre
indican la asociación peifecta de tipo negativo y las medias de los tres grupos respecto a preferencias
positivo, respectivamente, y el Oindica que no existe musicales, y la diferencia máxima se observa en el
una relación discernible. grupo al que se sometió a la inayor complejidad. Sin
Las medidas de relaciones son índices comparati- embargo, estas diferencias no nos interesan real-.
vamente directos de relaciones, en el sentido de que mente. Lo que nos interesa es la relación del estudio:
a partir de ellas el investigador tiene cierta idea di- la relación que priva entre la modificación de la
recta del grado de covariación de las variables. Por preferencia artística, y la modificación hacia una
ejemplo, elevar al cuadrado el coeficiente de corre- mayor preferencia por la complejidad musical. En
lación producto-momento, permite obtener una es- estas circunstancias las diferencias entre las medias
timación directa del grado de varianza que compar- reflejan realmente la relación entre la variable inde-
ten las variables. Es posible señalar, cuando menos pendiente y la dependiente. Si no existieran diferen-
de un modo general, la gran fuerza o la debilidad de cias significativas entre las medias, la correlación
una relación, lo cual se diferencia de las medidas de entre la variable independiente y la dependiente se-
significación estadística que señalan, de hecho, que ría O y, por lo contrario, cuanto mayor sean las
una relación es o no "significativa", .en algún nivel diferencias más grande será la correlación, a igual-
específico de significación. Como meta óptima, todo dad de otros factores.
análisis de datos de investigación debiera incluir Supongamos que se emprende un experimento
ambos tipos de índices, medidas de la significación para estudiar el efecto del refuerzo aleatorio de la
de una relación, y medidas de la magnitud de la expresión oral de opiniones, en la frecuencia con que
relación. -se expresan las mismas, y que el grupo de experi-
Las medidas de relaciones, especialmente los co- mentación al cual se aplicó el refuerzo aleatorio tuvo
eficientes de correlación producto-momento, son un promedio de seis expresiones en un lapso especi-
extraordinarias, porque ellas mismas están sujetas a ficado, y el grupo testigo que recibió refuerzo con
formas extensas y complejas de análisis, básica- ritmo regular, tuvo un promedio de cuatro expresio-
mente el análisis de relación múltiple y el análisis de nes.( 17) La diferencia es estadísticamente significa-
factores (ver más adelante). Por esta razón, son de tiva, y concluimos, con base en la diferencia signifi-
enorme utilidad y constituyen instrumentos poten- cativa, que existe una relación entre el reforza-
tes para el investigador. miento y la frecuencia con que se expresan opinio-
nes. En capítulos anteriores expresamos gráfica-
Análisis de diferencias mente las relaciones entre las variables medidas,
El análisis de diferencias, en particular el que se para mostrar la naturaleza de dichas relaciones.
hace entre diferencias de las medias, ocupa una También es posible graficar la relación presente en-
parte importante del análisis y la inferencia estadís- tre la variable independiente experimental (manipu-
ticos. Conviene que señalemos dos aspectos de los lada) y ·1a variable dependiente medida, cosa que se
análisis de diferencias. El primero es que por ningún ha hecho en la figura 9-4, en la cual se expresaron
concepto se limita a las diferencias entre medidas de gráficamente las medias como se señala. Si bien la
tendencia central. También pueden analizarse con expresión en gráficas es más o menos arbitraria (por
este instrumento prácticamente todo tipo de dife- ejemplo, no hay unidades reales de línea base o
rencias: entre frecuencias, proporciones, porcenta- basales para la variable independiente) se aprecia
jes, rangos, correlaciones y varianzas. Ocupémonos· nítidamente la similitud con otras gráficas anterio-
de las varianzas. Supongamos que un psicólogo edu- res, y también la idea básica de la relación.
cacional desea saber si un tipo de instrucción hace Si el lector recuerda siempre que las relaciones
que los alumnos sean más heterogéneos en el apren- son conjuntos de pares ordenados, apreciará con
dizaje de conceptos. Puede someter a prueba la dife- nitidez la semejanza de conceptos de la figura 9-4
rencia entre las varianzas de grupos enseñados por con gráficas antes presentadas. En las gráficas ante-
diferentes métodos, o si el investigador lo desea, riores cada miembro de cada par era una puntuación.
saber si los grupos constituidos como homogéneos
lo son en cuanto a variables diferentes de las utiliza- (16) V. Renner, "Effects of Modification of Cognitive Style on
das para integrar los grupos. Creative Behavior," Journal of Personality and Social Psyclzo-
El segundo punto es más importante. Todo análi- logy, XIV (1970), 257-262.
(17) La idea de este problema proviene de: W. Verplanck, "The
sis de diferencias tiene como fin real estudiar rela- Control of the Content of Conversation: Reinforcement of State-
ciones. Supongamos que el investigador piensa que ments of Opinion," Journal of Abnormal and Social Psychology,
al cambiar las preferencias artísticas hacia otras de LI (1955), 668-676.
PRINCIPIOS DEL ANALISIS Y DE LA INTERPRET ACION 105

Variable
dependiente

5
.,,
-g 4
-
.t

:t. 3
2

Variable
independiente
Grupo Grup.:>
de control experimental
Figura 9-4.

En la figura 9-4, un par ordenado consiste en un Para los fines de este libro, el análisis de varianza
tratamiento experimental y una puntuación. Si asig- es más importante por sus ideas básicas y paradig-
namos la unidad ( 1) al grupo experimental y O al mas, que por su flexibilidad o potencia. Afirmamos
grupo de control, dos pares ordenados serían: ( 1, 8), enfáticamente que no hay una mejor forma de estu-
(0, 3). diar el diseño experimental que por medio del análi-
sis de varianza. Las personas expertas en el uso de
Análisis de varianza este método piensan automáticamente en otros mo-
y métodos afines delos de análisis de varianza cuando se enfrentan a
Una parte importante de este libro la dedicaremos nuevos problemas de investigación. Supongamos
al análisis de varianza y métodos conexos. Por esta que se pide a un investigador experto poner a prueba
razón, en este apartado no entraremos en grandes tres métodos de enseñanza de lectura. Se piensa
detalles. Lo único que necesita el lector es tener una inmediatamente en el análisis sencillo y unidireccio-
perspectiva adecuada de este importante método de nal de varianza, del cual surgirá un paradigma muy
análisis. El análisis de vaiianza entraña peifecta- semejante al lado izquierdo (marcado con A) de la
mente lo que indica su nombre, y todavía más, es un figura 9-5. Si se piensa que el sexo es una variable
método de identificar, subdividir y poner a prueba de importante por incluir, el paradigma se asemejará al
significación estadística las vaiianzas que provienen lado derecho de dicha figura. También pueden aña-
de diferentes fuentes. En este sentido, una variable dirse otras variables, pero existen limitaciones prác-
dependiente tiene una cantidad total de varianza, de ticas. Sin duda, el análisis de varianza es un método
la cual, una parte depende del tratamiento experi- importante para estudiar diferencias.
mental, otra del error, y otra más, de diversas cau-
sas. El propósito del análisis de varianza es trabajar
con estas varianzas y las fuentes de donde surgieron. Análisis de perfiles
En términos estrictos, el análisis de varianza es más El análisis de perfiles es básicamente la valora-
adecuado para usarse en datos experimentales que ción de las semejanzas de los perfiles de individuos o
en datos no experimentales, aunque su inventor, grupos. Un perfil es un conjunto de medidas diferen-
Fisher, lo empleó para ambos fines.( 18) Lo conside- tes de una persona o grupo, cada una de las cuales se
raremos por esa razón, como un método para el expresa en la misma unidad de medición. Las pun-
análisis de datos obtenidos en experimentos en los tuaciones de una persona en un conjunto de pruebas
cuales se emplearon la asignacíón aleatoria y la ma- diferentes constituyen un perfil, si todos los puntajes
nipulación de una variable independiente, cuando se han transformado a un sistema común de medi-
menos. ción como porcentiles, rangos y puntuaciones es-
tándar. Los perfiles se han usado más bien con fines
diagnósticos, por ejemplo los que se usan en la
(18) R. Fisher, Statístical Methods for Research Workers, ! la. prueba de aptitud diferencial, para valorar y orientar
ed. Nueva York: Hafner. 1950, págs. 227 y sigs. a los alumnos de enseñanza media (preparatoria).
106 ANALISIS, INTERPRETACION, ESTADISTICA E INFERENCIA

(a) (b)
Métodos Métodos

Niño
Puntuaciones de
aprovechamiento en
la lectura
Niña
I\

Figura 9-S.

Sin embargo, han adquirido importancia cada vez ción y desarrollo de las ciencias de la conducta y la
mayor en la investigación psicológica y pedagógica, educación, lo constituyen el análisis de múltiples
como apreciaremos más adelante cuando estudie- variables y el análisis factorial. El análísís multiva-
mos, entre otros puntos, el diferencial semántico y la riable, es un término general empleado para definir
metodología Q. una familia de métodos analíticos cuya característica
El análisis de perfiles entraña problemas especia- principal es el análisis simultáneo de las variables
les que exigen la consideración más cuidadosa por independientes k y las dependientes m.(22) Si, por
parte de los investigadores. Como Cronbach y Gle- ejemplo, un análisis incluye cuatro variables inde-
ser han señalado, la similitud no es una característica pendientes y dos dependientes, tratadas simultá-
general de las personas; existe similitud sólo en lo neamente, se puede hablar de un análisis multivaria-
que respecta a características específicas o conjun- ble.
tos de las mismas.( 19) Otra dificultad, o más bien Puede afirmarse que de todos los métodos de análi-
conjunto de dificultades, reside en la información sis, los métodos con múltiples variables son los más
que el investigador desea sacrificar al calcular los potentes y adecuados para la investigación conduc-
índices de semejanza de perfiles. Dichas decisiones, tual y pedagógica científica. El argumento en pro de
por supuesto, dependen del problema de investiga- dicha afirmación sería largo de detallar, y abarcaría
ción. Cuando se usa el coeficiente de correlación aspectos diversos, y tal vez nos alejaría un poco de
producto-momento, que es la medición de un peñil, nuestro tema. De modo básico, depende de la idea de
el investigador pierde nivel, esto es, sacrifica dife- que los problemas conductuales por lo regular tienen
rencias entre las medias, lo cual constituye una pér- naturaleza multivariable, y no pueden ser resueltos
dida de elevación. La letra r, esto es, el coeficiente por un método con dos variables (o bivariable) esto
de correlación producto-momento, toma en consi- es, aquel que considere sólo una variable indepen-
deración sólo laforma. Todavía más, en el cálculo diente y otra dependiente en una ocasión dada. Esta
de otros tipos de perfiles se pierde la dispersión, esto dificultad se aprecia netamente en gran parte de la
es, la diferencia en la variabilidad de los perfiles. En investigación pedagógica, en la cual, por ejemplo,
resumen, puede perderse información, cosa que son complejos los determinantes de aprendizaje y
ocurre en la realidad.(20) El estudiante hallará ayuda aprovechamiento: inteligencia, motivación, clase
y orientación excelente en lo que respecta al análisis sociál, instrucción, atmósferas dentro de la escuela y
de perfiles, en el libro de Nunnall sobre psicome- dentro de la clase, organización, etc. Evidentemente
tría, si bien la forma en que trata el tema no es variables como las señaladas interactúan entre sí, a
elemental .(21) veces en forma antagónica, y en la mayor parte de las
Análisis multivariable
(22) En este texto no nos ocuparemos con gran detalle de la
Posiblemente la forma más importante del análisis terminología empleada para el análisis de múltiples variables
estadístico, en especial en la etapa actual de evolu- ("'multivariable"). Para algunos investigadores, el análisis de esta
índole incluye el análisis factorial y otras formas de análisis, como
( 19) L. Cronbach y G. Gleser, "Assessing Similarity Between el de regresión múltiple. Para esas personas, "multivariable" signi-
Profiles," Psycho/ogical Bulleti11, L (1953), 456-473 (pág. 457). fica algo más que una variable independiente o más de una variable
(20) !bid., págs. 460-461. Consultar también J. Nunnally, "Ana- dependiente, o un análisis con ambas características. Otros en el
lysis of Profile Data." Psychological Bulletin, LI X(l962), 311-319. campo de la investigación emplean el ''análisis multivariable", sólo
(21) J. Nunnally, Psychometric Theory. Nueva York: para el caso de que concurran tanto múltiples variables indepen·
McGraw-Hill, 1967, cap. 11. dientes, como dependientes.
PRINCIPIOS DEL ANALISIS Y DE LA INTERPRETACION 107

ocasiones, en formas desconocidas, para alterar o de regresión múltiple. Al modelo de regresión múlti-
modificar el aprendizaje y el aprovechamiento.(23) ple añade más de una variable dependiente. En otras
En otras palabras, para explicar los fenómenos psi- palabras, se ocupa de las relaciones entre conjuntos
cológicos y sociológicos complejos de la educación de variables independientes y conjuntos de variables
se necesitan diseño e instrumentos analíticos que dependientes. Constituye, en teoría, un potente mé-
sean capaces de desentrañar la complejidad, que se todo de análisis. Sin embargo, tiene limitaciones que
manifiesta plenamente en muchísimas variables in- pueden aminorar su utilidad, básicamente en la in-
dependientes y dependientes. Puede aducirse un ar- terpretación de los resultados que logra.
gumento similar en el caso de la investigación psico- El análisis discriminativo también guarda relación
lógica y sociológica. íntima con la regresión múltiple. En su nombre lleva
El argumento anterior y la realidad en que se sus- el objetivo; discriminar entre sí grupos, con base en
tenta imponen una pesada carga a los que enseñan y conjuntos de medidas. Es también útil para asignar
a los que aprenden métodos y procedimientos de individuos a grupos, sobre la base de li!S puntuacio-
investigación. No es un método realista (e incluso es nes que han obtenido en diversas pruebas. Esta ex-
equívoco) abordar la investigación por medio de la plicación tal vez sea insuficiente, pero basta por el
enseñanza y aprendizaje de un método cuya concep- momento.
ción depende básicamente de dos variables (bivaria- En este párrafo es dificil definir incluso a nivel
ble). Sin embargo, los métodos con multivariables a superficial la técnica conocida como análisis de va-
semejanza de la realidad conductual que tratan de rianza entre múltiples variables, porque no hemos
reflejar, son complejos. La necesidad pedagógica, estudiado el análisis de la varianza, y posponemos su
hasta donde concierne a este libro, es hacer que el comentario hasta llegar al capítulo 36.
lector comprenda las bases del razonamiento, di- El análisis factorial es diferente en cuanto a tipo y
seño, métodos y análisis en investigación, funda- propósito con respecto a otros métodos que tratan
mentalmente por un método modificado con base en múltiples variables. Su finalidad básica es ayudar al
dos variables, ampliar dicho método en el mayor investigador a descubrir e identificar las unidades o
grado posible para abarcar los conceptos y métodos dimensiones llamadas factores, en que se fundan
multivariables, con la esperanza de que el estudiante muchas medidas. Por ejemplo, sabemos que muchas
profundice más en los puntos que sean de su particu- medidas de capacidad e inteligencia se basan en unas
lar interés después de haber sentado las bases ade- cuantas dimensiones o factores generales. Dos de
cuadas para ello. Hemos encontrado ya algunos los factores mejor conocidos son la aptitud verbal y
conceptos que implican un razonamiento que abarca la aptitud matemática. Al medir aptitudes sociales se
múltiples variables pero todavía no nos hemos ocu- han descubierto factores religiosos, económicos y
pado del análisis en sí. Continuaremos este enfoque educativos.
y lo ampliaremos en páginas ulteriores. Antes de concluir este comentario de los métodos
Las técnicas multivariables son, en gran parte, que tratan múltiples variables, debemos señalar un
prolongaciones lógicas de las técnicas con una va- hecho importante y extraordinario, de tal manera
riable. El análisis de regresión múltiple es un mé- que nos permita tener una mejor perspectiva al tra-
todo de analizar las contribuciones de dos o más bajo venidero y esclarecer algunos problemas de
variables independientes, a una variable depen- análisis. El hecho extraordinario del cual se conoce
diente. Con él los investigadores educativos estu- poco en este momento, es que la regresión múltiple
dian los efectos en combinación, y separados, en el puede aportar todo lo que aporta el análisis de va-
aprovechamiento escolar, por ejemplo, de la inteli- rianza, y más. En la quinta parte expondremos un
gencia, la aptitud, la clase social, la raza, el medio análisis de varianza en detalle considerable y el lec-
hogareño, la atmósfera escolar, las características tor se preguntará por qué. Si el análisis de regresión
del maestro, y otras más.(24) De los métodos con múltiple puede lograr todo lo que logra el análisis de
múltiples variables (con la posible excepción del varianza y más: ¿por qué gastar nuestro tiempo y
análisis factorial), posiblemente sea el más útil y atención en el análisis de varianza? La respuesta es
flexible. Puede tratar cualquier número y tipo de compleja y no la señalaremos por completo en este
variables independientes. continuas y categóricas, apartado. Una de las razones es que Ja regresión
aunque consideraciones prácticas restringen a me- múltiple, si bien es un instrumento potente, no es tan
nudo el número de variables. fácil de entender. Por otra parte, el análisis de la
La correlación canónica es una prolongación ló- varianza es muy adecuado para estadísticas de pe-
gica de la regresión múliiple. De hecho es un método dagogía, inferencia estadística y diseño experimen-
tal. Por estas razones, en primer lugar estudiaremos
(23) Coleman, op. cit. el análisis de la varianza casi como si no existiera el
(24) Esta afirmación también tiene limitaciones en lo que res- análisis de regresión múltiple. Más tarde reuniremos
pecta a las contribuciones separadas de las variables independien- los dos métodos en un procedimiento muy útil, flexi-
tes que se comentarán en el c<wítulo 35. ble y potente.
108 ANALISIS, INTERPRETACION, ESTADISTICA E INFERENCIA

Indices La razón es una expresión compuesta de dos nú-


El índice puede definirse en dos formas conexas. meros, en que se relaciona un número con el otro, en
En la primera, un índice es un fenómeno observable forma fraccionada o decimal. Toda fracción o co-
que substituye a un fenómeno menos observable. ciente es una proporción o razón. En sí el numerador
Por ejemplo, un termómetro señala cifras que equi- y el denominador de una proporción pueden ser ya
valen a grados de temperatura. Los numerales en la razones. La finalidad básica y utilidad de una razón
carátula de un velocímetro indican la velocidad del es establecer relaciones y permitir la comparación
vehículo. Las puntuaciones de diversas pruebas in- de números que no serían comparables por otros
dican los niveles de aprovechamiento, aptitudes métodos. Para lograr lo anterior, tal vez sea mejor
verbales, grados de ansiedad y otros aspectos. colocar al mayor de los dos números del cociente en
Una definición tal vez más útil para la investiga- el denominador. Lo anterior, por supuesto, satisface
ción sería: un índice es un número compuesto de dos la condición señalada de que las cifras de la propor-
o más números diferentes. Un investigador hace una ción oscilen entre O y l.00 entre -1.00, pasando
serie de observaciones, por ejemplo, y obtiene un por O, hasta + 1.00. Sin embargo, esto no es absolu-
solo número a partir de todas las medidas de las tamente necesario. Por ejemplo, si quisiésemos
observ¡lciones que hizo, para resumirlas y expresar- comparar la razón entre varones y mujeres que
las en forma sucinta. Con base en esta definición, existe entre graduados de enseñanza superior, con la
todas las sumas y promedios son índices: incluyen razón entre varones y mujeres graduados de ense-
en una sola medición más de una medida. No obs- ñanza media alta, en el curso de varios años, la razón
tante, la definición también incluye la idea de índices en ocasiones sería de 1.00 y a veces mayor de 1.00,
como un "'agregado" compuesto de diferentes me- pues es posible que de un año a otro cambie el
didas. predominio de un sexo en relación con el otro.
Los coeficientes de correlación son índices con En ocasiones, las razones suministran informa-
estas características, pues combinan diferentes me- ción más precisa (en cierto sentido) que las partes
didas en un solo índice o medida. que las componen. Si se estudiara la relación entre
El cociente intelectual (IQ) es un índice que se variables educacionales y tasas de impuestos y si se
calcula al dividir la edad mental entre la edad crono- emplearan las tasas reales de impuestos, podría ob-
lógica (la edad mental en sí también es un índice, tenerse una noción errónea de la relación, porque
pues se compone de varias mediciones). Existen dichas tasas sobre la propiedad suelen ser desorien-
índices de clase social. Por ejemplo, es posible com- tadoras. Algunas comunidades con elevados im-
binar ingreso económico, ocupación y sitio de resi- puestos, en realidad tienen tasas muy bajas. La valo-
dencia, para obtener un índice bastante preciso de la ración catastral de la propiedad puede imponer tasas
clase social. Se puede obtener un índice de cohesión bajas. Para evitar las diferencias entre una comuni-
al preguntar a miembros de un grupo si les gustaría dad y otra, el investigador puede calcular para cada
seguir siendo parte del mismo. Sus respuestas pue- una la razón de la valoración estimada, con la valo-
den combinarse en una sola cifra. ración verdadera. Después puede calcular una tasa
Los índices tienen gran importancia en el análisis ajustada de impuestos o una tasa "verdadera" al
científico, pues simplifican las comparaciones. De multiplicar la tasa de impuestos usada, por la frac-
hecho, permiten a Jos investigadores hacer compa- ción antes señalada, con lo cual obtendrá una cifra
raciones que no podrían hacerse por otros medios, o más exacta para entrar en cálculos de relaciones
que si se hicieran, sería con gran dificultad. Los entre la tasa de impuestos y otras variables.
datos en bruto suelen ser demasiado complejos Newcomb en su estudio del proceso de conoci-
como para captarlos y usarlos en manipulaciones miento inventó un índice interesante.(25) Como ín-
matemáticas y estadísticas y, en consecuencia, hay dice de concordancia contó los temas, entre un gran
que reducirlos a una forma más sencilla y tratable. número de ellos, en los cuales parejas de individuos
Un ejemplo satisfactorio de lo anterior son los por- concordaron y discordaron. Por cada pareja se com-
centajes, que transforman los números originales o putó la siguiente razón:
en bruto en una forma que permite la comparación.
Los índices suelen tornar Ja forma de cocientes, Número de respuestas concordantes a los puntos
que se calculan al dividir un número entre otro. Los de importancia, por ambos miembros
más útiles están entre O y 1.00 o entre -1.00, pa- Número de respuestas discordantes a los temas
sando por O, hasta + 1.00. Esto Jos hace indepen- de importancia, por ambos miembros
dientes del número de casos, y facilita la compara-
ción entre una muestra y otra, y un estudio y otro Es una fracción en la cual el numerador es una de dos
(por lo regular se expresan en forma decimal). Exis- frecuencias observadas, o más (el denominador es la
ten dos formas de cocientes: razones y proporcio-
nes. El porcentaje, que sería una tercera forma de (25) T. Newcomb, The Acquaintance Process. Nueva York:
índice, es una variación de la proporción. Holt, Rinehart and Winston, 1961, págs. 281-282.
PRINCIPIOS DEL ANALISIS Y DE LA INTERPRETACION 109

suma de las frecuencias observadas). La definición tarse a la interpretación de los datos. Por ejemplo,
de probabilidad que señalamos, p =si( s + f), en la casi todos los psicólogos concordarán en cuanto a
cual s=número de éxitos yf=número de fracasos, es los datos de los experimentos de reforzamiento. Sin
una proporción. Tomemos otros números, por embargo, discordarán enérgicamente en la interpre-
ejemplo, 20 y 60. La razón de los dos números es tación de los datos de los experimentos. Dichas dis-
20/60 = .33 (podría ser también 60/20 = 3). Si estos cordancias dependen en parte.de las teorías. En un
dos números fuesen frecuencias observadas de la libro como éste no podemos ahondar en la interpre-
presencia y ausencia de un atributo en una muestra tación desde los puntos de vista teóricos. Debemos
total, en las que N = 60 + 20 = 80, la proporción restringirnos a un objetivo más limitado: el esclare-
sería: 20/(60 + 20) = .25. Otra proporción sería, por cer algunos preceptos comunes de la interpretación
supuesto, 60/80 = .75. de los datos dentro de un estudio particular o una
Unporcentaje es una proporción multiplicada por serie de investigaciones.
100. En el ejemplo anterior, 20/80 x 100 = 25 por
100. Con las proporciones y porcentajes se busca Adecuación del diseño experimental,
básicamente reducir conjuntos diferentes de núme- metodología, mediciones y análisis
ros, a conjuntos semejantes de cifras, con una base Uno de los principales temas de este libro es la
común. Todo conjunto de frecuencias puede trans- adecuación de la metodología al problema que se
formarse en proporciones o porcentajes, para así investiga. El investigador suele tener a su libre elec-
facilitar la manipulación y la interpretación estadís- ción diseños de investigación, métodos de observa-
ticas.(26) ción y de medición, y tipos de análisis. Todos deben
Conviene en este punto señalar un aspecto que ser congruentes y mostrar concordancia mutua. Por
debe cuidarse. Los índices, por ser a menudo una ejemplo, no conviene usar un análisis que sea apro-
mezcla de dos mediciones falibles, pueden ser peli- piado para las frecuencias, en caso de mediciones
grosos. El cociente intelectual es un ejemplo exacto continuas obtenidas por una escala de actitudes. De
de esta situación. El numerador de la fracción en sí mayor importancia, el diseño, los métodos de obser-
mismo es un índice, pues la edad mental es un pro- vación, medición y análisis estadístico, deben ser
ducto compuesto de diversas mediciones. Un ejem- apropiados para el problema de investigación.
plo mejor sería el llamado cociente de aprovecha- Un investigador debe vigilar con enorme cuidado
miento: AQ = 100 x EA/MA, en el cual EA = edad la adecuación técnica de los métodos, las medicio-
educacional y MA = edad mental. En este caso, el nes y los datos estadísticos. La adecuación de la
numerador y el denominador de la fracción son índi- interpretación de datos depende en forma capital de
ces complejos. Ambos son mezclas de mediciones dicha vigilancia. Por ejemplo, una causa frecuente
de diversa fiabilidad. ¿Cuál es el significado del ín- de inadecuación en la interpretación es descuidar o
dice resultante y en qué forma podemos interpre- no prestar importancia a los problemas de medición.
tarlo sensatamente? Es dificil precisar lo anterior. Es necesario prestar atención particular a la confia-
En resumen, si bien los índices son complementos bilidad y validez de las medidas de las variables (ver
indispensables del análisis científico, deben em- caps. 26 y 27). Un error craso es aceptarlas simple-
plearse con cautela y cuidado. mente sin cuestionar su confiabilidad y validez. El
investigador debe tener enorme cuidado de cuestio-
Interpretación de los datos nar la validez de sus mediciones, pues todo su con-
de investigación texto interpretativo puede venirse abajo y quedar
Los científicos, al valorar la investigación pueden anulado por este solo punto. Si el problema de un
discrepar en dos aspectos amplios: en los datos, y en investigador pedagógico incluye Ja ansiedad como
su interpretación. Las discordancias sobre los datos variable y el análisis estadístico muestra una corre-
comprenden básicamente problemas como la vali- lación positiva entre la ansiedad y el aprovecha-
dez y confiabilidad de instrumentos de medición y miento, el investigador debe preguntarse a sí mismo
la adecuación e inadecuación de un diseño de inves- y cuestionar sus datos, si la ansiedad que se mide es
tigación, métodos de observación y análisis. Sin em- la que corresponde adecuadamente al problema. Por
bargo, si suponemos que los adversarios son compe- ejemplo, pudo haber medido la ansiedad a la prueba
tentes, las discordancias principales tenderán a limi- cuando la variable del problema era en realidad la
ansiedad general. De manera similar debe pregun-
tarse a sí mismo si su estimación del aprovecha-
(26) No conviene usar los porcentajes con números pequeños si miento es válida para el fin experimental. Si el pro-
bien puede ser necesario usar las proporciones. Una de las causas blema de investigación exige aplicar principios, pero
de la restricción del uso de porcentaje en los cómputos es que los la medida del aprovechamiento depende de una
porcentajes relativamente grandes dan una sensación de precisión
que no existe realmente en los datos. Por ejemplo, supongamos
prueba estandarizada que insiste en el conocimiento
que las dos frecuencias observadas son 6 y 4. Transformarlas en de hechos, puede ser errónea la interpretación de los
60 por 100 y 40 por 100 es absurdo. datos.
110 ANALISIS, INTERPRETACION, ESTADISTICA E INFERENCIA

En otras palabras, en este aspecto nos enfrenta- que la metodología, las mediciones y el análisis fue-
mos al hecho obvio, pero a menudo descuidado, de ron adecuados, los resultados negativos pueden
que la adecuación de la interpretación depende de constituir contribuciones definidas al avance cientí-
cada eslabón de la cadena metodológica, así como de fico, porque su presencia nos da alguna confianza de
lo apropiado y adecuado de cada eslabón con el que nuestras hipótesis no son válidas.
problema de investigación y la congruencia entre
todos los eslabones. Lo anterior se aprecia con cla- Relaciones 110 pla11teadas por hipótesis
ridad cuando nos enfrentamos a resultados negati- y hallazgos 110 alllicipados
vos o no concluyentes. El someter a prueba relaciones planteadas por
hipótesis es un punto en el que insistiremos constan-
Resultados negativos y 110 co11cluye11tes temente en este libro, lo cual no significa, empero,
Los resultados negativos o no concluyentes son que no busquemos o pongamos a prueba otras rela-
más difíciles de interpretar, que los resultados posi- ciones en los datos. Todo lo contrario: el investiga-
tivos. Cuando aparecen estos últimos, cuando los dor en su tarea debe estar extraordinariamente alerta
datos refuerzan la hipótesis, el científico los inter- hacia la búsqueda y estudio de las relaciones entre
preta siguiendo las pautas y líneas de la teoría y el sus datos. La relación no predicha puede ser una
razonamiento en que se funda la hipótesis. Si bien clave importante para profundizar y mejorar la com-
hay que formularse cuestiones y preguntas críticas, prensión de una teoría. Puede arrojar luz sobre as-
las predicciones cumplidas son signo de la validez pectos del problema que no se habían anticipado
del razonamiento en que se fundó la formulación o cuando se formuló aquél. Por lo expuesto, los inves-
expresión de un problema. tigadores, si bien insisten en las relaciones sobre las
Esta es una de las grandes virtudes de la predic- cuales se formula una hipótesis, dében estar siempre
ción científica. Cuando el investigador predice algo, alerta hacia la aparición de relaciones no anticipa-
y planea y ejecuta un esquema para someter a prueba das, en sus datos.
su predicción, y los resultados concuerdan con lo Supongamos que planteamos hipótesis de que ~l
que buscaba, parece que se refuerza la adecuación agrupamiento homogéneo de alumnos es benefi-
de su razonamiento y la ejecución de su experi- cioso para los alumnos "brillantes", pero no lo es
mento. Sin embargo, nunca estamos tan seguros. para los que tienen una menor capaci~?,intelectual.
Los resultados, aunque sean predecibles, pudieran La hipótesis es válida, en nuestra op1ruon. Pero ad-
definir en forma absoluta de los que ávidamente vertimos una diferencia manifiesta entre las áreas
esperamos, por razones diferentes. Aun así, el he- suburbana y rural, en la cual la relación parece ser
cho de que la sucesión completa y el encadena- más intensa en las zonas suburbanas y no serlo en
miento de la teoría, la deducción a partir de la teoría, algunas zonas rurales. Analizamos los datos po~ em-
el diseño, la metodología, la medición y el análisis pleo de una variable suburbana-rural. Advertm~os
nos hayan llevado a los resultados previstos, es que el agrupamiento homogéneo parece tener in-
prueba convincente de la adecuación de toda la es- fluencia notable en los niños "brillantes" en los
tructura. Hacemos una apuesta complicada en la suburbios, pero que tiene poca o nula influencia ~n
cual tenemos en nuestra contra las probabilidades, los de zonas rurales, lo cual, después de todo, podna
por así decirlo. En forma metafórica arrojamos nues- ser un hallazgo importante.
tro dado o ponemos en marcha la ruleta de la investi- Los conocidos estudios de Hawthorne(27) consti-
gación. Si surge el número predicho, nos parecerán tuyen uno de los mejores ejemplos del surgir~iento
que son adecuadas el razonamiento y la ejecución de un hallazgo inesperado. Se elaboraron metodos
que llevaron a la predicción feliz. Si podemos repetir complicados para estudiar los efectos de diferentes
la hazaña, la prueba y evidencia de la adecuación son condiciones laborales en el rendimiento de un grupo
aún más convincentes. de trabajadoras. Se hicieron sucesivamente diversos
Ahora consideremos el caso contrario: ¿por qué cambios en la situación de trabajo de las mujeres:
aparecieron resultados negativos? ¿Por qué los re- por ejemplo, cambios de los pagos,. mayores peri?"
sultados no surgieron como los habíamos predicho? dos de descanso, y un menor penodo de trabajo
Apréciese que todo eslabón débil en la cadena de la diario. La curva de producción aumentó. Sin em-
investigación puede producir resultados negativos, bargo, los investigadores entraron en so~pe~has.
lo cual tal vez se deba a uno, a varios o a todos los ¿Algún factor interveníaen este aumento? S1gm~ron
factores siguientes: teorías e hipótesis incorrectas: adelante con los cambios y devolvieron a las mujeres
metodología inapropiada o incorrecta, mediciones a su situación original de trabajo. La curva de pro-
inadecuadas o insuficientes, y análisis deficiente.
Todos estos factores deben ser examinados con gran
(27) G. Homans, "Group Factors in Worker Productivity." En
cuidado, vigilados y tal vez vincular los resultados H. Proshansky y B. Seidenberg, dir., Basic St~dies in Social P_sy-
negativos con la presencia de uno, varios o todos cho/ogy. Nueva York: Holt, Rinehart and Wmston, 1965, pags.
ellos. Si podemos tener la seguridad suficiente de 592-604.
PRINCIPIOS DEL ANALISIS Y DE LA INTERPRETACION 111

ducción aumentó todavía más. Este hallazgo inespe- pro o en contra de la validez de las hipótesis someti-
rado los obligó a reconsiderar sus planteamientos. das a prueba.
Como Homans señala, "el incremento en el rendi- Por fortuna, para nuestros fines de investigación
miento pudo guardar relación ... con la creación no es necesario que el científico se preocupe dema-
de un grupo social organizado, con una relación siado por la causalidad y la demostración. Para el
peculiar y eficaz con sus supervisores" .(28) progreso científico bastan la evidencia, a niveles
Los hallazgos imprevistos deben despertar mayor satisfactorios de probabilidad. La causalidad y la
sospecha que los previstos. Antes de aceptarlos de- demostración se expusieron en este capítulo para
ben ser validados por una investigación indepen- alertar al lector respecto al peligro del empleo indis-
diente, en la cual se hace una predicción específica criminado o inexacto de los términos. El conoci-
antes de que aparezcan y se sometan a prueba. Sólo miento del razonamiento científico, la práctica y el
cuando se somete a prueba de manera sistemática y cuidado razonable en la interpretación de datos de
deliberada una relación, y en el diseño experimental investigación, si bien no garantizan absolutamente la
se incluyan los controles necesarios, podrá el inves- validez de las interpretaciones por parte del investi-
tigador depositar confianza en sus resultados. El gador, son salvaguardas útiles que lo protegen de
hallazgo inesperado puede ser fortuito o espurio. llevar a cabo inferencias inadecuadas a partir de los
datos, para llegar a sus conclusiones.
Comprobación, probabilidad e interpretación
La interpretación de los datos de investigación Sugerencias de estudio
culmina con las afirmaciones probabilísticas condi- l. Supongamos que un investigador desea estudiar
cionales del tipo: "si tenemos p, obtendremos q' '. la relación entre clase social y ansiedad a una
Reforzaremos las afirmaciones de esta índole al cali- prueba. ¿Cuáles son las dos principales posibili-
ficarlas en alguna forma como: "si tenemos p, ob- dades de analizar los datos (omitiendo la posibili-
tendremos q, en las circunstancias r, s y t". De dad de calcular un coeficiente de correlación)?
ordinario rehuimos las afirmaciones causales, por- Elabore dos estructuras analíticas.
que sabemos que no pueden hacerse sin correr un 2. Supongamos que el lector desea agregar el sexo
grave peligro de error. como variable al problema del inciso anterior.
De mayor importancia práctica para el investiga- Elabore dos tipos de paradigmas de análisis.
dor que interpreta los datos, es el problema de la 3. Supongamos que un investigador ha sometido a
comprobación. Afirmemos llanamente que nada prueba los efectos de tres métodos de enseñanza
puede ''probarse" científicamente. Todo lo que de lectura, en el aprovechamiento en esta asigna-
hace el investigador es aportar pruebas que indiquen tura. En cada grupo hubo 30 sujetos y contó con
que una proposición determinada es válida o verda- una puntuación de aprovechamiento en la lec-
dera.(29) La comprobación es un asunto de deduc- tura, para cada sujeto. También incluyó el sexo
ción y los métodos experimentales de investigación como variable independiente: la mitad de estos
no son en realidad métodos de prueba. Son métodos sujetos fueron varones, y la mitad, mujeres. ¿A
controlados para hacer que los datos o evidencias qué se parece su paradigma de análisis? ¿Qué
nos indiquen si las proposiciones, en cuanto a rela- elemento se introducirá en las casillas?
ciones, tienen en sí verdad o falsedad probables. En 4. Después de estudiar el lector la figura 9-5: ¿estos
resumen, ninguna investigación científica prueba en análisis de los diseños o paradigmas de la va-
forma absoluta una relación. Sobre esta base, la rianza representan división o partición de las va-
interpretación del análisis de los datos de investiga- riables? ¿Por qué? ¿Por qué es importante la par-
ción nunca incluirá el término "prueba" en el sen- tición en la hechura de diseños experimentales y
tido lógico del mismo. Más bien, la interpretación en el análisis de los datos? ¿Las reglás de catego-
debe enfocarse propiamente hacia la evidencia en rización y partición tienen efecfo alguno en la
interpretación de los datos? Si lo tienen: ¿qué
efectos podrían tener? (Conviene que el lector
(28) !bid., pág. 596. analice los efectos de transgredir las dos reglas
(29) Kerlinger, op. cit .. pág. 1134. básicas de partición.)
CAPITULO 10
Análisis de divisiones cruzadas

Hasta este momento nos hemos ocupado princi- analizaron los valores personales de los estudiantes,
palmente del análisis; en este capítulo estudiaremos y se les interrogó si les gustaría ser profesores.(2) El
su práctica. La forma más sencilla de analizar datos investigador también precisó si los estudiantes te-
a fin de estudiar relaciones, es por medio de la parti- nían valores "orientados hacia las personas", esto
ción cruzada de frecuencias. La partición cruzada, es, trabajar con personas y no con cosas y ser útiles a
como señalamos en el capítulo 4, es la yuxtaposición los demás, o "no sentían esta inclinación". U na de
de los subconjuntos de U. Constituimos subconjun- las relaciones se muestra en el cuadro 10-2.(3) Los
tos con la forma A n B, a partir de los subconjuntos datos en dicho cuadro parecen indicar que entre los
A y B de U. En el capítulo 4 se presentaron ejemplos, estudiantes que eligen la enseñanza como profesión,
y brevemente añadiremos otros. La expresión "'par- los que no están orientados hacia las personas tienen
tición cruzada" denota un proceso abstracto en teo- mayor propensión a dejar el magisterio, que quienes
ría de conjuntos. En este texto, cuando se aplique el lo están.
concepto de partición al análisis de la frecuencia Los cuadros 10-1 y 10-2 son particiones o divisio-
para estudiar las relaciones entre las variables, lla- nes cruzadas y en ambas se usan porcentajes, prác-
maremos a las particiones cruzadas "divisiones cru- tica común y útil.
zadas". El tipo de análisis que mostraremos también
recibe el nombre de análisis de contingencias.
No es posible proseguir este estudio sin ciertas
Datos y terminología variable
nociones de estadística, por lo que introduciremos En el capítulo 3 diferenciamos entre variables ac-
tivas y de atributos, y señalamos que la primera
una forma de análisis estadístico que normalmente
se utiliza con las frecuencias: la prueba de chi al denotaba una variable experimental o manipulada, y
que la segunda era una variable mensurada. El tér-
cuadrado(x 2). También daremos una idea de la "sig-
mino "atributo" se usó porque es general y abarca
nificación" estadística. El estudio de las divisiones
cruzadas y de chi al cuadrado nos facilitará el apren- las propiedades de todos los objetos, animados o
dizaje de la estadística. inanimados. Por desgracia, en ocasiones se ha em-
En una encuesta Gallup, se les preguntó a los pleado el vocablo "atributo" para denotar lo que
sacerdotes católicos, "¿convendría que se permitie- hemos llamado en este libro variables categóricas.
Según este uso, por ejemplo, el sexo, la raza, la
ra a los sacerdotes casarse?" ( 1) Los investigadores
evidentemente pensaron que existía alguna relación religión y otras variables categóricas similares han
entre las respuestas a esta pregunta y la edad. Por sido llamados atributos. También se les ha denomi-
estas razones, tabularon los datos en forma porcen- nado variables cualitativas. Ambos usos parecen
tual, como se muestra en el cuadro 10-1. Parece poco atinados. Un atributo es toda propiedad que
haber una relación entre la edad y las opiniones que tiene cualquier objeto, sea que se mida en forma
emitieron sobre el matrimonio de los sacerdotes ca- parcial o completa o por medio de un conjunto de
tólicos los propios clérigos; casi todos los sacerdotes medidas continuas. De este modo, lo usaremos en
jóvenes evidentemente creían que era conveniente este libro no para rechazar el uso corriente, si esto
el matrimonio, en tanto que para los de mayor edad, fuera posible, sino más bien para esclarecer la dife-
era inconveniente. rencia entre variables experimentales y mensuradas.
La deserción profesional entre los maestros ha En el capítulo 3 criticamos el empleo de la expre-
sido un gran problema entre quienes se dedican a la sión "variable cualitativa". De hecho, no existe va-
enseñanza. ¿Por qué los maestros dejan el magiste- riable alguna que sea realmente cualitativa. Siempre
rio y se dedican a otras ocupaciones? El e~ tudio de
Rosenberg aportó algunos datos indirectos sobre (2) M. Rosenberg, "Factors Influencing Change in Occupational
Choice." En P. Lazarsfeld y M. Rosenberg, eds., The Language of
este punto; en él, en 1950 y de nuevo en 1952, se Social Research. Nueva York: Free Press, 1955, págs. 250-259.
{3) /bid., pág. 251. La tabla de Rosenberg se ha cambiado lige-
( 1) New York Times, abril 11. 1971. ramente mediante la inversión de las variables.

112
ANALISIS DE DIVISIONES CRUZADAS 113

podemos asignar la unidad ( 1) y el cero (O) a variables Cuadro 10-1. Relación entre la edad de los
categóricas y, por esta razón, es posible la cuantifi- sacerdotes y sus opiniones sobre el matri-
cación. En otras partes de este libro apreciaremos monio de los clérigos, porcentajes
que el uso de estos numerales no es un simple juego
de palabras. No se dio
Lo que hemos llamado variables categóricas tam- Edad Sí No opinión
bién recibe el nombre, tal vez más exacto, de "va-
Menores de 40 años 77 17 6
riables nominales", porque pertenecen a lo que lla-
maremos más tarde el nivel de medición conocido
Mayores de 40 años 36 56 8
como .. nominal." En este capítulo y en otros debe-
mos esclarecer la diferencia entre variables conti-
nuas y categóricas y, por esta razón, anticiparemos
algunos datos y comentarios ulteriores y definire- !las en las que y= {O, 1, 2, ... , k}, o algún sistema
mos lo que es medición. Cuando Jos números o sím- numérico en el cual los números denotan en mayor o
bolos que se asignan a objetos no tienen un signifi- menor grado, el atributo en cuestión (matemática-
cado numérico más allá de la presencia o ausencia de mente es difícil definir "medidas continuas", y la
la propiedad o atributo que se mide, la medición definición presentada en este párrafo no es satisfac-
recibe el nombre de "nominal". Por supuesto, la toria. Sin embargo, más adelante aclararemos este
variable nominal es aquella que hemos llamado "ca- significado).
tegórica". La asignación de un nombre (nominal) En este capítulo, el nivel de medición es, en su
implica la colocación dentro de una categoría ("ca- mayor parte, nominal. Incluso cuando se emplean
tegorizar"). variables continuas, se transforman en variables ca-
El lector probablemente tenga una idea más clara tegóricas. En general, no conviene hacerlo porque
de los conceptos anteriores con la siguiente ecuación se elimina o desecha información (varianza). No
de conjuntos, que es una definición general de medi- obstante, hay ocasiones en que ajuicio del investi-
ción:( 4) gador es necesario o conveniente tratar una variable
continua como si fuese variable categórica. Por
f = { (x, y): x =cualquier objeto ejemplo, .es posible medir una variable potencial-
y y =cualquier numeral} mente continua en forma burda, digamos, al hacer
que un observador juzgue si los objetos poseen o no
Jo que se lee de esta forma:! es la regla de correspon- un atributo. Existen grados de conducta agresiva,
dencia que se define como un conjunto de pares pero lo único que puede decirse es que un individuo
ordenados (x, y), de tal forma quex sea algún objeto muestra tal conducta o no Ja muestra, o que puede
y y algún numeral que se asigna ax. Esta es una ser suficiente para los fines de la investigación.
definición general que abarca todos los casos de Idealmente sería mejor asignar valores continuos a
medición. Es obvio que y puede ser un conjunto de individuos, con Jo cual se lograría una medición más
medidas continuas o simplemente el conjunto {O, l}. adecuada. Sin embargo, la propiedad en cuestión
Las variables categóricas o nominales son aquellas puede ser tan burda o escurridiza, que sólo es posi-
en las que y={ O, l}, Oy 1 se asignaron sobre la base ble recurrir a la medición nominal.
de que el objeto x tenga o no alguna propiedad o
atributo definido. Las variables continuas son aqué-
Definición y fines
(4) F. Kerlinger, "Researchin Education." En R. Ebel, V. Noll,
de las divisiones cruzadas
y R. Bauer. dir., Encyclopediaof Educatio11al Research, 4a. ed. La división cruzada es Ja presentación tabular
Nueva York: Macmillan. 1969, págs. 1127-1144(pág. 1137). numérica de datos, por lo regular se hace en forma de

Cuadro 10-2. Valores orientados hacia las "relaciones humanas" y cambios en la selección
ocupacional según el estudio de Rosenberg (porcentual)

Permanecieron en el magisterio, Abandonaron el magisterio,


1952 1952
Orientados hacia
relaciones humanas 57 43
No orientados hacia
relaciones humanas 19 81
114 ANALISIS, INTERPRETACION, ESTADISTICA E INFERENCIA

Cuadro 10-3. División cruzada de afiliación Otra finalidad de las divisiones cruzadas es el con-
política y voto de los diputados sobre trol de las variables. Como advertiremos más ade-
la conveniencia de ampliar el Comité de lante, permiten que el investigador estudie y someta
Legislación sobre Normas de la Cámara a prueba una relación entre dos variables, en tanto
(Cámara de Diputados), LXXXVIII controla una tercera. En esta forma pueden ponerse
Congreso" al descubierto las relaciones "espurias" y "especi-
ficarse" las relaciones entre las variables -esto es,
Sí No pueden determinarse las diferencias en el grado de
relación de diferentes niveles de una variable de
Demócratas 207 48 255 control.
(.81)
En párrafos anteriores señalamos otro uso de las
(.19)
divisiones cruzadas: su estudio y su empleo permi-
ten que tanto el estudiante como el investigador
Republicanos 28 148 176 adquieran cierta sensibilidad en cuanto al diseño
(.16) (.84) estructura de investigación. Es una práctica saluda-
ble reducir Jos problemas de investigación a una
235 196 (431) división cruzada. Si el investigador o el lector no
ªLas cifras dentro de cada celda, en la parte inferior y en pueden expresar en un paradigma esquemático su
el lado derecho, son expresiones de frecuencia. La cifra problema de investigación, en la forma de análisis de
decimal en paréntesis indica proporciones o porcentajes varianza o de división cruzada, es que en realidad no
calculados a través de las filas; por ejemplo, 207/255 = .81 y Jo ha comprendido bien, no está en realidad ante un
48/255 = .19. problema de investigación.

frecuencias o porcentajes, en la cual las variables se Divisiones cruzadas simples


dividen en forma cruzada para estudiar las relacio- y reglas para construirlas
nes existentes entre ellas.(5) Es una forma común de La forma más sencilla que puede tomar una divi-
análisis que puede utilizarse casi con cualquier tipo sión cruzada es la de la tabla 2 x 2. Hemos dado
de datos. Sin embargo, se usa principalmente con algunos ejemplos de divisiones cruzadas 2 x 2 en
datos categóricos o nominales. La división cruzada, forma de porcentajes. En el cuadro 10-3 se presenta
además de su empleo en investigación real, es un un tercer ejemplo, en esta ocasión, en forma de
instrumento pedagógico valioso. Su claridad y senci- frecuencias. Los datos del cuadro se tomaron de una
llez la hacen un medio eficaz para aprender la forma tabulación de 12 listas de votación de la Cámara de
de estructurar problemas de investigación y de ana- Representantes estadounidense en el Lxxxvm Con-
lizar datos. Las divisiones cruzadas en realidad son greso, 1963-1964, hecha por Wirt, Morey y Brake-
particiones cruzadas, como indicamos en párrafos man.(6) (Las cifras entre paréntesis son los porcen-
anteriores. Por esta razón, las reglas de partición y tajes.) Representan el voto de la Cámara sobre una
las nociones de conjunto se pueden aplicar fácil- resolución de ampliar el Comité sobre las Normas
mente a su análisis. Camerales de 12 a 15 miembros, una cuestión polí-
Las divisiones cruzadas permiten al investigador tica y de procedimientos de enorme importancia. De
precisar la naturaleza de las relaciones entre las va- mayor importancia para nuestros fines, son la rela-
riables, pero también tienen otros propósitos latera- ción entre la afiliación política y el voto sobre la
les. Pueden emplearse para organizar datos en forma resolución. Antes de comentar la interpretación de
conveniente en el análisis estadístico. Después se los datos tabulados, necesitamos saber la. forma en
aplica una prueba estadística a los datos. Los índices que se recabaron.
de asociación también se pueden calcular fácilmente Aparentemente no hay reglas aceptadas en lo que
por medio de ellas. se refiere a la disposición o arreglo de las divisiones
cruzadas. Sin embargo, sabemos que son particio-
(5) Las divisiones cruzadas también se emplean en forma des- nes cruzadas y que, por esta razón, deben seguir las
criptiva. El investigador tal vez no se interese en las relaciones reglas de partición o "categorización" que comen-
como tales; tal vez desee únicamente describir una situación exis- tamos en párrafos anteriores: las categorías se dis-
tente. Por ejemplo, supongamos que en un cuadro o tabla se dis-
pone la pertenencia a una clase social, en comparación con la
ponen o arreglan con base en las hipótesis de investi-
posesión de conjuntos de televisores, refrigeradores y otros apara- gación; son independientes y mutuamente excluyen-
tos. Esta es una comparación descriptiva, y no una división cruzada tes; son exhaustivas; cada categoría se deriva de un
variable, a pesar de que podríamos, sin lugar a dudas designarla
como "conjunto de posesión de un televisor", por ejemplo, en
lugar de usar el nombre de la variable. Nos ocuparemos exclusiva- (6) F. Wirt, R. Morey, y L. Brakeman, Introductory Prob/ems in
mente del análisis de datos reunidos para someter a prueba o Po/itica/ Research, Englewood Cliffs, N. J.: Prentice-Hall, 1970,
explorar relaciones. pág. 73 (cuadro 6-3). La división cruzada es del autor de este libro.
ANALISIS DE DIVISIONES CRUZADAS 115

principio de clasificación, y solamente de él, y en


conjunto pertenece a un solo nivel de discurso.
En la figura 10-1 presentamos una división cru-
zada de 2 x 2 en símbolos variables. A 1 y A2 son las
particiones de la variable A; B1 y fü son las particio-
nes de la variable B. Las casillas A1B1, ... , A2B2
son simplemente intersecciones de subconjuntos
de A y B: A1 n Bi, ... , A2 n fü. Todo objeto en
U (que es el universo de objetos) puede "categori-
zarse" como A1B1, A1B2, A2B1, o A2B2. Si en el
universo U, que es una muestra de niños, A es el Figura 10.1.
sexo y B la delincuencia, en este caso un miembro de
A 1B1 es un niño delincuente, en tanto que un miem-
bro de la casilla A2B2 seria una niña no delincuente. esperar por azar? En caso que así sea, diremos que
Las tablas de mayor tamaño, esto es, 2 x 3, 2 x 4, existe una relación entre las variables. Supongamos
3 x 2 y así sucesivamente, son simples amplia- que se ha practicado una prueba estadística, y sus
ciones de esta idea. resultados indican que las proporciones se apartan o
En el caso de tres variables, para ser estrictos, se alejan en grado mucho mayor de lo que cabria espe-
necesita una disposición cúbica. Supongamos que rar por azar (en páginas siguientes presentaremos la
hay tres variables A, B, Cy que cada una de ellas está forma de practicar dicha prueba). En este caso, de-
dicotomizada (en aras de la sencillez). La situación cimos que existe una relación estadísticamente sig-
real se asemejarla a la que se muestra en la figura nificativa entre la orientación hacia las personas y el
10-2. Cada celda es un cubo con triple letrero. Todos hecho de permanecer en el magisterio o abando-
los cubos visibles han sido "rotulados" convenien- narlo.
temente. Si las variables A, By C fuesen sexos, clase Sin embargo: ¿qué naturaleza tiene la relación?
social y delincuencia, respectivamente, con base en Esto puede determinarse si se analiza el cuadro.
el ejemplo señalado, el miembro de una celda Podemos notar que la falta de orientación hacia per-
A2B2C 1 seria una niña delincuente, de la clase traba- sonas constituye un factor importante en la deser-
jadora. Manejar cubos es una tarea compleja·y, por ción entre los maestros. En esta muestra, casi todos
esta razón, empleamos un sistema más sencillo. La los que no tenían orientación hacia las personas,
tabla de divisiones cruzadas, con tres variables, abandonaron el magisterio: 81 por 100 de los maes-
puede semejarse a la figura 10-3. Retornaremos más tros no orientados hacia las personas dejaron la en-
tarde a las divisiones cruzadas, con tres variables. señanza, en comparación con 19 por 100 que perma-
necieron en el magisterio. Adviértase que entre los
maestros con orientación hacia las personas la dife-
Cálculo de porcentajes rencia no alcanzó tal magnitud: 57 por 100, contra el
La regla general enuncia: calcular porcentajes a 43 por 100.
partir de la variable independiente hasta la variable Las divisiones cruzadas a base de frecuencias en
dependiente. En estudios en que no es posible "rotu- ocasiones pueden interpretarse como están, pero
lar" a las variables como independiente y depen- suele ser mejor transformarlas en porcentajes, si-
diente, no es válida la regla que acabamos de seña- guiendo la regla señalada en líneas anteriores: calcu-
lar, pero casi en todos los casos sí lo es.(7) Por lar, a partir de la variable independiente y hasta la
ejemplo, en el cuadro 10-3, los porcentajes se calcu- variable dependiente, una fila (o columna) cada vez.
lan con base en las divisiones Demócrata y Republi- Para hacer lo anterior, en primer lugar súmense las
cano, y respuestas afirmativa y negativa. Los por- frecuencias de las filas y de las columnas, y anótense
centajes aparecen entre paréntesis en el cuadro. estas sumas en la parte inferior y en la lateral de la
Volvamos al cuadro 10-2, que incluye los datos del tabla. En el cuadro 10-3 se han anotado estas sumas.
estudio de Rosenberg. ¿Indica el cuadro una rela- Reciben el nombre de "frecuencias marginales".
ción mayor que la debida al azar, entre la orientación (En realidad, para calcular los porcentajes sólo es
de los maestros hacia personas y su permanencia en necesario sumar las hileras del cuadro 10-3. Más
el magisterio (o "elección ocupacional")? ¿Se ale- tarde se necesitarán tanto sumas de filas como de las
jan significativamente las proporciones en las cuatro columnas.) En la relación del cuadro 10-3, la variable
celdas del cuadro de las proporciones que cabria independiente es de manera evidente, "afiliación
política" y la dependiente es el voto emitido en
relación con un punto, sea Sí o No. Sin embargo, en
(7) Zeisel expone la regla en forma diferente: " ... los porcenta-
jes deben computarse en la misma direcdón de/factor causal." H. ocasiones no es tan sencillo pre'cisar la identidad de
z.eisel,Saylt With Figures, 4a. ed. Nueva York: Harperand Row, una variable y de otra. Sea como sea, calculamos los
1957' pág. 24. porcentajes a través de las filas, o a partir de la
116 ANALISIS, INTERPRETACION, ESTADISTICA E INFERENCIA

A¡ A¡ 81 C¡ A1 82C1

Az 8¡ C1 Az 82C1

Figura 10.2.

variable independiente (filas) hasta la variable de- En el estudio de Rosenberg el problema consistía
pendiente (columnas).(8) en explicar por qué los maestros dejaban el magiste-
Calcularemos ahora los porcentajes o proporcio- rio. La cuestión es: ¿dejan la enseñanza los maestros
nes. Tomemos por separado cada fila. Empezare- que no sienten inclinación hacia las personas? La
mos con la fila "demócratas" del cuadro 10-3: hipótesis implícita en esta cuestión es: los maestros
207/255 = .81, y 48/255 = .19. Los porcentajes se que no están orientados hacia las personas dejan la
obtienen simplemente al multiplicar estas propor- enseñanza. Tenemos una proposición del tipo: "Si
ciones por cien, que se calcula al mover el punto p, entonces q: si los maestros no están orientados
decimal dos sitios hacia la derecha. Ahora repitamos hacia las personas abandonarán la enseñanza." No
el sistema con la fila de los republicanos: 28/176 = puede haber duda alguna de las variables indepen-
.16, y 148/176 = .84. (Note el lector que los resulta- dientes y dependientes. Por consiguiente, el cálculo
dos de cada fila deben sumar LOO ó 100 por 100.) La de los porcentajes está determinado después que
relación ahora es clara: el 81 por 100 de los demócra- formulamos la siguiente pregunta: dada la falta de
tas votaron SI y 19 por 100 votaron NO; de los orientación hacia las personas: ¿qué proporción de
republicanos, el 16 por 100 votaron SI y 84 por 100, maestros abandonan su profesión? Esta cuestión se
NO. Adviértase la forma en que los porcentajes de resuelve en la segunda hilera del cuadro 10-2: 81 por
las divisiones cruzadas esclarecen las relaciones. En 100. (Por supuesto, la primera fila también es impor-
la tabla de frecuencia la relación no está muy clara, tante en la relación global.) Si los porcentajes se
por el número desigual de demócratas (255) y repu- calculan con base en las columnas, equivaldrá a
blicanos (176). El cálculo de los porcentajes trans- preguntar: si sabemos que hay un grupo de maestros
forma ambas filas a una base común, mejora la com- que abandonan su profesión: ¿qué proporción de
paración y hace más clara la relación. ellos no tienen orientación hacia las personas? La
En este punto el lector puede preguntarse dos respuesta es: 37 por 100 (véase más adelante), lo que
cosas: ¿por qué no calcular los porcentajes en otra apenas nos da una impresión precisa de la relación.
forma, esto es, partiendo de la variable dependiente
hasta llegar a la variable independiente? ¿Por qué no Cálculo de porcentajes
calcular los porcentajes en base a toda la tabla? Usar y probabilidad condicional
uno u otro de estos métodos no entraña nada inco- Por fortuna, es posible explicar la regla de cálculo
rrecto. En el primer caso, aplicaríamos los datos a de porcentajes al señalar sus bases teóricas. Esto es
una.interrogante o cuestión distinta, y en el segundo, neq!sario porque los porcentajes suelen calcularse
simplemente transformaríamos los datos de fre- siguiendo un procedimiento "equivocado" y es difi-
cuencia en datos porcentuales o de proporción, sin cil descubrir dichos "errores". (Véase la quinta
cambiar el patrón de las frecuencias. Guía de Estudio al final de este capítulo.) También
podemos esclarecer lo que implica el cálculo de pro-
(8) Los investigadores a menudo elaboran sus tablas de otro porciones .basado en la tabla completa. Para hacerlo,
modo, esto es, la variable independiente en la parte superior y la volvamos a la idea de la probabilidad condicional
dependiente a un lado. Por supuesto, importa poco la forma en que
lo hagan, a condición de que el cálculo sea preciso y correcto. En
que se expuso en el capítulo 7. También revisaremos
caso de que participen más de una variable independiente, es más someramente la potencia de la teoría de conjuntos y
complicada la elaboración de la tabla. Siempre que sea posible probabilidad, en sus aplicaciones a la investigación
seguimos el sistema usado en los cuadros 10-1, 10-2 y J0-3. y el análisis.
ANALISIS DE DIVISIONES CRUZADAS 117

C1 C2 C1 C2

A1B1C1 A1B1C2 A1B2C1 A1B2C2

A2B1C1 A2B1C2 A2B2C1 A~2C2

Figura 10-3.

En primer lugar, obsérvese que la figura 10-1 re- sión. De este modop(LTnNPO) se obtiene al calcu-
presenta el producto Cartesiano (véase capítulo 5) lar: 21/ 108 = . 1944. p(N PO) se calcula al emplear la
de los conjuntos A y B o A x B. Nótese también que suma marginal que corresponde a NPO: 261108 =
AtB1, A1B2, etcétera, son símbolos abreviados .2407. Si substituimos la ecuación anterior por cifras,
de A 1 n B 1, A 1 n B2, y así sucesivamente. Recor- obtendremos: .1944/.2407 = .81. Sin embargo, este
demos la ecuación de probabilidad condicional. es el porcentaje que calculamos mediante las filas del
cuadro 10-2. Los porcentajes de las otras tres celdas
(A 1 B) = p(A n B) se calculan en forma similar.
p p(B) En otras palabras, los porcentajes calculados de
la variable independiente a la variable dependiente
Supongamos que A = abandonos del magisterio son las probabílídades condicionales, cuyos enun-
(LT), y B = falta de orientación hacia las personas ciados correctos se derivaron del problema original
(NPO). En este caso la ecuación se transforma en: de investigación. El cálculo en base a la columna del
cuadro 10-4 nos da una imagen distinta y errónea.
(LT 1 NPO) =p(LT n NPO) Equivaldría a escribir: p(N POILT) o la probabilidad
p p(NPO) de que no haya orientación hacia las personas, dado
el abandono del magisterio. El enunciado de proba-
Es más fácil obtener la probabilidad necesaria, a bilidad condicional p(AIB);· expresa una relación en-
partir de las frecuencias originales, que aparecen en tre una variable independiente y otra dependiente,
el cuadro 10-4 (éstas se calcularon con base en la de las cuales A es Ja dependiente y B la indepen-
tabla de porcentajes de Rosenberg y el total N de diente. Cuando decimos "condicional" denotamos
108). LT n NPO, la intersección de LT y NPO, o el que A "depende" de B. Con mayor exactitud, como
evento combinado de abandono del magisterio y ser explicamos en el capítulo 7, las especificaciones deB
un maestro no orientado hacia las personas está en la cambian el espacio muestra!. Por empleo de los sím-
celda inferior derecha: 21 maestros que no estaban bolos de la figura 10-1, calculamos la probabilidad
orientados hacia las personas abandonaron su profe- conjunta de A1B1:

Cuadro 10-4. Frecuencias del cuadro 10-2: valores de maestros orientados hacia las relaciones
humanas y cambios en la elección ocupacionalª

Permanecieron Abandonaron
en el magisterio, el magisterio,
1952 1952

Maestros orienta-
dos hacia las rela-
dones humanas 47 35 82
No orientados
hacia personas 5 21 26
52 56 108
ªLas frecuencias se calcularon con base en los porcentajes señalados en el cuadro 10-2, y N que expresaba el total, de
108.
118 ANALISIS, INTERPRETACION, ESTADISTICA E INFERENCIA

Cuadro 10-5. Proporciones obtenidas al calcular (a) por empleo de las columnas (b) de toda la tabla
y (c) a partir de la variable independiente hasta la variable
dependiente, con las frecuencias del cuadro 10-4ª

Permanecieron en el magisterio, Abandonaron el magisterio,


1952 1952

.90 .63
Maestros orientados hacia
(.57) (.43) (1.00)
las personas
.44 .32
.10 .37
Maestros no orientados hacia (.19) (.81) (1.00)
las personas .05 .19
1.00 1.00

ªCálculos de las columnas: en la parte superior izquierda de cada celda. Los cálculos en base a toda la tabla: parte
inferior derecha de cada casilla. Los cálculos a partir de la variable independiente hasta la variable dependiente, aparecen
entre paréntesis.

n B ) = n(A 1 n B ¡} el dato de la celda superior derecha (del cuadro


P (A i i n(U) 10-4): 35/56 = .63. En segundo lugar, calculamos las
proporciones en base a toda la tabla y obtenemos los
donde N(A1 n Bt) es el número de casos At.81 datos de la parte inferior derecha de cada celda. Para
y n(U) = N =todos los casos, o sea, 47/108 = .44, la la celda inferior derecha (el cuadro 10-4):21/108 =
probabilidad de que cualquier caso de la muestra .19. Si se interpretan ambos conjuntos de proporcio-
caiga dentro de la celda A 1Bt. Ahora supongamos nes, conducirán a conclusiones muy diferentes de
que sabemos que un maestro sí tiene orientación las obtenidas por las proporciones calculadas a par-
hacia las personas, lo cual significa que el espacio tir de la variable independiente hasta la variable
muestra! se ha reducido a la fila superior de la tabla. dependiente (que aparece entre paréntesis en el cua-
En esta situación calculamos la probabilidad con el dro 10-5). Dejamos al lector que estudie estas dife-
nuevo espacio de muestreo, de este modo: rencias.

B 'A )_p(A1 n B 1)
P( 1 1 i - p(Ai) Significación estadística
y prueba de x2
Si traducimos esto a los símbolos del ejemplo, ten- Interrumpiremos en este punto nuestro análisis de
dremos: · las divisiones cruzadas para estudiar unos cuantos
datos sobre estadísticas y, de este modo, preparar el
(RT I PO)= p(PO n RT) = 47/108 = terreno para la exposición del próximo capítulo.
p p(PO) 82/108 .57 Aunque es posible hablar de las divisiones cruzadas
y de la manera en que se constituyen sin tener que
la cual es la proporción obtenida para la celda, al recurrir a la estadística, es imposible emprender el
calcular en base a la fila, o a partir de la variable análisis y la interpretación de los datos de frecuencia
independiente hasta la dependiente. Para calcular la sin ciertos conocimientos mínimos sobre esta cien-
celda de la parte inferior derecha del cuadro 10-4 cia. Por estas razones, examinaremos una de las
escribimos: pruebas estadísticas más sencillas y más útiles, Ja
prueba de chi cuadrada (x 2 ).
(LTINPO) = p(NPO n LT) = 21/108 = 81 Obsérvense las frecuencias del cuadro 10-4. ¿Ex-
p p(NPO) 26/108 . presan realmente una relación entre la orientación
hacia las personas y el cambio en Ja elección profe-
Calculemos ahora las proporciones por otros dos sional? ¿O pudieron haber sucedido por azar?
procedimientos y comparémoslas por los cálculos ¿Constituyen un patrón entre otros muchos patrones
obtenidos de la variable independiente a la depen- de frecuencias que el investigador podría obtener
diente. En primer lugar, calculamos las columnas y para escoger números de una tabla de números alea-
obtenemos las proporciones en la esquina superior torios, y que tal selección estuviera limitada sola-
izquierda en el cuadro 10-5. Por ejemplo, calculamos mente por las frecuencias marginales dadas? Estas
ANALISIS DE DIVISIONES CRUZADAS 119

cuestiones deben formularse para cada conjunto de Para poder responder si 60/40 difiere significati-
resultados de frecuencia obtenidos a partir de las vamente del resultado esperado por indiferencia o
muestras. Mientras no se dé respuesta a estas cues- por azar se debe hacer una prueba estadística cono-
tiones, tendrá poca o ninguna utilidad el proseguir cida como x2 • Para ello elabora una tabla (cuadro
con la interpretación de los datos. Si los resultados 10-6) para obtener Jos términos necesarios para cal-
hubieran acontecido por azar: ¿qué utilidad tendría cular x2 • El término fo significa "frecuencia obte-
nuestro esfuerzo por interpretarlos? nida", y fe significa "frecuencia esperada". La fun-
¿Qué significa decir que un resultado es' 'estadís- ción de las pruebas estadísticas consiste en compa-
ticamente significativo" -esto es, que se aleja "sig- rar los resultados obtenidos con los que aparecerían
nificativamente" de lo esperado por azar? Supon- si sólo interviniera el azar. En este caso comparemos
gamos que hiciéramos un experimento real, 100 ve- fo con fe. En base a la suposición de que operara la
ces, como arrojar al aire una moneda l 00 ocasiones. indiferencia o el azar escribimos 50 y 50, pero las
Cada experimento consiste en lanzar una moneda o cifras obtenidas fueron 60 y 40. Hay una diferencia
un dado. El resultado de cada uno de ellos puede de 10. ¿Tal diferencia podría deberse al azar? Otra
considerarse como un punto de muestreo. El espacio forma de plantear esta cuestión es: si hiciéramos el
muestra!, si es concebido de manera adecuada, es un mismo experimento 100 veces y únicamente operara
número infinito de dichos experimentos o puntos de el azar -esto es, que los miembros del profesorado
muestreo. contestaron las preguntas en forma indiferente o por
Por conveniencia debemos aceptar las 100 ré- azar-: ¿cuántas veces cabría esperar que apareciera
plicas del experimento como el espacio de muestreo una desviación de la magnitud de 60/40 en 100?
U. Esto no es nada nuevo, pues fue lo que hicimos Cuando arrojamos una moneda 100 veces, sabemos
con las monedas y con los dados. que en ocasiones saldrán 60 caras y 40 cruces, y 40
Tenemos un ejemplo sencillo. La administración caras y 60 cruces. ¿Qué número de veces esta dife-
de una universidad considera la conveniencia de rencia grande (si constituye una gran diferencia)
cambiar el sistema de calificaciones, pero desea co- aparecería por azar? La prueba de x2 es una forma
nocer las actitudes del profesorado hacia el cambio conveniente de obtener la respuesta.
propuesto, pues sabe, con base en la experiencia, Escribamos la fórmula para calcular x2 :
que si la mayor parte de los profesores no aprueba un
cambio, la implantación del nuevo sistema enfren-
tará muchas dificultades. Por medio de· un método (10.1)
adecuado se interroga a 100 miembros del profeso-
rado, elegidos aleatoriamente sobre sus actitudes lo cual simplemente establece: "De la frecuencia
hacia el cambio propuesto. Sesenta de ellos aprue- semejante obtenida, fo, reste cada frecuencia espe-
ban el cambio y 40 Jo rechazan. La administración rada, fé, eleve al cuadrado esta diferencia, divida la
tendría ahora que preguntar: ¿es una mayoría "signi- frecuencia elevada al cuadrado por la diferencia es-
ficativa"? La administración sigue este razona- perada fe, y después sume estos cocientes." Esto
miento: si Jos miembros del profesorado fueran to- fue lo que se hizo en el cuadro 10-6. Para tener la
talmente indiferentes al cambio, sus respuestas se- seguridad de que el lector entiende lo que ocurre, lo
rían semejantes a las que se manifiestan por azar: plantearemos de este modo:
ahora de esta manera, ahora de aquélla. La frecuen-
cia esperada en base a esta hipótesis de indiferencia
sería por supuesto, 50/50, el resultado que cabría
esperar por azar.

Cuadro 10-6. Cálculo de x 2 : aprobación y rechazo, por parte del profesorado, de los cambios
propuestos en el sistema de calificaciones

Aprobación Rechazo

fo 60 40
fe 50 50
fo -fe 10 -10
<fo - f e) 2 100 100
<fo - fe) 2 100 100 -2
fe 50=2 50 -
120 ANALISIS, INTERPRETACION, ESTADISTICA E IJ'IFERENCIA

Cuadro 10-7. Frecuencias y su x2 correspondienteª


Frecuencias xz
40/60 4.00
4lí59 3.24
42/58 2.56
43/57 1.96
44/56 1.44
45/55 l.00
46/54 .64
47 /53 .36
48/52 .16
49/51 .04
50/50 o
ªPor supuesto, los valores de x 2
para 51/49 ... , 60/40, son los mismos que los del cuadro pero en orden inverso.

Pero, ¿qué significa x2 = 4? x2 es una medida de la Para entender mejor la mecánica de estas opera-
diferencia o alejamiento entre las medidas obtenidas ciones, supóngase que calculamos todas las x2 para
y las frecuencias esperadas por intervención del todas las posibilidades:
azar. Si suponemos que contamos con alguna forma
de saber cuáles son las "expectativas" por azar y 60/60, 41159, 42/58, ... ' 50/50, ... '60/40.
alguna manera de conocer que las observaciones son
independientes, entonces siempre podremos calcu- Después de hacerlo, obtenemos el conjunto de
lar x2 • Cuanto mayor sea x2 , las frecuencias obte- valores que aparecen en el cuadro 10-7. (Al leer el
nidas se desviarán en mayor grado de las frecuencias cuadro ayudará pensar que la primera frecuencia de
"aleatorias" esperadas. El valor de x2 va desde cada par es: "caras", o "concµerda con", o "va-
cero, que indica que no hay desviación ni aleja- rón", o cualquier otra variable.) De estas x2, sólo
miento alguno de las frecuencias esperadas, hasta un dos de ellas, valores de 4.00, correspondientes a
gran número de valores cada vez mayores. 40/60 y 60/40, son estadísticamente significativos;
Además de la fórmula anterior es necesario cono- y lo son porque al consultar el cuadro de x2 en
cer los llamados grados de libertad del problema, y la columna correspondiente a un grado de libertad,
contar con una tabla de x2 • Las tablas de chi cua- hallamos la cifra de 3.841, preCisamente en el lla-
drada aparecen prácticamente en todos los libros de mado "nivel de significación de .05". Todas las
estadística, junto con las instrucciones de la forma demás x2 en el cuadro 10-7 son menores de 3.841.
de emplearlas, y también explicaciones sobre los Ocupémonos de x2 para 42/58, que es de 2.56: Si
grados de libertad. En este punto podemos decir que consultamos el cuadro, 2.56 está situado entre valo-
"grado de libertad" denota la amplitud de variación res de x2 con probabilidades de .10 y .25, ó 2.706 y
que posee un problema estadístico. En el problema 1.323, respectivamente. Esto es, en realidad, una
antes expuesto, existe un grado de libertad, porque probabilidad de .14, aproximadamente. En casi to-
el número total de casos es fijo, esto es, 100, y tan dos los casos no necesitamos molestarnos por averi-
pronto se conoce una de las frecuencias se puede guar en qué punto cae. Todo lo que necesitamos es
determinar de inmediato la otra. Es decir, que no hay señalar que no corresponde al grado .05 de 3.841. Si
grados de libertad cuando dos números deben sumar no corresponde, podemos decir que no es estadísti-
100 y se conoce uno de ellos, por ejemplo 40. Una camente significativo a nivel de .05. El lector puede
vez que se conoce 40 ó 45 o cualquier otro número, preguntarse: "¿cuál es el nivel de .05?" "¿Por qué
prácticamente sobran los cálculos, pues el número escogemos este nivel?" "¿Por qué no escogemos
restante no tiene libertad alguna de variación.(9) .10, o incluso .15?" Para resolver estas preguntas
desviémonos un poco de nuestras explicaciones.
(9) De manera similar, si se calcula un promedio de 100 puntua-
ciones, el investigador emplea un grado de libertad al imponer una Niveles de significación estadística
restricción a sus datos. Es probable que el mejor texto para explicar El nivel .05 quiere decir que un resultado obtenido
los grados de libertad sea el de Walker. Consultar: H. Walker, que es significativo a dicho niveli podría ocurrir por ,
"DegreesofFreedom,'' Journal ofEducational Psychology, XXXI azar sólo cinco veces en 100 intentos o experimen-
(1940), 253-269, y H. Walker, Mathematics Essentialfor Elemen-
tary Statistics, rev. ed. Nueva York: Holt, Rinehart and Winston, tos. El caso de las respuestas a lfl pregunta formu-
1951, cap. 22. lada por Ja administración escolar en que hubo 60
ANALISIS DE DIVISIONES CRUZADAS 121

acuerdos y 40 desacuerdos, podemos decir que una que en ocasiones debiera usarse el nivel de .10, en
diferencia de la magnitud señalada ocurriría por azar tanto que otros dicen que 10 posibilidades de azar en
sólo cinco veces en 100 pruebas. Puede suceder con 100 son demasiadas, de tal forma que no desean que
mayor o menor frecuencia, pero probablemente una decisión cualquiera quede expuesta a tal riesgo
ocurrirá unas cinco veces en cada 100 experimentos. si se acepta este nivel de aleatoriedad. Otros afirman
El nivel de significación estadística en cierto modo que el nivel de .O 1o una posibilidad de azaren 100, es
se elige arbitrariamente,( 10) pero si lo analizamos demasiado estricto, y que con él se descartarían o
con mayor detalle, advertimos que su elección no es eliminarían resultados "realmente" significativos.
del todo caprichosa. Otro nivel de significación que a ¿Se debe escoger un nivel de significación y per-
menudo se usa es .01. Los niveles de .05 y .01 co- sistir en su uso? Esta es una pregunta de difícil
rresponden bastante bien a dos y tres desviaciones respuesta. Se han recomendado ampliamente los ni-
"típicas" o estándar a partir de la media de una veles de .05 y .O l. Existe un nuevo criterio que
distribución normál de probabilidad (la distribución recomienda'indicar los niveles de significación de
normal de probabilidad es la curva simétrica con todos los resultados; v. gr.: si el resultado tiene
forma de campana que muy probablemente el lector significación a un nivel de .12, debe señalarse con
ha visto en otros sitios, de la cual nos ocuparemos todo detalle. Algunos investigadores objetan esta
más adelante). práctica, y señalan que el científico debe hacer una
Volvamos al lanzamiento de monedas, en el cual apuesta y persistir en ella, esto es, no cambiarla.
una moneda se arrojó 100 veces. La cara apareció 52 Existe otro criterio que recomienda trabajar con lo
veces y la cruz 48 veces. Si consultamos el cuadro que ha denominado "intervalo de confianza" .(11)
10-7, apreciaremos que x2 = .16 y de ello deducimos En este libro usaremos el método de los "niveles"
que el resultado no es significativo. Pero suponga- estadísticos, porque es más sencillo. Para el estu-
mos que la moneda se arrojó no sólo un conjunto de diante que no planea emprender alguna investiga-
100 veces, sino 100 conjuntos de 100 veces, que ción, este punto no es muy importante. Sin embargo.
calificamos como equivalente a 100 experimentos. las personas que se dedicarán a la investigación de-
Según estos 100 experimentos, obtuvimos diversos ben estudiar otros procedimientos, como los méto-
resultados: 58/42, 46/54, 51/49 y así sucesivamente. dos de estimación estadística, intervalos de con-
De estos experimentos, 95 ó 96 se habrían producido fianza y métodos de probabilidad exacta.
"caras" dentro de los límites de 40 y 60, esto es, sólo Para ilustrar el cálculo y empleo de la prueba de x~
cuatro o cinco de los experimentos habrían produ- con divisiones cruzadas, la aplicaremos a los datos
cido menos de 40 o más de 60 caras. De manera de frecuencia del cuadro 10-4. Usamos la fó1mula
similar, si hacemos un experimento y encontramos 10-1, sin embargo con las tablas de divisiones cruza-
una diferencia entre dos medias que, después de das su aplicación es más complicada que si usamos el
efectuar una prueba estadística apropiada, está en el cuadro 10-6. La diferencia principal reside en el cál-
nivel de significación de .05, tendríamos razón para culo de las frecuencias esperadas. Los cálculos ne-
creer que la diferencia de las medias obtenida no se
debe simplemente a una diferencia por azar. No ( 11) Casi todos los investigadores indican simplemente que los
obstante,podría ser una diferencia debida al azar. Si resultados no son significativos si nó alcanzan el nivel de .05 ó .O l.
Consultar Ja obra de Rozeboom: "The Fallacy of the Null-
el experimento se hiciera 100 veces y no hubiera Hypothesis Significance Test." Psychological Bulletin, LVII
realmente diferencia entre las medias, cinco de estas ( 1960), 416-428, en busca de un comentario más minucioso sobre
100 repeticiones mostrarían diferencias tan grandes este punto muy difícil. Dicho investigador recomienda el empleo de
como las obtenidas en la realidad. intervalos de confianza, e indicar en todo reporte, valores de pro-
babilidad precisa de los resultados de experimentación. También
Si bien este comentario pod1ía ser útil para escla- consúltese la obra de J. Nunnally, "The Place of Statistics in
recer el concepto de Ja significación estadística, to- Psychology," Educational and Psyclzologícal Measurement, XX
davía no resuelve todas las cuestiones que nos plan- (1960), 641-650; H. Walker y J. Lev, Statistíca/ Inference. Nueva
teamos antes. El nivel de .05 se escogió original- York: Holt, Rinehart and Winston, 1953, págs. 52 y sigs. La idea
básica es que en vez de rechazar categóricamente las hipótesis si no
mente (costumbre que ha persistido entre Jos inves- alcanzan el grado de significación de .05. es mejor indicar que existe
tigadores), porque se consideró que representaba un la probabilidad de .95 de que la cifra o valor desconocido caigan
"riesgo" razonablemente satisfactorio. Para casi entre .30 y .50. Por ejemplo, si la proporción obtenida de métodos
toda la investigación científica en sociología no es empíricos es de 60, será una prueba de que la hipótesis principal del
investigador era correcta, o expresado en el lenguaje de la hipótesis
demasiado grande ni demasiado pequeño. Sin em- de nulidad, que se rechazó esta última hipótesis. En el capítulo de
bargo, muchos investigadores prefieren el nivel de C. Harris, '' Statistical Methods", en la obra citada de R. E bel y
significación de .O 1, que sin duda es un nivel alto de col., págs. 1307-1318 se expone un comentario justo de estos pro-
certidumbre y equivale en realidad a una "certidum- blemas estadísticos y de otros. En Ja obra de R. Chandler, "The
bre práctica''. Álgunos investigadores han afirmado Statistical Concepts ofConfidence and Significance," Psyclwlogi-
ca/ Bu/letin, LIV ( 1957). 429-430. hay un comentario de las diferen-
(IO) Al parecer, el .nivel de .05 fue elegido originalmente por cias entre los términos "significación" y "confianza". Consúltese
Fisher.'VerR;'Fist\er. Statistical Methods for Research Workers, también la obra de W. Hays, Statistics. Nueva York: Holt, Ri-
l la. ed. Nueva York: Hafner, 1950, págs. 80 y sigs. nehart and Winston, 1963, cap. 9.
122 ANALISIS, INTERPRETACION, ESTADISTICA E INFERENCIA

Cuadro 10-8. Cálculo de x", con los datos del cuadro 10-4

39.4815ª 42.5185
47 35 82
7.5185b -7.5185

12.5185 13.4815
5 21 26
-7.5185 7.5185

52 56 108

ª(82 X 52)/108 = 39.4815; (82 X 56)/108 = 42.5185; etc.


b47-39.4815 = 7.5185; etc.

cesarios se presentan en el cuadro 10-8. Las fre- y sumar los resultados. Los cálculos se indican en la
cuencias esperadas o anticipadas, fe aparecen en la parte inferior de la tabla. x" = 11.4698, a un grado de
esquina superior izquierdo de cada celda, dichas libertad (¿por qué se escoge un grado de libertad?).
frecuencias se calculan con el procedimiento que se Si analizamos la cifra de x" en la tabla, precisamente
señala en el pie a del cuadro. Las frecuencias obte- en el correspondiente a un grado de libertad en el
nidas, fo, se presentan en el lado derecho (en el nivel de .01, obtendremos 6.635. Nuestro valor ex-
centro), de cada celda. Los términos fo - fe, reque- cedió notablemente del valor señalado y, por esta
ridos por la fórmula, se muestran en la esquina infe- razón, podemos decir que x" es estadísticamente
rior izquierda de las celdas y son los mismos en.todas significativa, que los resultados obtenidos proba-
ellas, sólo difiere su signo. Esto es cierto para las blemente no se deban al azar, y que la relación
tablas 2 x 2. La fórmula x" simplemente obliga a expresada en la tabla es "real" en el sentido de que
elevar al cuadrado estas diferencias, dividir los cua- probablemente no llegue a intervenir en ella
drados entre las frecuencias esperadas o calculadas el azar.(12)

x" = 2: [u;.-_ ¡;.)2]


j,.
= (47.0-39.4815) 2 + (35.0-42.5185) 2 + (5.0-12.5185) 2 + (21.0-13.4815) 2
39.4815 42.5185 12.5185 13.4815
= 11.4698
x", al igual que otros cálculos estadísticos que Si substituimos el valor de x2 calculado en líneas
indican significación estadística, no denota nada so- anteriores, y lo introducimos junto con Nen la ecua-
bre la magnitud de la relación. Es una prueba de la ción, obtendremos:
independencia de las variables, en el sentido que se
dio a este concepto en el capítulo 9. Estrictamente
hablando, no es una medida de asociación. Uno de 11. 4698 • r;:;;:c;::
los problemas estadísticos más antiguos consiste en
e= 11.4698+108 = v.0960 = .3098 = .31
expresar por medio de índices, la potencia y magni-
tud de asociación o relación entre variables categó- que es un índice aproximado y conservador de la
ricas. Su complejidad impide que lo comentemos en potencia o fuerza de la relación.
este punto. Sin embargo, presentamos una fórmula En parte, Ces inadecuado, porque no alcanza la
estadística, que aunque no es la mejor, se puede unidad ( 1.00), carece de signo y no puede ser inter-
aplicar fácilmente y usar con alguna tabla de contin- pretado fácilmente en diversos términos como ocu-
gencias o divisiones cruzadas de cualquier magni-
tud: e, el coeficiente de contingev.cia.
( 12) Nótese que x' necesita corrección si N es pequeño. La regla
aproximada que se usa, es la llamada corrección de continuidad,
que simplemente consiste en restar .5 a la diferencia absóluta entre
- fT
c-vxt+N (10.2) fo y fe en la fórmula de x'. antes de elevarla al cuadrado, cuando
las frecuencias anticipadas son menores de cinéo en las tablas de 2
X 2.
ANALISIS DE DIVISIONES CRUZADAS 123

Cuadro 10-9. Datos de Chlld, Potter y Levine


0 /o en que (O/o en que no fue-
Modo de adquisición fueron recompensados ron recompensados)

Esfuerzo 93 (7)
Compra, venta, intercambio 80 (20)
Petición, expresión de deseo, aceptación
de lo que se ofrece 68 (32)
Dominio, agresión, robo, engaño 41 (59)

rre con r, por ejemplo. A pesar de ello, constituye señala número o proporción entre varones y mujeres
una medida de asociación que es útil si se usa con en San Francisco, Estados Unidos, el número de
cautela.( 13) En términos generales, el mejor consejo coches de diferentes marcas producidos en 1972, el
para usar datos categóricos es calcular x2 para de- número de niños en cada uno de los grados de un
terminar la significación estadística, calcular e (u sistema escolar X, se usan tablas unidimensionales
otras medidas, véaseelpiedepágina 13), calcularlos "verdaderas", pues en ellas se incluye sólo una
porcentajes como señalamos, y después interpretar variable.
los datos, usando toda la información Los sociólogos en ocasiones publican sus datos en
tablas que parecen ser de una sola variable, pero en
Tipos de divisiones realidad son de dos variables. Analizaremos una
cruzadas y tablas tabla publicada por Child, Potter y Levine.( 14) En
En general, hay tres tipos de tablas: 1) unidimen- este estudio, se analizaron los valores contenidos en
sionales; 2) bidimensionales, y 3) k-dimensional. El los libros de texto para niños de tercer grado. El
número de dimensiones de una tabla depende del cuadro I0-9 muestra los porcentajes de veces en los
número de variables; la tabla unidimensional tiene que se dieron diversas recompensas para diversas
una variable, la bidimensional tiene dos, y así suce- formas de adquisición. (En la tabla original sola-
sivamente. No importa el número de categorías que mente aparece la columna de porcentajes de la iz-
tenga cualquier variable en particular; las dimensio- quierda.) A simple vista parece que el cuadro es de
nes de la tabla son siempre fijadas por el número de una sola variable, pero en realidad expresa una rela-
variables. Hemos considerado la tabla bidimensio- ción entre dos variables: la forma de adquisición y la
nal donde dos variables, una independiente y otra recompensa.
dependiente, están en yuxtaposición. Suele ser fruc- El punto básico en este asunto es que los cuadros
tífero y necesario considerar simultáneamente más de esta índole en realidad no tienen una sola varia-
de dos variables. En teoría, no hay límite para el ble. En el cuadro 10-9, una de las variables, ''recom-
número de variables que pueden considerarse en un pensa", está expresada en forma incompleta. Para
momento dado. Las únicas limitaciones son prácti- aclarar este punto añadiremos otra columna de por-
cas: tamaño insuficiente de la muestra y dificultad centajes junto a la que aparece en la tabla original
para abarcar las relaciones comprendidas en una (como se hizo en el cuadro). Podemos llamar a esta
tabla multidimensional. columna "sin recompensa". En este momento, te-
nemos ya una tabla completa de dos variables, y así
Tablas unidimensionales se puede observar con nitidez la relación. (En oca-
Hay dos tipos de tablas unidimensionales. Una de siones no puede hacerse lo anterior, porque no se
ellas es la "verdadera", que tiene poco interés para tienen los datos para "completar" la tabla.)
nuestros fines porque no expresa una relación. Estas
tablas se publican frecuentemente en periódicos, da- Tablas bidimensionales
tos oficiales, revistas y otros medios. Cuando se Las tablas bidimensionales o de divisiones cruza-
das tienen dos variables, cada una de las cuales tiene
( 13) Recomendamos al lector profundizar en este tema. Con- dos o más subclases. La forma más sencilla de estas
viene que consulte: Hays,op. cit., págs. 603-614. El estudiante más tablas, como hemos visto es la llamada tabla de 2 x
avanzado tal vez desee estudiar un método nuevo y del todo dis- 2. Sin embargo, las tablas de dos variables no sólo
tinto de la asociación predictiva. La fuente original es: L. Good- están limitadas a la forma 2 x 2. De hecho, no hay
man y H. Kruskal, "Measures of Association for Cross Classi-
fication," Journal of the American Statistica/ Associatio11, XLI X limitación lógica o deliberada en el número de sub-
(1954), 732-764. El método de Goodman y Kruskal al parecer no se
ha usado mucho en las ciencias de la conducta, pero tal vez ello se ( 14) l. Child, E. Potter, y E. Levine, "Children's Textbooks and
deba a que es congruente con un enfoque de probabilidad condicio- Personality Development: An Exploration in the Social Psychology
nal. of Education," Psychological Monographs, LX (1946), núm. 3.
124 ANALISIS, INTERPRETACION, ESTADISTICA E INFERENCIA

Cuadro 10-10. Relación entre clase social y tipo de disciplina en


el estudio de Miller y Swanson

Disciplina
Psicológica Mixta Corporal

29 5 4
Clase media .76 .13 .ll
Clase trabajadora 9 28 40
.12 .36 .52

clases que cada variable puede incluir. Considere- ción entre el nivel de educación y el grado de tole-
mos algunos ejemplos de tablas m x n. rancia? La tabla de división cruzada que aparece en
Miller y Swanson han publicado los resultados del el cuadro 10-12 es útil, porque: l) es del tipo 5 x 3, y
sometimiento a prueba de diversas hipótesis intere- por lo tanto más complejo que las anteriores; 2)
santes.(15) Una de esas hipótesis predecía la rela- yuxtapone una variable ordinal, la educación, contra
ción entre la clase social a la que pertenecieran los una clasificación de una supuesta variable continua,
padres y el tipo de disciplina que empleaban, como la tolerancia, y 3) ilustra un punt() que parece des-
aparece en el cuadro 10-10.(16) La cifra para x2 es de orientar a los estudiantes, esto es, que los números m
49.45, esto es, altamente significativa. Desde luego, y n de una división cruzadam x n, indican el número
esta es una tabla 2 x 3, que el lector puede interpre- de subclases y subcategorías y no el número de
tar fácilmente. Los porcentajes o proporciones se variables. El estudio de la tabla muestra que existe
han colocado en las celdas, con tal propósito. una relación entre las dos variables: evidentemente,
En el cuadro 10-11( 17) presentamos una tabla cuanto mayor sea el nivel de edúcación, mayor será
similar tomada del mismo libro. De nuevo, x2 es el grado de tolerancia.
altamente significativo (29.52) y de fácil interpreta-
ción. (El estudiante debe tener la seguridad de que
puede interpretar los cuadros 10- IO y 10- l l, así como Tablas bidimensionales, dicotomías
otras tablas, antes de seguir adelante.) "verdaderas" y mediciones continuas
Otro ejemplo de tabla bidimensional que nos Muchas tablas bidimensionales señalan datos no-
puede esclarecer dos o tres puntos importantes y minales "verdaderos" datos de variables que son en
darnos datos interesantes de estudio, es la del estu- verdad dicotómicos: sexo, vivo-muerto, y otros
dio de Stouffer sobre conformidad-tolerancia.( 18) más. Sin embargo, muchas de estas tablas tienen una
Stouffer estudió la relación entre la tolerancia, por o ambas variables supuestamente continuas, y dico-
una parte, y otras variables sociológicas, por la otra. tomizadas o tricotomizadas en forma artificial. Whi-
Una de estas últimas fue la educación. El investiga- ting y Child, en su libro Child Training and Persona-
dor trató de responder la pregunta: ¿cuál es la rela- lity, ( 19) emplearon un ejemplo interesante de tabla 2
x 2 con una variable; la explicación oral, una dico-
tomía "natural" o "verdadera", y la otra variable,
(15) D. Miller y G. Swanson,Inner Conflict and Defense, Nueva
York: Holt, Rinehart and Winston, 1960. Ei' Apéndice D de este ansiedad oral o verbal, que era una variable continua
libro incluye un gran número de divisiones cruzadas. dicotomizada en forma artificial a nivel de la me-
( 16) /bid., pág. 426. El comentario textual está en la pág. 73 y diana. Al estudiar el problema mayor, los autores
sigs. Sería provechoso que el lector interesado estudiara el razona- plantearon la hipótesis que las sociedades fomentan
miento teórico del autor y sus predicciones en relación con las
tablas señaladas en el Apéndice D. Este libro es un estudio teórico-
la ansiedad verbal u oral en su proceso de socializa-
empírico refinado que además de su interés intrínseco, es muy ción, explican las enfermedades de manera oral.
provechoso en la práctica. Parte de su evidencia aparece en el cuadro IO- I 3. Los
(17) /bid.
(18) S. Stouffer. Communish, Conformity, and Civil Liberties.
Nueva York: Doubleday, 1955. Copyright " 1955 por Samuel A. (19) J. Whiting e J. Child, Child Training y Personality. New
Stouffer. Reimpreso con permiso de Doubleday y Company, loe. Haven: Yale-University Press, 1953, pág. 156. Las frecuencias en
Este libro contiene análisis exhaustivos de las divisiones cruzadas. la tabla son el número de sociedades y no de individuos. El total N
Podríamos considerarlo casi un modelo de la forma de analizar las fue 75 (7 5 sociedades). Esta obra, al igual que otras citadas (Miller y
relaciones por medio de las divisiones cruzadas. Son especialmente Swanson: Gross) es un ejemplo excelente de razonatniento teórico
útiles las especificaciones de Stouffer, siempre justas y amenas, de muy elaborado y a prueba empírica y cuidadosa de una hipótesis; es
sus datos. Por ejemplo, consúltese el capítulo 4, en el cual yuxta- particularmente instructivo por el ingenio y flexibilidad que los
pone edad, educación, tolerancia y otras variables. autores muestran en la cuantificación de variables complrjas.
ANALISIS DE DIVISIONES CRUZADAS 125

Cuadro 10-11. Relación entre la clase social y el tipo de recompensa


en el estudio de Miller y Swanson

Tipo de recompensa
Psíquica Ninguna Concreta

Clase media 25 6 7
.66 .16 .IS
Clase obrera 12 37 28
.16 .48 .36

Cuadro 10-12. Relación entre educación y tolerancia en el


estudio de Stouffer

Porcentaje de distribución de puntuaciones


en la escala de tolerancia

EducaciÍ5n Menos tolerante Intermedia Más tolerante N

Graduados universitarios 5 29 66 308


Enseñanza superior incompleta 9 38 53 319
Graduados de enseñanza media
superior (bachilleres) 12 46 42 768
Enseñanza media incompleta 17 54 29 576
Escuela primaria 22 62 16 792

datos son estadísticamente significativos. De este relaciones entre tres o más variables. Tornaremos
modo la hipótesis se refuerza.(20) un ejemplo de tres variables que designaremos con
las letras A, By C. Podemos estudiar las siguientes
Tablas tridimensionales relaciones: entre A y B, entre A y C entre B y C, y
y mullidimensionales (k) entre A, B y C. El segundo propósito consiste en
En teoría, es posible manejar mediante las divi- controlar una variable en tanto se estudia la relación
siones cruzadas cualquier número de variables, pero entre las otras dos. Por ejemplo, podemos estudiar la
en la práctica existe un límite de tres o cuatro varia- relación entre B y C, mientras controlarnos A. Un
bles (con mayor frecuencia, tres). Las razones de uso importante de esta noción es ayudar a detectar
esta limitación son obvias: se requieren muestras relaciones espurias. Otro, es' 'especificar" una rela-
muy grandes (N) y lo que es más importante, la ción, indicarnos el momento o las circunstancias en
interpretación de los datos se hace mucho más difí- que una relación es más o menos intensa.
cil. Otro punto importante que hay que tener en
mente es que nunca se debe usar un análisis com-
Especificación
plejo si se puede lograr el mismo resultado analítico
" ... es el proceso de descripción de las condi-
con otro más sencillo. Aun así, las tablas de tres e
ciones o circunstancias en las cuales puede existir o
incluso cuatro variables son útiles y aportan infor-
no una relación particular, o existir en un grado
mación indispensable. mayor o menor."(21) Una parte importante del aná-
El análisis simultáneo de tres o más variables tiene lisis es la especificación de las relaciones a través de
dos propósitos básicos. Uno de ellos es estudiar las las divisiones cruzadas, porque es posible detectar
relaciones espurias y definir circunstancias y condi-
(20) Whiting y Child emplearon un método poco usado, de some- ciones en las cuales existe o no una relación.
ter a prueba la significación estadística. Véase la misma obra, págs. Supongamos que un investigador se interesa por la
163-166. Los porcentajes no aparecen en el cuadro 10-4, porque su
uso con tan pocos casos es cuestionable. Los porcentajes. cuando hipótesis de que el nivel de aspiración guarda rela-
existe un número pequeño de casos, son desorientadores. Sin em-
bargo, es dificil definir lo que es un "número pequeño de casos".
Una regla empírica sería: no calcular porcentajes si la frecuencia (21) W. Goode y P. Hatt, Methods in Social Research. Nueva
marginal es menor de 30. York: McGraw-Hill. 1952, pág. 356.
126 ANALISIS, INTERPRETACION, ESIADISTICA E INFERENCIA

Cuadro 10-13. Relación entre la ansiedad oral y las explicaciones verbales


de las enfermedades según el estudio de Wbiting y Child

Sociedades con Sociedades sin


explicación oral explicación oral

Sociedades por arriba


de la mediana en cuanto a 17 3
ansiedad oral

Sociedades por debajo


de la mediana en cuanto a 6 13
ansiedad oral

ción positiva con el aprovechamiento (éxito) en una vuelve a sus datos: afortunadamente cuenta con ín-
institución de enseñanza superior: cuanto mayor sea dices de las clases sociales para todos los sujetos y
el nivel de aspiración, mayor será la probabilidad de obtiene, cuando hace la división cruzada con tres
que una persona se gradúe. Más aún, imaginemos variables, los resultados que aparecen en el cuadro
que el investigador cuenta con una medida dicotó- 10-15.
mica relativamente burda o cruda del nivel de aspi- El x2 global es 144, que es significativo a un nivel
ración.(22) También tiene por supuesto, una medida de .00 l. C = .51. Las frecuencias de la tabla se alejan
del éxito en la institución de enseñanza superior: ¿se muy significativamente de los resultados esperados
graduó un estudiante o no? En consecuencia, las por azar. ¿Pero qué es lo que contribuye a este
variables o categorías son Hi LA (nivel alto de aspi- resuitado? La inspección de los datos demuestra que
ración), Lo LA (nivel bajo de aspiración), SC (éxito el colega del investigador estaba en lo cierto: la
en la carrera universitaria), y NSC (fracaso en la relación entre el nivel de aspiración y el éxito en la
carrera universitaria). Extrae una muestra aleatoria institución de enseñanza superior (graduación), es
de 400 alumnos de segundo año de una institución muchísimo más notable en el caso de los estudiantes
universitaria y obtiene el nivel de medidas de aspira- de clase media, que en el de los estudiantes de clase
ción, con base en ella. Divide a los 400 estudiantes en obrera.
mitades, con base en las medidas de nivel de aspira- El investigador puede estudiar las relaciones con
ción. Al final de tres años establece categorías de mayor profundidad si calcula por separado los por-
estudiantes tomando como base el que se hubieran centajes (laterales) de la clase media y de la clase
graduado o no. Supongamos que los resultados co- obrera, en el cuadro 10-15.
rresponden a los del cuadro 10-14.(23) Evidente- En este caso, dado que las frecuencias en cada fila
mente hay una relación entre las variables: x~ = 64, de las mitades de la tabla totalizan 100, las frecuen-
que es significativa al nivel de .001, y e = .37. cias de hecho son porcentajes. Puede apreciarse que
El investigador muestra los resultados a un co- la relación entre el nivel de aspiración y el éxito en
lega, una persona muy escéptica, quien le indica que los estudios superiores, es más fuerte en los estu-
son cuestionables, y que si se hubiera hecho partici- diantes de clase media que en los de clase obrera.(24)
par en el estudio a la clase social, la relación sería En el análisis anterior se especificaron los datos:
totalmente distinta. Su razonamiento es que la clase se mostró, al introducir la vmiable de clase social,
social y el nivel de aspiración guardan una fuerte que la relación era más potente con un grupo, que
relación, y que la relación original sería válida para con el otro. Pero este es el mismo fenómeno que se
los estudiantes de clase media, pero no para los de comentó en el capítulo 9: interacción (véasefig. 9-1 y
clase trabajadora. Desconcertado, el investigador el comentario respectivo). Señalamos en páginas an-
teriores que la interacción significa que una variable
independiente afecta a otra dependiente, de manera
(22) No hay razón lógica por la cual un investigador no emplee
tres, cuatro o más categorías como medida del nivel de aspiración.
distinta a diferentes niveles o facetas de otra variable
De hecho, con las medidas continuas adecuadas hay métodos más independiente. Esto es prácticamente lo que tene-
potentes de análisis. mos en el cuadro 10-15: la relación entre el nivel de
(2 3) Los totales marginales LA de la tabla se igualaron para
simplificar el análisis. Los totales SC y NSC también se igualaron.
De manera similar, los totales marginales del cuadro 10-16 también (24) Es posible y conveniente dividir una tabla de ese tipo y sus
fueron igualados. Existen pocas probabilidades de que en la prác- componentes, ycalcular las x• que contribuyen a cada uno de ellos.
tica se obtengan totales marginales igualados, como los que presen- Este procedimiento queda fuera del alcance de este capítulo, si bien
tamos. Según esto, el ejemplo no es realista. Sin embargo, es útil guarda relación íntima con un análisis similar de métodos de va-
para demostrar los puntos expuestos. rianza que se comenta en la quinta parte.
ANALISIS DE DIVISIONES CRUZADAS 127

aspiración y el éxito en la institución de enseñanza Cuadro 10-14. Relación entre el nivel de


superior es diferente en las dos clases sociales. aspiración y aprovechamiento escolar
(datos hipotéticos)
Mediciones cruzadas, relaciones,
pares ordenados
se NSC

y representaciones gráficas HíLA 140 60 200


Los vínculos entre divisiones cruzadas, relacio- Lo LA 60 140 2QO
nes y correlaciones, son interesantes e instructivos.
200 200 (400)
Una relación comprende un conjunto de pares orde-
nados. Dos de las formas en las cuales podemos
expresar un conjunto de pares_ordenados, es por
medio de una lista de los pares o bien al expresarlos elevado nivel de aspiración (B1), él sería A iB1; en
gráficamente. El índice de correlación es aquel que consecuencia, el par ordenado que se le asigna seria
expresa el grado de relación. La división cruzada (1, l). Los primeros 10 sujetos del cuadro 10-17
expresa en forma tabular los pares ordenados. pertenecen a la categoría A 1B 1 y, de esta forma, se
Para mostrar la relación que priva entre estas les asigna los índices (1, 1). De manera similar, se
ideas, tomemos los datos ficticios del cuadro 10-16, asignan pares ordenados de números al resto de los
donde el universo U = 23 alumnos. La relación bajo sujetos, de acuerdo al subconjunto al que pertenez-
estudio es la que existe entre el sexo y el nivel de can. En el cuadro 10-17 se presenta la lista completa
aspiración. Dividimos el universo U en varones (M) de los 23 pares ordenados. Las categorías o intersec-
y mujeres (F). También dividimos U en un nivel alto ciones de la división cruzada (coajunto) aparecen
de aspiración (Hi LA), y un nivel bajo (Lo LA). De indicadas.
este modo, tenemos una partición de dos variables o La relación es el conjunto de pares ordenados de
división cruzada. unos y ceros. El cuadro 10-17 es simplemente una
Supongamos que de los 23 miembros del universo forma diferente de expresar la misma relación que
tenemos 12 M (varones) y 11 F (mujeres). También aparece en el cuadro 10-16. Podemos calcular el
contamos con 13 Hi LA (personas con un alto nivel coeficiente de correlación para ambas tablas. Si, por
de aspiración) y 10 Lo LA (personas con un nivel ejemplo, calculamos un coeficiente de correlación,
bajo), lo cual nos da los totales marginales de una un producto-momento r, de los datos del cuadro
división cruzada. Los datos no indican el número de 10-17, obtendremos .56. (El coeficiente de correla-
miembros que existen en cada celda. Ahora debe- ción producto-momento [r] calculado con base en
mos contar el número de alumnos varones( M), o que los unos y los ceros, recibe el nombre de coeficiente
tienen HI LA (un elevado nivel de aspiración) y phi [<t>J.)(26)
también el número de varones que tienen Lo LA (un Elaboremos una gráfica de la relación. Suponga-
nivel bajo de aspiración) el número de alumnas que mos que hay dos ejes, A y B, que forman un ángulo
también tienen Hi LA (nivel alto de aspiración), y el recto, y que A y B representan las dos variables de
número de alumnas que tienen Lo LA (nivel bajo de los cuadros 10-16 y 10-17. Nos interesa estudiar la
aspiración). El resultado corresponde a las cifras del relación entreA y B. La figura I0-4muestralospares
cuadro 10-16. Estas frecuencias distan significati- ordenados, expresados en una gráfica. También
vamente de ser datos obtenidos por azar.(25) Existe muestra una línea de "relación" a través del grupo
una relación significativa del sexo y el nivel de aspi- mayor de pares. ¿En dónde está la relación? Pregun-
ración. tamos: ¿existe un conjunto de pares ordenados que
Consideremos el ejemplo en otra forma. Supon- defina una relación significativa entre A y B? Hemos
gamos queA1=M; A2=F; B1=HiLA, yfü =Lo LA. pareado la puntuación de cada persona en A, con' 'la
¿En qué forma disponemos los pares ordenados en la puntuación" enB, y graficado los pares en los ejes A
división cruzada? Lo hacemos al asignar a cada uno y B. Si retornamos a la esencia de la relación, parea-
de los 23 sujetos, una de las combinaciones ( I, 1), (O, mos cada "puntuación" individual sobre el sexo,
1), (1, O), (0, O). Asignaremos un 1aA1 y B1, y un Oa con la "puntuación" del nivel de aspiración del es-
A2 y B2. Si el individuo es varón (A 1) y tiene un tudiante. De esta forma, obtenemos un conjunto de
pares ordenados y este subconjunto es una relación.
(25) Según indican las tablas de Finney. Véase S. Siegel, Nonpa-
Planteada de otra forma, nuestra pregunta real no es:
rametric Statistics. Nueva York: McGraw-Hill, 1956, págs. 256- ¿existe una relación entre A y B?, sino más bien:
270. Cuando las frecuencias son relativamente pequeñas, las tablas ¿cuál es la relación entre A y B?
de Finney permiten una estimación más precisa de la significación,
que la prueba)('! Las tablas de Finney también se pueden encontrar (26) Este no es el método recomendado. Lo usamos en este punto
en: E. Pearson y H. Hartley, eds. Biometrika Tables for Statisti- para esclarecer métodos de análisis y para ilustrar la forma en que
cians, Vol. I. Cambridge: Cambridge University Press, 1954, págs. se calcula .p. Cuando ambas variables son dicotonúas reales, se usa,
188 y sigs. pero no es lo que ocurre en este caso.
128 ANALISIS, INTERPRETACION, ESTADISTICA E INFERENCIA

Cuadro 10-15. Relaciones entre el nivel de aspiración, clase nificativa. Pocos investigadores comprenden a fondo
social y aprovechamiento escolar (datos hipotéticos) toda la estadística, y los métodos de observación y
de análisis, especialmente en las primeras etapas de
MC wc estudio. El conocimiento profundo se adquiere sólo
HiLA LoL1 HiLA Lo LA
con el estudio y la experiencia. El investigador debe
probar los métodos antes descritos. y probable-
se 80 20 60 40 200 mente notará que a medida que lo hace, comenzará a
disfrutarlos. Una vez que esto ocurre, ha comen-
NSC 20 80 40 60 200 zado el aprendizaje real. Más tarde estudiaremos
métodos más interesantes y, sin duda, más potentes.
JO() 100 JO() 100 (400)

(200) (200) Apéndice: otros tipos


de divisiones cruzadas
Existen otros tipos de divisiones cruzadas, dife-
rentes de los que hemos descrito en este capítulo. No
Podemos observar de la figura I0-4, que la rela- los expusimos porque en estos párrafos insistimos
ción entre A y B es bastante fuerte, lo cual depende en los conocimientós básicos del análisis de frecuen-
de los pares ordenados: ellos son básicamente (a1, cia (y porcentajes) en la investigación científica con-
b1) y (a2, b2). Son comparativamentepocos(a1, b2) y ductual, y tratamos de integrar dicho análisis a las
( a2, b1). En otras palabras, las puntuaciones de los ideas previas de conjuntos y relaciones.
varones se parean con las puntuaciones del nivel alto Por desgracia, los sociólogos y los psicólogos han
de aspiración ( 1, l), y las puntuaciones de las muje- usado métodos muy diferentes, y no se han perca-
res forman pares con las puntuaciones del nivel bajo tado que existen puntos comunes en sus investiga-
de aspiración (O, O), con pocas excepciones (cinco ciones. Los psicólogos, en su mayor parte, usan
casos de un total de 23). No podemos denominar medidas continuas y técnicas adecuadas a ellas: me-
sucintamente a esta relación, como lo hacemos con dias, desviaciones típicas o estándar, pruebas t,
relaciones como '"matrimonio" ,''fraternidad". y pruebas F, correlaciones y otras más. Pero usan con
otras semejantes. Sin embargo, podríamos llamarla menor frecuencia divisiones cruzadas y análisis de
"sexo-nivel de aspiración". y con ello, denotar que frecuencias. Por otra parte, los sociólogos emplean
existe una relación en el par ordenado. básicamente análisis de frecuencias y de divisiones
Debe quedar claro para el lector que existen diver- cruzadas. Nuestro propósito es dár al estudiante
sas formas de analizar los mismos datos. Nunca se todos los datos teóricos y prácticos, de tal forma que
enfatizará lo suficiente la importancia de conocer los pueda leer inteligentemente la literatura sobre este
diferentes métodos, sus relaciones con los proble- tema, y, lo que es más importante,·escoger las for-
mas de investigación, y sus relaciones mutuas. Con mas de análisis que mejor se adapten a sus proble-
el uso y conocimiento de métodos diferentes, el in- mas.
vestigador no sólo adquiere competencia técnica, Hay que recordar siempre un precepto: no se debe
sino profundidad y flexibilidad en el conocimiento. usar el análisis de divisiones cruzadas si los datos
Se hacen muchísimos análisis de manera rutinaria e garantizan el empleo de un método más potente de
incomprensible. Si bien no tiene sentido pensar ·análisis. Si la variable dependiente con que se tra-
cuando no se necesita, como señaló hace mucho baja tiene medidas continuas, por lo regular no suele
Whitehead, también es peligroso no pensar y desco- ser conveniente el análisis de divisiones cruzadas.
nocer lo que se hace, tanto cuando se planea la Nunca hemos eliminado en forma consciente y deli-
investigación y el análisis de los datos que se van a berada la varianza. Es la esencia básica del análisis
obtener, como cuando se lleva a cabo realmente y, por desgracia, las medidas continuas en que se
dicho análisis.
Ningún método de análisis es perfecto. Por el be-
neficio obtenido por un método a menudo perdemos Cuadro 10-16. Relación entre clase social
el que obtenemos con otro. Conviene escoger el y aprovechamiento escolar (datos ficticios)
método que se adapte mejor al problema de investi-
gación y a los datos experimentales. El investigador B, B2
debe estudiarlo, emplearlo, e interpretar los resulta- HiLA Lo LA
dos obtenidos, con gran cuidado. Conviene que co-
nozca a fondo los métodos que usa, al igual que la A, M lO 2 12
estadística y no se preocupe demasiado por las supo- A2 F 3 8 11
siciones y restricciones. Son importantes, por su- 13 lO
puesto, pero es más importante la investigación sig-
ANALISIS DE DIVISIONES CRUZADAS 129

Cuadro 10-17. Ordenamiento por pares de los datos del cuadro 10-16

Ss A B

l l l
2 l l
3 1 l
4 l l
5 l 1
6 1
7 1 1
8 1 l
9 1 1
10 I
11 o l
12 o l
13 o l

14 l o
15 o
16 o o
17 o o
18 o o
19 o o
20 o o
21 o o
22 o o
23 o o

aplica la división cruzada eliminan la varianza. Si el problemas sociológicos y psicológicos. Si tomamos,


investigador tiene una escala de actitudes y hace por ejemplo, la American Sociological Review, ad-
dicotomías y tricotomías dividiéndolas en alta y vertiremos con sorpresa·, que un gran número de
baja, alta, media y baja, etc., estará eliminando la variables que se estudian en las investigaciones son
varianza y con ella una información útil. psicológicas, y por lo contrario, en el Journal of
Las formas de análisis que una disciplina particu- Personality and Social Psychology que muchas de
lar tiende a utilizar, reciben como algo natural la las variables son sociológicas.
influencia de las variables que privan en su campo de
acción. Los sociólogos usan muchísimo los análisis Guías de estudio
de divisiones cruzadas y análisis conexos, porque 1. ¿Qué relación guarda la especificación con datos
muchas variables sociológicas son categóricas o se espurios? Prepare uno o dos ejemplos para de-
les trata como tales: ingreso económico, religión, mostrar su explicación.
ocupación, sexo y otras. Por otra parte, las variables 2. En el importante Comunicado de la Comisión
psicológicas tienden a ser continuas, como señala- Kemer sobre desórdenes civiles en Estados Uni-
mos: ansiedad, inteligencia, actitud, agresividad, dos, un gran número de relaciones fueron expues-
aprovechamiento y otras. Sin embargo, en años re- tas en forma tabular. Presentamos una de las
cientes se ha presentado un acercamiento cada vez tablas de la encuesta Newark, que consigna los
mayor entre ambas disciplinas y, por consiguiente, porcentajes de respuestas al reactivo "a veces
entre sus problemas y métodos de investigación; ello odio a los blancos", que se formuló a los alboro-
obliga a psicólogos y sociólogos a dominar y ampliar tadores (R) y a personas que no alborotaban
los instrumentos que en época pasada fueron del (Nl).(27)
dominio exclusivo de una de las dos disciplinas. Esta R(N= !05) Nl(N= 126)
es una consecuencia saludable que permitirá a los
científicos de la conducta cumplir a fondo su come- Personas que concordaron 72.4% 50.0%
tido al orientar su atención a problemas y su estudio, Personas que discordaron 27.6 50.0
y no a métodos y técnicas. Desde hace mucho (27) Report of the Nationai Advisory Comnússion on Civil Di-
tiempo ya no se hace la división tajante entre los sorders. Nueva York: Bantam, 1968, pág. 176.
130 ANALISIS, INTERPRETACION, ESTADISTICA E INFERENCIA

3. Poco después que tomó posesión el finado Presi-


dente Kennedy, hubo controversias en el Comité
Normativo de la Cámara de Representantes (Di-
putados). El representante Rayburn deseaba au-
s 1<1) . mentar el número de miembros del Comité, de tal
forma que no estuviese dominado por una coali-
ción conservadora. Cuando se sometió el pro-
B yecto a votación en la Cámara, las fuerzas co-
mandadas por Rayburn ganaron por 217 votos
contra 212. Cabría preguntar: ¿existe relación al-
guna entre la afiliación política y los votos sobre
este particular? Los datos son:(28)

En pro En contra

Demócratas 195 . 64
Republicanos 22 148

Figura 10.4. Calcular x2y C. También calcule Ja tabla apro-


piada de porcentajes. Interprete los datos.
¿Existe otra interpretación posible, esto es, po-
a) Interprete la tabla y examine los datos con dría actuar una variable independiente distinta de
cuidado antes de interpretarlos. la afiliación política?
b) Calcule las frecuencias (por ejemplo .724 x [Respuestas: X = 159.61 (.001); C = .52.]
105 = 76) ¿Se calcularon los porcentajes por el 4. En su estudio sobre los mecanismos de defensa y
método "más adecuado"? Calcúlelos a través clase social, Miller y Swanson(29) publicaron un
de las filas, por ejemplo, 761139 = .55. ¿Cam- gran número de tablas interesantes entre las cua-
bia la interpretación? ¿En qué forma? les estaban fas siguientes. Conviene que el lector
e) Si, en opinión de usted, se han calculado inco- interprete cada una de ellas, en primer lugar cal-
rrectamente los porcentajes en los datos ante- culando porcentajes, después x2 ' y después c.
riores: ¿a qué se debió el error? (Las variables se explican por sí mismas.)

(a) Solicitudes de obediencia (b) Destete

Arbitrarias Explicadas Temprano Tardío

Clase media 16 27· Clase medfa 33 22


Clase obrera 28 10 Oase obrera 17 31

(e) Tipo de recompensa (d) Disciplina

Psíquica Mixta Concreta Psicológica Mixta Corporal

Oase media 25 6 7 Oase media 29 5 4


Clase obrera 12 37 28 Clase obrera 9 28 40

Es conveniente que el lector advierta particular- lector que estos x2 se calcularon empleando la
mente en estos cuatro ejemplos, que estudiar las corrección para continuidad. Simplemente se
freéuencias y x2 no nos reporta mucha informa- resta .5 de fo-fe antes de elevar al cuadrado.)
ción en cuanto a las relacione~. Es necesario in-
terpretar las .tablas. (28) Elaborado con cifras pubÍicadas en el New lork Times,
(Respuestas: x2 : a) 9.40; b) 5.26; e) 29.52; d) febrero 15, 1961, sec. 4, pág. l.
49.45. C: a) .32; b) .22; e) .45; d) .55. Advierta el (29) Miller y Swanson; op. cit., págs. 426 y sigs.
CAPITULO 11
Finalidad, enfoque y metodología de la estadística

El enfoque básico al modelo aleatorio. Si los datos empíricos "con-


El principio básico en el que se funda el uso de las cuerdan" con el modelo aleatorio, se dice que "no
pruebas estadísticas de significación puede conden- son significativos", pero si no concuerdan y se ale-
sarse en una oración: comparación de los resultados jan "lo suficiente" del modelo aleatorio, se dice que
obtenidos con los que cabría esperar por la sola son "significativos".
intervención del azar. Después de hacer una investi- Dedicaremos este capítulo y los siguientes a la
gación y obtener los resultados estadísticos respec- exposición del enfoque estadístico, y a su aplicación
tivos, éstos se comparan con los resultados que se a los problemas experimentales. En este capítulo
producirían por la sola intervención del azar. En el ampliamos los comentarios del capítulo .7 sobre la
capítulo 7 expusimos ejemplos de comprobación d~ probabilidad, a concepciones básicas de la media,
resultados empíricos, en los que se compararon los varianza y desviación típica (estándar). También
resultados obtenidos al lanzar dados y monedas con explicaremos e ínterpretaremos la llamada ley de los
las expectativas teóricas. Por ejemplo, si se arroja un grandes números y la curva de probabilidad normal,
dado muchísimas veces, la proporción esperada de y señalaremos algunos conceptos para su empleo
que aparezca el cuatro, es un sexto del número total provechoso en estadística. En· el siguiente capítulo
de lanzamientos. En el capítulo 10 señalamos que el nos ocuparemos de la idea del análisis estadístico,
fundamento de la prueba x2 consistía en la compara- por sí misma, tales capítulos son la base de dicha
ción de las frecuencias observadas de eventos, con exposición.
los números de frecuencias esperadas con la sola
intervención del azar. Por esta razón, las ideas esta-
dísticas del capítulo 10 antecedieron a las del capí- Definición y finalidad
tulo 11, en parte para dar al estudiante experiencia de la estadística
preliminar en lo que respecta a los resultados obte- La estadística es la teoría y el método de analizar
nidos y a los espetados. datos cuantitativos obtenidos a partir de muestras
En la demostración descrita en el capítulo 7 se de observaciones, a fin de.estudiar y comparar las
arrojaron dos dados 72 veces. En teoría, el número fuentes de varianza de los fenómenos, hacer deci-
siete debió aparecer 1/6 x 72 = 12 veces, pero en el siones sobre la aceptación o rechazo de relaciones
cuadro 7-2 se observó que el número siete salió 15 hipotéticas entre los fenómenos, y facilitar la obten-
veces en 72 lanzamientos, y no 12 veces. Formula- ción de inferencias fidedignas a partir de observa-
remos una pregunta importante: ¿este resultado difi- ciones empíricas.
rió significativamente del resultado que en teoría se Esta definición sugiere que la estadística tiene
esperaba? O bien: ¿difirió el resultado obtenido del cuatro finalidades. La primera es la más común y
resultado que se esperaba por intervención del azar, tradicional: reducir grandes cantidades de datos a
en grado suficiente para justificar la idea de que en una forma de fácil comprensión y tratamiento. Por
los lanzamientos intervino algún factor diferente del ejemplo, es imposible asimilar 100 puntuaciones,
azar? pero si se calculan la media y la desviación estándar,
Dichas cuestiones constituyen la esencia del en- una persona experta podrá interpretar fácilmente las
foque estadístico. El estadístico es un escéptico. No puntuaciones. La definición d.e "estadígrafo" pro-
cree en la "realidad" de los resultados empíricos viene de este uso y finalidad tradicional de la estadís-
hasta que les ha aplicado pruebas estadísticas. Su- tica. El estadígrafo es la medida calculada a partir de
pone que todos los resultados se deben al azar, hasta una muestra. El estadígrafo es diferente delparáme-
que prueba lo contrario. Hasta donde cabe, podría~ tro, que es un valor de una población. Si en una
mos llamarlo un probabilista inveterado. Lo esencial población o universo U calculamos la media, obte-
del tratamiento que da a los datos empíricos es plan- nemos· un parámetro. Ahora tomemos un subcon-
tear como hipótesis la expectativa de que todo se junto (muestra) A del universo. La media del subcon-
debió al azar, y tratar de adaptar los datos empíricos junto A es un estadígrafo. Para nuestros fines, los
131
132 ANAUSIS, INTERPRETACION, ESTADISTICA E INFERENCIA

parámetros tienen únicamente interés teórico, por- en la suposición de que dos, tres, cuatro, cinco, seis
que por lo regular se les desconoce. Se les estima, y siete tienen igual probabilidad de salir (equiproba-
por medio de la estadística. De este modo, el investi- bilidad). En esta situación, posiblemente B ganará.
gador se ocupa básicamente de estadígrafos de La cuarta y última finalidad de la estadística, con-
muestras o subconjuntos. Por lo regular, se conciben siste en facilitar la obtención de inferencias confia-
las muestras o subconjuntos como representativas bles a partir de datos de observación, guarda rela-
de U. Sobre esta base, los estadígrafos son resúme- ción íntima y, de hecho, forma parte del objetivo de
nes de las muestras y, a menudo, de las poblaciones facilitar las decisiones en base a las hipótesis. Una
a partir de las cuales se calcularon. Medias, media- inferencia es una proposición o generalización obte-
nas, varianzas, desviaciones estándar, porcentiles, nida por razonamiento, partiendo de otras proposi-
porcentajes y otras cifras calculadas a partir de las ciones o de las pruebas materiales. En términos ge-
muestras, son estadígrafos. nerales, una inferencia es una conclusión a la que se
Otro uso de la estadística es facilitar el estudio de llega por medio del razonamiento. En la estadística,
las poblaciones y las muestras. La utilización de la pueden extraerse diversas inferencias, al someter a
estadística para este fin es tan común, que no la prueba varias hipótesis estadísticas. "Concluimos"
comentaremos. Además, en capítulos anteriores es- que los métodos A y B realmente difieren o, con base
tudiamos someramente poblaciones y muestras. en la evidencia empírica, señalamos que, por ejem-
La tercera finalidad de la estadística es facilitar la plo: r=.67, y que las dos variables están verdadera-
toma de decisiones. Si el psicólogo educacional ne- mente relacionadas.
cesita saber cuál de tres métodos de instrucción Las inferencias estadísticas tienen dos peculiari-
programada permite el mejor aprendizaje con el me- dades; en primer lugar se hacen respecto a las carac-
nor costo, puede emplear la estadística para tener terísticas de una población en base a las característi-
una mejor idea del asunto. Este empleo de la estadís- cas que presenta una muestra. Cuando afirmamos
tica es relativamente reciente. En este libro emplea- que las variables A y B guardan relación porque la
remos algunas de las Ideas básicas de la teoría de la evidencia estadística es r= .67, inferimos que como r
decisión estadística, sin las ramificaciones técnicas. = .67 en esta muestra, lar de la población de la cual
De hecho, esta finalidad está implícita en la exposi- se extrajo la muestra también tiene el mismo valor, o
ción de inferencia que comentaremos más adelante. uno muy cercano. El segundo tipo de inferencia se
Aunque casi todas las situaciones en que se re- usa cuando los investigadores no están interesados
quiere hacer una toma de decisión suelen ser más en las poblaciones o su interés es sólo secundario.
complejas, emplearemos un ejemplo que es muy Un investigador de pedagogía estudia el supuesto
conocido. Un jugador de dados que ha de tomar efecto de las relaciones entre los miembros del con-
decisiones, en primer lugar tratará de calcular y sejo de enseñanza y los jefes de administración edu-
plantearse los resultados de lanzamientos. Estos, cacional, por una parte, y el estado de ánimo del
por supuesto, pueden ser los números 2 hasta 12. maestro, por otra parte. Ha planteado la hipótesis de
Observa la frecuencia diferente con que aparecen los que cuando la relación entre los Consejos de ense-
números. Por ejemplo, el dos (uno más uno) y el 12 ñanza y los jefes administradores son tensas, hay
(seis más seis) probablemente ocurran con menor mayor depresión en el estado de ánimo "moral" de
fr~uencia que el siete o el seis. Calcula las probabi- los maestros que cuando no es así. Se interesa sólo
lidades de que aparezcan diversas combinaciones y en poner a prueba esta hipótesis en el condado Y.
resultados. Por último, con base en la cantidad de Hace el estudio y obtiene resultados estadísticos que
dinero que espera ganar, crea un sistema de apues- apoyan la hipótesis, por ejemplo, de que en el sis-
tas. Por ejemplo, decide que como el número siete tema A, el estado de ánimo de los maestros sufre
tiene una probabilidad de 1/6, necesitará que su mayor depresión, que en los sistemas B y C. Infiere o
rival le pague cinco tantos por uno, en vez de pagarle deduce, con base en los datos estadísticos de la
a la par, en el primer lanzamiento (podemos tomar- existencia de una diferencia en A, poruna parte, y en
nos algunas libertades con el juego "seven- los sistemas B y C, por otra, que su proposición
eleven"). Para hacer el juego un poco más emocio- hipotética es correcta, justamente en el condado Y,
nante, supongamos que los dos jugadores operan y es posible que su interés se limite sólo a dicho
con dos tomas de decisión distintas.(}) Eljugador A condado.
propone el siguiente juego: él ganará si aparecen los Para resumir gran parte del comentario anterior,
números dos, tres o cuatro, y su oponente, B, si podemos reducir las finalidades de la estadística en
salen. los puntos, cinco, seis o siete. (Los números una sola de mayor importancia: facilitar la obten-
del 8 al 12 no se incluirán en esta jugada.) Es obvio ción de inferencias, la cual es una de las metas bási-
que la toma de decisión de A es errónea, pues se basa cas en el diseño de investigación, la metodología y
las operaciones estadísticas. Los científicos desean
( 1) Este ejemplo fue sugerido por l. Bross, Design for Decision. extraer u obtener inferencias de los datos. La esta-
Nueva York: Macmillan, 1953, pág. 28. dística, por su capacidad de reducir los datos a for-
FINALIDAD, ENFOQUE Y METODOLOGIA DE LA ESTADISTICA 133

mas "manejables" (estadígrafos), y estudiar y anali- Por supuesto, según la fórmula 11. l; es la misma,
zar las varianzas, permite a los científicos atribuir pero su cálculo parece distinto:
estimaciones de probabilidad a las inferencias ex-
traídas de los datos. La estadística, en efecto, se- M=l · 1/5+2·1/5+3·1/5+4·1/5+5·1/5=3
ñala: "La inferencia que usted obtuvo es correcta en
tal nivel de significación. Usted puede actuar como ¿Por qué detenerse en minucias? Arrojemos al aire
si su hipótesis fuese verdadera, sin olvidar que existe una moneda. U ={H, T}. El número promedio de
una probabilidad de diversa magnitud, de que no lo caras, con base en la ecuación 11. l, es
sea." Por lo anterior, es posible entender por qué
algunos estadísticos contemporáneos denominan a M = 1 · 1/2 + O · 1/2 = I /2
su campo de estudio como la disciplina de toma de
decisiones bajo incertidumbre. También debe que- Arrojemos al aire dos monedas. U={HH, HT, TH,
dar claro que, sépalo o no, el investigador siempre IT}. El número promedio de caras o la expectativa
hace inferencias, asigna probabilidades a diversos de que aparezcan es
resultados o hipótesis, y toma decisiones con base
en razonamientos estadísticos. El empleo de la teo- M = 2·1/4+1·1/4+ 1·1/4+0 · 1/4 = 4/4 = 1
ría de la probabilidad y las matemáticas simplemente
hace que este proceso sea más exacto. Lo cual significa que si se arrojaran muchas veces
dos monedas, el número promedio de caras por lan-
Estadísticas binomiales zamiento sería 1. Si tomamos una muestra de una
Cuando se cuentan cosas, el sistema de numerales persona de un conjunto de 30 varones y 70 mujeres,
es sencillo y útil. Cuando se cuentan objetos, se el promedio, en lo que respecta a los varones, sería
toma como base algún criterio, alguna variable o M=3/10 · 1 + 7/10 ·O= .3, y el de las mujeres, M =
atributo, en lenguaje experimental. Hemos expuesto 3/ 10 · O+ 7/10 · l = .7. Estas serían las medias para
muchos ejemplos: caras y cruces en las monedas, un resultado (es como si se dijera "un promedio de
números en los dados, sexo, actos agresivos, prefe- 2.5 niños por familia").
rencias políticas y otras más. Si una persona o una Lo que se ha dicho en estos ejemplos es que la
cosa poseen el atributo, se les "cuenta". Cuando media de cualquier experimento (un solo lanza-
algo se "cuenta" porque posee el atributo en cues- miento de moneda o una muestra de una persona) es
tión, se le asigna el número· uno, y si no posee el la probabilidad de que ocun·a uno de dos posibles
atributo, se le asigna el cero. Este es el sistema resultados (caras, un hombre), al cual si aconteciera
binomial. en realidad, se le asignaría un uno y si no, se le
Anteriormente definimos a la media como M asignaría un cero. Esto equivale a decir: p( l) = p y
= 'i.Xln. La varianza es V= 'i.x 2 /n, enlacualx =X - p(O) = l - p. En el experimento de un lanzamiento,
M (cadax es una desviación a partir de la media). La se asignará el número uno si aparece la cara, y el cero
desviación estándar es SD = VV. Por supuesto, si aparece la cruz. En esta situaciónp( !) = 1/2 y p(O)
estas fórmulas sirven para cualquier puntuación. En = l - 1/2 = 1/2. Al arrojar dos veces una moneda
este contexto, las usaremos sólo con los unos y los asignaremos uno a cada vez que salga cara y cero a
ceros. También resultará útil modificar la fórmula cada vez que aparezca cruz. Nos interesan los resul-
para la media. La fórmula 'i.Xln no es lo suficiente- tados "caras". U'={HH, HT, TH, TT}. La media es
mente general, pues supone que todas las puntua-
ciones son equiprobables (que tienen igual probabi- M= 1/4·2+1/4· l+l/4· l+l/4·0= l
lidad). Una fórmala más general que se emplea
cuando se supone que no hay equiprobabilidad es: ¿Podríamos llegar al mismo resultado de una ma-
nera más fácil? Por supuesto: basta con sumar las
M = ~ [X· w(X)] (11.l) medias de cada resultado. La media del evento que
resulta de arrojar sólo una vez al aire la moneda, es
en la cual w(X) es el peso que se Je asigna a una X. 1/2. Para dos lanzamientos es simplemente l/2 + 1/2
w( X) simplemente denota la probabilidad que tiene = l. Para asignar probabilidades a un lanzamiento
cada X de ocurrir. La fórmula señala: multiplique "ponderamos" o pesamos l (cara) con su probabili-
cada X, cada puntuación, por su peso (probabilidad), dad, y O(cruz) con su probabilidad, y de esta manera
y después haga una suma total. Adviértase que si se obtiene: M=p · 1 + (1 - p) ·O= p. Ocupémonos
todas las X son igualmente probables, la fórmula ahora del problema de muestrear varones y mujeres.
tendría la forma "i..Xln. Supongamos que p = la probabilidad de extraer un
La media del conjunto { l, 2, 3, 4, 5} es varón en un solo intento, y I - p=q=la probabilidad
de extraer una mujer en un solo intento. En esta
M = l + 2 + 3 + 4 + 5 = 15 = 3 situación,p=3/10yq=7/IO. Ahora estamos interesa-
5 5 dos en la media de la probabilidad de que sea mues-
134 ANALISIS, INTERPRETACION, ESTADISTICA E INFERENCIA

treado un varón. Dado que M = p · l + q ·O= p, M= M(S 11 ) = pn ( 11.3)


3/10 · l + 7/10 ·O = 3/10 =p. La media es 3/10, y la
probabilidad es 3/10. EvidentementeM=p, es decir, En n ensayos o intentos, el número promedio de
que la media es igual a la probabilidad.
veces en que aparece un resultado relacionado con
¿Qué ocurriría con una serie de eventos? Identifi- pes pn.
caremos por las literales Sn la suma den resultados.
Dimos un ejemplo en líneas anteriores, que es el
lanzamiento de dos monedas. Supongamos que nos Varianza
ocupamos del problema de muestreo de varones- Recordemos que en el capítulo 6 definimos a la
mujeres. La media de que extraigamos un varón es varianza como V =-"i.x 2 /n. Por supuesto, en este capí-
3/10, y de que sea: una mujer de 7/10. Si extraemos tulo no cambiaremos el concepto fundamental, pero
muestras de 10 personas. ¿Cuál será el número pro-
sí los símbolos (por Ja misma razón que dimos en
medio de varones? En otras palabras: ¿cuál es la
cuanto a Ja fórmula de Ja media):
expectativa de que sean varones? Si sumamos las 10
medias de los resultados individuales, tendremos la
respuesta:
V=¡ [ w(X) (X-M) 2 ] (l l.4)
M(S10) =Mi+ M2 + · · · + M 10 (l l.2)
Para precisar lo que sigriifican la varianza y Ja des-
= 3/10+3/10+ .. ·+3/10 = 30/10 = 3 viación estándar en Ja teoría de probabilidades, pon-
dremos dos ejemplos. Recordemos que, binomial-
En una muestra de 10 esperamos obtener la res- mente, son posibles únicamente dos resultados: uno
puesta: tres varones. Pudo haberse obtenido el y cero. Por lo expuesto, X es igual a uno o cero.
mismo resultado al multiplicar 3/10 · 10 = 3, pero Elaboremos una tabla que nos ayude a calcular la
3/10 · 10 espn o varianza del evento ''cara'', al arrojar una moneda.

Resultado X w(X)=p (X-M) 2

Cara 1 1/2 (1- 1/2)2 = 1/4


Cruz o 1/2 (0-1/2) 2 = 1/4

La varianza es, entonces,

V= 1/2(1-1/2) 2 + 1/2(0-1/2)2 = 1/2 · 1/4+ 1/2 · 1/4 = 1/8 + 1/8 = 2/8 = 1/4
La media es 1/2 y la varianza es l/4. La desviación substituye ala ecuación 11.5. Con un poco de opera-
estándar es simplemente la raíz cuadrada de la va- ciones algebraicas, podremos obtenerla:
rianza, o sea Vi74 = 112.
Sin embargo, la varían.ta de un resultado indivi- V= P (1- P) = pq (11.7)
dual no tiene gran significado. Lo que realmente
deseamos conocer es la varianza de la suma de di- Esta es la varianza de un resultado. La varianza del
versos resultados. Si los resultados son independien- número de veces que acontece un resultado es, en
tes, la varianza de la suma de los resultados será forma análoga a las ecuaciones 11.2, 11.3 y 11.6, la
igual a la suma de las varianzas de los resultados: suma de las varianzas de cada resultado o

(11.5) V(S 11 ) = npq. (11.8)

O, en forma análoga, para las ecuaciones 11.2 y 11.3, La desviación estándar es


si todos los resultados tienen la misma media:
SD(S11 ) = v;pq (11.9)
V(Sn) = nVi (i = l, 2, ... , n) (11.6)
Las ecuaciones 11.3, 11.8 y l l.9 son importantes y
Para los 10 lanzamientos de monedas, la varianza de útiles. Pueden aplicarse a muchas situaciones esta-
las caras en esta situación sería V (H io) = 10 · 1/4 = dísticas. Aplicaremos la fórmula anterior adoso tres
10/4 = 2.5. situaciones: en primer lugar, al problema de
En párrafos anteriores señalamos que M (Sn) = acuerdo-desacuerdo del último capítulo. Se tomó
np. Ahora deseamos hallar una fórmula para la va- una muestra de 100 y, por esta razón, n = 100. Si
rianza, esto es, una expresión sencilla y directa que suponemos que hay equiprobabilidad, p = 1/2 y q =
FINALIDAD, ENFOQUE Y METODOLOGIA DE LA ESTADISTICA 135

Cuadro 11·1. Medias, varianzas, desviaciones estándar y probabilidades


esperadas de que aparezca el resultado "cara" con muestras
de diferente tamañoª

n M(S,.) =nP J'(S,.) = npq SD(S,.) M(H,.) =p J'(H,.) = pq/n


1h
1
10
50
1h
5
25
.25
2.50
12.50
.50
1.58
3.54
1h
1h
*1hoo
Y40

100 50 25.00 5.00 1h Y40o


400 200 100.00 10.00 1h *600
1000 500 250.00 15.81 1h Y40oo
ªVéase el texto en cuanto a explicación de los símbolos de este cuadro.

1/2. Por la razón expuesta,M(S 1oo)=np=lOO · 1/2 = el número de muestras, disminuirá la probabilidad
50,V(S1oo)=npq=lOO· l/2· l/2=25,ySD(S100)= de que el valor observado de un evento A se desvíe
\125 = 5. Se encontró que hubo 60 personas que delvalor"verdaderodeA, engradonomayordeuna
respondieron afirmativamente, esto es, asintieron. cantidad fija, k. Si se extraen de manera indepen-
En términos estadísticos, corresponde a dos desvia- diente los miembros de las muestras, cuanto más
ciones estándares a partir de la media de 50, lo cual grande sea la muestra, más cerca se estará del valor
sería 60 - 50 = 10 y 10/5 = 2. En segundo lugar, "verdadero" de la población. La ley también per-
ocupémonos del experimento de lanzar la moneda mite someter a prueba hipótesis estadísticas, como
que utilizamos en el capítulo sobre probabilidad. En veremos más adelante.
él se halló que en 100 lanzamientos aparecieron 52 Lancemos una moneda l, 10, 50, 100, 400 y I 000
caras. Los cálculos son los mismos que hemos seña- veces. Supongamos que nos interesa el resultado
lado. Hubo 52 caras y, por esta razón, la desviación a "caras". Calculamos medias, varianzas, desviacio-
partir de la media (la frecuencia esperada) es de 52 - nes estándares y dos nuevas medidas. La primera de
50 = 2. En términos de unidades de desviación es- ellas es la proporción de resultados favorables (cara
tándar corresponde a 2/5 = .4 unidades de desvia- en este caso), en la muestra total. Designamos con el
ción estándar a partir de la media. Retornaremos. a símbolo H n a esta media, y la definimos como H n=
una de las preguntas originales que planteamos: ¿Es· Snln. (Recordemos que Sn es el número total de
tas diferencias son "estadísticamente significati- veces en que aparece el resultado favorable en n
vas?" Vemos que después de aplicar x2 , el resultado intentos o pruebas.) Según lo expuesto, la fracción
de los 60 acuerdos o respuestas afirmativas, fue es- del tiempo en que ocurre el resultado favorable es
tadísticamente significativo, y que el resultado de las Hn. La media de H n es p, o M(Hn) =p. [Esto se
52 caras no lo fue: ¿podemos hacer lo mismo con deduce de la ecuación 11.3, en la cual M(Sn)=pn,
esta fórmula? Por supuesto que sí. Aún más, la ven- dado que H n=Snln, M(Hn) =M(Sn)!n=np!n=p.]En
taja del método presente es que puede aplicarse a resumen, M(Hn) es igual ala probabilidad esperada.
todos los tipos de números y no sólo a los binomia· La segunda medida es la varianza de Hn, que se
les. Antes de demostrar lo anterior, debemos estu- define: V(Hn) =pq/n. La varianza, V(Hn), es una
diar brevemente la llamada ley de los grandes núme- medida de variabilidad de la mediaM(Hn). Más ade-
ros y las propiedades de la desviación estándar y la lante nos ocuparemos oon mayor detalle de la raíz
curva normal de probabilidad. cuadrada de V(Hn), llamada error estándar de la
medía. Los resultados del cálculo se presentan en el
Ley de los grandes números cuadro 11-1.
A Jacobo Bernoulli le tomó 20 años elaborar la ley Adviértase que a pesar de que las medias, varian-
de los grandes números. En esencia es tan sencilla, zas y desviaciones estándares de las sumas aumen-
que se pregunta uno por qué tardó tanto en formu- tan con el tamaño de las muestras, los números de
larla.(2) A grandes rasgos, señala que si se aumenta M(Hn) o p, siguen siendo los mismos; esto es, el
(2) En la obra de J. Newman, The World ofMathematics, vol~ 3. número promedio de caras o M(Hn), siempre es 112.
Nueva York: Simon y Schuster, 1956, págs. 1452-1455, se halla un Sin embargo, la varianza del promedio de caras,
resumen de la ley de Bernoulli hecha por él mismo. Si se desea una V(Hn), disminuye cada vez más conforme aumenta
exposición más exacta de la que se expone en este texto, véase el tamaño de las muestras. De nuevo, V(Hn) es una
ibid., págs. 1448-1449. En la obra de J. Kemeny y col., Finite
Mathematícal Structures, se presenta un tratamiento matemático medida de la variabilidad de los promedios. Como
más riguroso. Englewood Cliffs. N. J.: Prentice-Hall, 1959, págs. indica claramente el cuadro 11-1, el número prome-
165-178. dio de resultados debe acercarse cada vez más al
136 ANALISIS, INTERPRETACION, ESTADISTICA E INFERENCIA

50

96 por
100
99 por
ººº má
IQ 52 68 84 100 116 132 148
(Z) -3 -2 -1 o +I +2 +3
Figura 11-1.

valor "real", en este caso 1/2. (El estudiante debe las probabilidades de las estadísticas que uno cal-
analizar con todo cuidado este ejemplo, antes de cula. Si los datos, como hemos dicho, son normales
proseguir.) o aproximadamente normales, el investigador tiene
una interpretación nítida de lo que hace.
Curva normal de probabilidad En la investigación pedagógica y de las ciencias
y desviación estándar sociales se usan dos tipos de gráficas. En una de
La curva normal de probabilidad es una curva ellas, como hemos observado, se comparan los valo-
campanular que a menudo aparece en Jos libros de res de una variable dependiente con los valores de
estadística y psicología. Su importancia deriva de una variable independiente. El seguQdo tipo impor-
tante de gráfica tiene una finalidad distinta: mostrar
que los fenómenos aleatorios en grandes números
la distribución de una sola variáble. Los valores se
tienden a distribuirse siguiendo la forma de esta
colocan en el eje horizontal o de las abscisas, en
curva. La llamada teoría de los errores utiliza esta
forma similar a como se hace en el primer tipo de
curva. Muchos fenómenos naturales, físicos y psico-
gráfica, pero en el eje vertical o de las órdenadas, se
lógicos muestran una distribución en una forma
colocan las frecuencias, o los intervalos defrecuen-
aproximadamente normal; ejemplos conocidos son
cias o probabilidades.
talla, inteligencia y aprovechamiento. Las medias de
Trazaremos una curva normal y colocaremos dos
las muestras se distribuyen siguiendo la curva nor-
mal .(3) Es dificil concebir la estadística moderna sin conjuntos de valores en el eje horizontal (abscisas).
esta curva. Cada texto de estadística tiene una tabla En un conjunto de valores empleamos las cifras de
llamada "de la desviación normal" o de la "curva cociente intelectual y una desviación estándar de 16.
normal". Supongamos que tenemos una muestra de 400, y los
datos (cifras de cociente intelectual) siguen una
La razón estadística más importante para usar la
formit' aproximadamente normal (se dice que los da-
curva normal es que permite interpretar fácilmente tos muestran "distribución normal"). La curva se
asemeja a la que se muestra en la figura 11-1. Imagi-
(3) El lector debe evitar la idea aún no comprobada .de que todos
los fenómenos o casi todos siguen una distribución normal. Siempre
némonos un eje vertical Y en el cual estén señaladas
que ~a posible hay que probar los datos por.,métodos apropiados, las frecuencias (o proporciones). Las características
especialmente al hacer una gráfica. Los datos amenudo son sutiles. principales de las curvas normales son la unimodali-
Por ejemplo, ocupémonos de la talla. En la pobliaón global, Ja talla dad (una curva), Ja simetría (un lado tiene la misma
probablemente siga una distribución normal; sin ~inbargo, supon- forma que el otro) y algunas propiedades matemáti-
gamos que estudiamos varones de gran talento. ¿SegÜirá siendo la
talla una distribución normal? (Algunas gentes pueden pensar que cas. Son precisamente estas últimas las que nosfote-
las personas de talla baja tienen más talento y otras, que las de talla resan porque permiten hacer inferencias estadísticas
alta.) Havelock Ellis en su estudio del genio en los ingleses señala de enorme fuerza.
270 varones de gran talento, con base en su talla: 103 altos, 57 La desviación estándar puede ser concebida como
medianos y 100 personas de talla corta. A pesar de que podemos
cuestionar la muestra y los datos originales, el ejemplo es instruc~
el desplazamiento horizontal a lo largo de la línea
tivo. (Ver H. Ellis, A Study ofBritish Genius. Boston: Houghton basal de la curva; del punto medio de elevación
Mifflin, 1926. págs. 278-281.} Margenau aporta un potente argu- máxima de la curva, hacia la derecha o Ja izquierda.
mento racional de la normalidad: H. Margenau, The Nature of También puede visualizarse como un punto en la
Physical Reality. Nueva York: McGraw-Hill, 1950, págs. 114-115.
Para un comentario aclaratorio del concepto de normalidad, ver M.
línea basal, que está a cierta distancia de la media.
Tate,Statistics in Education. Nueva York: Macmillan, 1955, págs. Una desviación estándar a partir de la media en esta
203-209. distribución particular, sería 100 + 16 = 116. La
FINALIDAD, ENFOQUE Y METODOLOGIA DE LA ESTADISTICA 137

distancia de 100 a 16 se ha indicado en la figura 11-1. facilitarla interpretación.) El área entrez=- 3 y z=+
Mediante un segmento grueso en la línea de base. De 3 es 99 por 100. De manera similar, todas las otras
manera semejante, esta misma desviación estándar distancias posibles en la línea de base y en las áreas
por debajo de la media es igual a IOO - 16 = 84. Dos correspondientes, pueden transformarse en porcen-
desviaciones estándar serían 100 + (2)( 16) = 132 y tajes de la curva total. Un aspecto importante por
100 - (2)( 16) = 68. Si el investigador puede tener la recordar es que el área debajo de toda la curva es
confianza razonable de que sus datos siguen una iguala l.OOó IOOpor IOOy,deestemodo,equivaleal
distribución normal, podrá trazar una curva seme- universo U de la teoría de las probabilidades; sobre
jante a la que señalamos, marcar la media y trazar las esta base, es posible interpretar los porcentajes de
desviaciones estándar, como se ha hecho en la figura áreas como probabilidad. De hecho, los datos de la
11-1. La línea base también ha sido subdividida en tabla normal de probabilidad se indican en los por-
uilidades de desviación estándar (identificadas por z centajes de áreas que corresponden a las unidades z
en la figura), esto es, en vez de las puntuaciones de de desviación estándar.
100, 116 y 68 de cociente intelectual, se ha empleado
la puntuación en unidades de desviación estándar, Interpretación de los datos
con O, + l, -2, y así sucesivamente. También se
por medio de la curva normal
indican los puntos entre estas cifras unitarias. Por
ejemplo, la unidad de una desviación estándar por de probabilidades:
arriba de la media en las puntuaciones originales, datos de frecuencia
sería 100 + ( 112)( 16) = 108. En unidades de desvia- Ahora trataremos de investigar las probabilidades
ción estándar sería O + .5 = .5. Estas unidades de de que acontezcan eventos. Para ello, en primer
desviación estándar en la práctica reciben el nombre lugar debemos retornar al lanzamiento de monedas.
de puntuaciones o unidades estándar z, y van de -3 En términos estrictos, las frecuencias con que apa-
pasando por O, a +3.(4) recen caras y cruces son eventos discontinuos, en
Si se emplean las unidades z y el área total bajo la tanto que la curva normal de probabilidad es conti-
curva se iguala a 1.00, se dice que la curva tiene una nua. Esto no debe preocuparnos, porque las apro-
forma típica o estándar, lo que de inmediato sugiere ximaciones son muy grandes. Es posible especificar
probabilidad. Las porciones del área de la curva se con enorme precisión y gran facilidad ,las probabili-
conciben como probabilidades, y como tales se in- dades con que ocurrirán eventos al azar. En lugar de
terpretan. Si el área total debajo de toda la curva es calcular probabilidades exactas, como hicimos, po-
igual a I.00, y si trazamos una línea vertical desde la demos estimar probabilidades a partir del conoci-
línea de base a nivel de la media (z=O), hasta el punto miento de las probabilidades de la curva normal.
máximo de la curva, las· áreas a la izquierda y a la Supongamos que de nuevo, aunque quizá con un
derecha de la línea vertical serán iguales a la mitad o poco de desgano; que arrojamos 100 monedas. Ob-
al 50 por 100. Sin embargo, pueden trazarse líneas servamos que el número promedio de veces en que
verticales en cualquier punto sobre la línea base a probablemente aparecerán caras es M( S 100) = np =
una desviación estándar a la derecha de la media(z = 100 · 1/2 = 50, yladesviaciónestándaresSD(S100) =
1), o a dos desviaciones estándar a la izquierda de la YV(S100)=\/ñpq"=v'IOO · 1/2 · 1/2 = v'25 = 5. Por
media (z = -2). Para interpretar dichos puntos en medio de los porcentajes de la curva (probabilida-
términos de área y de probabilidad, debemos cono- des), podemos hacer proposiciones de probabilidad.
cer las propiedades de área de la curva. Por ejemplo, podemos señalar que en 100 lanzamien-
En la figura 11-1 aparecen los porcentajes aproxi- tos la probabilidad de que aparezcan caras, entre una
mados d·e las áreas correspondientes a una, dos y desviación estándar a la izquierda de la media(z=-
tres desviaciones estándar a la derecha y a la iz- 1) y una desviación estándar a la derecha de la media
quierda de la media. Para nuestros fines, no es nece- (z=+ 1), es aproximadamente .68. De manera gene-
sario usar los porcentajes exactos. El área entrez=- ral, de cada tres posibilidades hay dos de que el
1 y z = + 1 es aproximadamente 68 por 100; el área número de caras estará entre 45 y 55 (50± 5). Existe
entrez = -2yz = +2es,pocomásomenos,96por una posibilidad de cada tres, aproximadamente, de
100. (La cifra exacta es .9544. Empleamos .% para que el número de caras sea menor de 45 o mayor de
5~. Esto es, q = 1 - p = l - .68 = .32, aproximada-
mente.
(4) Para transformar cualquier puntuación cruda a unidadesz. se
debe emplear la fórmula z = x!s, en la quex=X - M y s son la Tomemos ahora dos desviaciones estándar a la
desviación estándar de la muestra. Las x reciben el nombre de derecha y a la izquierda de la media. Estos puntos
puntuacionés de la desviación. Ahora podemos dividir la desvia- serían 50 - (2)(5) = 40 y 50 + (2)(5) = 60. Sabemos
ción estándar entre cualquier x, para transformar la puntuación X
(cruda) en unidades z. Por ejemplo, supongamos que X ' 120. En
que probablemente el 95 ó 96 por !00 de los casos
esta situación z = ( 120 - !00)/16 = 20/16 = 1.25. Lo anterior estarán dentro de esta zona, esto es, entre z=- 2 y z=
significa que una puntuación cruda de 120, equivale, en unidades z. +2, o entre 40ó 60; por esta razón, podemos afirmar
a 1.25 ó !'/,desviaciones estándar por arriba de la media. que la probabilidad de que el número de caras no sea
138 . ANALISIS, INTERPRETACION, ESTADISTICA E INFERENCIA

menor de 40 ni mayor de 60, está entre .95 y .%, lo brá seguridad en toda interpretación de las puntua-
cual nos indica que únicamente cuatro o cinco veces ciones de niños individuales. La cifra de 75 podría
de cada 100 lanzamientos, aparecerán menos de 40 ser el promedio en esta ocasión, pero si la media no
caras o más de 60 caras. Esto es posible, pero pocas es fidedigna, dicha cifra en una prueba futura podría
veces ocurre. (Recordemos que en líneas anteriores ser mucho mayor. En otras palabras, debemos con-
comentamos que con el método de probabilidad tar con una media confiable o fidedigna.
exacta, la probabilidad era de .96.) Imaginemos que aplicamos muchísimas veces
Si queremos o necesitamos tener certidumbre en más la misma prueba al mismo grupo de niños una y
la práctica (como en algunos tipos de investigación otra vez. Aún más, supongamos que podemos apli-
médica o de ingeniería), tendríamos que desplazar- car, exactamente en las mismas condiciones 100 000
nos tres desviaciones estándar, z = -3 y z = +3, o veces la prueba y que los demás factores no cam-
tal vez un poco menos de este límite. (El nivel de bian: los niños no aprenden nada nuevo con todas
.O 1 corresponde más o menos a 2.5 desviaciones estas repeticiones; no se fatigan, las condiciones
estándar.) Tres desviaciones estándar significaría ambientales son las mismas, etcétera.
que el número de caras estaría entre 35 y 65. Las tres Si calculamos una media y una desviación están-
desviaciones estándar por arriba y por debajo de la dar para cada una de las pruebas o intentos anterio-
media en la figura 11-1 comprenden más del 99 por res, obtendremos una distribución gigantesca de
100 del área por debajo de la curva, y por esta razón, medias y desviaciones estándares. ¿Qué forma to-
podemos decir que tenemos una certeza casi com- maría esta distribución? En primer lugar, tomaría la
pleta de que el número de caras en 100 lanzamientos de una bella curva campanular normal, porque las
de una moda "perfecta" no será menor de 35 ni medias también la siguen. Tienen Ja propiedad de
mayor de 65. La probabilidad excede de .99. Sí se ajustarse con toda exactitud a la distribución nor-
arrojó la moneda l 00 veces y se obtuvieron 68 caras, mal, incluso si las distribuciones originales a partir
el investigador podría llegar a la conclusión de que la de las cuales se calcularon no son normales, lo cual
moneda no era perfecta o que posiblemente estaba se debe a que suponemos "igualdad de otros facto-
"cargada". Por supuesto, pueden aparecer 68 caras, res" y de esta forma, las fluctuaciones de las medias
pero este es un evento que rarísimas·veces ocurre sin no tienen más explicación que el azar. Las medias
intervención de la voluntad humana. fluctuarán, pero las fluctuaciones serán debidas to-
El antiguo problema de acuerdo-desacuerdo se talmente al azar. Casi toda·s estas fluctuaciones se
trata exactamente como lo hicimos con la moneda. agruparán alrededor de lo que llamaríamos la media
Muy pocas veces ocurre en la realidad el resultado "verdadera", que sería el valor "verdadero" de la
60 acuerdos y 40 desacuerdos. Hay sólo cuatro posi- población gigantesca de medias. Unas cuantas se-
bilidades en 100 de que aparezcan por el solo azar, 60 rían valores extremos. Si repetimos innumerables
concordancias y 40 discordancias. Por aplicación de veces, el experimento de arrojar 100 veces una mo-
la prueba x2 obtuvimos este dato antes, y también neda, observaremos que las caras se agruparán alre-
por la prueba de probabilidad exacta. Ahora conta- dedor de lo que conocemos como valor "verda-
mos con un tercer método que puede aplicarse ex- dero": 50. Algunas puntuaciones se'rán un poco ma-
tensamente a todo tipo de datos, a condición de que yores, otras un poco menores, unas pocas más mu-
éstos sigan una distribución normal o casi normal. chísimo mayores y otras más muchísimo menores.
En resumen, las caras y las cruces obedecen a una
Interpretación de datos "ley", en la que se supone que ningún factor distinto
del azar opera en esta situación y, por esta razón,
por medio de la curva normal
debemos concluir que estas fluctuaciones dependen
de probabilidad: datos continuos únicamente del azar, y los errores por azar, si apare-
Supongamos que contamos con las puntuaciones cen en número suficiente, se distribuirán también
de pruebas de estudios sociales de una muestra de siguiendo la distribución normal; esta es la base de la
100 niños de quinto año escolar. El promedio de las llamada teoría de los errores.
puntuaciones es 70; la desviación estándar de 10. Sigamos nuestro análisis de la media: si tuviéra-
Con base en lo que aprendimos en páginas anterio- mos los datos de muchísimas pruebas de estudios
res, la distribución de las puntuaciones en esta sociales aplicadas al mismo grupo, podríamos calcu-
prueba tiene una forma aproximadamente normal. lar una media y una desviación estándar. La media
Sin duda, podemos interpretar los datos por empleo calculada en esta forma se acercaría muchísimo a la
de la curva normal. Nuestro interés radica en la media "verdadera". Si tuviéramos un número infi-
confiabilidad de la media. ¿En qué grado podemos nito de medias de un número infinito de aplicaciones
depender de ella? Con nuevas muestras de niños de la prueba y calculáramos la media de las medias,
semejantes, de quinto año escolar, ¿obtendríamos la también obtendríamos la media "verdadera". Un
misma media? Si la media no es fidedigna, esto es, fenómeno similar ocurre con la desviación estándar
fluctúa extensamente de una muestra a otra, no ha- delas medias. Naturalmente no podemos hacer esto,
FINALIDAD, ENFOQUE Y METODOLOGIA DE LA ESTADISTICA 139

67 68 69 70 71 72 73
Figura 11-2.

pues en la realidad no contamos con un número les. Es fácil observar que las medías de esta distribu-
infinito o incluso grandísimo de aplicaciones de la ción no varían mucho. Si duplicamos el error están-
prueba. Por fortuna, existe una forma sencilla de dar de la medía obtendremos 2. Sí a 70, que es la
resolver el problema, y consiste en aceptar la media media, restamos y sumamos la cifra 2, obtendría-
calculada a partir de la muestra, como la media mos: 68 a 72. La probabilidad es de .95, aproxima-
''verdadera", y después estimar qué tan exacta es damente, de que la media de la población (' 'verda-
esta suposición o afirmación. Para lograr lo anterior dera") esté dentro del intervalo de 68 a 72, esto es,
se calcula el llamado error estándar de la media que aproximadamente 5 por IOO de las veces de las me-
se define de esta forma: días de las muestras aleatorias de esta magnitud
estarán fuera de este intervalo.
Si hacemos la misma operación con los datos de la
SE,11=~ (11.10)
prueba de inteligencia de la figura 11-1 obtendremos

ecuación en la cual el error estándar de la media es 16 16


SEM; la desviación estándar de población es <Tpop (la SE.1, = \l4oO =
20 = .80
letra griega "sigma"), y el número de casos en la
muestra es n. Tres errores estándar a la derecha y a la izquierda de
En este punto surge un pequeño obstáculo. Des- la media ( 100 en este caso) corresponden al intervalo
conocemos o no podremos conocer la desviación 97.60 a 1