You are on page 1of 147

UNIVERSIDAD AGRARIA DEL

ECUADOR
SIPUAE
MAESTRA EN PLANIFICACION Y
GESTION DE PROYECTOS
AGROTURISTICOS Y
ECOLOGICOS
Estadstica
Dr. Andrs Venereo Bravo, PhD
2013
2
Bases Estadsticas
1
1.1 Introduccin
A partir del presente epgrafe trataremos algunos conceptos estadsticos fundamentales
sin los cuales sera imposible interpretar el contenido de futuros Captulos de este
material, y que estn relacionados con mtodos de la Estadstica Descriptiva e
Inferencial utilizados en el anlisis e interpretacin de resultados. No obstante, nos
limitaremos a estudiar solamente aquellos que realmente son necesarios, evitando
agobiar al lector con grficos, polgonos, monedas y dados que solo lograran
incrementar el nmero de pginas de este Captulo, sin lograr con ello el real propsito
que perseguimos. Los lectores interesados en estudiar los aspectos sealados con
anterioridad, podrn hacerlo en los innumerables libros que abordan esta temtica.

1.2 Poblacin y Muestra
Uno de los conceptos ms sencillo, y no por ello menos importante, que sirve de base al
desarrollo de la Estadstica Inferencial es el de Poblacin y Muestra.
Poblacin es cualquier conjunto formado por elementos que pueden ser
inequvocamente identificados y que adems poseen uno o ms atributos factibles de ser
medidos. Por ejemplo, el conjunto de todas las familias de clase alta es una poblacin,
ya que los elementos de este conjunto son fcilmente identificables el uno del otro y
adems, poseen caractersticas medibles u observables, tales como, la cantidad de
miembros, la edad promedio, sus ingresos, etc.
Pero estudiar una caracterstica cualquiera usando para ello todos los elementos de una
poblacin resulta, en la inmensa mayora de los casos, una tarea imposible, y es por ello
que en la prctica, solo sea factible analizar una parte de la misma. A cualquier
subconjunto de elementos extrados de una determinada poblacin se le llama Muestra.
El tamao de una poblacin o de una muestra viene dado por la cantidad de elementos
que la conforman y se representan con las letras N y n respectivamente. El tamao de
la poblacin puede ser finito o infinito. El tamao de una muestra es siempre finito.
Para que una muestra sea lo suficientemente representativa de la poblacin de la cual
proviene, se requiere determinar la cantidad de elementos que deben ser extrados de
3
dicha poblacin, as como la forma en que esto debe hacerse. En un Captulo posterior
nos referiremos a los principios que norman la extraccin de una muestra representativa.
La extraccin de una muestra de una determinada poblacin tiene siempre un objetivo
central: tomar decisiones acerca del comportamiento de un atributo de la poblacin,
conocido con el nombre de parmetro, tomando como base el comportamiento de este
mismo atributo en la muestra extrada, conocido con el nombre de estadgrafo.
El papel fundamental de la Inferencia Estadstica es precisamente ofrecer al
investigador los mtodos que le permitan realizar una adecuada estimacin del
comportamiento de un parmetro tomando como base el comportamiento del
estadgrafo correspondiente.
1.3 Probabilidad de ocurrencia de un suceso
Cuando analizamos los volmenes de venta de una empresa, el que ste sea menor a
10000 unidades es un suceso, mientras que el hecho de que sea mayor es otro suceso.
En la teora de probabilidades, un suceso es uno o ms de los posibles resultados de una
actividad cualquiera.
Todos estamos familiarizados de una manera emprica con el concepto de probabilidad
de ocurrencia de un suceso. Por ejemplo, si hemos planificado disfrutar con nuestra
familia de un hermoso domingo en una agradable playa, seguramente cambiaremos
nuestros planes luego de escuchar un parte meteorolgico que pronostica un 70 % de
probabilidad de lluvia para ese da.
Visto de una forma general y elemental, la probabilidad de ocurrencia de un suceso es la
posibilidad de que este suceso ocurra. La teora de probabilidades es la base sobre la
cual se han desarrollado los mtodos estadsticos que nos permiten la toma de
decisiones ante situaciones de incertidumbre, y es por ello que a continuacin
dedicaremos un poco de atencin a esta importante teora.

1.3.1 Experimento Aleatorio
La actividad que da lugar a la ocurrencia de un suceso se llama experimento. Un
experimento se considera aleatorio cuando su resultado no se puede predecir con toda
exactitud. Como ejemplo de algunos experimentos aleatorios podemos citar, el estudio
de la precipitacin ocurrida en una etapa, el estudio del comportamiento de las
declaraciones de impuestos en un ao determinado, etc.
Una caracterstica importante de los experimentos aleatorios es la capacidad de los
mismos para poder ser repetidos. Si un experimento aleatorio se repite un gran nmero
de veces, la frecuencia de un resultado tiende a ser constante, y decimos entonces que el
resultado muestra una regularidad estadstica.
1.3.2 Espacio muestral
Un espacio muestral es el conjunto formado por todos los posibles resultados de un
experimento aleatorio. El espacio muestral se denota con la letra S y ser finito o
4
infinito en dependencia de que el conjunto tenga un nmero finito o infinito de
elementos.
1.3.3 Definicin clsica de probabilidad:
Se llama probabilidad de ocurrencia de un suceso al cociente del nmero de resultados
en los que se presenta el suceso y el nmero total de resultados posibles del
experimento, es decir, si denotamos por P(A) la probabilidad de ocurrencia de un suceso
A, entonces:
posibles resultados de total nmero
suceso el presenta se que los en resultados de nmero
A P ) (
Es necesario destacar que la definicin de probabilidad dada anteriormente es solo
aplicable a espacios muestrales finitos.
1.3.4 Ejemplo de clculo de probabilidad
El CUADRO 1.3.1 muestra los ingresos en dlares de 100 familias de clase baja:
CUADRO 1.3.1
153 156 157 154 159 160 155 158 159 154
157 151 158 160 161 159 162 157 155 162
158 159 161 154 156 163 160 159 158 156
155 160 158 162 160 153 164 157 161 159
157 152 159 150 158 164 156 163 160 157
160 163 154 155 162 153 165 161 159 158
158 155 157 162 156 158 161 162 152 155
154 164 159 165 151 160 156 163 159 156
156 153 161 157 163 160 164 153 157 158
161 157 155 158 154 156 161 159 158 152
a) Cual es la probabilidad de que al seleccionar al azar una de estas familias su ingreso
sea igual a 156 dlares ?
Suceso A: Que la familia tenga un ingreso de 156 dlares.
Cantidad de familias con ingresos de 156 dlares = 9
Cantidad total de familias = 100
De donde:
posibles resultados de total nmero
suceso el presenta se que los en resultados de nmero
A P ) (

09 . 0
100
9

5
es decir, la probabilidad de que al seleccionar al azar una familia sta tenga un ingreso
de 156 dlares es igual a 0.09.
b) Cual es la probabilidad de que al seleccionar al azar una de estas familias su ingreso
sea menor a 154 dlares ?
Suceso A: Que la familia ingrese menos de 154 dlares.
Cantidad de familias con un ingreso menor a 154 dlares = 11
Cantidad total de familias = 100
de donde:
posibles resultados de total nmero
suceso el presenta se que los en resultados de nmero
A P ) (

11 . 0
100
11

es decir, la probabilidad de que al seleccionar al azar una familia sta ingrese menos de
154 dlares es igual a 0.11.
c) Cual es la probabilidad de que al seleccionar al azar una de estas familias su ingreso
sea mayor a 161 dlares ?
Suceso A: Que la familia ingrese ms de 161 dlares.
Cantidad de familias con un ingreso mayor a 161 dlares = 17
Cantidad total de familias = 100
de donde:
posibles resultados de total nmero
suceso el presenta se que los en resultados de nmero
A P ) (

17 . 0
100
17

es decir, la probabilidad de que al seleccionar al azar una familia sta ingrese ms de
161 dlares es igual a 0.17.
Observe que el valor numrico de las tres probabilidades calculadas ( 0.09, 0.11 y 0.17 )
es una cantidad que oscila entre 0 y 1.
Probemos a continuacin que este resultado es una regularidad, es decir, que la
probabilidad de ocurrencia de un suceso es siempre un valor entre 0 y 1.
6
Denotemos con N
A
el nmero de resultados en los que se presenta el suceso y con N el
nmero total de resultados posibles, entonces:
N
N
A P
A
) (
Se cumple siempre que:
0 N
A
N y dividiendo toda la expresin para N:
0/N N
A
/N N/N, es decir, 0 P(A) 1
Cuando A es un suceso seguro entonces P(A)=1, y cuando A es un suceso imposible
entonces P(A)=0
1.3.5 Variable Aleatoria
Una Variable Aleatoria es una funcin definida en un espacio muestral dado y que
toma valores en el conjunto de los nmeros reales, es decir, si X representa una variable
aleatoria, entonces,
X: S ------- R
Una variable aleatoria puede ser discreta o continua. Una variable aleatoria es discreta
cuando solo puede tomar un nmero finito de valores. Un ejemplo de variable aleatoria
discreta es el nmero de contribuyentes en una ciudad, ya que esta variable solo puede
tomar valores enteros, y por supuesto, nunca un valor decimal.
Una variable aleatoria es continua cuando puede tomar valores en todo el conjunto de
nmeros reales o en un intervalo de ste. Los ingresos familiares es una variable
continua ya que dentro de un intervalo, sta puede tomar cualquier valor.
1.4 Medidas de tendencia central o estadgrafos de posicin
1.4.1 La Media Aritmtica
Uno de los estadgrafos mas utilizados en trabajos de investigacin es la Media
Aritmtica, tambin conocida como Promedio Aritmtico, la cual expresa
numricamente en que punto se encuentra el valor central de un conjunto de datos. La
media aritmtica de una muestra puede ser, y de hecho es utilizada, como una
estimacin del valor de la media aritmtica de una poblacin, lo cual la convierte en un
elemento muy importante al momento de establecer una inferencia sobre el
comportamiento de los datos en una poblacin cualquiera.
La media aritmtica de un conjunto de n valores X
1
, X
2
, , X
n
de una variable X, se
define como :
M(X) = Xi n
n
/
1

= (X
1
+ X
2
+ + X
n
) / n
7
Con bastante regularidad se usa el smbolo
_
x
para denotar la media aritmtica de una
muestra y la letra griega para designar la media poblacional.
En el CUADRO 1.4.1 se aprecia una muestra de los volmenes de venta de 9 diferentes
empresas medidos en miles de unidades:
CUADRO 1.4.1
14.3 15.8 14.6 14.3 15.5 16.1 16.0 15.7 14.9
La media aritmtica de este conjunto viene dada por:
_
x
= (14.3+15.8+14.6+14.3+15.5+16.1+16.0+15.7+14.9) / 9
_
x
= 137.2 / 9 = 15.2
1.4.2 Propiedades de la Media Aritmtica
Propiedad 1:
Si a cada valor de un conjunto X
1
, X
2
, , X
n
de datos se le suma (o se le resta) una
constante, la media aritmtica del nuevo conjunto de datos es igual a la media aritmtica
del conjunto original mas ( o menos ) la constante.
Si Y
i
= X
i
+ k entonces
_
y
=

+
n
i
n
k X
1
=

+
n n
i
n
k
n
X
1 1
=
_
x
+ ( nk / n) =
_
x
+ k
Propiedad 2:
Si cada valor de un conjunto X
1
, X
2
, , X
n
se multiplica (o se divide) por una
constante, la media aritmtica del nuevo conjunto es igual a la media aritmtica del
conjunto original multiplicado (o dividido) por la constante.
Si Y
i
= kX
i
entonces
_
y
= kXi n
n
/
1

=

n
n Xi k
1
/
= k
_
x
Propiedad 3:
La suma de las desviaciones de cada valor de un conjunto de datos X
1
, X
2
, , X
n
con respecto a su media aritmtica es igual cero.
Esta propiedad significa que:
) (
1
_


n
x Xi
= 0
8


n
x Xi
1
_
) (
=

n n
x Xi
1 1
_
= Xi
n
1

- n
_
x
= n
_
x
- n
_
x
= 0
ya que Xi
n
1

= n
_
x
1.5 Medidas de dispersin o estadgrafos de dispersin
Otros estadgrafos que revisten una gran importancia en el quehacer investigativo son
aquellos que expresan el grado de dispersin o variabilidad que tiene un conjunto
cualquiera de datos, y que adems, calculados a nivel de una muestra, son utilizados
como una estimacin del comportamiento de ellos a nivel de toda la poblacin. Estas
medidas se conocen con el nombre de estadgrafos de dispersin, siendo los ms
utilizados la varianza, la desviacin tpica y el coeficiente de variacin.
1.5.1 La varianza
La varianza de un conjunto X
1
, X
2
, , X
n
de valores de una variable X se define
como:
V(X) =
) (
1
_


n
x Xi
2
/ n
es decir, la varianza es la media de las desviaciones al cuadrado de cada valor X
i
con
respecto a la media aritmtica del conjunto, y por esta razn mientras mayor es el valor
numrico de la varianza, ms dispersos estn los datos alrededor de su media aritmtica.
Otra forma de expresar la varianza es la siguiente:
V(X) = { Xi
n
2
1

- ( ) Xi
n
1

2
/ n } / n
Con bastante regularidad se usa el smbolo S
2
para denotar la varianza de una muestra y

2
para designar la varianza de toda la poblacin.
1.5.1.1 Propiedades de la Varianza
Propiedad 1:
La varianza de un conjunto de valores X
1
, X
2
, , X
n
es siempre un nmero no
negativo. Esta propiedad expresa que para cualquier conjunto de datos S
2
0, lo cual
puede ser fcilmente verificado si observamos que el numerador de la varianza es
siempre un nmero no negativo, ya que es el resultado de una suma de cuadrados.
Propiedad 2:
La varianza de un conjunto de valores X
1
, X
2
, , X
n
todos iguales, es igual a cero.
Esta propiedad significa que V(k) = 0.
Si X
i
= k entonces
_
x
= k y por tanto,
9
V(X) =
2
1
_
) (


n
x Xi
/ n = 0 ya que al ser X
i
= k,
X
i
-
_
x
= 0
Propiedad 3:
Si a cada valor de un conjunto X
1
, X
2
, , X
n
se le adiciona (o se le resta) una
constante k>0, la varianza del nuevo conjunto de valores es igual a la varianza del
conjunto original.
Esta propiedad significa que si Y = X t k entonces V(Y) = V(X).
Propiedad 4:
Si cada valor de un conjunto X
1
, X
2
, , X
n
se multiplica (o divide) por una
constante k, la varianza del nuevo conjunto es igual a la varianza del conjunto original
multiplicada (o dividida) por el cuadrado de la constante.
Esta propiedad significa que si Y = k . X entonces se cumple que V(Y) = k
2
V(X).
1.5.2 La desviacin tpica
La Desviacin Tpica de un conjunto de valores X
1
, X
2
, , X
n
se define como la raz
cuadrada positiva de la varianza.
Es decir DT(X) = V X ( )
Con bastante regularidad se usa el smbolo S para denotar la desviacin tpica de una
muestra y la letra griega

para designar la desviacin tpica de toda la poblacin.
1.5.3 El coeficiente de variacin
El Coeficiente de Variacin de un conjunto de datos X
1
, X
2
, , X
n
se define como
el cociente de la desviacin tpica y la media de dicho conjunto. Es comn expresar este
estadgrafo como un porcentaje, para lo cual debe ser multiplicado por 100, es decir,
CV(X) = _
x
S
x 100
1.5.4 Mtodo de clculo
Calculemos los estadgrafos de dispersin correspondiente a la muestra de los 9
volmenes de venta reportados en el CUADRO 1.4.1:
X
i
X
i
-
_
x


(X
i
-
_
x
)
2
10
14,3 -0,9 0,89
15,8 0,6 0,31
14,6 -0,6 0,42
14,3 -0,9 0,89
15,5 0,3 0,07
16,1 0,9 0,73
16.0 0,8 0,57
15,7 0,5 0,21
14,9 -0,3 0,12
137.2 4.20
_
x
= 137.2 / 9 = 15.2 (

X
i
-
_
x
)
2
= 4.20
V(X) = S
2
= (

X
i
-
_
x
)
2
/ n = 4.20 / 9 = 0.47
S = 47 . 0 = 0.68
CV (X) = (S /
_
x
) x 100= 0.68 / 15.2 = 4.48 %
1.5.5 La importancia de la varianza
Al ser la varianza un estadgrafo que expresa el grado de variabilidad de los datos de un
conjunto alrededor de su media aritmtica, su valor numrico nos da informacin de la
confiabilidad de su estadgrafo de posicin. Si los datos se encuentran muy dispersos, la
posicin central que calculemos ser mucho menos representativa de estos datos que
cuando stos se agrupan ms cercanamente alrededor de su media. Para evidenciar lo
que acabamos de sealar, supongamos que otra muestra de los volmenes de venta de 9
diferentes empresas es la que se reporta en el CUADRO 1.5.1:
CUADRO 1.5.1
10.3 20.8 10.6 14.3 21.5 10.1 20.0 10.7 18.9
Resultar fcil para el lector comprobar que la media y la varianza de esta muestra son
15.2 y 22.2 respectivamente, es decir, la misma media aritmtica que la de la muestra
reportada en el CUADRO 1.4.1 pero con una varianza mucho mayor que sta.
Adicionalmente, una simple comparacin de ambos conjuntos evidencia que la media
15.2 es mucho ms representativa de los valores del primer conjunto que de los valores
del segundo, es decir, a menos variabilidad mayor representatividad de la media
aritmtica calculada.

1.5.6 La importancia del Coeficiente de Variacin
El valor numrico de la varianza de un conjunto de datos depende de la unidad en que
stos hayan sido medidos. Segn la Propiedad 4 de la varianza estudiada en un epgrafe
anterior, si X representa el peso de un grupo de bultos medido en kilogramos y la
variable Y este mismo peso medido en libras, entonces entre las varianzas de ambos
conjuntos existe la siguiente relacin:
V(Y) = (2.2)
2
V(X) ya que Y = 2.2 X
11
es decir, la varianza del peso de los bultos medido en libras es (2.2)
2
= 4.84 veces mayor
que la varianza de los pesos de estos mismos bultos medido en kilogramos, siendo
ambos sin embargo el mismo conjunto.
Al ser el Coeficiente de Variacin una cantidad relativa, su valor es el mismo
independientemente de las unidades en que fue medido el conjunto, es decir,
) (
) (
) (
) (
) (
) (
) (
) (
) (
_ _ _ _
Ton x
Ton S
Gr x
Gr S
Lb x
Lb S
KG x
Kg S
X CV

ya que las unidades del numerador y el denominador se cancelan entre s.
1.6 Distribuciones de Probabilidad
El presente epgrafe lo dedicaremos al estudio de las Distribuciones de Probabilidad,
las cuales son modelos tericos que permiten calcular la probabilidad de ocurrencia de
un suceso determinado. Para iniciar este estudio, abordaremos en primer lugar el tema
relacionado con las Distribuciones de Frecuencias, las cuales le sirven de base.
1.6.1 Distribuciones de Frecuencias
Retomemos los datos correspondientes a la variable aleatoria Ingresos Familiares que
fueron reportados en el CUADRO 1.3.1:
153 156 157 154 159 160 155 158 159 154
157 151 158 160 161 159 162 157 155 162
158 159 161 154 156 163 160 159 158 156
155 160 158 162 160 153 164 157 161 159
157 152 159 150 158 164 156 163 160 157
160 163 154 155 162 153 165 161 159 158
158 155 157 162 156 158 161 162 152 155
154 164 159 165 151 160 156 163 159 156
156 153 161 157 163 160 164 153 157 158
161 157 155 158 154 156 161 159 158 152
En el CUADRO 1.6.1 se muestra una relacin de los ingresos con la correspondiente
frecuencia en que aparecen, es decir, la cantidad de familias con cada uno de estos
ingresos:
CUADRO 1.6.1
Ingresos ($) Frecuencia (Familias)
150 1
151 2
12
152 3
153 5
154 6
155 7
156 9
157 10
158 12
159 11
160 9
161 8
162 6
163 5
164 4
165 2
100
El CUADRO 1.6.1 puede caracterizarse diciendo que es una lista de todos los posibles
resultados de un experimento, a la que se le ha adicionado la frecuencia observada de
cada resultado posible, o lo que es lo mismo, dicho CUADRO es una Distribucin de
Frecuencias de los ingresos de las 100 familias estudiadas.
Concretando an mas lo dicho anteriormente, podemos sealar que una distribucin de
frecuencias no es mas que un listado de las frecuencias observadas de todos los
posibles resultados de un experimento, elaborada con posterioridad a la realizacin
de dicho experimento. Basados en esta definicin podemos entonces enunciar que una
distribucin de probabilidad es un listado de las probabilidades de ocurrencia de
todos los posibles resultados que podran ser obtenidos en el caso de que este
experimento sea llevado a cabo.
Lo anteriormente expuesto es la clave de la diferencia entre distribuciones de
frecuencias y distribuciones de probabilidad.

1.6.2 La Distribucin Normal
La Distribucin Normal es una distribucin de probabilidad continua, la cual fue
introducida por el astrnomo matemtico del siglo XIX Karl Gauss al abordar la teora
de los errores de medidas fsicas. Una gran cantidad de mtodos estadsticos utilizan la
distribucin normal, razn por la cual ocupa un lugar tan destacado dentro de la
estadstica. Debido a la participacin de Gauss en el desarrollo de la teora de la
distribucin normal, sta tambin es conocida como distribucin Gaussiana o
campana de Gauss.
Una variable aleatoria continua X sigue una distribucin normal si la misma tiene la
siguiente funcin de distribucin:
f(x) =
2
2
1
2
1

,
_


x
e

13
donde y

representan la media y la desviacin tpica poblacional respectivamente. Lo
anterior significa que para definir una distribucin normal solo es necesario establecer
dos parmetros, la media () y la desviacin tpica (), y por tanto existe una gran
familia de distribuciones normales cada una de ellas definida por una media y una
desviacin tpica especfica.
La forma resumida X N ( ,
2
) significa que la variable X sigue una distribucin
normal con media y varianza
2
.
La forma grfica de una distribucin normal se muestra en la FIGURA 1.6.1.
FIGURA 1.6.1

X
1.6.2.1 Caractersticas de la distribucin normal.
Si observa de forma detenida la FIGURA 1.6.1 podr percatarse de las siguientes
caractersticas de la distribucin normal:
La curva alcanza su valor mximo en la media de la poblacin, la cual se encuentra
en el centro de misma.
La lnea vertical que pasa por la media divide a la curva en dos partes exactamente
iguales, es decir, la curva es simtrica con relacin a la vertical que pasa por su
media.
Los dos extremos de la curva normal se extienden de forma indefinida y nunca
tocan el eje horizontal.
A cualquier valor X en el eje horizontal de la curva se le denomina percentil de la
distribucin.
1.6.2.2 reas entre la curva normal y el eje horizontal.
Cualquiera sean los valores de y en una distribucin normal, el rea entre la curva y
el eje horizontal siempre es igual a 1, lo cual nos sugiere que reas bajo la curva normal
pueden ser tratadas como si fueran probabilidades. De hecho, cada parte de la curva
normal tiene un rea bajo la curva igual a 0.5.
Como hemos sealado, la distribucin normal depende de los parmetros poblacionales
y , los cuales representan la media y la desviacin tpica de la poblacin. Resulta
muy aconsejable expresar f(x) de forma tal que no sea necesario elaborar tablas para las
diversas combinaciones de valores de y .
14
El cambio de variable z = ( x - )/ hace que todo clculo de probabilidad donde se
utilice una distribucin normal cualquiera, sea mucho mas fcil utilizando la llamada
forma tipificada. Es importante sealar que siempre Z tendr una distribucin normal
con media 0 y desviacin tpica 1, o lo que es lo mismo, Z N (0,1).
Solamente se tabula la distribucin en forma acumulativa para esta variable Z, ya que
cualquier otra se puede llevar a esta forma mediante la tipificacin de la variable X.
Esta tabla puede ser encontrada en el Anexo de este material y a ella nos referiremos de
inmediato. La distribucin Z es simtrica con respecto a 0, siendo el rea bajo la curva
la probabilidad de ocurrencia de un suceso y los puntos en el eje X los llamados
percentiles de la distribucin. La notacin Z
p
indica que el rea bajo la curva a la
izquierda de este percentil es p.
Estudiemos un ejemplo de cmo calcular la probabilidad de ocurrencia de un suceso
haciendo uso de la distribucin normal. Supongamos que los ingresos de familias de
clase baja sigue una distribucin normal con media poblacional igual a 260 dlares y
una varianza poblacional igual a 12 dlares, es decir,
X N (260 , 12

) donde X representa la variable ingreso familiar.
a) Cual es la probabilidad que al seleccionar al azar una familia de clase baja, su
ingreso sea menor a 265 dlares ?
Debemos calcular P (X<265). En primer lugar, la tabla de la distribucin normal con
una media igual a 260 y varianza igual a 12 no est disponible, por tanto, se requiere
tipificar la variable ingreso familiar (X) y convertirla en una nueva variable Z que sigue
una distribucin normal con media 0 y varianza 1, la cual s se encuentra tabulada.
Tipificando:
44 . 1
464 . 3
260 265

Z

En la TABLA 48 buscamos la interseccin de la fila 1.4 con la columna 0.04 ( percentil
1.44 ) y encontramos que el rea a la izquierda de este percentil es 0.9251, de donde
concluimos que:
P (X<265) = P (Z<1.44) = 0.9251
b) Cual es la probabilidad que al seleccionar al azar una familia de clase baja, su
ingreso sea mayor a 263 dlares ?
Debemos calcular P (X>263). Tipificando:
87 . 0
464 . 3
260 263

Z

15
es decir, debemos calcular P (Z>0.87), la cual grficamente implica obtener el rea bajo
la curva normal que se encuentra a la derecha del percentil 0.87. Las reas a la derecha
de un percentil no se encuentran tabuladas, razn por la cual haremos uso de las
propiedades grficas de la curva para encontrar la probabilidad deseada. Veamos
grficamente la situacin:


P(Z<0.87) P(Z>0.87)

0 0.87
Como el rea total bajo la curva es igual a 1, entonces:
P(Z<0.87) + P(Z>0.87) = 1 o lo que es lo mismo:
P(Z>0.87) = 1 P(Z<0.87)
Y como P(Z<0.87) = 0.8078 ( Ver Tabla )
entonces, P(X>263) = P(Z>0.87) = 1 0.8078 = 0.1922
De manera general, si a es un percentil no negativo (>=0) de una distribucin normal,
entonces:
P (Z>a) = 1 P (Z<a)
c) Cual es la probabilidad que al seleccionar al azar una familia de clase baja, su
ingreso sea menor a 256 dlares ?
Debemos calcular P (X<256). Tipificando:
15 . 1
464 . 3
260 256

Z

es decir, debemos calcular P (Z<-1.15), la cual grficamente implica obtener el rea
bajo la curva normal que se encuentra a la izquierda del percentil 1.15. Las reas
correspondientes a percentiles negativos no se encuentran tabuladas, razn por la cual
debemos nuevamente hacer uso de las propiedades grficas de la curva. Veamos
grficamente la situacin:


P(Z<-1.15) P(Z>1.15)
16

-1.15 0 1.15
En el grfico, P (Z<-1.15) es exactamente igual a P (Z>1.15) debido a la simetra de la
curva con relacin a 0, de donde:
P(Z<-1.15) = P(Z>1.15) = 1 P(Z<1.15)
y como P(Z<1.15) = 0.8749 ( Ver Tabla )
entonces, P(X<256) = P(Z<-1.15) = 1 0.8749 = 0.1251
De manera general, si a es un percentil no negativo (>=0) de una distribucin normal,
entonces:
P (Z<-a) = 1 P (Z<a)
d) Cual es la probabilidad que al seleccionar al azar una familia de clase baja, su
ingreso sea mayor a 258 dlares ?
Debemos calcular P (X>258). Tipificando:
58 . 0
464 . 3
260 258

Z

es decir, debemos calcular P (Z>-0.58), la cual grficamente implica obtener el rea
bajo la curva normal que se encuentra a la derecha del percentil 0.58. Esta rea no se
encuentran tabulada, razn por la cual debemos nuevamente hacer uso de las
propiedades grficas de la curva.

P(Z>-0.58)
-0.58 0
P(Z<0.58)
17
0 0.58
En los dos grficos anteriores se puede apreciar que P (Z>-0.58) es exactamente igual a
P (Z<-0.58) debido a la simetra de la curva, es decir:
P(Z>-0.58) = P(Z<0.58)
y como P(Z<0.58) = 0.7190 ( Ver Tabla )
entonces, P(X>258) = P(Z>-0.58) = 0.7190
De manera general, si a es un percentil no negativo (>=0) de una distribucin normal,
entonces:
P (Z>-a) = P (Z<a)
e) Cual es la probabilidad que al seleccionar al azar una familia de clase baja, su
ingreso sea menor a 263 dlares y mayor a 255 dlares ?
Debemos calcular P (255<X<263). Tipificando:
87 . 0 44 . 1
464 . 3
260 263
464 . 3
260 255
< <

< <

Z Z

es decir, debemos calcular P (-1.44 < Z < 0.87).


P(-1.44<Z<0.87)

-1.44 0 0.87
Grficamente puede apreciarse que:
P(-1.44<Z<0.87) = P(Z<0.87) P(Z<-1.44)
P(Z<0.87) [ 1 P(Z<1.44) ]
= P(Z<0.87) 1 + P(Z<1.44) = 0.8078 1 + 0.9251
18
de donde P(255<X<263) = P(-1.44<Z<0.87) = 0.7329
De manera general, si a y b son percentiles no negativos (>=0) de una distribucin
normal, entonces:
P (b<Z<a) = P (Z<a) P (Z<b)
1.7 Distribuciones muestrales
Una distribucin muestral es una distribucin de probabilidad de un estadgrafo
muestral, el cual es calculado tomando como base todas las muestras posibles de tamao
n, seleccionadas al azar de una poblacin determinada. A continuacin estudiaremos
algunas Distribuciones Muestrales de gran importancia para el desarrollo de contenidos
posteriores.
1.7.1 Distribucin muestral de la media
Consideremos una poblacin y todas las posibles muestras de tamao n de ella. Si
pudiramos obtener la media de cada una de estas muestras, podramos considerar el
conjunto de los nmeros obtenidos como los valores de una variable aleatoria. A la
distribucin de esta variable aleatoria se le llama Distribucin muestral de la media.
Si
_
x
es la media de una muestra aleatoria de tamao n de una determina poblacin,
entonces la media y la varianza de la distribucin muestral de x son y
2
/ n donde
y
2
son la media y la varianza de la poblacin de donde provienen las muestras.
Demostremos la veracidad de lo que acabamos de afirmar:
Segn la hiptesis: M(X) = y V(X) =
2
de aqu que aplicando las propiedades de la
media y la varianza:
M(
_
x
) = M( Xi n
n
/
1

) =

n
n Xi M
1
/ ) (
= 1/n ( n ) =
V(
_
x
) = V( Xi n
n
/
1

) =

n
n Xi V
1
/ ) (
= 1/n
2
( n
2
) =
2
/ n
Si las muestras provienen de una poblacin con distribucin normal o la poblacin no es
normal pero n es lo suficientemente grande, entonces:

_
x
N ( ,
2
/ n)
Este resultado se conoce como teorema central del lmite y es de gran importancia en
la estadstica.
19
De todo lo anteriormente expuesto se puede concluir que la variable
_
x
tipificada, es
decir,
Z =
n
x


_
sigue una distribucin normal con media cero y varianza 1.
1.7.1.1 Distribucin t ( t de Student )
Acabamos de ver que la variable:
Z =
n
x


_
est normalmente distribuida con media cero y varianza 1. Sin embargo, por regla
general, el valor de la varianza poblacional, y en consecuencia de la
desviacin tpica poblacional, nunca es conocido, razn por la cual se
requiere utilizar en su lugar la varianza muestral s
2
, dando lugar a la nueva
variable:
t =
n
s
x
_
la cual es conocida como distribucin t de Student o simplemente distribucin t. Esta
distribucin fue introducida por W.S. Gosset, el cual realiz publicaciones bajo el
nombre de Student en 1908.
Entre la distribucin t y la distribucin normal existe una determinada relacin. Ambas
son simtricas con respecto a la media y por regla general la distribucin t es ms plana
que la normal. Adicionalmente, una distribucin t alcanza una menor altura en la media
que una normal, y por el contrario, la primera es mayor en los extremos que la segunda.
Hay una distribucin t diferente para cada tamao posible de muestra y cuando sta es
mayor de 30, se vuelve aproximadamente igual a la normal. Es por esto, que para
tamaos de muestra mayores a 30 se suele utilizar la distribucin normal en lugar de la t
de Student.
1.7.1.2 Grados de libertad
Hemos sealado que para cada tamao posible de muestra existe una distribucin t
diferente, o dicho es trminos estadsticos, existe una distribucin t distinta para cada
uno de los posibles grados de libertad. Pasemos a definir este concepto, y para ello,
supongamos un conjunto formado por tres elementos de los cuales conocemos que su
media es igual a 24. Sean a, b, y c estos elementos. Por tanto:
20
24
3

+ + c b a
Supongamos que escogemos a = 20 y b = 38. Despus de haber hecho esto, el valor de c
no puede ser escogido arbitrariamente sino que tiene que tomar el valor 14, ya que
como a + b + c tiene que ser igual a 72 ( 24 x 3 ) entonces:
14 38 20 72 72 + + c c c b a

Se dice entonces que el conjunto formado por estos tres elementos tiene 2 grados de
libertad ya que somos libres de establecer el valor de solamente dos de estos elementos,
quedando el valor del tercer elemento inequvocamente establecido.
Generalizando, podemos afirmar que un conjunto formado por n elementos tiene n 1
grados de libertad.
Para la determinacin del percentil de una distribucin t de Student especfica, podemos
utilizar la TABLA 49 del anexo la cual estudiaremos en detalle en un epgrafe posterior.
1.7.2 Distribucin de una proporcin muestral
En ocasiones, resulta necesario hacer inferencias sobre una proporcin poblacional en
lugar de una media. Por ejemplo, en un estudio realizado en una provincia se puede
estar interesado en conocer la proporcin de personas que cumplen puntualmente con
sus obligaciones tributarias.
En estos casos, el estadgrafo que interesa es la proporcin muestral, la cual viene dada
por:
p
muestra la en entidades de total nmero
estudiada tica caracters
la con muestra la en entidades de nmero


Por ejemplo, si en una muestra de 800 personas, 748 cumplen con sus obligaciones
tributarias, entonces la proporcin de personas en la muestra que cumplen, viene dado
por:
p

935 . 0
800
748


Por lo dicho anteriormente, las tcnicas de inferencia estadstica en estos casos
dependern de la distribucin muestral de
p
.
La distribucin de una proporcin muestral
p
calculada de muestras aleatorias de
tamao n extradas de una poblacin en la que la proporcin poblacional es p, sigue
aproximadamente una distribucin normal si n es grande, con media igual a p y varianza
.
n
p p ) 1 (
21
1.7.3 Distribucin F de Fischer
Hasta el momento nos hemos interesado en establecer inferencias con relacin a la
diferencia entre dos medias poblacionales o entre dos proporciones poblacionales. Sin
embargo, cuando se trata de inferencias sobre dos varianzas poblacionales la razn entre
ellas resulta la mejor va para una aproximacin. Por lo antes expuesto, el estudio de la
distribucin muestral de la razn de dos varianzas muestrales resulta de gran inters en
la estadstica.
En el ao 1924, R. A. Fischer present una distribucin conocida con el nombre de
Distribucin F, la cual es de inestimable utilidad para establecer procedimientos de
inferencia usando la razn entre dos varianzas muestrales. La naturaleza de dicha
distribucin se expresa del siguiente modo:
Si S
2
1
y S
2
2
son varianzas calculadas a partir de muestras aleatorias independientes de
tamao n
1
y n
2
extradas de poblaciones distribuidas normalmente con varianzas
1

2
y

2

2
respectivamente, entonces la variable aleatoria
2
2
2
2
1
2
1
2

S
S
F

sigue una distribucin F de Fischer con n
1
1 y n
2
1 grados de libertad en el
numerador y denominador respectivamente.
Cuando las varianzas de ambas poblaciones son iguales entonces:
2
2
1
2
S
S
F
En la TABLA 50 del anexo aparecen los percentiles de la distribucin F de Fisher. El
uso de esta tabla y de los percentiles que contiene, ser abordado en un Captulo
posterior.
1.8 Intervalos de confianza.
1.8.1 Estimacin puntual
A menudo se necesita conocer el valor de un parmetro y resulta de suma complejidad
su obtencin debido al tamao de la poblacin. Por ejemplo, podramos querer conocer
el gasto promedio de un determinado tipo de profesional. Resulta prcticamente
imposible estudiar a todos estos profesionales y hallar el valor promedio de dichos
gastos. Una solucin es tomar una muestra de los gastos de tales profesionales y
considerar el gasto promedio de los mismos como el gasto promedio de la poblacin. En
este caso se dice que hemos hecho una estimacin puntual del valor promedio
poblacional. La estimacin puntual de un parmetro debiera ser una cantidad cercana al
22
verdadero valor de ste, sin embargo, la precisin de la estimacin realizada es
siempre una incgnita. La solucin a este problema conduce a la utilizacin de otro
mtodo de estimacin llamado estimacin por intervalo o intervalo de confianza,
mediante el cual podemos obtener un intervalo cuyos extremos son funciones de la
muestra, es decir, variables aleatorias entre las cuales con determinada probabilidad se
halla el verdadero valor del parmetro estimado.
Esto es, si designamos con la letra griega al parmetro que deseamos estimar,
entonces el procedimiento consiste en tomar una muestra aleatoria de la
correspondiente poblacin y hallar un intervalo aleatorio [ I , D ] donde I = extremo
izquierdo del intervalo y D = extremo derecho, tal que la probabilidad de que el
verdadero valor del parmetro est dentro del intervalo calculado sea lo suficientemente
grande, es decir,
P{ [ I , D ] } = 1 -
donde es un valor lo suficientemente pequeo y recibe el nombre de nivel de
significacin. A 1 - se le conoce como nivel de confianza de la estimacin por
intervalo, y se dice que [ I , D ] es un intervalo de confianza del 100(1 - )%, o lo que
es lo mismo, una estimacin por intervalo de con un nivel de confianza de 1 - .
Por supuesto que los valores de 1 - deben ser lo ms cercano a 1. Usualmente se
escogen los valores de 1 - iguales a 0.95, 0.99 o 0.999, o lo que es lo mismo, igual
a 0.05, 0.01 o 0.001. Por supuesto que otros valores de pueden ser escogidos segn
los intereses del investigador, pero nunca mayores a 0.10.
1.8.2 Intervalo de confianza para la media de una poblacin distribuida
normalmente con varianza
2
conocida

.
Si X
1
, X
2
, , X
n
es una muestra aleatoria de tamao n de una poblacin con
distribucin normal con media y varianza
2
conocida, entonces:
I = [
x
-
n

2
1

Z
,
x
+
n

2
1

Z
] es un intervalo de confianza para la
estimacin de con un nivel de confianza de 1 - , donde
2
1

Z
es el percentil de
orden
2
1

de la distribucin normal tipificada, es decir, el percentil con un rea a su


derecha
2
1

.
Para demostrarlo basta con probar que P( I ) = 1 -
P{ I } = P [
x
-
n

2
1
Z

x
+
n

2
1

Z
] =
P [-
n

_
2
1
x Z

2
1

Z
] =
23
P [-

n
x
Z

_
2
1
2
1

Z
] =

,
_

,
_


2
1
2
1

Z N Z N
=

,
_

,
_

,
_


2
1
2
1
1

Z N Z N
=

,
_

,
_


2
1
2
1
1

Z N Z N
=
2
1 1
2
1

+
= 1-
con lo cual queda demostrado lo que nos habamos propuesto.
Veamos a continuacin un ejemplo al respecto. Supongamos que a causa de una
investigacin, deseamos obtener un intervalo de confianza del 99% de confiabilidad con
el objetivo de estimar entre que valores se encuentra el gasto promedio en comisariato
de un determinado tipo de profesional. Supongamos que para ello se extrajo una
muestra de los gastos en comisariato de 9 de dichos profesionales, la cual dio como
resultado una media muestral igual a 121.78 dlares, y que adems, sabemos por
trabajos anteriores que la desviacin tpica poblacional de estos gastos es igual a 4.71
dlares.
Obtengamos el intervalo de confianza requerido:
parmetro a estimar
x = 121.78 n = 9 = 4.71
Como deseamos obtener un intervalo del 99% de confiabilidad entonces el nivel de
significacin es del 1%, es decir, = 0.01 y
por tanto,
995 . 0 005 . 0 1
2
01 . 0
1
2
1

El percentil de la distribucin normal tipificada con un rea a su izquierda igual a 0.995


es 2.57, lo cual puede comprobar el lector haciendo uso de la TABLA 48 del Anexo. La
expresin del intervalo de confianza viene dado entonces por:
( ) ( )
1
]
1

+ 57 . 2
9
71 . 4
78 . 121 , 57 . 2
9
71 . 4
78 . 121
es decir,
[ 120.21 , 123.35 ]
lo cual significa que con un 99% de confiabilidad podemos asegurar que el gasto
promedio en comisariato a nivel poblacional de los profesionales estudiados, est entre
120.21 y 123.35 dlares.
O sea, 120.21 123.35 con un nivel de confianza del 99 %.
El intervalo de confianza obtenido se muestra grficamente en la FIGURA 1.8.1:
24
FIGURA 1.8.1


0.99 del rea bajo la curva
0.005 del rea bajo la curva 0.005 del rea bajo la curva



120.21 123.35


Intervalo de confianza

Observe como el nivel de significacin = 0.01 se encuentra equitativamente
repartido en ambos extremos de la curva, es decir,
005 . 0
2
01 . 0
2

del rea en cada una de las colas de la curva.


Por lo antes expuesto, se dice en trminos estadsticos que se ha realizado una prueba de
dos colas.

1.8.3 Intervalo de confianza para la media de una poblacin distribuida
normalmente con varianza
2
desconocida

.
Una estimacin por intervalo de confianza de la media de una poblacin con
distribucin normal y varianza poblacional desconocida viene dada por:
[
x
-
n
s
( ) 1 n
t

,
x
+
n
s
( ) 1 n
t

]
donde s

es la desviacin tpica muestral y
( ) 1 n
t

es el percentil para una prueba de dos


colas de la distribucin t de Student con n-1 grados de libertad y nivel de significacin
.
Veamos el mismo ejemplo estudiado en el epgrafe anterior.
Supongamos que la muestra de los gastos en comisariato de los profesionales, fue la que
se muestra a continuacin:
120 128 117 129 115 123 121 119 124
Obtengamos el intervalo de confianza requerido:
25
parmetro a estimar
x =
9
1096
= 121.78
n = 9
y sin lugar a dudas no ser difcil para el lector comprobar que:
s
2
= 22.19 y en consecuencia, s = 4.71
Como deseamos obtener un intervalo del 99% de confiabilidad, entonces el nivel de
significacin es del 1%, es decir, = 0.01.
El percentil de la distribucin t de Student para una prueba de dos colas, un nivel de
significacin del 1% y 8 grados de libertad es igual a 3.355, lo cual puede comprobar el
lector haciendo uso de la TABLA 49 del Anexo. Para encontrar este percentil
procedemos de la siguiente manera:
Primero nos ubicamos donde se encuentra el nivel de significacin = 0.01 en la fila
Prueba de dos colas. A continuacin ubicamos la fila con el nmero 8 en la columna
correspondiente a los grados de libertad (G.L.). Finalmente, en la interseccin de esta
fila y la columna correspondiente a 0.01 encontramos el percentil que buscamos, es
decir, 3.355.
La expresin del intervalo de confianza viene dado por:
( ) ( )
1
]
1

+ 355 . 3
9
71 . 4
78 . 121 , 355 . 3
9
71 . 4
78 . 121
es decir,
[ 116.51 , 127.05 ]
lo cual significa que con un 99% de confiabilidad podemos asegurar que el gasto
promedio en comisariato a nivel poblacional de los profesionales estudiados, est entre
116.51 y 127.05 dlares.
O sea, 116.51 127.05 con un nivel de confianza del 99 %.
Para n suficientemente grande ( n 30 ), la distribucin t puede ser aproximada por la
distribucin normal, por lo que en lugar del percentil t podra haberse utilizado, de haber
sido el caso, el percentil correspondiente de la normal.
1.8.4 Intervalo de confianza para una proporcin.
Una estimacin por intervalo de confianza para la proporcin p de elementos con cierta
caracterstica en una poblacin, viene dada por:
p
-
n
p p ) 1 (

2
1

Z
,
p
+
n
p p ) 1 (

2
1

Z
donde
p
es
26
la proporcin muestral correspondiente.
De esta forma, si en una muestra aleatoria de 64 contribuyentes extrada en un
determinado cantn se encontraron 13 contribuyentes morosos, entonces una estimacin
por intervalo con nivel de confianza del 95 % para la proporcin de contribuyentes
morosos en todo el cantn viene dado por:
n = 64
p
= 13 / 64 = 0.2
= 0.05 1 - / 2 = 0.975 Z
0.975
= 1.96
0.2 t
( . )( . ) 0 2 08
64
( 1.96 ) = 0.2 t 0.4 / 8 = 0.2 t 0.1
por tanto, el intervalo de confianza es:
[ 0.1 ; 0.3 ] o sea, 0.1 p 0.3
con nivel de confiabilidad del 95 %.
1.9 Tamao de muestra necesario para estimar el valor de un parmetro.
En todos los aspectos tratados hasta el momento con relacin a la teora de estimacin
hemos estado utilizando el smbolo n para referirnos al tamao de la muestra, y en los
ejercicios desarrollados al respecto, hemos seleccionado un tamao de muestra
arbitrario. Sin embargo, en la prctica real de la investigacin el valor de n debe ser
calculado con absoluta precisin, ya que si sta es muy pequea corremos el riesgo de
no alcanzar el objetivo de nuestro anlisis, y por el contrario, si es demasiado grande
estaremos desperdiciando valiosos recursos cuando obtengamos la muestra.
Por razones obvias, siempre que obtenemos una muestra se pierde una parte de
informacin til con respecto a la poblacin, y por tanto, si pretendemos tener un alto
nivel de precisin (esto es, asegurarnos de que la estimacin es lo ms cercana posible
al valor real del parmetro que se desea estimar), tendremos que tomar una muestra
suficiente de la poblacin que nos garantice la informacin requerida.
Por tanto, que tamao de muestra debe ser seleccionada para estimar el valor real de
un parmetro con una adecuada precisin ?
1.9.1 Tamao de muestra para estimar una media poblacional.
En el epgrafe 1.8.2 vimos que los lmites de confianza para estimar una media
poblacional mediante un intervalo de confianza con nivel de significacin vienen
dados por :
Lmite inferior Lmite superior
x -
n

2
1

Z
x +
n

2
1

Z

27
es decir, que el error que se comete por defecto o por exceso (error de muestreo = e) al
estimar una media poblacional viene dado por :
e =
n

2
1

Z
, de donde despejando el trmino n :
2
2
4
2
3
2
2
2
1
32
8
m
T T T T

+ + +
lo que representa la expresin que nos permite calcular el tamao de la muestra para
estimar la media de una poblacin, donde es la desviacin tpica de la poblacin,
2
1

Z
el percentil de la distribucin normal de orden
2
1

, e el error de muestreo y
el nivel de significacin seleccionado.
Veamos un ejemplo del clculo del tamao de una muestra.
El gerente de una Empresa Agropecuaria desea calcular el tamao de muestra necesario
para estimar la media poblacional de produccin de leche de vacas Holstein de mediano
potencial en el cantn donde sta se encuentra ubicada. Para ello decide utilizar un nivel
de significacin del 1% ( nivel de confiabilidad del 99 % ), y se encuentra satisfecho si
logra estimar el valor de la media con un error de muestreo de ms menos un litro.
Adicionalmente conoce por experiencias anteriores que el valor de la desviacin tpica
de esta poblacin es igual a 0.64. Que tamao de muestra ser necesario para la
estimacin ?
= 0.01 de donde
995 . 0
2
01 . 0
1
2
1

y Z
0.995
= 2.57 de donde;
6 . 24
1
57 . 2 93 . 1
2
2
2
1

,
_

,
_


x
e
Z
n

es decir, con los indicadores establecidos, se requiere medir la produccin de leche a 25


vacas para obtener la estimacin deseada.
En el ejemplo que acabamos de ver tenamos conocimiento del valor de la desviacin
tpica de la poblacin, sin embargo en muchas ocasiones, por no decir en todas, este
valor en realidad se desconoce. Por otra parte, no es posible estimar el valor de este
parmetro con los procedimientos que ya conocemos puesto que nos encontramos en la
fase de decidir el tamao de muestra que debe ser seleccionado, y por tanto, sta an no
ha sido tomada. Pero si tenemos una idea ms o menos clara de cual es el alcance de la
poblacin, es decir, la diferencia entre su valor mximo y su valor mnimo, entonces
podemos utilizarlo para obtener una estimacin aproximada pero utilizable del valor de
la desviacin tpica.
28
Se conoce que en una distribucin normal ms menos tres desviaciones tpicas incluyen
el 99.7% del rea total bajo la curva, es decir, ms tres desviaciones tpicas y menos tres
desviaciones tpicas de la media incluyen a casi toda el rea de la distribucin.
Esto quiere decir, que si en el ejemplo anterior no hubisemos tenido conocimiento del
valor de la desviacin tpica de la produccin de leche ( lo cual es usual ) pero s que
entre la produccin de leche mayor y la menor hay una diferencia de 4 litros, entonces
la relacin aproximada entre el alcance y la distribucin tpica de la poblacin sera
como se muestra en la siguiente figura :
FIGURA 1.9.1
-3 +3
Alcance (4 litros)
Por tanto, una estimacin aproximada de la desviacin tpica de la poblacin vendra
dada por:
67 . 0
6
4
4 6


La estimacin que hemos obtenido de la desviacin tpica de la poblacin no es del todo
precisa, pero puede marcar la diferencia entre poder calcular un tamao de muestra
utilizable y no poder hacerlo.
1.9.2 Tamao de muestra para estimar una proporcin poblacional.
Los procedimientos utilizados para estimar el valor de una proporcin poblacional son
en esencia muy similares a los utilizados para estimar una media poblacional. Los
lmites de confianza para estimar una proporcin poblacional p mediante un intervalo
de confianza con nivel de significacin vienen dados por :

Lmite inferior Lmite superior
p
-
n
p p ) 1 (

2
1

Z

p
+
n
p p ) 1 (

2
1

Z
donde
p
es
la proporcin muestral correspondiente.

29
De aqu que e =
n
p p ) 1 (

2
1

Z
y despejando el valor de n :
2
2
1
2
) 1 (
e
Z p p
n

donde p es el valor de la proporcin poblacional.


Desarrollemos un ejemplo. Una empresa desea estimar la proporcin de artculos
defectuosos en su almacn de piezas de repuestos y para ello decide utilizar un nivel de
significacin del 5% y estara satisfecha si logra estimar este valor con un error de
muestreo de mas menos el 4% ( 0.04 en trminos de proporcin ). Que tamao de
muestra ser necesario para la estimacin ?
= 0.05 por tanto,
975 . 0
2
05 . 0
1
2
1

y Z
0.975
= 1.96
Para hallar el valor de n an necesitamos tener una estimacin del valor de p. Si
tenemos una buena idea del valor real de la proporcin de piezas defectuosas en el
almacn, podemos entonces utilizar ste como nuestra estimacin de p para calcular n.
Si por el contrario, no tenemos la menor idea del valor de p, entonces nuestra mejor
opcin seria escogerlo de forma tal que determinemos el valor de n de forma
conservadora (es decir, de modo que el tamao de la muestra sea lo suficientemente
grande para obtener una buena precisin en la estimacin) lo cual se logra con p = 0.5.
Procediendo de esta forma:
25 . 600
) 04 . 0 (
) 96 . 1 ( ) 5 . 0 1 ( 5 . 0
) 1 (
2
2
2
2
1
2


e
Z p p
n

es decir, con los indicadores establecidos, ser necesario extraer del almacn un total de
600 piezas de repuesto.
1.10 Prueba de Hiptesis.
1.10.1 Introduccin.
En el desarrollo ulterior de los mtodos estadsticos y en el quehacer diario de la
Ciencia y la Tecnologa, se presenta con mucha frecuencia la necesidad de tomar una
decisin con relacin al valor de un parmetro de una poblacin determinada.
30
Los problemas que involucran una toma de decisin pueden, por regla general, reducirse
a un procedimiento que implique el rechazo o la aceptacin de una hiptesis o
suposicin sobre el valor de la media o la proporcin poblacional de una distribucin.
El procedimiento estadstico que da solucin a este tipo de problemtica se conoce
como PRUEBA DE HIPTESIS, el cual pasamos a describir a continuacin.
Con el objetivo de ilustrar el problema, iniciaremos la descripcin del procedimiento
mediante una prueba de hiptesis sencilla. Supongamos que se desea tomar una
decisin sobre el valor de una media poblacional de la cual conocemos que solo puede
tomar los valores 14 o 19. Una formulacin de hiptesis para este caso puede ser
expresada de la siguiente manera:
H
0:
= 14 y H
1
: = 19
En trminos de una Prueba de Hiptesis, a H
0
se le conoce como la hiptesis nula y a
H
1
como la hiptesis alternativa.
Como vimos anteriormente, decidir si la media poblacional es igual a 14 o igual a 19, se
reduce a tomar una de las dos siguientes decisiones:
Rechazar H
0
, lo cual implica aceptar H
1
y en consecuencia decidir que = 19
Aceptar H
0
, lo cual determina que = 14
Pero la estadstica no es una ciencia exacta, y en consecuencia, cualquiera sea la
decisin que tomemos podemos cometer dos tipos de errores:
Si rechazamos H
0
y realmente esta hiptesis es verdadera, cometemos el error
conocido como Error de Tipo I
Si aceptamos H
0
y en realidad esta hiptesis es falsa, cometemos el error conocido
como Error de Tipo II
En trminos probabilsticos, a la probabilidad de cometer el Error de Tipo I, se le
denomina nivel de significacin y como sealamos en un epgrafe anterior, se le
representa con la letra griega ( alfa ). A la probabilidad de cometer el Error de Tipo II
se le designa con la letra griega ( Beta ).
Con el objetivo de optimizar el mtodo, la formulacin de las hiptesis nula y
alternativa se realiza de forma tal que el Error de Tipo I sea el de consecuencias mas
graves fijando la probabilidad de cometerlo con un valor lo suficientemente pequeo y
que sea aceptable para el investigador.
Con relacin a las hiptesis anteriormente formuladas, una regla de decisin razonable
sera aceptar H
0
si la media de una muestra extrada de la poblacin bajo estudio es
menor o igual que un cierto valor crtico z comprendido entre 14 y 19, y aceptar H
1
si
esta media es mayor que dicho valor. Supongamos entonces que una muestra de
tamao 16 extrada de la poblacin bajo estudio dio como resultado una media muestral
igual a 17, y que conocemos que la desviacin tpica poblacional tiene un valor igual a
31
9. Si fijamos el valor de , entonces la probabilidad de rechazar H
0
siendo verdadera,
viene dada por la expresin:
P{ x > z | = 14 } =
Consideremos = 0.05, entonces, P{ x > z | = 14 } = 0.05
P{ x > z | = 14 } = 1 - P{ x z | = 14 } = 0.05
Tipificando: 1- P{
x
n


4
9
14 z
} = 0.05
De donde:
P{
x
n


4
9
14 z
} = 1 0.05 = 0.95

,
_

4
9
14 z
N
= 0.95
25 . 2
14 z
= 1.64 y despejando z = 17.69
Entonces la regla de decisin quedara como sigue:
Aceptar H
0
y rechazar H
1
si x 17.69
Rechazar H
0
y aceptar H
1
si x > 17.69

Y como x = 17 entonces la decisin final ser aceptar H
0 .
Pasemos a continuacin a calcular la probabilidad de cometer el error de tipo II o error
para diferentes valores de :
Para = 0.05 ya vimos que z = 17.69
= P{ x 17.69 | = 19 } =

,
_

4
9
19 69 . 17
N
= N (-0.58) = 1- N (0.58) = 1-
0.7190 = 0.2810
Para = 0.01

,
_

4
9
14 z
N
= 0.99
25 . 2
14 z
= 2.33 y despejando z = 19.24
= P{ x 19.24 | = 19 } =

,
_

4
9
19 24 . 19
N
= N (0.11) = 0.5438
32
Para = 0.001

,
_

4
9
14 z
N
= 0.999
25 . 2
14 z
= 3.08 y despejando z = 20.93
= P{ x 20.93 | = 19 } =

,
_

4
9
19 93 . 20
N
= N (0.86) = 0.8051
Resumiendo:

0.05 0.2810
0.01 0.5438
0.001 0.8051
El resumen anterior evidencia que cuando se disminuye la probabilidad de cometer el
Error de Tipo I entonces aumenta la probabilidad de cometer el Error de Tipo II y
viceversa.
1.10.2 Potencia de la prueba de hiptesis.
Para cualquier investigador, una buena prueba de hiptesis es, sin lugar a dudas,
aquella en que la probabilidad de rechazar H
0
cuando sta es falsa, es un valor cercano a
1, o dicho de otra manera, cuando:
P[Rechazar H
0
, cuando H
0
es falsa] =
1- P[Aceptar H
0
, cuando H
0
es falsa] = 1-
es un valor cercano a 1. Al valor 1- se le conoce como la potencia de la prueba de
hiptesis. Ampliando el resumen del epgrafe anterior:
n
1 -
16 0.05 0.2810 0.7190
16 0.01 0.5438 0.4562
16 0.001 0.8051 0.1949
se puede apreciar que para un tamao de muestra fijo (n=16), cuando se disminuye la
probabilidad de rechazar H
0
cuando sta es verdadera () entonces se disminuye
tambin la potencia de la prueba (1-), lo cual es por supuesto algo no deseable.
Veamos a continuacin de que forma podemos incrementar la potencia de la prueba de
una hiptesis con independencia del valor de que haya sido escogido.
Como se aprecia en el resumen anterior para un tamao de muestra igual a 16 y un nivel
de significacin igual a 0.05, la potencia de la prueba es igual a 0.7190. Calculemos la
33
potencia de la prueba si incrementamos el tamao de la muestra, por ejemplo, a 25. Tal
y como hicimos en el epgrafe anterior:
Para = 0.05 y n = 25

,
_

5
9
14 z
N
= 0.95
8 . 1
14 z
= 1.64 y despejando z = 16.95
= P{ x 16.95 | = 19 } =

,
_

5
9
19 95 . 16
N
= N (-1.14) = 1 N (1.14) = 1
0.8729 = 0.1271 , y por tanto:
1- = 1 0.1271 = 0.8729
valor que comparado con la potencia de la prueba ( 0.7190 ) para n igual a 16 y igual
a 0.05, nos indica que al aumentar el tamao de la muestra podemos incrementar el
valor de la potencia de la prueba de hiptesis. El lector podr comprobar sin mucha
dificultad los resultados que se reportan en el siguiente resumen y compararlos con los
que aparecen al inicio de este epgrafe:
n 1 -
25 0.05 0.1271 0.8729
25 0.01 0.3264 0.6736
25 0.001 0.3821 0.6179
1.10.3 Prueba de hiptesis sobre la media de una poblacin con varianza
poblacional conocida.
En toda prueba de hiptesis se hace necesario asignarle un valor hipottico a la media
de la poblacin sobre la cual se desarrolla la investigacin. Una prueba de hiptesis para
la media de una poblacin se hace necesaria cuando ocurre un evento que de alguna
manera nos hace suponer un cambio en la media poblacional. El valor de la media
poblacional antes de que tal evento ocurra, es el valor hipottico al que nos referamos
con anterioridad, y se le suele designar como
0
. Para una mejor comprensin del
aspecto que estamos tratando, analicemos la situacin que se presenta a continuacin:
El tiempo empleado por un contribuyente para su declaracin del IVA mensual por
INTERNET, es de 10.1 minutos. Se le hacen modificaciones a la pgina WEB , y en
una muestra aleatoria de 16 contribuyentes despus del cambio, se obtuvo un tiempo
promedio en la declaracin de 10.8 minutos. Adicionalmente se conoce que el valor
de la varianza poblacional es de 1.21 minutos.
Observe que antes de que se produjera el evento relacionado con el cambio en la pgina
WEB del SRI, existan evidencias que el tiempo empleado en la declaracin era de 10.1
minutos. Este valor representa el tiempo que de manera tradicional se utilizaba antes de
que la pgina WEB fuera modificada, es decir, antes que el evento hubiese ocurrido. Por
34
tanto, y sin lugar a dudas, podemos concluir que el valor hipottico de la media de la
poblacin es de 10.1 minutos, y en consecuencia:

0
= 10.1
La formulacin de la hiptesis nula sera entonces:
H
0
: = 10.1
Tres hiptesis alternativas podran entonces ser formuladas en correspondencia con el
inters de la investigacin. Estas diferentes hiptesis alternativas son:
H
1
: 10.1 si nos interesa conocer si la modificacin en la pgina WEB hizo que
el tiempo empleado en la declaracin cambiara.
H
1
: > 10.1 si esperamos que la nueva pgina haya incrementado el tiempo
empleado en la declaracin.
H
1
: < 10.1 si por el contrario suponemos que el cambio hizo que disminuyera el
tiempo.
Un resumen de los datos de la prueba de hiptesis se muestra a continuacin:

0
= 10.1 n = 16
8 . 10
_
x
1 . 1 21 . 1
2

Desarrollemos a continuacin de forma terica las tres posibles pruebas de hiptesis que
pueden ser formuladas, para con posterioridad referirnos especficamente al caso que
nos ocupa:
Consideremos en primer lugar las hiptesis:
H
0:
=
0
H
1:

0
donde es la media de la distribucin de una poblacin normal con varianza
2
y
0
es
un nmero real.
Si x es la media de una muestra aleatoria de esta poblacin, resulta razonable rechazar
H
0
si x difiere mucho de , o sea, si
| x - |> x para x suficientemente grande. Tipificando:
n
x


_
>
n
x

= z
El problema de la decisin de rechazar H
0
se reduce entonces a determinar el valor de z.
Utilicemos el nivel de significacin partiendo de la relacin:
P{ rechazar H
0
| H
0
es cierta } =
35
P
1
1
1
1
]
1

n
x

0
_
> z = ya que si H
0
es cierta entonces =
0

P
1
1
1
1
]
1

z
n
x

0
_
= 1- P
1
1
1
1
]
1

z
n
x
z

0
_
= 1-
N (z) - N(-z) = 1 - N(z) - 1 + N(z) = 1 -
2 N(z) = 2 - N(z) =
2
1

y entonces z =
2
1

Z
que es el percentil de orden
2
1

de la
distribucin N(0,1).
La regla de decisin quedara entonces como sigue:
Rechazar H
0
si
n
x

0
_

>
2
1

Z

Aceptar H
0
si
n
x

0
_


2
1

Z
Apliquemos la regla de decisin en el caso que estamos estudiando utilizando un nivel
de significacin del 5 %.
H
0:
= 10.1

H
1:
10.1
5 . 2
28 . 0
7 . 0
16
1 . 1
1 . 10 8 . 10

975 . 0 025 . 0 1
2
05 . 0
1
2
1

Z
0.975
= 1.96
y como 2.5 > 1.96, rechazamos H
0
con un nivel de significacin del 5%, es decir, la
nueva pgina WEB provoc un cambio en el tiempo empleado en la declaracin, y la
probabilidad de que este resultado no sea cierto es del 5%.
36
Las zonas de rechazo y de aceptacin de esta prueba de hiptesis se muestran en la
FIGURA 1.10.1:

FIGURA 1.10.1
Zona de aceptacin
Zona de rechazo

Cuando se observa el grfico anterior se puede apreciar que la zona de rechazo est
conformada por dos colas que se extienden a la derecha e izquierda de la curva de la
distribucin normal. Por esta razn se dice que la prueba de hiptesis que hemos
desarrollado es una prueba de dos colas.
Consideremos las hiptesis:
H
0:
=
0
H
1:
>
0
Si x es la media de una muestra aleatoria de esta poblacin, resulta razonable rechazar
H
0
si x es mucho mayor que , o sea, si x - > x para x suficientemente grande.
Tipificando:
n
x


_
>
n
x

= z
Calculemos el valor de z para un nivel de significacin .
P{ rechazar H
0
| H
0
es cierta } =
P
1
1
1
1
]
1

n
x

0
_
> z = ya que si H
0
es cierta entonces =
0

37
P
z
n
x

1
1
1
1
]
1

0
_
= 1-
N (z) = 1 -
y entonces z =
1
Z
que es el percentil de orden 1 de la
distribucin N(0,1).
La regla de decisin quedara entonces como sigue:
Rechazar H
0
si
n
x

0
_

>
1
Z

Aceptar H
0
si
n
x

0
_


1
Z
En nuestro caso:
H
0:
= 10.1

H
1:
> 10.1
5 . 2
28 . 0
7 . 0
16
1 . 1
1 . 10 8 . 10

95 . 0 05 . 0 1 1
Z
0.95
= 1.64
y como 2.5 > 1.64, rechazamos H
0
con un nivel de significacin del 5%, es decir, la
nueva pgina WEB provoc un aumento en el tiempo empleado en la declaracin, y la
probabilidad de que este resultado no sea cierto es del 5%.
Las zonas de rechazo y de aceptacin de esta prueba de hiptesis se muestran en la
FIGURA 1.10.2:

FIGURA 1.10.2
Zona de aceptacin
38
Apreciando el grfico podemos concluir que la prueba de hiptesis desarrollada es una
prueba de una cola.
Sean las hiptesis:
H
0:
=
0
H
1:
<
0
donde es la media de la distribucin de una poblacin normal con varianza
2
y
0
es
un nmero real.
Si x es la media de una muestra aleatoria de esta poblacin, resulta razonable rechazar
H
0
si x es mucho menor que , o sea, si x - < -x para x suficientemente grande, de
donde:
n
x


_
<
n
x

= -z
P
1
1
1
1
]
1

n
x

0
_
< -z = ya que si H
0
es cierta entonces =
0

1- P
1
1
1
1
]
1

n
x

0
_
< z = P
1
1
1
1
]
1

n
x

0
< z =1-
N (z) = 1 - de donde z = 1
Z
.
La regla de decisin quedara entonces:
39
Rechazar H
0
si
n
x

0
_

< -
1
Z

Aceptar H
0
si
n
x

0
_

-
1
Z
Particularizando:
H
0:
= 10.1

H
1:
> 10.1
5 . 2
28 . 0
7 . 0
16
1 . 1
1 . 10 8 . 10

95 . 0 05 . 0 1 1
Z
0.95
= 1.64
y como 2.5 > -1.64, aceptamos H
0
con un nivel de significacin del 5%, es decir, la
nueva pgina WEB no provoc una disminucin en el tiempo empleado en la
declaracin, y la probabilidad de que este resultado no sea cierto es del 5%.
Las zonas de rechazo y de aceptacin de esta prueba de hiptesis se muestran en la
FIGURA 1.10.3:
FIGURA 1.10.3

Zona de aceptacin
La prueba de hiptesis que acabamos de desarrollar es una prueba de una cola.
1.10.4 Prueba de hiptesis sobre la media de una poblacin con varianza
poblacional desconocida.
40
Cuando en una prueba de hiptesis la varianza poblacional es desconocida, se hace
necesario obtener con los datos de la muestra una estimacin de esta varianza, lo cual
trae como consecuencia un cambio en la distribucin del nuevo estadgrafo. Es decir, el
nuevo estadgrafo:
n
s
x
T
0
_


sigue una distribucin t de Student con n-1 grados de libertad.
En consecuencia, las reglas de decisin para las tres pruebas de hiptesis desarrolladas
en el epgrafe anterior, quedaran como sigue:
H
0:
=
0
H
1:

0
Rechazar H
0
si
n
s
x
0
_

>
( ) 1 n
t


Aceptar H
0
si
n
s
x
0
_


( ) 1 n
t

la cual es una prueba de hiptesis de dos colas.


H
0:
=
0
H
1:
>
0
Rechazar H
0
si
n
s
x
0
_

>
( ) 1 n
t

Aceptar H
0
si
n
s
x
0
_


( ) 1 n
t

en una prueba de hiptesis de una cola.


H
0:
=
0
H
1:
<
0
Rechazar H
0
si
n
s
x
0
_

<
( ) 1

n
t

41
Aceptar H
0
si
n
s
x
0
_


( ) 1

n
t

en una prueba de hiptesis de una cola.


Ejemplifiquemos estas pruebas de hiptesis con el caso estudiado en el epgrafe anterior
El tiempo empleado por un contribuyente para su declaracin del IVA mensual por
INTERNET, es de 10.1 minutos. Se le hacen modificaciones a la pgina WEB , y en
una muestra aleatoria de 16 contribuyentes despus del cambio, se obtuvo que los
tiempos empleados en la declaracin fueron los siguientes :
10.7 10.9 11.1 11.2 10.5 10.4 10.8 11.0
10.6 11.3 11.2 11.0 10.8 10.3 10.4 10.6
Utilizando = 0.01 procedamos a calcular y resumir los datos necesarios:
8 . 10
16
8 . 172
_

n
x
x
i

9 . 0
16
5 . 1
2
_
2

,
_

n
x x
s
i
de donde 95 . 0 9 . 0 s
0
= 10.1
por tanto:
H
0:
= 10.1

H
1:
10.1
67 . 11
06 . 0
7 . 0
16
95 . 0
1 . 10 8 . 10

Se trata de una prueba de dos colas, por tanto el percentil de la t de Student (Ver
TABLA 49) para un nivel de significacin del 1% y 15 grados de libertad tiene un valor
igual a 2.947 y como 11.67 > 2.947, concluimos rechazar la hiptesis nula, es decir, al
cambiar la pgina WEB el tiempo empleado en la declaracin no continu siendo igual
a 10.1 minutos.
H
0:
= 10.1

H
1:
> 10.1
67 . 11
06 . 0
7 . 0
16
95 . 0
1 . 10 8 . 10

En este caso se trata de una prueba de una sola cola, y el percentil de la t de Student
para = 0.01 y 15 grados de libertad tiene un valor igual a 2.602 y como 11.67 > 2.602,
concluimos rechazar la hiptesis nula, es decir, al cambiar la pgina WEB el tiempo
empleado en la declaracin se increment por encima de los 10.1 minutos.
42
H
0:
=
0
H
1:
<
0
67 . 11
06 . 0
7 . 0
16
95 . 0
1 . 10 8 . 10


Este otro caso es tambin una prueba de una sola cola, y el percentil de la t de Student
es igual a 2.202 y a consecuencia de que 11.67 > -2.202, concluimos aceptar la hiptesis
nula, es decir, al cambiar la pgina WEB el tiempo empleado en la declaracin no fue
menor a 10.1 minutos.
1.10.5 Prueba de hiptesis para la proporcin de una poblacin.

Las normas tcnicas indican que el porcentaje de piezas de repuesto defectuosas que
pueden encontrarse en el almacn de una empresa es de 8% (0.08). Un inspector desea
conocer si el almacn de una empresa en particular no cumple con esta norma y para
ello extrae una muestra de 60 piezas de las cuales 7 se hallaron defectuosas. Con un
nivel de significacin de 5%,
a) existen evidencias de que el almacn de esta empresa no cumple la norma tcnica
establecida ?
Analicemos los datos del problema:
El valor de la proporcin hipottica es p
0
= 0.08
El tamao de la muestra es n = 60
De la muestra escogida 7 piezas se hallaron defectuosas. Si denotamos este valor con X
entonces X = 7
El nivel de significacin es = 0.05

Las hiptesis nula y alternativa seran entonces:
H
0:
p

= 0.08

H
1:
p 0.08
Para este caso la regla de decisin quedara como sigue:
Rechazar H
0
si
2
1
0 0
0
) 1 (

>

Z
p np
np X

Aceptar H
0
si
2
1
0 0
0
) 1 (

Z
p np
np X

Segn los datos del problema:
975 . 0 025 . 0 1
2
05 . 0
1
2
1

Z
0.975
= 1.96
43
10 . 7 10 . 7
31 . 0
2 . 2
) 02 . 0 )( 08 . 0 ( 60
) 08 . 0 ( 60 7
) 1 (
0 0
0

p np
np X

y como 7.10 > 1.96, se rechaza la hiptesis nula, y en conclusin, el almacn de la
empresa no cumple la norma tcnica establecida.
b) hay razones para pensar que la proporcin de piezas defectuosas en el almacn de la
empresa es mayor que la norma establecida ?
Las hiptesis nula y alternativa seran entonces:
H
0:
p

= 0.08

H
1:
p > 0.08
Para este caso la regla de decisin quedara como sigue:
Rechazar H
0
si
>

1
0 0
0
) 1 (
Z
p np
np X

Aceptar H
0
si

1
0 0
0
) 1 (
Z
p np
np X

Segn los datos del problema:
95 . 0 05 . 0 1 1
Z
0.95
= 1.64
10 . 7
) 1 (
0 0
0

p np
np X
y como 7.10 > 1.64, se rechaza la hiptesis nula, y en conclusin, en el almacn de la
empresa existe una proporcin de piezas defectuosas mayor a la norma tcnica
establecida.
c) hay razones para pensar que la proporcin de piezas defectuosas en el almacn de la
empresa es menor que la norma establecida ?
Las hiptesis nula y alternativa seran entonces:
H
0:
p

= 0.08

H
1:
p < 0.08
Para este caso la regla de decisin quedara como sigue:
44
Rechazar H
0
si
<

1
0 0
0
) 1 (
Z
p np
np X

Aceptar H
0
si

1
0 0
0
) 1 (
Z
p np
np X

Segn los datos del problema:
95 . 0 05 . 0 1 1
Z
0.95
= 1.64
10 . 7
) 1 (
0 0
0

p np
np X
y como 7.10 > - 1.64, se acepta la hiptesis nula, y en consecuencia, debemos concluir
que en el almacn de la empresa no existe una proporcin de piezas defectuosas menor
a la norma tcnica establecida.
45
46
Anlisis estadstico de los
resultados
2
2.1 El modelo lineal general.
El conocimiento, al menos bsico, de la teora general de los modelos lineales
representa para el profesional una herramienta fundamental sin la cual difcilmente
podr lograr una adecuada interpretacin de sus resultados experimentales.
Cualquier procedimiento formal de anlisis de resultados provenientes de un
experimento, requiere ante todo, que cada observacin obtenida sea representada
mediante un modelo matemtico que exprese los diferentes factores que de una manera
u otra han sido responsables de esa respuesta. As, por ejemplo, la respuesta en
volmenes de prdidas de una empresa, puede estar determinada por un nmero mas o
menos grande de factores que deben ser expresados mediante un modelo matemtico
que permita conocer cual de ellos son los realmente importantes, y poder estimar su
grado de contribucin a los volmenes de prdidas alcanzados.
Factores tales como los costos de las materias primas, el costo de la mano de obra, la
disponibilidad semanal de tiempo, y otros ms, son factores que el modelo debe
considerar y estimar.
Pero si estamos hablando de un modelo lineal general, sera conveniente para alcanzar
esta generalizacin, que el modelo contenga parmetros que representen otros factores
que seguramente no contribuyen a la respuesta, y de alguna manera, dejar implcito en
el modelo que esto est ocurriendo.
Supongamos entonces que se tienen n datos u observaciones provenientes de n variables
aleatorias y
1
, y
2
, ., y
n
y que las mismas pueden estar o no influenciadas por el
efecto de p factores
1
,
2
, .. ,
p
.
El modelo lineal general para la i sima observacin viene dado entonces por:
i p Pi i i i
e x x x y + + + +
2 2 1 1
47
donde i = 1, 2, .. , n y e
i
son los errores experimentales.
Los coeficientes constantes x
ji
pueden entonces ser utilizados para, en un caso concreto,
sealar cuando un parmetro determinado es considerado o no en el modelo, siendo el
coeficiente x
ji
igual a 1 o 0 respectivamente. Es por ello, que a estos coeficientes se les
conoce como variables contadoras o variables indicadoras.
El modelo en trminos de matrices puede ser expresado como se muestra a
continuacin:
48
1
1
1
1
1
1
1
1
1
]
1

+
1
1
1
1
1
1
1
1
1
]
1

1
1
1
1
1
1
1
1
1
1
]
1

1
1
1
1
1
1
1
1
1
]
1

n p pn n n n
p
p
n
e
e
e
a a a a
a a a a
a a a a
y
y
y
y
...
...
...
...
...
...
...
...
.. ..........
.......... .......... ..........
.......... .......... ..........
.......... .......... ..........
.......... .......... ..........
..........
..........
2
1
2
1
3 2 1
2 32 22 12
1 31 21 11
3
2
1

49
o en forma an ms abreviada, Y = X

+ e
2.1.1 Clasificacin de los modelos lineales.
Los modelos lineales se clasifican atendiendo a dos aspectos diferentes, tal como se
expresa a continuacin:
a) Segn los valores de las variables x
ji
.
a.1) Cuando todas las variables x
ji
son indicadoras, es decir, solo toman los valores 0 o
1, el modelo se llama de Anlisis de Varianza.
a.2) Si por el contrario, todas las variables x
ji
, excepto una que tiene valor 1, son
variables aleatorias, entonces se dice que el modelo es de Anlisis de Regresin.
a.3) Decimos que el modelo es de Anlisis de Covarianza cuando es una combinacin
de los dos primeros, es decir, cuando algunas de las variables x
ji
tienen valor 0 o 1 y
otras son variables aleatorias.
b) Segn el valor de los parmetros
j
.
b.1) Cuando todos los
j
son valores constantes, decimos que el modelo es de Efectos
Fijos.
b.2) Si por el contrario, todos los
j
son variables aleatorias, entonces se dice que el
modelo es de Efectos Aleatorios.
b.3) Se dice que el modelo es de Efectos Mixtos cuando es una combinacin de los dos
primeros, es decir, cuando algunos
j
son valores constantes y otros variables
aleatorias.
Durante el desarrollo de este trabajo estudiaremos los modelos de Anlisis de Varianza
y de Regresin solo de efectos fijos. Los modelos de efectos aleatorios y mixtos son
solo utilizados en casos muy especiales, y su grado de complejidad no justifica su
inclusin en este material.

2.1.2 Hiptesis de base.
El desarrollo terico de los mtodos estadsticos asociados al modelo lineal general,
requieren que al mismo se le efecten algunas restricciones o suposiciones iniciales que
reciben el nombre de hiptesis de base. En esencia, estas hiptesis son las siguientes:
1) Los errores experimentales e
i
son independientes.
2) Los errores siguen una distribucin Normal con media cero y varianza
2
, lo cual se
expresa de forma ms resumida con la expresin e
i
~ N(0,
2
).
3) La varianza de los errores es homognea.
La independencia de los errores experimentales implica que dos observaciones
diferentes no pueden estar relacionadas a travs de ninguna dependencia, lo cual suele
ocurrir, por ejemplo, cuando sacamos muestras de una misma unidad en etapas
diferentes y las procesamos como observaciones independientes cuando en realidad no
lo son, y deben en cambio ser promediadas con el fin de obtener un solo dato.
50
La homogeneidad de las varianzas significa que las variables aleatorias e
i
tienen la
misma varianza.
Los procedimientos estadsticos que desarrollaremos en captulos posteriores son, en
general, extremadamente sensibles a violaciones de las hiptesis de base, conduciendo
en muchos casos a errores ocasionados por esta causa. Posteriormente nos referiremos
concretamente a este aspecto.
2.1.3 Estimacin de los parmetros en el modelo lineal.
Un aporte importante de la teora de la inferencia estadstica seala que los mejores
estimadores de los parmetros
j
son aquellos que se obtienen mediante la aplicacin
del mtodo de los mnimos cuadrados. Este mtodo consiste en escoger los
estimadores de los
j
de forma tal que hagan mnima la suma de los cuadrados de los
errores experimentales, es decir, que minimicen la expresin:
o en trminos de matrices:
= ee = (Y-X)(Y-X)
Supongamos que estamos estudiando el efecto de dos tipos de campaas publicitarias
sobre los volmenes de venta de un artculo expresados en miles de unidades, y que
para ello, cada uno de las campaas ha sido aplicada en tres diferentes provincias siendo
los resultados los que se muestran en el CUADRO 2.1.1:
CUADRO 2.1.1
Campaas Volmenes de venta
A 12 15 14
B 10 8 11
El modelo lineal correspondiente a este experimento puede ser expresado en trminos
de matrices de la siguiente forma:


2
2 2 1 1
2
) ......... (
p pi i i i i
x x x y e
51
donde:

1
= constante comn a todas las observaciones

2
= efecto sobre los volmenes de venta de la campaa A
) 1 (
1 0 1
1 0 1
1 0 1
0 1 1
0 1 1
0 1 1
11
8
10
14
15
12
6
5
4
3
2
1
3
2
1
1
1
1
1
1
1
1
1
]
1

+
1
1
1
]
1

1
1
1
1
1
1
1
1
]
1

1
1
1
1
1
1
1
1
]
1

e
e
e
e
e
e

52

3
= efecto sobre los volmenes de venta de la campaa B
e
i
= errores experimentales normalmente distribuidos con media cero y varianza
homognea
2
.
No perdemos generalidad si consideramos que la suma de los efectos de las
campaas es igual a cero, es decir,
2
+
3
= 0 , o lo que es lo mismo,
3
= -
2
, de
donde, el modelo lineal (1) puede ser expresado como se muestra a continuacin:
1
1
1
1
1
1
1
1
]
1

+
1
]
1

1
1
1
1
1
1
1
1
]
1

1
1
1
1
1
1
1
1
]
1

6
5
4
3
2
1
2
1
1 1
1 1
1 1
1 1
1 1
1 1
11
8
10
14
15
12
e
e
e
e
e
e

53
de donde = ee = (Y-X)(Y-X) viene dado entonces por:
De la teora de optimizacin de funciones conocemos que los valores de
1
y
2
que
hacen mnima la funcin pueden ser calculados igualando a cero las respectivas
derivadas parciales de con relacin a
1
y
2
, es decir,
y resolviendo la ecuacin anterior:
Procediendo de idntica forma para
2
tenemos:
de donde:

y como
3
= -
2
entonces:
2.2 Clculo estadstico de los resultados experimentales.
Para el desarrollo del presente epgrafe supondremos un experimento para estudiar los
efectos de tres dosis distintas de potasa (K
2
O) y un Testigo (sin aplicacin de potasa)
sobre la produccin de un determinado cultivo. Sean estas dosis las siguientes:
+ + +
2
2 1
2
2 1
2
2 1
) 14 ( ) 15 ( ) 12 (
2
2 1
2
2 1
2
2 1
) 11 ( ) 8 ( ) 10 ( + + + + +
0 ) 1 )( 11 ( 2 ) 1 )( 8 ( 2 ) 1 )( 10 ( 2
) 1 )( 14 ( 2 ) 1 )( 15 ( 2 ) 1 )( 12 ( 2
2 1 2 1 2 1
2 1 2 1 2 1
1
+ +
+ + + +

67 . 11
1
^

+ +

) 1 )( 15 ( 2 ) 1 )( 12 ( 2
2 1 2 1
2

+ + + + + ) 1 )( 8 ( 2 ) 1 )( 10 ( 2 ) 1 )( 14 ( 2
2 1 2 1 2 1

0 ) 1 )( 11 ( 2
2 1
+
00 . 2
2
^

00 . 2
3
^

54
A: 0 Kg de K
2
O /Ha. (Testigo)
B: 40 Kg de K
2
O /Ha.
C: 80 Kg de K
2
O /Ha.
D: 120 Kg de K
2
O /Ha.
Consideremos que se decidi utilizar ocho rplicas para cada uno de los tratamientos
bajo estudio, es decir, que a cada grupo de ocho parcelas experimentales sembradas con
el cultivo se le aplic una dosis de potasa diferente. Supongamos adems diferencias en
la fertilidad del suelo en sentido horizontal. La aleatorizacin del experimento se
muestra a continuacin:
B C A D D B A C
D A B A C A C B
A B D B B D D A
C D C C A C B D
El primer paso para iniciar el anlisis estadstico de los datos es establecer un modelo
matemtico para representar cada una de las observaciones del experimento. Un estudio
de las observaciones nos hace concluir que las mismas se encuentran afectadas por
cuatro tipo de componentes: 1) una constante general supuestamente alrededor de la
cual fluctan los valores de las observaciones, 2) una componente que representa el
efecto directo de la dosis aplicada, 3) otra componente que representa cambios en la
fertilidad del suelo y que el diseo utilizado es capaz de aislar y estimar, y 4) un efecto
residual, el cual incluye todos los dems factores que pueden influir en el
comportamiento de las observaciones y que no fueron considerados en el diseo
experimental.
Si representamos con la constante general, con
i
(i = 1,2,3,4 ) el efecto del
tratamiento, con
j
(j = 1,2,3,4,5,6,7,8) el efecto del bloque y con e
ij
el error
experimental, el modelo lineal queda expresado como:
y
ij
= +
i
+
j
+ e
ij

e
i
~ N(0,
2
) e
i
independientes y
2
homognea.
2.3 Estimacin de los efectos del modelo.
Utilizando el mtodo de los mnimos cuadrados, obtendremos la estimacin de los
parmetros del modelo de forma que hagan mnima la suma de los cuadrados de los
errores. Esta suma de cuadrados queda expresada de la siguiente forma:
donde m, t
i
, y b
j
son las estimaciones mnimo - cuadrticas de ,
i
y
j
respectivamente.

( )


2 2
j i ij ij
b t m y e
55
Para encontrar los valores que hacen mnima la expresin anterior, se hace necesario
igualar a cero la derivada parcial con relacin a un parmetro en especfico. De esta
forma, la estimacin mnimo cuadrtica de m viene dada por:
donde la suma comprende a todas las observaciones cuyo modelo lineal contengan el
parmetro m, en este caso, todas las observaciones. Las ecuaciones anteriores reciben el
nombre de ecuaciones normales.
Como en el experimento existen un total de 32 observaciones, entonces:
32m + 8 ( t
1
+ t
2
+ t
3
+ t
4
) + 4 ( b
1
+ b
2
+ b
3
+ b
4
+ b
5
+ b
6
+ b
7
+ b
8
) = G
donde G es la suma total de las 32 observaciones.
Llegado a este punto, resulta conveniente hacerle una simplificacin al modelo
mediante la suposicin de que tanto la suma de los efectos de tratamientos como de
bloques es igual a cero, lo cual no provoca que el modelo pierda su generalidad si
tomamos en cuenta que estas cantidades solo se utilizan para indicar en cuanto difiere
una de ellas en particular del resto de las dems. As entonces, haciendo las
suposiciones:
t
1
+ t
2
+ t
3
+ t
4
= 0 y b
1
+ b
2
+ b
3
+ b
4
+ b
5
+ b
6
+ b
7
+ b
8
= 0
tendremos que:
32m = G , o lo que es lo mismo, m = G/32 .
El resultado anterior indica, que haciendo una generalizacin del mismo, podemos
concluir que la estimacin mnimo cuadrtica del parmetro del modelo lineal que
estamos trabajando se obtiene calculando el valor promedio de todas las observaciones,
es decir,
De igual forma, la estimacin de un efecto particular t
i
puede ser obtenida sumando
todas las observaciones que reciben este tratamiento, y en consecuencia,
8m + 8t
i
+ b
1
+ b
2
+ b
3
+ b
4
+ b
5
+ b
6
+ b
7
+ b
8
= T
i
donde T
i
representa la suma de todas
las observaciones que reciben el tratamiento i .
Simplificando el modelo mediante las suposiciones antes realizadas, obtenemos que:
( )
( )

m
b t m y
b t m y
m
e
j i ij
j i ij
ij
2
2
( ) ( )

+ +
ij j i j i ij
y b t m b t m y 0 2
n y m
ij
/

56
de donde se desprende que el efecto de cualquier tratamiento puede ser estimado como
la diferencia entre la media de todas las observaciones que reciben el tratamiento y la
media general.
Se deja al lector la comprobacin de que el efecto de un bloque en particular viene dado
en nuestro ejemplo por:

Es decir, que el efecto de cualquier bloque puede ser estimado como la diferencia entre
la media de todas las observaciones que pertenecen al bloque y la media general.
2.4 Prueba de hiptesis de los efectos de tratamientos.
Usualmente, el inters fundamental del investigador al desarrollar un experimento, es
determinar si los efectos de tratamientos son todos iguales o si por el contrario, al menos
uno de los efectos difiere de los dems, y en ese caso, cuales efectos difieren de cuales.
En trminos de Prueba de Hiptesis este inters puede quedar expresado como sigue:
H
1
: Al menos uno de los efectos difiere de los dems
Con la finalidad de determinar la veracidad o no de la hiptesis nula planteada,
calculamos de forma usual y como hemos expuesto anteriormente las estimaciones
mnimo cuadrticas de los efectos del modelo planteado, y con ellas la suma de los
cuadrados de las desviaciones de las observaciones con relacin a los valores de los
parmetros calculados. El valor de esta suma de cuadrados nos permite conocer en que
magnitud se acerca el modelo a las observaciones. Adicionalmente, calculamos
nuevamente las estimaciones mnimo cuadrticas del modelo, pero en este caso,
adicionando las restricciones
1
=
2
=
3
=
4
, es decir, bajo el supuesto de que la
hiptesis nula es cierta.
Procediendo de esta manera, la suma de cuadrados del error calculada de la manera
usual vendra expresada por:
y la suma de cuadrados del error calculada adicionando las restricciones:
donde t

es un valor comn para los efectos de tratamientos.


Resulta entonces, que si S
2
2
es mucho mayor que S
1
2
, el modelo con las restricciones no
se acerca a las observaciones con la eficiencia que lo hace el modelo original, y por
m
T
t
i
i

8
m
Bj
b
j

4
4 3 2 1 0
H
( )
2
' ' ' 2
2
j
ij
b t m y S

( )
2 2
1 j ij
b t m y S

57
tanto, la hiptesis nula no es cierta y debe ser rechazada. Si por el contrario, ambas
sumas de cuadrados son lo suficientemente similares, la hiptesis nula es cierta y no
debe ser rechazada. No obstante lo sealado, tanto S
1
2
como S
2
2
dependen de las
unidades en que fueron medidas las observaciones, y por tanto, S
2
2
- S
1
2
no expresan con
toda claridad la diferencia entre el modelo con restricciones y el modelo original. Por tal
razn es que se ha preferido expresar la ganancia en el ajuste mediante la expresin:
(S
2
2
- S
1
2
)/ S
1
2
, la cual no depende de las unidades de medida.
Por otra parte,
sigue una distribucin F de Fischer con (p-1) y n
e
grados de libertad, donde (S
2
2
- S
1
2
)
se conoce como la suma de cuadrados debida a tratamientos y S
1
2
la suma de cuadrados
debida al error. Este resultado permite entonces, haciendo uso de la distribucin F de
Fischer, determinar la veracidad o no de la hiptesis nula lo cual representa una
importante herramienta para el anlisis estadstico de los resultados experimentales.
2.5 El anlisis de varianza.
La determinacin del valor numrico de S
1
2
y (S
2
2
- S
1
2
) con el mtodo que hasta el
momento ha sido expuesto resulta realmente engorroso, lo cual aconseja encontrar un
procedimiento ms simple para obtener estas cantidades. Con este objetivo, expresemos
el modelo lineal correspondiente a cada observacin mediante la siguiente expresin:
y
ij
= m + t
i
+ b
j
+ (y
ij
- m - t
i
- b
j
) donde (y
ij
- m - t
i
- b
j
) = e
ij
De lo anterior se desprende que:
Puede demostrarse que los trminos correspondientes a los 6 productos cruzados que se
generan al resolver la elevacin al cuadrado del miembro derecho son iguales a cero,
por lo cual la expresin anterior se reduce a:
lo cual representa un importantsimo resultado de la teora del anlisis de varianza.
Para obtener el trmino de la izquierda de la expresin anterior simplemente se calcula
la suma de los cuadrados de todas las observaciones del experimento, dando lugar a lo
que se conoce como Suma de cuadrados total.
Como en nuestro ejemplo, m = G/32 entonces,
2
1
2
1
2
2
/
1
e
n
S
p
S S

( ) ( ) [ ]
2
2

+ + +
j i ij j i ij
b t m y b t m y
( ) ( )
2 2 2 2 2

+ + +
j i ij j i ij
b t m y b t m y
( )
2
2
2
32
G
m


58
como la sumatoria abarca las 32 observaciones, entonces:
lo que nos permite expresar de manera general que para cualquier cantidad de
observaciones:
donde n representa el nmero total de observaciones. A la expresin anterior se le suele
llamar Factor de Correccin (FC). Resulta habitual que la suma de cuadrados total y
el Factor de Correccin se unan en una sola expresin llamada Suma de cuadrados
corregida total (SCC
T
) la que viene dada por:
donde la sumatoria va desde 1 hasta n (cantidad de observaciones del experimento).
Procediendo de idntica forma puede ser calculada la suma de cuadrados de
tratamientos la cual para nuestro ejemplo viene dada por:
8( t
1
2
+ t
2
2
+ t
3
2
+ t
4
2
) donde:
Sustituyendo:
y desarrollando parntesis:
y como:
resulta que la suma de cuadrados de tratamientos vendr dada por:
( )
( )
32
32
32
2
2
2
2
G G
m

n
G
m
2
2

FC y SCC
ij
T

2
m
T
t
i
i

8
( ) ( ) ( ) ( ) [ ]
2
4
2
3
2
2
2
1
8 8 8 8
8
1
m T m T m T m T + + +
( )
2
4 3 2 1
2
4
2
3
2
2
2
1
32 2
8
m T T T T m
T T T T
+ + + +
+ + +
m G T T T T 32
4 3 2 1
+ + +
2
2
4
2
3
2
2
2
1
32
8
m
T T T T

+ + +
59
o lo que es igual,
Una generalizacin de este resultado para cualquier nmero de observaciones nos
permite establecer que la suma de cuadrados de tratamientos (SCC
TR
) viene dada por
donde la sumatoria va desde 1 hasta p (nmero de tratamientos ) y q es el nmero de
observaciones de cada tratamiento.
Se deja al lector la comprobacin de que trabajando en idntica forma se puede concluir
que la suma de cuadrados de bloques (SCC
B
) es igual a:
donde la sumatoria va desde j = 1 hasta el nmero de bloques y p es la cantidad de
observaciones por bloque.
Por otra parte, en el epgrafe 2.4 vimos que una manera de comprobar la veracidad o no
de la hiptesis nula

era mediante la distribucin F de Fischer , donde el valor de F calculada (F
C
) viene
dado por:
o lo que es lo mismo:
El trmino CM
TR
recibe el nombre de Cuadrado medio de tratamientos y representa la
varianza debida a los efectos de tratamientos. El trmino CM
E
representa la varianza
experimental y recibe el nombre de Cuadrado medio del error.
Con los elementos desarrollados hasta el momento procedamos a elaborar la Tabla de
Anlisis de Varianza correspondiente.
2.6 Ejemplo numrico.
Supongamos que los resultados experimentales del ejemplo planteado en el epgrafe 2.2
fueron los que se detallan en el CUADRO 2.6.1:
FC
T T T T

+ + +
8
2
4
2
3
2
2
2
1
FC
q
T
SCC
i
TR

2
FC
p
B
SCC
j
B

2
4 3 2 1 0
H
2
1
2
1
2
2
/
1
e
C
n
S
p
S S
F

E
TR
C
CM
CM
F
60
CUADRO 2.6.1
B
3.4
C
4.8
A
2.7
D
4.3
D
4.1
B
3.6
A
2.5
C
4.5
D
4.6
A
2.4
B
3.4
A
2.9
C
4.4
A
2.5
C
4.3
B
3.3
A
2.4
B
3.6
D
4.4
B
3.3
B
3.7
D
4.7
D
4.3
A
2.2
C
4.5
D
4.9
C
4.4
C
4.1
A
2.7
C
4.1
B
3.3
D
4.5
Con los datos anteriores sometamos a prueba la hiptesis nula:
H
o
:
A
=
B
=
C
=
D

Calculemos en primer trmino el Factor de correccin (FC):
Calculemos a continuacin la Suma de cuadrados total:
de donde la suma de cuadrados corregida total ser:
Procediendo de manera similar la suma de cuadrados corregida de tratamientos
puede ser calculada como:
De manera similar:
( )
2
32
5 . 4 ..... .......... 7 . 2 8 . 4 4 . 3 + + + +
FC
( )
045 . 441
32
8 . 118
2
FC
( ) ( ) ( ) ( ) 28 . 462 5 . 4 .... .......... 7 . 2 8 . 4 4 . 3
2 2 2 2
+ + + +
T
SC
235 . 21 045 . 441 28 . 462
T
SCC
( ) ( ) ( ) ( )
045 . 441
8
8 . 35 1 . 35 6 . 27 3 . 20
2 2 2 2

+ + +

TR
SCC
892 . 19 045 . 441
8
5 . 3687

TR
SCC
( ) ( ) ( ) ( )
045 . 441
4
4 . 14 . .......... 9 . 14 7 . 15 9 . 14
2 2 2 2

+ + + +

B
SCC
28 . 0 045 . 441
4
3 . 1765

B
SCC
61
y entonces:
Con relacin a los grados de libertad tenemos que:
Grados de libertad de la SCC
T
= el nmero de observaciones menos uno = 32 1 = 31
Grados de libertad de la SCC
TR
= el nmero de tratamientos menos uno = 4 1 = 3
Grados de libertad de la SCC
B
= el nmero de bloques menos uno = 8 1 = 7
Grados de libertad de la SCC
E
= 31 3 7 = 21
De donde la Tabla de Anlisis de Varianza queda como se muestra en el CUADRO
2.6.2:
CUADRO 2.6.2
Fuentes
de
Variacin
G.L S.C. C.M. F SIGN.
Total 31 21.235
Tratamientos 3 19.892 6.631 130.02 P<0.001
Bloques 7 0.28
Error 21 1.063 0.051
2.7 La columna Significacin (SIGN.).
De la inferencia estadstica conocemos el concepto de nivel de significacin y sabemos
que el mismo es la probabilidad de cometer el error de Tipo I, o lo que es igual, la
probabilidad de rechazar una hiptesis cuando esta es verdadera. Como hemos dicho
anteriormente, la hiptesis estadstica que pretendemos comprobar mediante la prueba F
de la tabla de anlisis de varianza es la igualdad de los efectos de tratamientos, es decir,
lo cual se logra comparando el valor de F calculada ( 130.02 ) con el percentil de la
Distribucin F de Fischer con 3 y 21 grados de libertad respectivamente. La
distribucin F est tabulada ( ver TABLA 50 del anexo ), para niveles de significacin
= 0.05 (5 %), 0.01 (1%) y 0.001 (0.1%). Por tanto, buscando en la tabla los
percentiles correspondientes a estos niveles de significacin para 3 y 21 grados de
libertad respectivamente, obtenemos:
F
5%
(3,21) = 3.07
F
1%
(3,21) = 4.87
063 . 1 28 . 0 892 . 19 235 . 21
B TR T E
SCC SCC SCC SCC
4 3 2 1 0
H
62
F
0.1%
(3,21) = 7.94
y como 130.02 > 7.94 concluimos que la hiptesis nula de la igualdad de los efectos de
tratamientos se rechaza a un nivel de significacin de 0.001 (0.1%), es decir,
rechazamos la hiptesis nula con una probabilidad de equivocarnos menor a 0.001.
Varios casos podan haberse presentado al hacer la comparacin de la F calculada con el
percentil de la F de Fischer:
1) La F calculada es menor o igual que la F de Fischer al 5 % (0.05). En esta situacin
concluimos no rechazar la hiptesis nula de la igualdad de los efectos de
tratamientos. En estos casos, es prctica comn escribir NS (no significativo), en la
columna Significacin correspondiente a la fila Tratamientos de la tabla de anlisis
de varianza.
2) La F calculada es mayor que la F de Fischer al 5 % (0.05) pero menor o igual que la
F de Fischer al 1 % (0.01). En esta situacin se concluye rechazar la hiptesis nula
al 5% (0.05) y se escribe p<0.05 en la columna Significacin, fila Tratamientos, de
la tabla de anlisis de varianza.
3) La F calculada es mayor que la F de Fischer al 1 % (0.01) pero menor o igual que la
F de Fischer al 0.1 % (0.001). Se rechaza la hiptesis nula al 1 % (0.01) y se escribe
p<0.01 en la columna Significacin, fila Tratamientos, de la tabla de anlisis de
varianza.
4) La F calculada es mayor que la F de Fischer al 0.1 % (0.001). Se rechaza la hiptesis
nula al 0.1 % (0.001) y se escribe p<0.001 en la columna Significacin, fila
Tratamientos, de la tabla de anlisis de varianza.
A continuacin ejemplificamos numricamente los cuatro casos estudiados
anteriormente con supuestas tablas de anlisis de varianza:
Caso 1: Los tratamientos no difieren significativamente.
ANLISIS DE VARIANZA
Fuentes
de
Variacin
G.L. S.C. C.M. F SIGN.
Total 31 21.235
Tratamientos 3 2.892 0.964 1.121 NS
Bloques 7 0.28
Error 21 18.063 0.860
Los tratamientos no difieren significativamente ya que el valor 1.121 < 3.07.
Caso 2: Los tratamientos difieren significativamente al 5 % (p<0.05).
63
ANLISIS DE VARIANZA
Fuentes
de
Variacin
G.L. S.C. C.M. F SIGN.
Total 31 21.235
Tratamientos 3 6.892 2.297 3.428 P<0.05
Bloques 7 0.28
Error 21 14.063 0.670
Los tratamientos solo difieren significativamente al 5%, 3.428 > 3.07, pero no es
mayor que 4.87.
Caso 3: Los tratamientos difieren significativamente al 1% (p<0.01).
ANLISIS DE VARIANZA
Fuentes
de
Variacin
G.L. S.C. C.M. F SIGN.
Total 31 21.235
Tratamientos 3 8.892 2.964 5.164 P<0.01
Bloques 7 0.28
Error 21 12.063 0.574
Los tratamientos solo difieren significativamente al 1%, 5.164 > 4.87, pero no es
mayor que 7.94.
Caso 4: Los tratamientos difieren significativamente al 0.1% (p<0.001).
ANLISIS DE VARIANZA
Fuentes
de
Variacin
G.L. S.C. C.M. F SIGN.
Total 31 21.235
Tratamientos 3 11.892 3.964 9.176 P<0.001
Bloques 7 0.28
Error 21 9.063 0.432
Los tratamientos difieren significativamente al 0.1%, 9.176 > 7.94.
2.8 Prueba de Comparacin Mltiple.
Cuando en el anlisis de varianza correspondiente a un experimento se produce el
rechazo por F de la hiptesis de igualdad de los efectos de tratamientos, resulta
indispensable determinar cuales de los efectos fueron responsables de este rechazo, es
decir, establecer varias pruebas de significacin de la diferencia entre dos tratamientos
cada vez. As en el ejemplo que hemos estado desarrollando, tendramos que hacer
64
comparaciones dos a dos de cada efecto de tratamiento con los dems. Este tipo de
comparaciones se ha dado por llamar prueba de comparacin mltiple.
Muchos han sido los mtodos de comparacin mltiple reportados en la literatura, pero
en realidad pocos han demostrado una verdadera eficiencia. En este trabajo, haremos
referencia a dos de los ms populares, pero solo propondremos uno de ellos.
2.8.1 Comparacin mltiple por t de Student.
Supongamos que deseamos comparar entre s el efecto del tratamiento A y el
tratamiento B en el ejemplo que estamos desarrollando, es decir, determinar si la
diferencia entre las medias de ambos tratamientos es o no significativamente diferente
de cero.
Sea la diferencia entre las medias de estos dos tratamientos:

De la teora de las distribuciones tericas de probabilidad sabemos que la distribucin
muestral de la diferencia entre dos medias muestrales, calculadas a partir de muestras
aleatorias independientes de tamao n
1
y n
2
extradas de dos poblaciones distribuidas
normalmente con varianza homognea
2
conocida, est distribuida normalmente con
media
1
-
2
y con varianza (
2
/ n
1
) + (
2
/ n
2
) .
Conocemos tambin que si la varianza poblacional es desconocida, entonces la relacin
sigue una distribucin t de Student, y S
2
puede ser estimada mediante el cuadrado medio
del error del anlisis de varianza. La relacin anterior es la utilizada para desarrollar la
prueba de significacin entre dos efectos o medias de tratamientos. Desarrollemos la
prueba de comparacin mltiple con los datos de nuestro ejemplo:
S
2
= CM
e
= 0.051 n
1
= n
2
= 8 gl
e
= 21 08 . 2
) 21 (
% 5
t

2 1
T T

,
_


2 1
2
2 1
1 1
n n
S
T T
54 . 2
8
3 . 20

A
T 45 . 3
8
6 . 27

B
T
39 . 4
8
1 . 35

C
T 48 . 4
8
8 . 35

D
T
65
1) Tratamiento A vs Tratamiento B
y como 8.05 > 2.08, entonces ambos tratamientos difieren significativamente con
= 0.05.
2) Tratamiento A vs Tratamiento C
y como 16.37 > 2.08, entonces ambos tratamientos difieren significativamente con
= 0.05.
3) Tratamiento A vs Tratamiento D
y como 17.17 > 2.08, entonces ambos tratamientos difieren significativamente con
= 0.05.
4) Tratamiento B vs Tratamiento C
y como 8.32 > 2.08, entonces ambos tratamientos difieren significativamente con
= 0.05.
5) Tratamiento B vs Tratamiento D
Y como 9.12 > 2.08, entonces ambos tratamientos difieren significativamente con
= 0.05.
6) Tratamiento C vs Tratamiento D
05 . 8
113 . 0
91 . 0
8
1
8
1
051 . 0
54 . 2 45 . 3

,
_

t
37 . 16
113 . 0
85 . 1
8
1
8
1
051 . 0
54 . 2 39 . 4

,
_

t
17 . 17
113 . 0
94 . 1
8
1
8
1
051 . 0
54 . 2 48 . 4

,
_

t
32 . 8
113 . 0
94 . 0
8
1
8
1
051 . 0
45 . 3 39 . 4

,
_

t
12 . 9
113 . 0
03 . 1
8
1
8
1
051 . 0
45 . 3 48 . 4

,
_

t
66
y como 0.80 < 2.08, entonces ambos tratamientos no difieren significativamente con
= 0.05.
Una buena prctica para resumir las comparaciones mltiples realizadas es ordenar las
medias de mayor a menor (o de menor a mayor), y unir con una misma lnea las medias
que no difieren significativamente, para luego, colocar el mismo super ndice a las
medias unidas por la misma lnea y diferentes al resto:
4.48 4.39 3.45 2.54
y de forma resumida:
A B C D
2.54
a
3.45
b
4.39
c
4.48
c
El lector podr comprobar que de esta manera queda resumida de forma muy abreviada
el proceso realizado anteriormente.
2.8.2 Una crtica a la prueba t Student.
El autor de este material incluy la prueba t de Student como va para el desarrollo de
comparaciones mltiples entre medias por una razn muy concreta. Y el motivo es que
con independencia de que desde hace algunas dcadas la t ha sido fuertemente criticada
cuando es utilizada con estos fines, la misma todava tiene bastantes seguidores.
Se ha demostrado, que cuando realizamos una prueba de comparacin mltiple
utilizando la t de Student, digamos, para un nivel de significacin del 5%, la
probabilidad de que rechacemos la igualdad de dos medias cuando estas realmente son
iguales, crece segn aumenta el nmero de comparaciones realizadas, y al cabo de 5
pruebas, esta probabilidad supera el 20%.
Duncan (1955) desarroll una prueba de comparacin mltiple (Prueba de rango
mltiple de Duncan), la cual hace un arreglo de las medias de los tratamientos por
orden de magnitud, y utiliza para cada comparacin entre dos medias un percentil que
depende de los grados de libertad del error en la tabla del Anlisis de Varianza y del
rango entre ambas medias. Ejemplifiquemos lo que se entiende por rango entre dos
medias:
El arreglo por orden de magnitud de las medias de tratamientos en el ejemplo que
hemos venido desarrollando se muestra a continuacin:
4.48 4.39 3.45 2.54
La comparacin entre las medias 4.48 y 4.39 es de rango 2, pues entre ambos valores en
el arreglo, hay 2 elementos. La comparacin entre 4.39 y 2.54 es de rango 3 pues entre
80 . 0
113 . 0
09 . 0
8
1
8
1
051 . 0
39 . 4 48 . 4

,
_

t
67
ambas medias hay, en el arreglo, 3 elementos. Por idntico razonamiento, la
comparacin entre la media 4.48 y 2.54 es de rango 4, y as sucesivamente.
2.8.3 Prueba de rango mltiple de Duncan.
La prueba de Duncan para comparar dos medias consiste en esencia en obtener la
cantidad:
donde el numerador es el valor de la diferencia entre ambas medias tomada en valor
absoluto, y el denominador, el error tpico comn a ambas medias, siendo CM
e
el
cuadrado medio del error del Anlisis de Varianza y n el nmero de observaciones por
tratamiento.
Si esta cantidad D es mayor que el percentil de Duncan (Ver TABLA 51 del anexo)
obtenido para el rango entre medias correspondiente y para los grados de libertad del
error, entonces concluiremos que las dos medias difieren significativamente al 5%. En
caso contrario, las medias no difieren.
En este libro solo usaremos percentiles de Duncan para un nivel de significacin del
5%, con el objetivo de evitar de esta manera que la zona de rechazo de esta prueba
supere la de la prueba F, con lo cual se obtendran resultados contradictorios.
Desarrollemos la prueba de Duncan con las medias de tratamientos obtenidas en nuestro
ejemplo. El primer paso consiste en establecer una tabla de doble entrada donde la
primera columna sea el arreglo de las medias por orden creciente de magnitud sin
incluir la mayor de ellas, y la primera fila el arreglo por orden decreciente de magnitud
sin incluir la menor. Esto es:
4.48 4.39 3.45
2.45 1 2 3
3.45 2 3
4.39 3
Observe que arreglar todas las comparaciones entre medias mediante esta tabla de doble
entrada, facilita de manera sustancial la bsqueda del rango en la comparacin, ya que
las que se encuentran en la misma diagonal (sealadas con el mismo nmero) utilizan el
mismo rango.
As la comparacin 4.48 con 2.45 (diagonal 1) utiliza rango 4, mientras que 4.39 con
2.45 y 4.48 con 3.45 (diagonal 2) son de rango 3. El lector puede comprobar que las
comparaciones de la diagonal 3 son todas de rango 2.
De la tabla del anlisis de varianza original tenemos:
gl
e
= 21 CM
e
= 0.051 n = 8 por tanto:
n
CM
T T
D
e
j i

0798 . 0
8
051 . 0

n
CM
e
68
a) 4.48 vs 2.45
Interpolando en la tabla de Duncan para 21 grados de libertad en el error y rango 4,
tenemos que el percentil correspondiente es igual a 3.18, y como 25.44 > 3.18, entonces
ambas medias difieren significativamente, y lo expresamos:
4.48 4.39 3.45
2.45 *
3.45
4.39
b) 4.39 vs 2.45
Interpolando en la tabla de Duncan para 21 grados de libertad en el error y rango 3,
tenemos que el percentil correspondiente es igual a 3.09, y como 25.44 > 3.09, entonces
ambas medias difieren significativamente, y lo expresamos:
4.48 4.39 3.45
2.45 * *
3.45
4.39
c) 4.48 vs 3.45
y como 12.91 > 3.09, entonces ambas medias difieren significativamente, y lo
expresamos:
4.48 4.39 3.45
2.45 * *
3.45 *
4.39
d) 3.45 vs 2.45
44 . 25
0798 . 0
45 . 2 48 . 4

D
31 . 24
0798 . 0
45 . 2 39 . 4

D
91 . 12
0798 . 0
45 . 3 48 . 4

D
53 . 12
0798 . 0
45 . 2 45 . 3

D
69
Interpolando en la tabla de Duncan para 21 grados de libertad en el error y rango 2,
tenemos que el percentil correspondiente es igual a 2.94, y como 25.44 > 2.94, entonces
ambas medias difieren significativamente, y lo expresamos:
4.48 4.39 3.45
2.45 * * *
3.45 *
4.39
e) 4.39 vs 3.45
y como 11.78 > 2.94, entonces ambas medias difieren significativamente, y lo
expresamos:
4.48 4.39 3.45
2.45 * * *
3.45 * *
4.39
f) 4.48 vs 4.39
y como 1.13 < 2.94, entonces ambas medias no difieren significativamente, y lo
expresamos:
4.48 4.39 3.45
2.45 * * *
3.45 * *
4.39 NS
Un aspecto importante relacionado con la forma en que hemos realizado las
comparaciones es que, cuando las medias comparadas tiene igual nmero de
observaciones, las comparaciones que estn a la derecha o hacia abajo de una
comparacin con resultado no significativo ( NS ) son tambin no significativas. De
igual forma, las comparaciones que estn a la izquierda o hacia arriba de una
comparacin con resultado significativo ( * ) son tambin significativas. Este beneficio,
usado adecuadamente, puede reducir de manera importante el nmero de comparaciones
a realizar en una prueba de este tipo. Por su sencillez, se deja al lector la comprobacin
de lo expuesto anteriormente.
3.9 Particin de la suma de cuadrados de tratamientos.
78 . 11
0798 . 0
45 . 3 39 . 4

D
13 . 1
0798 . 0
39 . 4 48 . 4

D
70
Como hemos visto anteriormente, la prueba F correspondiente a la fuente de variacin
debida a tratamientos, permite establecer si la hiptesis nula de la igualdad de los
efectos de los mismos debe ser aceptada o rechazada estadsticamente.
Sin embargo, en algunos experimentos resulta de inters someter a prueba un grupo de
hiptesis nulas diferentes a la sealada anteriormente. Por ejemplo, en el experimento
que hemos venido desarrollando podra resultar de alguna importancia establecer si
existen diferencias entre el Testigo (0 Kg/Ha.) y el resto de los tratamientos, con la
finalidad de conocer si hubo una respuesta a la aplicacin del fertilizante. Podra ser
importante tambin poder determinar si existen diferencias entre las dosis mayores, es
decir, entre el tratamiento C (80 Kg/Ha.) y el tratamiento D (120 Kg/Ha.), o tambin
entre la dosis ms baja (40 Kg/Ha.) y las ms altas ( 80 Kg/Ha. y 120 Kg/Ha.).
En casos como ste, la suma de cuadrados de tratamientos y sus grados de libertad
pueden ser subdivididos en un nmero de componentes, cada una de ellas
correspondiente a una determinada hiptesis, y realizar una prueba de F al cuadrado
medio de cada una de estas componentes.
Si representamos por T
A
, T
B
, T
C
y T
D
a los totales de cada tratamiento, entonces las
comparaciones anteriores pueden ser expresadas de la siguiente manera:
BCD vs A
D vs C
T
D
T
C
CD vs B
Las comparaciones o cantidades anteriores se llaman funciones lineales de las T.
Observe que en cada una de las tres cantidades planteadas, la suma de los coeficientes
de los totales de tratamientos es igual a cero, lo cual debe cumplirse si la cantidad
representa una comparacin entre las T.
En general, cualquier funcin lineal de la forma:
es una comparacin entre las T si se cumple que:

A D C B A
D C B
T T T T o T
T T T
3
3
+ +
+ +
B D C B
D C
T T T o T
T T
2
2
+
+

i i
T l L

0
i
l
71
Con los antecedentes anteriores, estamos en condiciones de formular el siguiente:
Teorema: Si L es una comparacin cualquiera entre las T
i
entonces la cantidad:

es una componente de la suma de cuadrados de tratamientos con 1 grado de libertad,
donde:

siendo r el nmero de repeticiones de cada tratamiento.
Tomando en consideracin que los totales de tratamientos en el ejemplo que hemos
venido desarrollando son:
T
A
= 20.3 , T
B
= 27.6 , T
C
= 35.1 y T
D
= 35.8
entonces las suma de cuadrados para cada comparacin puede ser calculada como se
muestra en el CUADRO 2.9.1.
CUADRO 2.9.1
A B C D L D S.C.
Total 20.3 27.6 35.1 35.8
BCD vs A -3 +1 +1 +1 37.6 96 14.73
D vs C 0 0 -1 +1 0.7 16 0.03
CD vs B 0 -2 +1 +1 15.7 48 5.13
Total 19.89

La suma de cuadrados de la comparacin BCD vs A fue obtenida de la siguiente
manera:
L = (-3) (20.3) + (1) (27.6) + (1) (35.1) + (1) (35.8) = 37.6
Observe en el CUADRO 2.9.1 los siguientes aspectos:
- La suma de las sumas de cuadrados de todas las comparaciones es igual a la suma de
cuadrados de tratamientos del anlisis de varianza.
- Las sumas de los coeficientes de cada comparacin es igual a cero.
D
L
2

2
i
l r D
96 ) 12 ( 8 ] ) 1 ( ) 1 ( ) 1 ( ) 3 [( 8
2 2 2 2
+ + + D
73 . 14
96
) 6 . 37 (
. .
2
C S
72
- La suma de los productos de los coeficientes de cualquier par de comparaciones es
igual a cero. En este caso se dice que las comparaciones son mutuamente
ortogonales, es decir, ortogonales dos a dos.
La tabla del anlisis de varianza ampliada se muestra en el CUADRO 2.9.2:
CUADRO 2.9.2
Fuentes
de
Variacin
G.L S.C. C.M. F SIGN.
Total 31 21.235
Tratamientos 3 19.892 6.631 130.02 P<0.001
BCD vs A 1 14.73 14.73 288.82 P<0.001
D vs C 1 0.03 0.03 0.59 NS
CD vs B 1 5.13 5.13 100.59 P<0.001
Bloques 7 0.28
Error 21 1.063 0.051
El CUADRO 2.9.2 muestra que existe una respuesta altamente significativa a la
aplicacin de la potasa sobre el rendimiento del cultivo. Por otra parte no existen
diferencias entre las dosis altas del fertilizante, y stas en promedio, s difieren de la
dosis ms baja.

2.10 Polinomios ortogonales y superficies de respuesta.
En un prrafo anterior hicimos referencia a un concepto de vital importancia para
investigar la forma en que responden un grupo cualquiera de tratamientos. Nos
referimos al concepto de comparaciones ortogonales y que a continuacin precisamos
con ms detalle:
Definicin:
Se dice que dos comparaciones L
1
y L
2
son ortogonales si para:
se cumple que:
o en otras palabras, cuando la suma de los productos de sus respectivos coeficientes es
igual a cero.
Definicin:
Si las comparaciones L
1
, L
2
, .. L
k-1
son ortogonales tomadas dos a dos, entonces
decimos que dichas comparaciones son mutuamente ortogonales.
2
2
4
2
3
2
2
2
1
32
8
m
T T T T

+ + +

0
2 1 i i
l l
73
Puede demostrarse que si seleccionamos una comparacin L
1
especfica, podemos
escoger el resto de las comparaciones de forma tal que formen un conjunto ortogonal.
Cuando los tratamientos aplicados en un experimento estn igualmente espaciados,
como es el caso del ensayo que hemos venido desarrollando ( incrementos de 40 kg/Ha
entre cada tratamiento ), es posible estudiar la forma de la respuesta de los mismos
mediante el uso de polinomios de distinto grado que al cumplir con las definiciones
dadas anteriormente reciben el nombre de polinomios ortogonales.
En dependencia del nmero de tratamientos aplicados en el experimento, y en
consecuencia, del nmero de comparaciones o polinomios ortogonales que puedan ser
utilizados, es posible estudiar si la superficie de respuesta de estos tratamientos es
lineal, cuadrtica, cbica, etc. y poder determinar eventualmente el punto mximo de
respuesta de los tratamientos estudiados. El CUADRO 2.10.1 muestra los coeficientes
de los polinomios ortogonales para diferentes nmeros de tratamientos:
CUADRO 2.10.1
Tratamientos Respuesta Totales de tratamientos
T
1
T
2
T
3
T
4
T
5
2 Lineal -1 +1
3 Lineal
Cuadrtica
-1
+1
0
-2
+1
+1
4
Lineal
Cuadrtica
Cbica
-3
+1
-1
-1
-1
+3
+1
-1
-3
+3
+1
+1
5
Lineal
Cuadrtica
Cbica
Curtica
-2
+2
-1
+1
-1
-1
+2
-4
0
-2
0
+6
+1
-1
-2
-4
+2
+2
+1
+1
Hallemos las respuestas lineal, cuadrtica y cbica para el ejemplo que nos ocupa:
Las cantidades necesarias para el clculo de estas respuestas se muestran en el
CUADRO 2.10.2
CUADRO 2.10.2
A B C D
Total 20.3 27.6 35.1 35.8 L D S.C.
Lineal -3 -1 +1 +3 54.0 160 18.22
Cuadrtica +1 -1 -1 +1 -6.6 32 1.36
Cbica -1 +3 -3 +1 -7.0 160 0.31
Total 19.89

La tabla del anlisis de varianza ampliada se muestra en el CUADRO 2.10.3:
74
CUADRO 2.10.3
Fuentes
de
Variacin
G.L S.C. C.M. F SIGN.
Total 31 21.235
Tratamientos 3 19.892 6.631 130.02 P<0.001
Lineal 1 18.22 18.22 357.25 P<0.001
Cuadrtica 1 1.36 1.36 26.67 P<0.001
Cbica 1 0.31 0.31 6.08 P<0.05
Bloques 7 0.28
Error 21 1.063 0.051
Como se puede apreciar en el CUADRO 2.10.3, la respuesta lineal muestra el mayor
valor de F en comparacin con las respuestas cuadrtica y cbica, lo cual se evidencia
en el GRAFICO 2.10.1 de la siguiente pgina. Este resultado sugiere que para
incrementos en la dosis de K
2
O/Ha aplicado, corresponden incrementos constantes en el
rendimiento del cultivo. No obstante, obsrvese que a partir de la aplicacin de 80 Kg.
de K
2
O/Ha. el rendimiento tiende a sufrir una disminucin, lo cual sugiere la necesidad
de desarrollar un segundo experimento con el objetivo de precisar si la curva de
respuesta contina su tendencia decreciente a partir de la aplicacin de 80 Kg. de
K
2
O/Ha, en el cual los tratamientos seran:
A) 40 kg. de K
2
O/Ha
B) 80 Kg. de K
2
O/Ha
C) 120 Kg. de K
2
O/Ha
D) 160 Kg. de K
2
O/Ha
GRAFICO 2.10.1
75
20.3
27.6
35.1
35.8
0
5
10
15
20
25
30
35
40
0 50 100 150
Rendimiento
Kg. de Potasa/Ha.
Superficie de respuesta
Rendimiento
76
77
Mtodos de anlisis estadstico
3
3.1 Introduccin.
En los prrafos que siguen presentamos los procedimientos de clculo estadstico de los
diseos experimentales estudiados en el captulo anterior, usando como recurso
metodolgico el anlisis de ejemplos numricos resueltos.
Durante el desarrollo se podr apreciar como los procedimientos de clculo se rigen por
el mismo principio para todos los arreglos experimentales, siendo solo necesario adaptar
estos procedimientos a las estructuras particulares de cada uno de ellos.
3.2 Diseos Completamente al Azar.
El efecto de la utilizacin de tres tipos diferentes de aceite en atn enlatado sobre los
volmenes de venta de dicho producto, se estudi mediante un diseo Completamente
al Azar con cuatro repeticiones, es decir, mediante la medicin de los volmenes de
venta en 12 supermercados diferentes.
Los tratamientos de referencia fueron:
A: Aceite de Girasol
B: Aceite de Oliva
C: Aceite de Soya
Los resultados experimentales y la distribucin aleatoria de los tratamientos se muestran
en el CUADRO 3.2.1:
CUADRO 3.2.1
Repeticiones
I II III IV
B 186.2 C 142.3 C 140.8 B 193.3
A 141.5 B 191.1 A 144.4 C 140.9
78
C 146.2 A 145.5 B 195.6 A 141.1
Los rendimientos ordenados por tratamientos se muestran en el siguiente cuadro:
CUADRO 3.2.2
Repeticiones
I II III IV Total Medias
A 141.5 145.5 144.4 141.1 572.5 143.1
B 186.2 191.1 195.6 193.3 766.2 191.6
C 146.2 142.3 140.8 140.9 570.2 142.6
1908.9

Calculemos las sumas de cuadrados necesarias para el anlisis de varianza:
Suma de cuadrados corregida total:
Suma de cuadrados corregida de tratamientos:
Suma de cuadrados corregida del error:
La correspondiente tabla del anlisis de varianza se muestra en el CUADRO 3.2.3:
CUADRO 3.2.3
ANALISIS DE VARIANZA
Fuentes
de G.L. S.C. C.M. F SIGN.
Variacin
Total 11 6409.88
Tratamientos 2 6328.41 3164.21 349.56 P<0.001
Error 9 81.47 9.05
FC SCC
T
+ + +
2 2 2
) 9 . 140 ( . .......... ) 5 . 145 ( ) 5 . 141 (
88 . 6409 27 . 303658 15 . 310068
T
SCC
FC SCC
TR

+ +

4
) 2 . 570 ( ) 2 . 766 ( ) 5 . 572 (
2 2 2
47 . 81 41 . 6328 88 . 6409
E
SCC
41 . 6328 27 . 303658 68 . 309986
TR
SCC
27 . 303658
12
) 9 . 1908 (
2
FC
79
El error tpico de las medias de tratamientos viene dado por:
La prueba de comparacin mltiple de Duncan correspondiente a este experimento, de
seguro podr ser desarrollada con facilidad por parte del lector.
Un resumen de los resultados del experimento se muestra en el CUADRO 3.2.4:
CUADRO 3.2.4
MEDIAS DE TRATAMIENTOS SIGN. Y E.T.
A B C P<0.001
t1.50 143.1
A
191.6
B
142.6
A
3.2.2 Valores faltantes.
Cuando en un diseo Completamente al Azar se produce la prdida de uno o ms
valores experimentales, no resulta necesario hacer el clculo de los valores faltantes
para poder realizar el anlisis estadstico de los resultados. En estos casos, el
experimento puede ser procesado considerando un nmero desigual de observaciones
por tratamiento.
Para ejemplificar lo antes expresado, supongamos que en el experimento anterior no
pudieron ser obtenidos, por razones del manejo experimental, los datos correspondientes
a la segunda repeticin del tratamiento A y cuarta del tratamiento C.
Los datos del experimento bajo esta suposicin, se muestran en el CUADRO 3.2.5:
CUADRO 3.2.5
Repeticiones
I II III IV Total Medias
A 141.5 144.4 141.1 427.0 142.3
B 186.2 191.1 195.6 193.3 766.2 191.6
C 146.2 142.3 140.8 429.3 143.1
1622.5

El factor de correccin y la suma de cuadrados corregida total se calculan de la forma
acostumbrada:
Suma de cuadrados corregida total:
50 . 1
4
05 . 9
) .( . t

r
CM
T T E
E
63 . 263250
10
) 5 . 1622 (
2
FC
80
La suma de cuadrados corregida de tratamientos debe ser calculada tomando en cuenta
el nmero real de observaciones en cada tratamiento, es decir:
Suma de cuadrados corregida de tratamientos:
Suma de cuadrados corregida del error:
La correspondiente tabla del anlisis de varianza se muestra en el CUADRO 3.2.6:
CUADRO 3.2.6
ANALISIS DE VARIANZA
Fuentes
de
Variacin
G.L. S.C. C.M. F SIGN.
Total 9 5794.46
Tratamientos 2 5724.14 2862.07 284.92 P<0.001
Error 7 70.32 10.05
El error tpico de las medias de tratamientos viene dado por:
Para los tratamientos A y C
Para el tratamiento B
La prueba de Duncan correspondiente a este experimento, de seguro podr ser
desarrollada con facilidad por parte del lector.
Un resumen de los resultados del experimento se muestra en el CUADRO 3.2.7.
FC SCC
T
+ + +
2 2 2
) 8 . 140 ( . .......... ) 4 . 144 ( ) 5 . 141 (
46 . 5794 63 . 263250 09 . 269045
T
SCC
FC SCC
TR
+ +
3
) 3 . 429 (
4
) 2 . 766 (
3
) 0 . 427 (
2 2 2
32 . 70 14 . 5724 46 . 5794
E
SCC
83 . 1
3
05 . 10
) .( . t

r
CM
T T E
E
14 . 5724 63 . 263250 77 . 268974
TR
SCC
58 . 1
4
05 . 10
) .( . t

r
CM
T T E
E
81
CUADRO 3.2.7
MEDIAS DE TRATAMIENTOS
A B C SIGN.
142.3
A
t 1.83
191.6
B
t 1.58
143.1
A
t 1.83
P<0.001
3.3 Diseos en Bloques al Azar.
Un estudio sobre el tiempo empleado para envasar un determinado producto utilizando
4 mtodos diferentes, fue desarrollado segn un diseo en Bloques al Azar con 5
rplicas.
La aleatorizacin y los resultados experimentales se muestran en el CUADRO 3.3.1.
CUADRO 3.3.1
Rplicas
I II III IV V
B 22.6 A 26.2 C 26.9 B 18.4 A 25.6
A 37.4 B 17.5 A 38.3 A 28.4 C 20.1
D 39.2 C 18.2 D 38.0 D 27.8 B 17.9
C 24.1 D 28.6 B 23.1 C 19.0 D 26.3
Los tiempos empleados ordenados por tratamientos y rplicas se muestran en el
CUADRO 3.3.2.
CUADRO 3.3.2
Rplicas
I II III IV V Total
A 37.4 26.2 38.3 28.4 25.6 155.9
B 22.6 17.5 23.1 18.4 17.9 99.5
C 24.1 18.2 26.9 19.0 20.1 108.3
D 39.2 28.6 38.0 27.8 26.3 159.9
Total 123.3 90.5 126.3 93.6 89.9 523.6
Factor de correccin:
Suma de cuadrados corregida total:
85 . 13707
20
) 6 . 523 (
2
FC
82
Suma de cuadrados corregida de bloques (rplicas):
Suma de cuadrados corregida de tratamientos:
Suma de cuadrados corregida del error:
La correspondiente tabla del anlisis de varianza se muestra en el CUADRO 3.3.3:
CUADRO 3.3.3
ANALISIS DE VARIANZA
Fuentes
de
Variacin
G.L. S.C. C.M. F SIGN.
Total 19 979.55
Bloques 4 339.10
Tratamientos 3 592.54 197.51 49.50 P<0.001
Error 12 47.91 3.99
La significacin de la fuente de variacin debida a tratamientos hace necesario una
prueba de comparacin mltiple a las medias de tratamientos reportadas en el
CUADRO 3.3.4. El lector sin mucha dificultad podr realizar esta prueba.
CUADRO 3.3.4
Totales Medias
A 155.9 31.2
B 99.5 19.9
C 108.3 21.7
D 159.9 32.0
El error tpico de estas medias viene dado por:
FC SCC
T
+ + +
2 2 2
) 3 . 26 ( . .......... ) 2 . 26 ( ) 4 . 37 (
55 . 979 85 . 13707 40 . 14687
T
SCC
FC SCC
B

+ + +

4
) 9 . 89 ( .... .......... ) 5 . 90 ( ) 3 . 123 (
2 2 2
10 . 339 85 . 13707 95 . 14046
B
SCC
FC SCC
TR

+ + +

5
) 9 . 159 ( ) 3 . 108 ( ) 5 . 99 ( ) 9 . 155 (
2 2 2 2
91 . 47 54 . 592 10 . 339 55 . 979
E
SCC
54 . 592 85 . 13707 39 . 14300
TR
SCC
83
3.3.1 Valores faltantes.
Si denotamos por t y r al nmero de tratamientos y rplicas respectivamente, tenemos
que:
Factor de correccin:
donde G es la suma total de todos los resultados experimentales existentes, y X el valor
faltante.
Suma de cuadrados corregida total:
donde K1 es la suma de los cuadrados de los resultados experimentales existentes.
Suma de cuadrados corregida de bloques (rplicas):
donde B representa la suma de los resultados experimentales del bloque donde se
encuentra el valor faltante, y K2 es la suma de cuadrados de los totales de los bloques
donde no se encuentra el valor faltante.
Suma de cuadrados corregida de tratamientos:
donde T representa la suma de los resultados experimentales del tratamiento donde se
encuentra el valor faltante, y K3 es la suma de cuadrados de los totales de los
tratamientos donde no se encuentra el valor faltante.
La suma de cuadrados corregida del error ser entonces:
Suma de cuadrados corregida del error:
89 . 0
5
99 . 3
5
) .( . t

E
CM
T T E
tr
G X
FC
2
) ( +

tr
G X
K X SCC
T
2
2
) (
1
+
+
tr
G X
t
K B X
SCC
B
2 2
) ( 2 ) ( +

+ +

tr
G X
r
K T X
SCC
TR
2 2
) ( 3 ) ( +

+ +

84
Como se puede apreciar en la expresin anterior, la suma de cuadrados corregida del
error es una funcin de la variable independiente X y G, B, T, K1, K2, K3, t y r son
valores constantes.
Debemos obtener entonces el valor de X que hace mnima la funcin de referencia. Este
valor de X es aquel que hace cero la primera derivada de la funcin con relacin a X.
Calculemos esta derivada:
pero tr r t + 1 = (r-1) (t-1) , por tanto,
Con el objetivo de ejemplificar el clculo de los valores faltantes en un diseo en
Bloques al Azar, supongamos que en el CUADRO 3.3.1 el tiempo empleado
correspondiente a la cuarta rplica del tratamiento C no pudo ser obtenido por alguna
razn de carcter experimental. La nueva situacin de los resultados experimentales se
muestra en el CUADRO 3.3.5:
CUADRO 3.3.5
Rplicas

I II III IV V Total
A 37.4 26.2 38.3 28.4 25.6 155.9
B 22.6 17.5 23.1 18.4 17.9 99.5
C 24.1 18.2 26.9 20.1 89.3
D 39.2 28.6 38.0 27.8 26.3 159.9
Total 123.3 90.5 126.3 74.6 89.9 504.6
donde B = 74.6 , T = 89.3 y G = 504.6
El valor del dato faltante puede ser calculado por:
tr
G X
t
K B X
tr
G X
K X SCC
E
2 2 2
2
) ( 2 ) ( ) (
1
+
+
+ +

+
+
tr
G X
r
K T X
2 2
) ( 3 ) ( +
+
+ +

0
) ( 2 ) ( 2 ) ( 2
2
) (

+
+
+

+

tr
G X
r
T X
t
B X
X
dX
SCC d
E
[ ] 0 ) ( ) (
2
+ + + + G X T X t B X r trX
tr
0 + + G X tT tX rB rX trX
G tT rB t r tr X + + ) 1 (
) 1 ( ) 1 (
+

t r
G tT rB
X
85
En el CUADRO 3.3.1 se puede observar que el valor que hemos supuesto faltante era
19.0 y mediante esta tcnica en su lugar usaremos para el anlisis estadstico el valor
18.8. En este punto es necesario insistir en que 18.8 es el valor que al ser incluido en
lugar del valor faltante hace mnima la suma de cuadrados corregida del error, y que no
debe ser interpretado como una estimacin del valor real 19.0.
El lector podr comprobar que la tabla del anlisis de varianza con el valor faltante
incluido queda como se muestra en el CUADRO 3.3.6:
CUADRO 3.3.6
ANALISIS DE VARIANZA
Fuentes
de
Variacin
G.L. S.C. C.M. F SIGN.
Total 18 982.46
Bloques 4 340.22
Tratamientos 3 594.36 198.12 45.54 P<0.001
Error 11 47.88 4.35
Observe que los grados de libertad del Total han sido reducidos en una unidad, y en
consecuencia, tambin los del Error. Esto obedece a que solo existen 19 resultados
experimentales independientes, por cuanto el valor faltante no lo es.
3.3.2 Error tpico de las medias de tratamientos.
El error tpico para las medias de tratamientos sin valor faltante se calcula de la forma
usual:
En el caso del tratamiento al cual pertenece el valor faltante, el error tpico viene dado
por la expresin:
por tanto, para el tratamiento C:
8 . 18
12
6 . 225
) 1 4 ( ) 1 5 (
6 . 504 ) 3 . 89 ( ) 4 ( ) 6 . 74 ( ) 5 (


+
X
1
]
1

) 1 ( ) 1 (
1
) .( .
t r r
t
r
CM T T E
E
08 . 1
15
1
5
1
35 . 4
) 1 4 ( ) 1 5 ( 5
4
5
1
35 . 4 ) .( . t
1
]
1

+
1
]
1

T T E
93 . 0
5
35 . 4
) .( . t

r
CM
T T E
E
86
Experimentos Factoriales
4
4.1 Introduccin.
Durante la exposicin de los diferentes tipos de diseos experimentales que hemos
desarrollado hasta el momento, hemos considerado que el investigador ha estado
solamente interesado en el estudio de un nico factor. Sin embargo, en la prctica se
presenta con mucha frecuencia la necesidad de estudiar el efecto que producen
diferentes factores sobre la respuesta de una determinada variable.
As, por ejemplo, finanzas de Nestle podra estar interesada en estudiar el efecto de
cuatro tipos de leche y tres formas de envase sobre los volmenes de venta de este
producto. En este caso, decimos que estamos en presencia de un experimento factorial
con el que se pretende estudiar los efectos de dos factores ( tipo de leche y forma de
envase ), y que el factor tipo de leche tiene cuatro niveles ( T
1
, T
2
, T
3
y T
4
) mientras
que el factor forma de envase tiene tres niveles ( F
1
, F
2
y F
3
). Una investigacin de este
tipo se dice que ha sido desarrollada mediante un experimento factorial 4 x 3.
La combinacin factorial del experimento antes descrito se muestra en el CUADRO
4.1.1:
CUADRO 4.1.1
Tipo de leche
Formas de envasado
F
1
F
2
F
3
T
1
T
1
F
1
T
1
F
2
T
1
F
3
T
2
T
2
F
1
T
2
F
2
T
2
F
3
T
3
T
3
F
1
T
3
F
2
T
3
F
3
T
4
T
4
F
1
T
4
F
2
T
4
F
3
Observe que la combinacin de los niveles de ambos factores hacen un total de 12
tratamientos sometidos a investigacin en el experimento.
En este punto debemos hacer una aclaracin: no existen los diseos factoriales. Un
experimento factorial, como en el caso anterior con 12 tratamientos, ser diseado en
87
correspondencia con los efectos de tipo ambiental y de otra ndole que estn
interviniendo, y en consecuencia, podrn seguir un diseo Completamente al Azar, en
Bloques al Azar, o de cualquier otro tipo. Hablar de diseos factoriales es un error de
concepto que el investigador no debe cometer. Si en nuestro ejemplo, decidimos utilizar
un diseo en bloques al azar con 5 rplicas, decimos entonces que se aplic este tipo de
diseo en un arreglo factorial 4 x 3.
4.2 Factorial con 2 factores. Anlisis estadstico.
Supongamos que los volmenes de venta medidos en cientos de unidades, son los que
se muestran en el CUADRO 4.2.1:
CUADRO 4.2.1
R p l i c a s
Tipo leche Envase I II III IV V Trat.
F
1
38 40 44 41 38 201
T
1
F
2
52 51 53 50 51 257
F
3
48 47 51 48 49 243 701
F
1
50 49 53 50 51 253
T
2
F
2
41 43 46 42 40 212
F
3
46 47 51 48

47 239 704
F
1
35 38 42 40 36 191
T
3
F
2
43 41 44 39 44 211
F
3
52 51 53 50 50 256 658
F
1
66 67 71 70 65 339
T
4
F
2
54 52 55 58 54 273
F
3
47 45 48 47 46 233 845
Rplicas 572 571 611 583 571 2908
Calculemos en primer trmino el factor de correccin (FC):
Calculemos a continuacin la Suma de cuadrados total:
de donde la suma de cuadrados corregida total ser:
( ) ( ) ( ) ( ) 144564 46 .... .......... 44 40 38
2 2 2 2
+ + + +
T
SC
93 . 3622 07 . 140941 144564
T
SCC
07 . 140941
60
) 2908 (
2
FC
88
La suma de cuadrados corregida de tratamientos es:
y como el diseo es en Bloques al Azar:
y entonces:
de donde la tabla de anlisis de varianza queda como se muestra en el CUADRO 4.2.2.
CUADRO 4.2.2
Fuentes
de
Variacin
G.L S.C. C.M. F SIGN.
Total 59 3622.93
Tratamientos 11 3428.93 311.72 143.65 P<0.001
Bloques 4 98.60
Error 44 95.40 2.17
y el error tpico de las medias de tratamientos ser:
La significacin obtenida para tratamientos indica que entre los mismos existen
diferencias significativas, y que sus medias deben ser comparadas entre s mediante una
prueba de comparacin mltiple de Duncan. Sin embargo, el investigador a cargo de
este experimento podra cuestionarse la posibilidad de estudiar el efecto del Tipo de
Leche y de la Formas de Envasado por separado, o como se conoce ms comnmente,
estudiar los efectos principales de Tipo de Leche y Formas de Envasado de manera
independiente. La posibilidad de que esto pueda hacerse depende de la interaccin
entre ambos factores, la cual se denota como A x B. El concepto de interaccin juega un
papel de principal importancia en la interpretacin de experimentos factoriales.
( ) ( ) ( )
07 . 140941
5
233 . .......... 257 201
2 2 2

+ + +

TR
SCC
93 . 3428 07 . 140941
5
721850

TR
SCC
( ) ( ) ( )
07 . 140941
12
571 . .......... 571 572
2 2 2

+ + +

B
SCC
60 . 98 07 . 140941
12
1692476

B
SCC
39 . 95 61 . 98 93 . 3428 93 . 3622

E
B TR T E
SCC
SCC SCC SCC SCC
66 . 0
5
17 . 2
) ( . . t

X T E
89
4.2.1 El concepto de interaccin.
Para poner en claro este importante concepto, hagamos un anlisis de los totales de cada
uno de los tratamientos estudiados mediante el CUADRO 4.2.3.
CUADRO 4.2.3
Tipo de leche
Formas de envasado
F
1
F
2
F
3
Efecto
Principal
T
1
201 257 243 701
T
2
253 212 239 704
T
3
191 211 256 658
T
4
339 273 233 845
Efecto
Principal
984 953 971
El anlisis de los efectos principales nos pudiera conducir a pensar que el Tipo de Leche
con la que se obtiene una mayor respuesta es la T
4
y que el mejor nivel de Forma de
Envasado es el F
1
. Sin embargo, obsrvese que el Tipo de Leche 1 alcanza una mayor
venta cuando es envasado con Tipo de Envasado 2, el Tipo de Leche 2 con la Forma de
Envasado 1, el Tipo de Leche 3 con la Forma de Envasado 3 y el Tipo de Leche 4 con
la Forma de Envasado 1. Este resultado sugiere que entre ambos factores existe una
interaccin que no permite realizar el estudio de los efectos principales de los factores
de forma separada, es decir, ambos factores interactan recprocamente, y por tanto la
nica respuesta aceptable es encontrar la combinacin ptima de los niveles de ambos
factores, en caso de que sta exista. Debemos probar estadsticamente que lo
anteriormente expresado es cierto, y que el efecto cruzado o interaccin es significativa.
4.2.2 Clculo de la suma de cuadrados debida a la interaccin.
De lo expuesto hasta el momento podemos concluir que el modelo lineal para un
experimento factorial con dos factores segn un diseo en Bloques al Azar viene dado
por la expresin:
donde:

= constante general comn a todas las observaciones

i
= efecto principal del factor A

j
= efecto principal del factor B
()
ij
= efecto de la interaccin entre los dos factores

k
= efecto del bloque
ijk k ij j i ijk
e Y + + + + + ) (
90
e
ijk
= error aleatorio normalmente distribuido son media cero y varianza homognea

2
.

De lo anteriormente planteado se deduce que el efecto de tratamientos puede ser
expresado como la suma de los efectos principales de los factores ms el efecto de la
interaccin, y en consecuencia:
SCC
TR
= SCC
A
+ SCC
B
+ SCC
AXB

o lo que es lo mismo:
SCC
AXB
= SCC
TR
- SCC
A
- SCC
B

Con el auxilio del CUADRO 4.2.3, procedamos entonces a calcular las sumas de
cuadrados del factor A (Tipo de Leche), del factor B (Forma de Envasado) y de la
interaccin AxB para el ejemplo que estamos desarrollando:
de donde:
La determinacin de los grados de libertad se realiza con un razonamiento anlogo.
El anlisis de varianza se muestra en el CUADRO 4.2.4.
CUADRO 4.2.4
Fuentes
de
Variacin
G.L. S.C. C.M. F SIGN.
Total 59 3622.93
Bloques 4 98.60
Tratamientos 11 3428.93 311.72
Tipo de Leche 3 1326.00 442.00 203.69 P<0.001
Forma de Envasado 2 24.23 12.12 5.58 P<0.01
T x F 6 2078.70 346.45 159.65 P<0.001
Error 44 95.40 2.17
07 . 140941
15
) 845 ( ) 658 ( ) 704 ( ) 701 (
2 2 2 2

+ + +

A
SCC
00 . 1326 07 . 140941
15
2134006

A
SCC
07 . 140941
20
) 971 ( ) 953 ( ) 984 (
2 2 2

+ +

B
SCC
23 . 24 07 . 140941
20
2819306

B
SCC
7 . 2078 23 . 24 00 . 1326 93 . 3428
AxB
SCC
91
Como puede apreciarse, la interaccin entre los factores Tipo de Leche y Forma de
Envasado resulta altamente significativa, razn por la cual podemos asegurar con un
nivel de significacin del 0.1% que ambos factores interactan entre s y que no es
posible dar una respuesta acerca del Tipo de Leche que produce una mayor venta sin
referirnos al Tipo de Envasado que utiliza. De igual forma, no es procedente sealar el
mejor nivel de Tipo de Envasado si no lo asociamos con el Tipo de Leche que contiene.
En conclusin, nuestra atencin tiene que centrarse en los 12 tratamientos que resultan
de combinar los 4 niveles de Tipo de Leche con los 3 niveles de Formas de Envasado,
para lo cual tendremos que desarrollar una prueba de comparacin mltiple de Duncan
y obtener las diferencias dos a dos entre las medias de tratamientos.
Los percentiles de rango mnimo de Duncan al 5% para 12 medias ( nmero de
tratamientos ) y 44 grados de libertad del error no aparecen reportados, como puede
apreciarse en la TABLA 51 del Anexo. Por tal razn, debemos proceder a realizar una
doble interpolacin ( horizontal y vertical ) en dicha tabla.
Para ello procedemos de la siguiente manera:
A) Interpolacin horizontal
a) Obtengamos el percentil de rango 11 para 40 grados de libertad:
El percentil de rango 10 es 3.35 y el de rango 12 es 3.39. Esto quiere decir, que para un
incremento de 2 unidades en el rango (12 10), corresponde un crecimiento de 0.04
unidades (3.39 3.35) en el percentil. Por tanto, a un incremento de 1 unidad en el
rango (12 11) corresponder un incremento en el percentil de x unidades. Lo anterior
es una regla de tres simple, es decir,
2 ----------------- 0.04
1 ----------------- x
de donde:
x = 0.04 / 2 = 0.02
El percentil de rango 11 para 40 grados de libertad ser igual a 3.39 0.02 = 3.37.
a) Obtengamos ahora el percentil de rango 11 para 60 grados de libertad:
El percentil de rango 10 es 3.33 y el de rango 12 es 3.37. Siguiendo el mismo
razonamiento anterior:
2 ----------------- 0.04
1 ----------------- x
de donde:
x = 0.04 / 2 = 0.02
El percentil de rango 11 para 60 grados de libertad del error ser 3.37 0.02 = 3.35.
92
B) Interpolacin vertical
Calculemos entonces los 11 percentiles requeridos para 44 grados de libertad:
Para 40 grados de libertad:

2.86 3.01 3.10 3.17 3.22 3.27 3.30 3.33 3.35 3.37 3.39
Para 60 grados de libertad:
2.83 2.98 3.08 3.14 3.20 3.24 3.28 3.31 3.33 3.35 3.37
Aplicando la regla de tres simple para el primer valor tenemos:
( 60 40 ) ----------------- ( 2.83 2.86 )
( 44 40 ) ---------------------------x
20 ---------------------------- 0.03
4 ---------------------------- x
x = - 0.12 / 20 = - 0.01
y el valor del percentil ser:
2.86 0.01 = 2.85
Procediendo de la misma forma pueden ser calculados el resto de los percentiles. El
lector podr comprobar que finalmente los 11 percentiles para 44 grados de libertad son
los siguientes:
( 2 ) ( 3 ) ( 4 ) ( 5 ) ( 6 ) ( 7 ) ( 8 ) ( 9 ) (10) (11) (12)
2.85 3.00 3.10 3.16 3.22 3.26 3.30 3.33 3.35 3.37 3.39
Apoyndonos en el CUADRO 4.2.3 podemos proceder a calcular las 12 medias de
tratamientos y las de efectos principales, las cuales se muestran en el CUADRO 4.2.5.

CUADRO 4.2.5
Tipos de Leche
Formas de Envasado
F
1
F
2
F
3
Efecto
Principal
T1
40.2 51.4 48.6 46.7
T
2
50.6 42.4 47.8 46.9
T
3
38.2 42.2 51.2 43.9
T
4
67.8 54.6 46.6 56.3
Efecto
Principal
49.2 47.6 48.6
Los errores tpicos para los efectos principales de Tipo de Leche y Formas de Envasado
vienen dados por:
93
La prueba de comparacin mltiple de Duncan tiene el formato que se muestra en el
CUADRO 4.2.6.
CUADRO 4.2.6
3.39 3.37 3.35 3.33 3.30 3.26 3.22 3.16 3.10 3.00 2.85
67.8 54.6 51.4 51.2 50.6 48.6 47.8 46.6 42.4 42.2 40.2
38.2 * * * * * * * * * * *
40.2 * * * * * * * * * *
42.2 * * * * * * * * NS
42.4 * * * * * * * *
46.6 * * * * * * NS
47.8 * * * * * NS
48.6 * * * * *
50.6 * * NS NS
51.2 * * NS
51.4 * *
54.6 *

Un resumen de todo el procesamiento estadstico realizado, se muestra en el CUADRO
4.2.7.
CUADRO 4.2.7
Tipos de
Leche
Formas de Envasado
F
1
F
2
F
3
Efecto
Principal
T
1
40.2
E
51.4
D
48.6
C
46.7
P<0.001
0.38
T
2
50.6
D
42.4
A
47.8
BC
46.9
T
3
38.2
F
42.2
A
51.2
D
43.9
T
4
67.8
G
54.6
H
46.6
B
56.3
Efecto
Principal 49.2 47.6 48.6
P<0.001
0.66
P<0.01
0.33
La interaccin AxB entre dos factores, estudiada en el presente epgrafe, recibe el
nombre de interaccin de primer orden.
66 . 0 . . t
TR
T E
38 . 0
15
17 . 2
. . t
n
CM
T E
e
A
33 . 0
20
17 . 2
. . t
n
CM
T E
e
B
94
Regresin y correlacin
5
5.1 Introduccin
Desde hace ya algn tiempo, aprendimos en nuestras clases de Fsica que en el
movimiento rectilneo uniforme es posible establecer una relacin funcional entre la
velocidad de un mvil y el tiempo que demora en recorrer una determinada distancia
con relacin al espacio recorrido, es decir, e = v t.
De esta manera, si conocemos la velocidad con que un mvil ha recorrido una
determinada distancia y el tiempo que ha empleado en ello, basta con sustituir estos
valores en la expresin anterior para obtener el espacio recorrido. En esta relacin, a las
variables v y t se les llama variables independientes mientras que e se conoce como
variable dependiente.
Pero la Fsica es una ciencia exacta, y en muchos otros casos, no es posible encontrar
una relacin funcional, frmula o modelo matemtico que exprese de forma exacta la
relacin que existe entre diferentes variables independientes (o series de datos) y una
variable dependiente (o serie de datos).
Resulta evidente, por ejemplo, que existe una relacin entre la temperatura (variable
independiente) en una ciudad y el nmero de colas vendidas (variable dependiente) en
un supermercado de este lugar. Pero el nmero de colas vendidas no solo depende de la
temperatura, sino mas bien, de un grupo de factores que intervienen en ello, y por tanto,
resulta difcil, sino imposible, obtener una relacin funcional o frmula entre ambas
variables que permita calcular de forma exacta el nmero de colas vendidas conocido el
valor de la temperatura.
En el desarrollo de este Captulo nos dedicaremos al estudio de la posible relacin entre
varias variables o series de valores que no puede ser expresada mediante una relacin
funcional, y para ello, abordaremos la teora de la regresin y la correlacin.
95
La regresin de una variable dependiente ( Y ) sobre una o ms variables independientes
( X
1
, X
2
, ) expresa la variacin que sufre la primera como consecuencia de
la variacin de las segundas. La teora de la regresin permite establecer una
expresin matemtica ( no funcional ) entre estas variables de forma que evaluando
la expresin en las variables independientes se pueda hacer una estimacin mas o
menos acertada de la variable dependiente.
Por su parte la teora de la correlacin tiene por objeto determinar el grado o intensidad
de la interdependencia entre dos o ms variables, permitiendo definir con claridad si
esta interdependencia es o no cierta.

5.2 Regresin lineal simple
Para iniciar este estudio, consideremos dos variables o series de datos entre las cuales se
considera pueda existir una relacin de tipo lineal, es decir, que la representacin
algebraica de esta relacin es una lnea recta.
En el Captulo 3, epgrafe 3.1, estudiados que el modelo lineal general viene dado por la
expresin:
y que este modelo es de Anlisis de Regresin cuando las variables X
ji
, excepto una,
son aleatorias.
Para el caso de la regresin lineal simple, el modelo anterior se reduce a:
o expresado de forma anloga:
5.2.1 Estimacin de los parmetros del modelo.
Para obtener las estimaciones mnimo cuadrticas a y b de los parmetros y
respectivamente, debemos minimizar la expresin:
Para obtener el valor de a debemos calcular:
i p Pi i i i
e x x x y + + + +
2 2 1 1
i i i
e x y + +
2 1

i i i
e x y + +
( )


2 2
i i i
x b a y e
( )
( )

a
x b a y
x b a y
a
e
i i
i i
i
2
2
( ) ( )

+
i i i i
y x b a x b a y 0 2
96
y por tanto, la estimacin de a viene dada por:
El valor de a se conoce como traza o intercepto de la lnea recta, y geomtricamente
representa el punto en que la lnea corta el eje de las Y.
Para obtener el valor de b calculamos:

Al valor b se le conoce como coeficiente de regresin, y su expresin numrica tiene la
siguiente interpretacin:
a) Cuando b > 0, a incrementos de la variable independiente X corresponden
incrementos de la variable dependiente Y, es decir, la lnea recta es creciente. En
este caso, es posible obtener una estimacin del valor de Y sustituyendo en la
ecuacin un valor determinado de X.
b) Cuando b < 0, la lnea recta es decreciente, es decir, a incrementos de la variable
independiente X corresponden decrecimientos de la variable dependiente Y.
Tambin en este caso es posible predecir el valor de Y para un determinado valor de
X.
c) Cuando b = 0, la ecuacin de la lnea recta asume la forma Y = a y por tanto es
paralela al eje de las X. En esta situacin resulta imposible predecir un valor de Y.
n
x
b
n
y
a donde de y x b a n
i i
i i


+

x b y a
( )
( )

b
x b a y
x b a y
b
e
i i
i i
i
2
2
( ) ( ) 0 0 2
2
+ +
i i i i i i i
x b x a y x x x b a y
: entonces
n
x
b
n
y
a como y
i i

( )
: 0
2
2
donde de x b
n
x
b
n
y x
y x
i
i i i
i i
+ +

( )

n
x
x
n
y x
y x
b
i
i
i i
i i
2
2
X
XY
SCC
SPC
b
97
Veamos a continuacin un ejemplo numrico sencillo del clculo de la ecuacin de
regresin lineal simple mnimo cuadrtica:
Dado los valores de las siguientes dos variables, obtengamos la ecuacin de regresin
lineal simple de X en Y.
X 2 3 4 5 6
Y 4 7 6 10 11
El grfico de dispersin (GRAFICO 5.2.1) en un sistema de ejes cartesianos muestra
que las series de valores, en efecto, tienen aparentemente una relacin de tipo
lineal:
GRAFICO 5.2.1
Las sumas de cuadrados y productos necesarios para estimar los parmetros de la
ecuacin de regresin se muestran en el CUADRO 5.2.1:
CUADRO 5.2.1
X Y
X
i
2

2
i
Y
X Y
i i

2 4 4 16 8
3 7 9 49 21
4 6 16 36 24
5 10 25 100 50
6 11 36 121 66
20 38 90 322 169
de donde:
X
XY
SCC
SPC
b
=
( ) ( )
( )
169
20 38
5
90
20
5
2

= 17 / 10 = 1.7
0
2
4
6
8
10
12
0 2 4 6 8
Variable dependiente
Variable independiente
Grfico de dispersin
98

Y
= 38 / 5 = 7.6

X
= 20 / 5 = 4

X b Y a
= 7.6 - 1.7 (4) = 0.8
La ecuacin de regresin es por tanto , Y = 0.8 + 1.7 X
La representacin grfica de esta ecuacin en un sistema de ejes coordenados se
muestra en el GRAFICO 5.2.2:
GRAFICO 5.2.2
Una estimacin del valor de Y para X = 4.5 ser:
Y = 0.8 + 1.7 (4.5) = 0.8 + 7.6 , es decir, Y = 8.4
Aprovechando el planteamiento del ejemplo anterior, resulta aconsejable hacer notar lo
siguiente:
a) Al realizar una regresin las series de valores utilizadas deben estar apareadas dos a
dos siguiendo una determinada lgica de organizacin, la cual puede tener un
carcter biolgico, fsico, natural o de otra ndole, pero que justifique lo acertado del
apareamiento.
b) Las observaciones de cada serie deben ser representativas de la poblacin que
representa y el nmero de ellas lo suficientemente grande para que garanticen una
acertada estimacin. Algunos autores aconsejan no realizar la regresin cuando el
nmero de pares de observaciones est por debajo de 30. En nuestro ejemplo,
utilizamos 5 pares de observaciones solo con la finalidad de reducir el volumen de
los clculos, pero en situaciones reales lo anteriormente expuesto debe ser tomado
en consideracin.
5.2.2 Prueba de hiptesis del coeficiente de regresin
0
2
4
6
8
10
12
0 2 4 6 8
Variable dependiente
Variable independiente
Regresin Lineal Simple
99
Sabemos de la teora de los mnimos cuadrados que la ecuacin de regresin lineal
simple obtenida en el ejemplo anterior, es de todas las posibles, la que mejor se ajusta a
las series de datos. Sin embargo, a pesar de que sabemos que es la de mejor ajuste, an
no conocemos si en verdad nos permitir hacer una adecuada estimacin del valor de Y
para un determinado valor de X. Para conocer esto ltimo, se requiere someter a prueba
estadstica el verdadero valor del coeficiente de regresin b, presentndose al respecto
las siguientes posibilidades:
a) El coeficiente de regresin b es significativamente mayor o menor que 0.
En este caso, la ecuacin de regresin lineal simple obtenida permite hacer una
estimacin del valor de la variable dependiente Y para un valor especfico de la
variable independiente X, y por tanto, puede ser utilizada con estos fines.
b) El coeficiente de regresin b es estadsticamente igual a 0.
Como sabemos, en este caso, la ecuacin de regresin lineal simple es paralela al
eje de las X, y por tanto, no permite hacer estimacin alguna de la variable Y, y en
consecuencia, no puede ser usada con esta finalidad y debe ser despreciada.
En conclusin, para determinar la bondad del ajuste de la ecuacin debemos someter a
prueba las siguientes hiptesis:
H
0
: = 0
H
1
: 0
Como vimos en el Captulo 3, epgrafes 3.4 y 3.5, una va para tomar una decisin
acerca de la veracidad o no de la hiptesis nula es mediante la tcnica de Anlisis de
Varianza, en este caso conocida como Anlisis de Regresin.
Para ello, debemos obtener la expresin matemtica de la suma de cuadrados debida a la
regresin. Procediendo de manera anloga a como lo hicimos en el Captulo 3 podemos
comprobar que esta suma de cuadrados viene dada por:
y por tanto, la tabla de anlisis de regresin queda como se muestra en el CUADRO
5.2.2:
CUADRO 5.2.2
Anlisis de Regresin
Fuentes de G.L. S.C. C.M. F
Variacin
Total n-1
Y
Y
n
i
i
i
i
2
2

_
,

S.C.
T
/ G.L.
( )
X
XY
R
SCC
SPC
SCC
2

100
Regresin 1
( ) SPC
SCC
XY
X
2
S.C.
R
/ G.L. C.M.
R
/ C.M.
E
Error n-2 S.C.
T
- S.C.
R
S.C.
E
/ G.L.
Desarrollemos el anlisis de regresin para el ejemplo que hemos venido desarrollando,
en el cual:

20
i
X

38
i
Y

90
2

i
X

322
2
i
Y

169
i i
Y X
Calculemos en primer trmino el Factor de Correccin (FC):
de donde la suma de cuadrados corregida total ser:
La suma de cuadrados debida a la regresin viene dada por:
y entonces:
Con relacin a los grados de libertad tenemos que:
Grados de libertad de la SCC
T
= el nmero de observaciones de la variable dependiente
menos uno, es decir, 5 1 = 4
Grados de libertad de la SCC
R
= el nmero de parmetros en el modelo menos uno, es
decir, 2 1 = 1
Grados de libertad de la SCC
E
= 4 1 = 3
La tabla de Anlisis de Regresin es la que se muestra en el CUADRO 5.2.3:
CUADRO 5.2.3
Fuentes
de
Variacin
G.L. S.C. C.M. F SIGN.
Total 4 33.20
Regresin 1 28.90 28.90 20.21 P<0.05
Error 3 4.30 1.43
( )
8 . 288
5
38
2
FC
2 . 33 80 . 288 00 . 322
T
SCC
3 . 4 9 . 28 2 . 33
R T E
SCC SCC SCC
( ) ( )
( )
9 . 28
10
289
5
20
90
5
38 20
169
2
2

,
_

R
SCC
101
La significacin que se reporta en la tabla ( p<0.05 ) se debe a que la F calculada es
mayor que F
0.05
(1,3) = 10.13, pero menor que F
0.01
(1,3) = 34.12.
Como conclusin podemos asegurar que con un nivel de significacin del 5 % la recta
de regresin obtenida se ajusta adecuadamente a los datos.
5.2.2.1 Error tpico de estimacin
Como ya hemos sealado anteriormente, la estimacin de un valor de la variable
dependiente Y a travs de la ecuacin de regresin no es un valor exacto, sino
aproximado. El error en la estimacin da lugar a los residuos, es decir, las diferencias
entre el verdadero valor de Y y su estimacin mediante la ecuacin. Pero esta
estimacin puede ser mas o menos exacta y sera conveniente disponer de una expresin
que nos informe del grado de exactitud de estas estimaciones. Este valor es el
denominado error tpico de la estimacin, el cual viene dado por la siguiente
expresin:

En el ejemplo que estamos desarrollando:
5.2.2.2 Error tpico del coeficiente de regresin
Para la determinacin del coeficiente de regresin b hemos basado nuestros clculos en
muestras extradas de dos diferentes poblaciones con las que obtuvimos una estimacin
puntual del verdadero valor poblacional de este parmetro. Por tal razn, resulta
aconsejable calcular un estadgrafo de dispersin para este coeficiente con el objetivo de
establecer el grado de precisin conque el mismo ha sido estimado. Este estadgrafo es
el error tpico del coeficiente de regresin.
Scheff (1959) al estudiar la teora general de los modelos lineales report que la
varianza del coeficiente de regresin lineal simple viene dado por la expresin:
donde
2
= CM
E
y m
ZZ,
= SCC
X
, es decir,
Y entonces:
E
E
X Y
CM
n
SCC
S

2
.
20 . 1 43 . 1
.
t
X Y
S

,
2
) (
ZZ
m
b V

X
E
SCC
CM
b V ) (
102
En nuestro ejemplo SCC
X
= 10 y CM
E
= 1.43, de donde:
5.2.3 Mtodo alternativo para calcular la suma de cuadrados del error
A partir de que las estimaciones mnimo cuadrticas de los parmetros del modelo de
regresin han sido calculadas, es posible obtener la suma de cuadrados del error sin que
para ello sea necesario desarrollar el anlisis de regresin. Esto es posible determinando
las desviaciones de los valores observados de la variable dependiente Y con relacin a
las estimaciones obtenidas de ellos mediante la ecuacin. La suma de cuadrados de estas
desviaciones o residuos, es igual a la suma de cuadrados del error en el anlisis de
regresin.
Los residuos y sus sumas de cuadrados para el ejemplo que hemos estado desarrollando
se presentan en el CUADRO 5.2.4:
CUADRO 5.2.4
4 4.2 - 0.2 0.04
7 5.9 1.1 1.21
6 7.6 - 1.6 2.56
10 9.3 0.7 0.49
11 11.0 0.0 0.00
0.00 4.30
son respectivamente la estimacin del valor de la variable Y a travs de la ecuacin de
regresin obtenida, el residuo o error cometido en la estimacin y el cuadrado de este
error.

38 . 0
10
43 . 1
) .( . t b T E
2
^ ^ ^
) ( ) ( , Y Y y Y Y Y donde
2
^ ^ ^
) ( Y Y Y Y Y Y
X
E
SCC
CM
b T E ) .( .
103
Observe en el CUADRO 5.2.4 como la suma de los residuos es igual a cero, tal y como
deba esperarse. En teora esta cantidad debe ser exactamente igual a cero. Cuando no lo
sea habr un error de clculo o un problema con la aproximacin.
El CUADRO 5.2.4 muestra que la suma de cuadrados del error es igual a 4.30. Compare
este valor con el obtenido en el anlisis de regresin (CUADRO 5.2.3) y podr
comprobar que son iguales.
5.2.4 Prueba de hiptesis del coeficiente de regresin
Un mtodo alternativo para determinar la bondad del ajuste de la ecuacin de regresin
lineal simple sin tener que desarrollar el anlisis de regresin, es determinado mediante
una prueba de hiptesis si el coeficiente de regresin es o no igual a cero.
En el epgrafe 5.2.2 vimos que la expresin del error tpico del coeficiente de regresin
viene dado por:
Apoyndonos en el resultado obtenido en el epgrafe 5.2.3:
de donde:
el cual es un resultado importante que nos permite calcular el error tpico del coeficiente
de regresin sin tener que desarrollar el anlisis de regresin correspondiente.
Formulemos entonces las hiptesis:
H
0
: = 0
H
1
: 0
En estas condiciones, si la hiptesis nula no es rechazada, el coeficiente de regresin es
igual a cero, la ecuacin de regresin es paralela al eje de las X, y por tanto, dicha
ecuacin no permite una adecuada estimacin de la variable dependiente Y. Si por el
contrario, la hiptesis nula es rechazada, entonces la ecuacin de regresin se ajusta
X
E
SCC
CM
b T E ) ( . .
2
) (
2
^


n
Y Y
CM
i
E
X
i
SCC n
Y Y
b T E
) 2 (
) (
) .( .
2
^


104
adecuadamente a los datos y cualquier estimacin de la variable dependiente a travs de
la ecuacin es satisfactoria.
De la teora estadstica conocemos que el estadgrafo:
sigue una distribucin t de Student, en este caso con n-2 grados de libertad, y que la
hiptesis nula es rechazada a un nivel de significacin si:
En nuestro ejemplo:
b = 1.7
n = 5
de donde:
Para una prueba de dos colas, los valores de los percentiles t de Student para 3 grados de
libertad y niveles de significacin del 5%, 1% y 0.1% reportados en la TABLA 49 del
Anexo son:
3.182 para un nivel de significacin del 5%
5.841 para un nivel de significacin del 1%
12.941 para un nivel de significacin del 0.1%
y como 4.59 > 3.182 rechazamos la hiptesis nula con un nivel de significacin del 5%,
es decir, la ecuacin de regresin se ajusta satisfactoriamente a las series de valores
dadas.
Observe que la significacin obtenida en la prueba de hiptesis (P<0.05) es la misma
alcanzada en el anlisis de regresin correspondiente (CUADRO 5.2.3).
5.2.5 Coeficiente de correlacin lineal simple
) .( . b T E
b
T
) 2 (
2
1

n
t T

59 . 4
37 . 0
7 . 1
14 . 0
7 . 1
) 10 ( ) 2 5 (
3 . 4
7 . 1
) .( .

b T E
b
30 . 4 ) (
2
^

Y Y
105
En el epgrafe anterior, concretamos en forma matemtica la posible relacin existente
entre dos variables o series de valores entre las cuales la dependencia poda ser
expresada mediante una lnea recta.
A menudo resulta muy favorable poder expresar en trminos numricos el grado de
dependencia que eventualmente pueda existir entre dos variables o entre las series de
datos que la representan. Este valor matemticamente calculado recibe el nombre de
coeficiente de correlacin.
Para obtener la expresin matemtica de este coeficiente partamos de la igualdad que se
muestra a continuacin:
pero,
De la teora de probabilidades sabemos que si X e Y son independientes, entonces se
cumple que:
Si por el contrario, X e Y no son independientes, entonces:
Podemos concluir entonces, que la expresin (1) puede ser utilizada para calcular de
forma numrica la intensidad o el grado de dependencia entre dos variables o series de
) )( ( ) ( ) (
) )( ( ) ( ) (
)] ( [ )] ( [



+ + +
+ + +
+ +



Y Y X X X X Y Y Y X Y X n
Y Y X X X X Y Y Y X Y X
Y Y Y X X X Y X
i i i i
i i i i
i i i i
n
Y Y X X
Y X
n
Y X
n para dividiendo tanto por Y Y y X X
i i i i
i i






+ +

) )( (
: , 0 ) ( 0 ) (
) 1 ( 0
) )( (
: ,


+ +




n
Y Y X X
caso ese en tanto por y Y X
n
Y
n
X
n
Y X
i i
i i i i
0
) )( (
:



n
Y Y X X
y
n
Y
n
X
n
Y X
i i
i i i i
106
valores, en concordancia con el hecho de que dicha expresin se acerque o est alejada
significativamente de 0.
Si en (1), expresamos los valores de las desviaciones con relacin a su media de cada
una de las variables en unidades de desviacin tpica, tenemos:
expresin que recibe el nombre de coeficiente de correlacin y se denota con la letra r.
Si escribimos la expresin (2) en trminos de desviaciones, obtenemos:
la cual expresada en trminos de sumas de cuadrados queda:
r =
SPC
SCC SCC
XY
X Y
.

donde:
SPC
XY
n
Y X
Y X
i i
i i
i
i
i


SCC
X
=
2
2
n
X
X
i
i
i
i

,
_

SCC
Y
=
Y
Y
n
i
i
i
i
2
2

_
,

n = nmero de pares de observaciones


Puede demostrarse matemticamente que el coeficiente de correlacin siempre es una
cantidad que oscila entre 1 y -1, es decir,
) 2 (
) )( (
) ( ) (
Y X
i i
Y
i
X
i
n
Y Y X X
n
Y Y X X



) 3 (
) ( ) (
) )( (
2 2

Y Y X X
Y Y X X
r
i i
i i
,
) ( ) (
) )( (
2
_
2
donde de
n
Y Y
n
X X
n
Y Y X X
r
i i
i i


107
-1 r 1.
Cuando r > 0, la correlacin es directa, y a valores crecientes de una de las variables
corresponden valores que tienden a ser crecientes de la otra.
Cuando r < 0, la correlacin es inversa, y a valores crecientes de una de las variables
corresponden valores que tienden a ser decrecientes de la otra.
Cuando r = 1 o r = -1, la correlacin es perfecta. Cuanto ms se acerque a la unidad el
valor del coeficiente de correlacin ms alta ser sta. En cambio, valores prximos a
cero indican, en general, ausencia de correlacin entre los valores simultneos de ambas
variables.
Calculemos el coeficiente de correlacin entre las dos series de datos que hemos estado
trabajando.
r =
SPC
SCC SCC
XY
X Y
.
=
( ) ( )
( ) ( )
169
20 38
5
90
20
5
322
38
5
2 2

_
,

_
,

=
17/18.22 = 0.933
El valor de r obtenido es positivo y cercano a 1, lo cual indica que existe una alta
correlacin directa entre ambas variables.
A menudo se suele reportar el valor del cuadrado del coeficiente de correlacin en lugar
de ste. Este valor recibe el nombre de coeficiente de determinacin y se denota como
R
2
. En nuestro caso, R
2
= 0.87.
Si como hemos dicho, el valor de r oscila entre 1 y 1, entonces el valor de R
2
es
siempre menor o igual a 1 y mayor o igual a 0.
Un mtodo alternativo para calcular el coeficiente de determinacin, y en consecuencia,
el coeficiente de correlacin, es mediante las sumas de cuadrados del anlisis de
regresin. El coeficiente de determinacin se define en estos trminos como el
porcentaje de la variacin de la variable dependiente Y explicado por la variable
independiente X, o lo que es lo mismo, mediante la siguiente expresin:
De la tabla del anlisis de regresin que fue reportada en el CUADRO 5.2.3 tenemos:
valor que coincide exactamente con el calculado anteriormente.

T
REG
SCC
SCC
R
2
87 . 0
2 . 33
9 . 28
2
R
108
Podemos decir entonces que el 87% de la variacin de la variable dependiente Y est
ocasionada por su relacin lineal con la variable independiente X.

5.2.5.1 Error tpico del coeficiente de correlacin
Por las mismas razones planteadas en el epgrafe 5.2.2.1 resulta muy conveniente
obtener un estadgrafo de dispersin para el coeficiente de correlacin que nos permita
conocer la precisin con que ste ha sido estimado.
El error tpico de este coeficiente se calcula a travs de las siguientes expresiones:
Sin embargo, algunos autores han reportado que el coeficiente de correlacin puede no
distribuirse normalmente, y en consecuencia, cuando la muestra es pequea o la
correlacin entre las series de valores es suficientemente grande, las expresiones
anteriores no son adecuadas para determinar la significacin del coeficiente. Por esta
razn, Fischer ha propuesto que para muestras pequeas ( lo cual es bastante usual ) se
utilice el siguiente error tpico:
expresin que utilizaremos en el desarrollo de este Captulo.

Para las series de valores que hemos venido utilizando:

5.2.5.2 Prueba de hiptesis del coeficiente de correlacin
Una forma alternativa de comprobar estadsticamente el ajuste o no de una lnea de
regresin simple es mediante la prueba de hiptesis del coeficiente de correlacin.
Como ya hemos expresado, cuando las variables X e Y estn incorrelacionadas el valor
de r tiende a ser cero, y por el contrario, cuando ste tiende a 1 o 1 existe una alta
correlacin entre ambas. De aqu que una forma de contrastar el ajuste de la ecuacin es
sometiendo a prueba las siguientes hiptesis:
H
0:
r = 0
H
1:
r 0
Para desarrollar esta prueba calculemos, en primer lugar, el valor t que viene expresado
por:
grandes muestras para
n
r
r T E
pequeas muestras para
n
r
r T E
1
1
) .( .
1
) .( .
2
2

2
1
) .( .
2

n
r
r T E
( )
22 . 0
3
14 . 0
2 5
93 . 0 1
) .( .
2
t

r T E
109
Los percentiles de la distribucin t de Student para una prueba de dos colas (TABLA
49 del Anexo) y 3 grados de libertad son, como ya hemos expresado, los siguientes:
Para un nivel de significacin del 5% = 3.182
Para un nivel de significacin del 1% = 5.841
Para un nivel de significacin del 0.1% = 12.941
y como 4.35 es mayor que 3.182 rechazamos la hiptesis nula con un nivel de
significacin del 5 %.
Observe que la significacin del coeficiente de correlacin obtenida mediante la t de
Student, coincide con la significacin hallada usando la F de Fischer en el anlisis de
regresin y con la obtenida mediante la prueba de hiptesis del coeficiente de regresin,
lo cual corrobora que los tres mtodos son vas alternativas para comprobar el ajuste de
la ecuacin de regresin lineal simple.
5.3 Modelos multiplicativos
En la prctica de la investigacin, la relacin existente entre dos variables o series de
valores no es siempre, por supuesto, de forma lineal. Sin embargo, existen algunos
modelos matemticos que definen una relacin no lineal entre dos variables y que
pueden, con una transformacin a la variable dependiente o a la variable independiente,
ser convertidos a la ecuacin de una lnea recta. En este epgrafe nos ocuparemos del
primer caso, es decir, cuando la transformacin se realiza sobre la variable dependiente.
5.3.1 Regresin exponencial simple
El modelo matemtico que define una relacin funcional exponencial entre dos
variables viene dado por la expresin:
donde e es la constante Euler (2.7183), y son parmetros del modelo y e
i
errores
aleatorios que siguen una distribucin normal con media 0 y varianza homognea
2
.
Obviando e
i
y aplicando logaritmo en base e ( logaritmo neperiano ) a ambos miembros
de la igualdad anterior, tenemos que:
en la que aplicando las propiedades de los logaritmos:
2 2
1
2
2
1
) .( .
r
n r
n
r
r
r T E
r
t


( )
35 . 4
37 . 0
61 . 1
93 . 0 1
3 93 . 0
2

t
i
X
i
e e y
i
+

i i
X y + ln ln
ln ln
' '
+ donde X y
i i
) ln( ln
i
X
i
e y


110
El resultado anterior demuestra que si deseamos ajustar una ecuacin exponencial
simple a dos series de valores dados, podemos hacerlo aplicando la transformacin
logaritmo neperiano ( logaritmo en base e ) a los datos de la variable dependiente y con
estos resultados desarrollar todo el proceso para el ajuste de una ecuacin de regresin
lineal simple tal y como ha sido descrito, teniendo la precaucin de expresar en
trminos de unidades originales el valor del parmetro a.
Desarrollemos el proceso antes indicado a las dos series de valores que se muestran a
continuacin:
X 1.1 1.2 1.5 1.9 2.3 2.7 3.2 3.9 4.6 5.1
Y 2.4 6.7 18.5 45.9 98.6 179.0 345.5 549.2 934.4 1234.9
El grfico de dispersin entre estas dos series de datos se muestra en el GRAFICO
5.3.1:
En dicho grfico puede apreciarse que efectivamente parece ser que entre ambas
variables existe una relacin de tipo exponencial.
GRAFICO 5.3.1
Realizando la transformacin logaritmo neperiano tenemos los resultados que se
muestran en el CUADRO 5.3.1 :
0
200
400
600
800
1000
1200
1400
0 2 4 6
Variable dependiente
Variable independiente
Grfico de dispersin
111
CUADRO 5.3.1
Y XY Y
2
X lnY X lnY X
2
(lnY)
2
1.1 0.88 0.96 1.21 0.77
1.2 1.90 2.28 1.44 3.62
1.5 2.92 4.38 2.25 8.51
1.9 3.83 7.27 3.61 14.64
2.3 4.59 10.56 5.29 21.08
2.7 5.19 14.01 7.29 26.91
3.2 5.84 18.70 10.24 34.16
3.9 6.31 24.60 15.21 39.80
4.6 6.84 31.46 21.16 46.78
5.1 7.12 36.31 26.01 50.68
27.50 45.41 150.53 93.71 246.95
X
XY
SCC
SPC
b
=
( )
( )
42 . 1
09 . 18
65 . 25
62 . 75 71 . 93
88 . 124 53 . 150
10
50 . 27
71 . 93
10
) 41 . 45 ( 50 . 27
53 . 150
2

Y
= 45.41/10 = 4.54

X
= 27.5/10 = 2.75

X b Y a
'
= 4.54 ( 1.42 ) ( 2.75 ) = 0.64
a = e
0.64
= 1.90
y por tanto , Y = 1.90 e
1.42X
La representacin grfica de esta ecuacin en un sistema de ejes coordenados se
muestra en el GRAFICO 5.3.2:
112
GRAFICO 5.3.2
De los datos del CUADRO 5.3.1 tenemos:
y la suma de cuadrados corregida total ser:
La suma de cuadrados debido a la regresin puede ser calculada como:
y entonces:
y:
CUADRO 5.3.2
ANALISIS DE REGRESION
Fuentes de
Variacin G.L. S.C. C.M. F SIGN.
Total 9 40.74
( )
21 . 206
10
41 . 45
2
FC
74 . 40 21 . 206 95 . 246
T
SCC
37 . 4 37 . 36 74 . 40
R T E
SCC SCC SCC
( )
37 . 36
09 . 18
92 . 657
09 . 18
65 . 25
2

R
SCC
0
500
1000
1500
2000
2500
3000
0 2 4 6
Variable dependiente
Variable independiente
Regresin Exponencial Simple
113
Regresin 1 36.37 36.37 66.13 P<0.001
Error 8 4.37 0.55
de donde:
Se deja al lector el clculo de la significacin del coeficiente de regresin y de
correlacin y la comprobacin de que ambas coinciden con la significacin de la tabla
del anlisis de regresin.
5.4 Regresin mltiple
En el epgrafe anterior, dedicamos nuestra atencin al estudio de la posible relacin
lineal entre dos variables, y ms concretamente, a la expresin matemtica que define la
influencia de una variable independiente sobre otra variable llamada dependiente. Sin
embargo, ocurre en ocasiones que es necesario ampliar el estudio de la regresin y la
correlacin a situaciones en las cuales existe una influencia de dos o ms variables
independientes sobre la variable dependiente. La tcnica de regresin y correlacin
mltiple se ocupa de estas situaciones.
5.4.1 Regresin lineal mltiple para el caso de dos variables independientes.
Para dos variables independientes, la forma general del modelo de regresin lineal
mltiple viene dado por la expresin:
y si a es la estimacin mnimo cuadrtica de
1
, b la estimacin de
2
y c la estimacin
de
3
entonces la ecuacin de regresin toma la forma:
Y = a + bX1 + cX2
donde:
X1 y X2 son las variables independientes, a es la ordenada del punto de interseccin
con el eje Y, y b, c son los coeficientes de regresin de la lnea recta.
Para obtener la expresin numrica de a, b y c debemos minimizar la suma de los
cuadrados de los errores, es decir, la expresin:
94 . 0
15 . 27
65 . 25
) 74 . 40 ( ) 09 . 18 (
65 . 25
r
12 . 0
8
) 94 . 0 ( 1
) ( . .
2
t

r T E
17 . 0
09 . 18
55 . 0
) ( . . t b T E
i i i i
e X X Y + + + 2 1
3 2 1

114

Estimacin mnimo cuadrtica de a
0

lo cual representa la primera ecuacin normal.


Estimacin mnimo cuadrtica de b
lo cual representa la segunda ecuacin normal.
Estimacin mnimo cuadrtica de c

2
i
e
2
2
2 2 2
2
1 1 1
) 2 1 ( . ..........
........ ) 2 1 ( ) 2 1 (
n n n
cX bX a Y
cX bX a Y cX bX a Y
+
+ +
0 ) 1 ( ) 2 1 ( 2 . ..........
) 1 ( ) 2 1 ( 2 ) 1 ( ) 2 1 ( 2
2 2 2 1 1 1
+ +
+

n n n
cX bX a Y
cX bX a Y cX bX a Y
a

0 ) 2 1 ( . ..........
. .......... ) 2 1 ( ) 2 1 (
2 2 2 1 1 1
+
+ +
n n n
cX bX a Y
cX bX a Y cX bX a Y

0 2 1
i i i
cX bX a Y

+ + ) 1 ( 2 1
i i i
X c X b na Y
0 ) 1 ( ) 2 1 ( 2 ........
) 1 ( ) 2 1 ( 2 ) 1 ( ) 2 1 ( 2
0
2 2 2 2 1 1 1
+
+ +

n n n n
i
X cX bX a Y
X cX bX a Y X cX bX a Y
b


0 2 1 1 1 1 1
i i i i i i i
X cX X bX a X Y X

+ + ) 2 ( 2 1 1 1 1
2
i i i i i i
X X c X b X a Y X
0 ) 2 ( ) 2 1 ( 2 ...
) 2 ( ) 2 1 ( 2 ) 2 ( ) 2 1 ( 2
2 2 2 2 1 1 1
+
+ +
n n n n
i
X cX bX a Y
X cX bX a Y X cX bX a Y
0

0 ) 1 ( ) 2 1 ( . ..........
) 1 ( ) 2 1 ( ) 1 ( ) 2 1 (
2 2 2 2 1 1 1 1
+
+ +
n n n n
X cX bX a Y
X cX bX a Y X cX bX a Y
115
lo cual representa la tercera ecuacin normal.
En resumen, para obtener las estimaciones mnimo cuadrticas de a, b y c debemos
resolver simultneamente las ecuaciones normales (1). (2) y (3), es decir,
5.4.2 Ejemplo numrico
Obtengamos las estimaciones mnimo cuadrticas de los parmetros del modelo de
regresin lineal mltiple para las series de valores:
Y 63 61 44 68 90 51 66 81 75 93 61 40
X1 8 7 4 9 12 5 7 10 9 12 8 5
X2 14 15 10 17 23 11 16 19 20 25 12 9
Las sumas de cuadrados y de productos requeridas para el clculo de las estimaciones se
muestran en el CUADRO 5.4.1:

CUADRO 5.4.1
Y X1 X2 (X1)
2
(X2)
2
X1Y X2Y X1X2
63 8 14 64 196 504 882 112
61 7 15 49 225 427 915 105
44 4 10 16 100 176 440 40
68 9 17 81 289 612 1156 153
90 12 23 144 529 1080 2070 276
51 5 11 25 121 255 561 55
0 ) 2 ( ) 2 1 ( . ..........
......... ) 2 ( ) 2 1 ( ) 2 ( ) 2 1 (
2 2 2 2 1 1 1 1
+
+ +
n n n n
X cX bX a Y
X cX bX a Y X cX bX a Y

0 2 2 2 1 2 2
i i i i i i i
X cX X bX a X Y X

+ + ) 3 ( 2 2 1 2 2
2
i i i i i i
X c X X b X a Y X

+ +
2
2 2 1 2 2
i i i i i i
X c X X b X a Y X

+ +
i i i i i i
X X c X b X a Y X 2 1 1 1 1
2

+ +
i i i
X c X b na Y 2 1
116
66 7 16 49 256 462 1056 112
81 10 19 100 361 810 1539 190
75 9 20 81 400 675 1500 180
93 12 25 144 625 1116 2325 300
61 8 12 64 144 488 732 96
40 5 9 25 81 200 360 45
793 96 191 842 3327 6805 13536 1664
Sustituyendo los totales obtenidos en las ecuaciones normales (1), (2) y (3) tendremos el
siguiente sistema de ecuaciones lineales:
12a + 96b + 191c = 793 (1)
96a + 842b + 1664c = 6805 (2)
191a + 1664b + 3327c = 13536 (3)
Eliminemos a de las ecuaciones (1) y (2):
12a + 96b + 191c = 793 x (- 8)
96a + 842b + 1664c = 6805
-96a - 768b 1528c = - 6344
96a + 842b + 1664c = 6805
de donde:
74b + 136c = 461 (4)
Eliminemos a de las ecuaciones (1) y (3):
12a + 96b + 191c = 793 x (- 191)
191a + 1664b + 3327c = 13536 x ( 12 )
-2292a - 18336b 36481c = - 151463
2292a + 19968b + 39924c = 162432
de donde:
1632b + 3443c = 10969 (5)
y simultaneando (4) con (5) tenemos:
74b + 136c = 461 x ( - 1632 )
1632b + 3443c = 10969 x ( 74 )
-120768b 221952c = - 752352
120768b + 254782c = 811706
32830c = 59354 de donde, c = 1.81
Sustituyendo este resultado en (4) tenemos:
117
74b +136 (1.81) = 461
74b = 461 - 246.16 = 214.84 de donde, b = 2.90
y sustituyendo los valores de b y c en (1) tenemos:
12a + 96 (2.90) + 191 (1.81) = 793
12a = 168.98 y a = 14.07
La ecuacin de regresin lineal mltiple mnimo cuadrtica es entonces:
Y = 14.07 + 2.90X1 + 1.81X2
Procedamos a continuacin a realizar la Prueba de Hiptesis Global de los
coeficientes de regresin. Las hiptesis nula y alternativa son:
H
0
:
2
=
3
= 0
H
1
: Los parmetros no son iguales a cero
Para tomar la decisin acerca de la veracidad o no de la hiptesis nula procedamos a
realizar el anlisis de regresin.
Los residuos y sus sumas de cuadrados se presentan en el CUADRO 5.4.2:
CUADRO 5.4.2
63 62.61 0.39 0.1521
61 61.52 -0.52 0.2704
44 43.77 0.23 0.0529
68 70.94 -2.94 8.6436
90 90.50 -0.50 0.2500
51 48.48 2.52 6.3504
66 63.33 2.67 7.1289
81 77.46 3.54 12.5316
75 76.37 -1.37 1.8769
93 94.12 -1.12 1.2544
61 58.99 2.01 4.0401
40 44.86 -4.86 23.6196
0.05 66.1709
Del CUADRO 5.4.2 se concluye que la suma de cuadrados corregida del error del
anlisis de regresin es:
SCC
E
= 66.17
2
^ ^ ^
) ( Y Y Y Y Y Y
118
La suma de cuadrados corregida total viene dada por:
de donde:
La tabla del anlisis de regresin es la que se muestra en el CUADRO 5.4.3:
CUADRO 5.4.3
ANALISIS DE REGRESION
Fuentes de
Variacin G.L. S.C. C.M. F SIGN.
Total 11 3058.92
Regresin 2 2992.75 1496.38 203.59 P<0.001
Error 9 66.17 7.35
En este caso, el error tpico mltiple de la estimacin ser igual a:
Calculemos a continuacin los coeficientes de determinacin y de correlacin mltiples:
Del resultado anterior podemos afirmar que el 98% de la variacin en la variable
dependiente Y est determinado por su relacin lineal mltiple con las variables
independientes X1 y X2.
5.4.3 Pruebas de hiptesis individuales para los coeficientes de regresin.
En prrafos anteriores concluimos mediante una prueba de hiptesis global para los
coeficientes de regresin, que stos eran diferentes de cero, y por tanto, la ecuacin de
regresin lineal mltiple era vlida. Sin embargo, al ser la prueba de tipo global, no
tenemos la certidumbre si ambos coeficientes son realmente diferentes de cero o si uno
solo de ellos fue el causante del rechazo de la hiptesis nula. Para corroborar esto se
hace necesario contrastar de forma individual si los coeficientes son iguales a cero o no.
Si uno de los coeficientes es estadsticamente igual a cero ser necesario entonces
considerar su exclusin de la ecuacin de regresin.
12
) 40 ..... 61 63 (
) 40 ( ...... ) 61 ( ) 63 (
2
2 2 2
+ + +
+ + +
T
SCC
92 . 3058
12
) 793 (
55463
2

T
SCC
75 . 2992 17 . 66 92 . 3058
E T REG
SCC SCC SCC
71 . 2 35 . 7
.
t
X Y
S
98 . 0
92 . 3058
75 . 2992
2
R
99 . 0 98 . 0
2
R r
119
Scheff (1959) report que para una ecuacin de regresin lineal mltiple con dos
variables independientes, las varianzas de los parmetros del modelo viene dada por:
donde:

Resumiendo, los errores tpicos de los coeficientes de regresin pueden ser calculados
mediante las expresiones:
Del CUADRO 5.4.1 tenemos:
de donde:
M
m
b V
WW
2
,
) (

M
m
c V
ZZ
2
,
) (

y m m m M
ZW WW ZZ
2
, , ,
) ( ) ( ) (


E
X X ZW X WW X ZZ
CM
y SPC m SCC m SCC m



2
2 1 , 2 , 1 ,
, ,

2
2 1 2 1
2
) .( .
X X X X
E X
SPC SCC SCC
CM SCC
b T E

2
2 1 2 1
1
) .( .
X X X X
E X
SPC SCC SCC
CM SCC
c T E


3327 ) 2 ( 842 ) 1 ( 191 2 96 1
2 2
X X X X

1664 2 1X X
74 768 842
12
) 96 (
842
2
1

X
SCC
92 . 286 08 . 3040 3327
12
) 191 (
3327
2
2

X
SCC
136 1528 1664
12
) 191 ( ) 96 (
1664
2 1

X X
SPC
120
M = (74)(286.92) (136)
2
= 21232.08 18496 = 2736.08
Del CUADRO 5.4.3, CMe = 7.35, por tanto,
Procedamos a realizar las pruebas de hiptesis individuales.
Para una prueba de dos colas, los valores de los percentiles t de Student para 9 grados de
libertad, reportados en la TABLA 49 del Anexo son:
2.262 para un nivel de significacin del 5%
3.250 para un nivel de significacin del 1%
4.781 para un nivel de significacin del 0.1%
Para el parmetro
2
H
0
:
2
= 0
H
1
:
2
0
y como 3.30 > 3.25 se rechaza la hiptesis nula con un nivel de significacin del 1%.
Para el parmetro
3
H
0
:
3
= 0
H
1
:
3
0
y como 4.02 > 3.25 se rechaza la hiptesis nula con un nivel de significacin del 1%.
Ambos coeficientes de regresin son significativamente diferentes de cero, lo cual
corrobora la validez de la ecuacin de regresin lineal mltiple obtenida.
5.5 Regresin cuadrtica simple
7708 . 0
08 . 2736
86 . 2108
08 . 2736
) 35 . 7 ( ) 92 . 286 (
) ( b V
88 . 0 7708 . 0 ) ( ) .( . t b V b T E
1988 . 0
08 . 2736
9 . 543
08 . 2736
) 35 . 7 ( ) 74 (
) ( c V
45 . 0 1988 . 0 ) ( ) .( . t c V c T E
30 . 3
88 . 0
90 . 2
T
02 . 4
45 . 0
81 . 1
T
121
Para iniciar el estudio de este tipo de regresin consideremos las dos siguientes series de
valores y su correspondiente grfico de dispersin (GRAFICO 5.5.1):
Y 30 24 18 31 21 22 29 24 26 27 28 19
X 5 4 1 6 9 2 4 7 6 9 5 2
GRAFICO 5.5
Como puede apreciarse en el GRAFICO 5.5.1 la lnea de tendencia que se ajusta a los
datos es una expresin cuadrtica de orden 2, cuyo modelo lineal viene expresado por:
Si comparamos este modelo con el correspondiente a una regresin lineal mltiple:
podemos concluir que el modelo (1) es igual al modelo (2) si consideramos:
Obtengamos entonces de esta manera las estimaciones mnimo cuadrticas de los
parmetros del modelo de regresin cuadrtica simple para las series de datos que se
muestran a continuacin:
Las sumas de cuadrados y de productos requeridas para el clculo de las estimaciones se
muestran en el CUADRO 5.5.1:

CUADRO 5.5.1
Y X1 X2 (X1)
2
(X2)
2
X1Y X2Y X1X2
30 5 25 25 625 150 750 125
24 4 16 16 256 96 384 64
18 1 1 1 1 18 18 1
31 6 36 36 1296 186 1116 216
21 9 81 81 6561 189 1701 729
( ) 1
2
3 2 1 i i
e X X Y + + +
0
5
10
15
20
25
30
35
0 5 10
Variable dependienteVariable independiente
GRAFICO DE DISPERSION
) 2 ( 2 1
3 2 1 i i
e X X Y + + +
2
2 1 X X y X X
122
22 2 4 4 16 44 88 8
29 4 16 16 256 116 464 64
24 7 49 49 2401 168 1176 343
26 6 36 36 1296 156 936 216
27 9 81 81 6561 243 2187 729
28 5 25 25 625 140 700 125
19 2 4 4 16 38 76 8
299 60 374 374 19910 1544 9596 2628
Sustituyendo los totales de la tabla anterior en las ecuaciones normales (1), (2) y (3)
obtenidas en el epgrafe 5.4.1 tenemos:
12a + 60b + 374c = 299 (1)
60a + 374b + 2628c = 1544 (2)
374a + 2628b +19910c = 9596 (3)
El lector puede comprobar que simultaneando el sistema de ecuaciones anterior
obtenemos:
a = 12.40
b = 5.37
c = -0.46
y por tanto, la ecuacin de regresin cuadrtica simple es:
Y = 12.40 + 5.37X - 0.46X
2
A continuacin realicemos la Prueba de Hiptesis Global de los coeficientes de
regresin:
H
0
:
2
=
3
= 0
H
1
: Los parmetros no son iguales a cero
Los residuos y sus sumas de cuadrados se presentan en el CUADRO 5.5.2.
CUADRO 5.5.2
30 27.75 2.25 5.0625 900
24 26.52 -2.52 6.3504 576
18 17.31 0.69 0.4761 324
31 28.06 2.94 8.6436 961
21 23.47 -2.47 6.1009 441
22 21.30 0.70 0.4900 484
29 26.52 2.48 6.1504 841
2 2
^ ^ ^
) ( Y Y Y Y Y Y Y
123
24 27.45 -3.45 11.9025 576
26 28.06 -2.06 4.2436 676
27 23.47 3.53 12.4609 729
28 27.75 0.25 0.0625 784
19 21.30 -2.30 5.2900 361
0.04 67.2334 7653
No resultar de mucha complejidad para el lector comprobar que la tabla del anlisis de
regresin es la que se muestra en el CUADRO 5.5.3.
CUADRO 5.5.3
ANALISIS DE REGRESION
Fuentes de
Variacin G.L. S.C. C.M. F SIGN.
Total 11 202.92
Regresin 2 135.69 67.84 9.08 P<0.01
Error 9 67.23 7.47
El error tpico mltiple de la estimacin ser igual a
y los coeficientes de determinacin y de correlacin:
por tanto, el 67% de la variacin en la variable dependiente Y est determinado por su
relacin cuadrtica simple con las variables independientes X y X
2
.
Hallemos el error tpico de los coeficientes de regresin:
Del CUADRO 5.5.1 tenemos:
de donde:
73 . 2 47 . 7
.
t
X Y
S
67 . 0
92 . 202
69 . 135
2
R
82 . 0 67 . 0
2
R r

19910 ) 2 ( 374 ) 1 ( 374 2 60 1
2 2
X X X X

2628 2 1 X X
74 300 374
12
) 60 (
374
2
1

X
SCC
124
Del CUADRO 5.5.3, CM
e
= 7.47, por tanto,
Procedamos a realizar las pruebas de hiptesis individuales.
Para una prueba de dos colas, los valores de los percentiles t de Student para 9 grados de
libertad son, tal y como hicimos referencia anteriormente:
2.262 para un nivel de significacin del 5%
3.250 para un nivel de significacin del 1%
4.781 para un nivel de significacin del 0.1%
Para el parmetro
2
H
0
:
2
= 0
H
1
:
2
0
y como 4.13 > 3.25 se rechaza la hiptesis nula con un nivel de significacin del 1%.
Para el parmetro
3
H
0
:
3
= 0
H
1
:
3
0
y como 3.83 > 3.25 se rechaza la hiptesis nula con un nivel de significacin del 1%.
67 . 8253 33 . 11656 19910
12
) 374 (
19910
2
2

X
SCC
758 1870 2628
12
) 374 ( ) 60 (
2628
2 1

X X
SPC
58 . 36207 ) 758 ( ) 67 . 8253 ( ) 74 (
2
M
7028 . 1
58 . 36207
91 . 61654
58 . 36207
) 47 . 7 ( ) 67 . 8253 (
) ( b V
30 . 1 7028 . 1 ) ( ) .( . t b V b T E
0153 . 0
58 . 36207
78 . 552
58 . 36207
) 47 . 7 ( ) 74 (
) ( c V
12 . 0 0153 . 0 ) ( ) .( . t c V c T E
13 . 4
30 . 1
37 . 5
T
83 . 3
12 . 0
46 . 0

T
125
Los resultados anteriores corroboran la validez de la ecuacin de regresin obtenida ya
que ambos coeficientes de regresin son significativamente diferentes de cero.
126
Tablas Estadsticas
127
TABLA 48 : Percentiles de la distribucin Normal tipificada
TABLA 49 : Percentiles de la distribucin t de Student
TABLA 50 : Percentiles de la distribucin F de Fisher
TABLA 51 : Percentiles de la prueba de rango mltiple de Duncan
TABLA 52 : Percentiles de la distribucin ChiCuadrado
TABLA 53 : Arcoseno de la raz cuadrada de datos expresados en porcentaje
TABLA 54 : Coeficientes de Correlacin
128
TABLA 48 Percentiles de la distribucin Normal tipificada TABLA 48 Percentiles de la distribucin Normal tipificada
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.5 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7518 0.7549
0.7 0.7580 0.7612 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3.0 0.9986 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990
3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995
3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998 0.9998
3.5 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998
3.6 0.9998 0.9998 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.7 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.8 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 1 1 1
129
TABLA 49 Percentiles de la distribucin t de Student
Prueba de 2 Colas Prueba de 2 Colas 0.5 0.4 0.3 0.2 0.1 0.05 0.02 0.01 0.001
Prueba de1 Cola 0.25 0.2 0.15 0.10 0.05 0.025 0.01 0.005 0.0005
G.L.
1 1.000 1.376 1.963 3.078 6.314 12.706 31.821 63.657 636.619
2 0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925 31.598
3 0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841 12.941
4 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604 8.610
5 0.727 0.920 1.156 1.476 2.015 2.571 3.365 4.032 6.869
6 0.718 0.906 1.134 1.440 1.943 2.447 3.143 3.707 5.959
7 0.711 0.896 1.119 1.415 1.895 2.365 2.998 3.499 5.405
8 0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355 5.041
9 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250 4.781
10 0.700 0.879 1.093 1.371 1.812 2.228 2.764 3.169 4.587
11 0.697 0.876 1.088 1.363 1.796 2.201 2.718 3.106 4.437
12 0.695 0.873 1.083 1.356 1.782 2.179 2.681 3.055 4.318
13 0.694 0.870 1.079 1.350 1.771 2.160 2.650 3.012 4.221
14 0.692 0.868 1.076 1.345 1.761 2.145 2.624 2.977 4.140
15 0.691 0.866 1.074 1.341 1.753 2.131 2.602 2.947 4.073
16 0.690 0.865 1.071 1.337 1.746 2.120 2.583 2.921 4.015
17 0.689 0.863 1.069 1.333 1.740 2.110 2.567 2.898 3.965
18 0.688 0.862 1.067 1.330 1.734 2.101 2.552 2.878 3.922
19 0.688 0.861 1.066 1.328 1.729 2.093 2.539 2.861 3.833
20 0.687 0.860 1.064 1.325 1.725 2.086 2.528 2.845 3.850
21 0.686 0.859 1.063 1.323 1.721 2.080 2.518 2.831 3.819
22 0.686 0.858 1.061 1.321 1.717 2.074 2.508 2.819 3.792
23 0.685 0.858 1.060 1.319 1.714 2.069 2.500 2.807 3.767
24 0.685 0.857 1.059 1.318 1.711 2.064 2.492 2.797 3.745
25 0.684 0.856 1.058 1.316 1.708 2.060 2.485 2.787 3.725
26 0.684 0.856 1.058 1.315 1.706 2.056 2.479 2.779 3.707
27 0.684 0.855 1.057 1.314 1.703 2.052 2.473 2.771 3.690
28 0.683 0.855 1.056 1.313 1.701 2.048 2.467 2.763 3.674
29 0.683 0.854 1.055 1.311 1.699 2.045 2.462 2.756 3.659
30 0.683 0.854 1.055 1.310 1.697 2.042 2.457 2.750 3.646
40 0.681 0.851 1.050 1.303 1.684 2.021 2.423 2.704 3.551
60 0.679 0.848 1.046 1.296 1.671 2.000 2.390 2.660 3.460
120 0.677 0.845 1.041 1.289 1.658 1.980 2.358 2.617 3.373
0.674 0.842 1.936 1.282 1.645 1.960 2.326 2.576 3.291
130
TABLA 50 Percentiles de la distribucin F de Fisher
G.L. G.L. DEL NUMERADOR
ERROR 1 2 3 4 5 6 7 8 9
0.100 39.86 49.50 53.59 55.83 57.24 58.20 58.91 59.44 59.86
0.050 161.45 199.50 215.71 224.58 230.16 233.99 236.77 238.88 240.54
1 0.025 647.79 799.48 864.15 899.60 921.83 937.11 948.20 956.64 963.28
0.010 4052.18 4999.34 5403.53 5624.26 5763.96 5858.95 5928.33 5980.95 6022.40
0.005 16212.46 19997.36 21614.13 22500.75 23055.82 23439.53 23715.20 23923.81 24091.45
0.001 405311.58 499725.34 540256.50 562667.85 576496.12 586032.87 593185.42 597953.80 602245.33
0.100 8.53 9.00 9.16 9.24 9.29 9.33 9.35 9.37 9.38
0.050 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38
2 0.025 38.51 39.00 39.17 39.25 39.30 39.33 39.36 39.37 39.39
0.010 98.50 99.00 99.16 99.25 99.30 99.33 99.36 99.38 99.39
0.005 198.50 199.01 199.16 199.24 199.30 199.33 199.36 199.38 199.39
0.001 998.38 998.84 999.31 999.31 999.31 999.31 999.31 999.31 999.31
0.100 5.54 5.46 5.39 5.34 5.31 5.28 5.27 5.25 5.24
0.050 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81
3 0.025 17.44 16.04 15.44 15.10 14.88 14.73 14.62 14.54 14.47
0.010 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.34
0.005 55.55 49.80 47.47 46.20 45.39 44.84 44.43 44.13 43.88
0.001 167.06 148.49 141.10 137.08 134.58 132.83 131.61 130.62 129.86
0.100 4.54 4.32 4.19 4.11 4.05 4.01 3.98 3.95 3.94
0.050 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00
4 0.025 12.22 10.65 9.98 9.60 9.36 9.20 9.07 8.98 8.90
0.010 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66
0.005 31.33 26.28 24.26 23.15 22.46 21.98 21.62 21.35 21.14
0.001 74.13 61.25 56.17 53.43 51.72 50.52 49.65 49.00 48.47
0.100 4.06 3.78 3.62 3.52 3.45 3.40 3.37 3.34 3.32
0.050 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77
5 0.025 10.01 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6.68
0.010 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16
0.005 22.78 18.31 16.53 15.56 14.94 14.51 14.20 13.96 13.77
0.001 47.18 37.12 33.20 31.08 29.75 28.83 28.17 27.65 27.24
0.100 3.78 3.46 3.29 3.18 3.11 3.05 3.01 2.98 2.96
0.050 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10
6 0.025 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60 5.52
0.010 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98
0.005 18.63 14.54 12.92 12.03 11.46 11.07 10.79 10.57 10.39
0.001 35.51 27.00 23.71 21.92 20.80 20.03 19.46 19.03 18.69
0.100 3.59 3.26 3.07 2.96 2.88 2.83 2.78 2.75 2.72
0.050 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68
7 0.025 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90 4.82
0.010 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72
0.005 16.24 12.40 10.88 10.05 9.52 9.16 8.89 8.68 8.51
0.001 29.25 21.69 18.77 17.20 16.21 15.52 15.02 14.63 14.33
TABLA 50 Percentiles de la distribucin F de Fisher
G.L. G.L. DEL NUMERADOR
ERROR 1 2 3 4 5 6 7 8 9
131
0.100 3.46 3.11 2.92 2.81 2.73 2.67 2.62 2.59 2.56
0.050 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39
8 0.025 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 4.36
0.010 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91
0.005 14.69 11.04 9.60 8.81 8.30 7.95 7.69 7.50 7.34
0.001 25.41 18.49 15.83 14.39 13.48 12.86 12.40 12.05 11.77
0.100 3.36 3.01 2.81 2.69 2.61 2.55 2.51 2.47 2.44
0.050 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18
9 0.025 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03
0.010 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35
0.005 13.61 10.11 8.72 7.96 7.47 7.13 6.88 6.69 6.54
0.001 22.86 16.39 13.90 12.56 11.71 11.13 10.70 10.37 10.11
0.100 3.29 2.92 2.73 2.61 2.52 2.46 2.41 2.38 2.35
0.050 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02
10 0.025 6.94 5.46 4.83 4.47 4.24 4.07 3.95 3.85 3.78
0.010 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94
0.005 12.83 9.43 8.08 7.34 6.87 6.54 6.30 6.12 5.97
0.001 21.04 14.90 12.55 11.28 10.48 9.93 9.52 9.20 8.96
0.100 3.23 2.86 2.66 2.54 2.45 2.39 2.34 2.30 2.27
0.050 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90
11 0.025 6.72 5.26 4.63 4.28 4.04 3.88 3.76 3.66 3.59
0.010 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63
0.005 12.23 8.91 7.60 6.88 6.42 6.10 5.86 5.68 5.54
0.001 19.69 13.81 11.56 10.35 9.58 9.05 8.65 8.35 8.12
0.100 3.18 2.81 2.61 2.48 2.39 2.33 2.28 2.24 2.21
0.050 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80
12 0.025 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44
0.010 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39
0.005 11.75 8.51 7.23 6.52 6.07 5.76 5.52 5.35 5.20
0.001 18.64 12.97 10.80 9.63 8.89 8.38 8.00 7.71 7.48
0.100 3.14 2.76 2.56 2.43 2.35 2.28 2.23 2.20 2.16
0.050 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71
13 0.025 6.41 4.97 4.35 4.00 3.77 3.60 3.48 3.39 3.31
0.010 9.07 6.70 5.74 5.21 4.86 4.62 4.44 4.30 4.19
0.005 11.37 8.19 6.93 6.23 5.79 5.48 5.25 5.08 4.94
0.001 17.82 12.31 10.21 9.07 8.35 7.86 7.49 7.21 6.98
0.100 3.10 2.73 2.52 2.39 2.31 2.24 2.19 2.15 2.12
0.050 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65
14 0.025 6.30 4.86 4.24 3.89 3.66 3.50 3.38 3.29 3.21
0.010 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03
0.005 11.06 7.92 6.68 6.00 5.56 5.26 5.03 4.86 4.72
0.001 17.14 11.78 9.73 8.62 7.92 7.44 7.08 6.80 6.58
132
TABLA 50 Percentiles de la distribucin F de Fisher
G.L. G.L. DEL NUMERADOR
ERROR 1 2 3 4 5 6 7 8 9
0.100 3.07 2.70 2.49 2.36 2.27 2.21 2.16 2.12 2.09
0.050 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59
15 0.025 6.20 4.77 4.15 3.80 3.58 3.41 3.29 3.20 3.12
0.010 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89
0.005 10.80 7.70 6.48 5.80 5.37 5.07 4.85 4.67 4.54
0.001 16.59 11.34 9.34 8.25 7.57 7.09 6.74 6.47 6.26
0.100 3.05 2.67 2.46 2.33 2.24 2.18 2.13 2.09 2.06
0.050 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54
16 0.025 6.12 4.69 4.08 3.73 3.50 3.34 3.22 3.12 3.05
0.010 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78
0.005 10.58 7.51 6.30 5.64 5.21 4.91 4.69 4.52 4.38
0.001 16.12 10.97 9.01 7.94 7.27 6.80 6.46 6.20 5.98
0.100 3.03 2.64 2.44 2.31 2.22 2.15 2.10 2.06 2.03
0.050 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49
17 0.025 6.04 4.62 4.01 3.66 3.44 3.28 3.16 3.06 2.98
0.010 8.40 6.11 5.19 4.67 4.34 4.10 3.93 3.79 3.68
0.005 10.38 7.35 6.16 5.50 5.07 4.78 4.56 4.39 4.25
0.001 15.72 10.66 8.73 7.68 7.02 6.56 6.22 5.96 5.75
0.100 3.01 2.62 2.42 2.29 2.20 2.13 2.08 2.04 2.00
0.050 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46
18 0.025 5.98 4.56 3.95 3.61 3.38 3.22 3.10 3.01 2.93
0.010 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60
0.005 10.22 7.21 6.03 5.37 4.96 4.66 4.44 4.28 4.14
0.001 15.38 10.39 8.49 7.46 6.81 6.35 6.02 5.76 5.56
0.100 2.99 2.61 2.40 2.27 2.18 2.11 2.06 2.02 1.98
0.050 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42
19 0.025 5.92 4.51 3.90 3.56 3.33 3.17 3.05 2.96 2.88
0.010 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52
0.005 10.07 7.09 5.92 5.27 4.85 4.56 4.34 4.18 4.04
0.001 15.08 10.16 8.28 7.27 6.62 6.18 5.85 5.59 5.39
0.100 2.97 2.59 2.38 2.25 2.16 2.09 2.04 2.00 1.96
0.050 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39
20 0.025 5.87 4.46 3.86 3.51 3.29 3.13 3.01 2.91 2.84
0.010 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46
0.005 9.94 6.99 5.82 5.17 4.76 4.47 4.26 4.09 3.96
0.001 14.82 9.95 8.10 7.10 6.46 6.02 5.69 5.44 5.24
0.100 2.96 2.57 2.36 2.23 2.14 2.08 2.02 1.98 1.95
0.050 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37
21 0.025 5.83 4.42 3.82 3.48 3.25 3.09 2.97 2.87 2.80
0.010 8.02 5.78 4.87 4.37 4.04 3.81 3.64 3.51 3.40
0.005 9.83 6.89 5.73 5.09 4.68 4.39 4.18 4.01 3.88
0.001 14.59 9.77 7.94 6.95 6.32 5.88 5.56 5.31 5.11
133
TABLA 50 Percentiles de la distribucin F de Fisher
G.L. G.L. DEL NUMERADOR
ERROR 1 2 3 4 5 6 7 8 9
0.100 2.95 2.56 2.35 2.22 2.13 2.06 2.01 1.97 1.93
0.050 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34
22 0.025 5.79 4.38 3.78 3.44 3.22 3.05 2.93 2.84 2.76
0.010 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35
0.005 9.73 6.81 5.65 5.02 4.61 4.32 4.11 3.94 3.81
0.001 14.38 9.61 7.80 6.81 6.19 5.76 5.44 5.19 4.99
0.100 2.94 2.55 2.34 2.21 2.11 2.05 1.99 1.95 1.92
0.050 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37 2.32
23 0.025 5.75 4.35 3.75 3.41 3.18 3.02 2.90 2.81 2.73
0.010 7.88 5.66 4.76 4.26 3.94 3.71 3.54 3.41 3.30
0.005 9.63 6.73 5.58 4.95 4.54 4.26 4.05 3.88 3.75
0.001 14.20 9.47 7.67 6.70 6.08 5.65 5.33 5.09 4.89
0.100 2.93 2.54 2.33 2.19 2.10 2.04 1.98 1.94 1.91
0.050 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30
24 0.025 5.72 4.32 3.72 3.38 3.15 2.99 2.87 2.78 2.70
0.010 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26
0.005 9.55 6.66 5.52 4.89 4.49 4.20 3.99 3.83 3.69
0.001 14.03 9.34 7.55 6.59 5.98 5.55 5.24 4.99 4.80
0.100 2.92 2.53 2.32 2.18 2.09 2.02 1.97 1.93 1.89
0.050 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28
25 0.025 5.69 4.29 3.69 3.35 3.13 2.97 2.85 2.75 2.68
0.010 7.77 5.57 4.68 4.18 3.85 3.63 3.46 3.32 3.22
0.005 9.48 6.60 5.46 4.84 4.43 4.15 3.94 3.78 3.64
0.001 13.88 9.22 7.45 6.49 5.89 5.46 5.15 4.91 4.71
0.100 2.91 2.52 2.31 2.17 2.08 2.01 1.96 1.92 1.88
0.050 4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27
26 0.025 5.66 4.27 3.67 3.33 3.10 2.94 2.82 2.73 2.65
0.010 7.72 5.53 4.64 4.14 3.82 3.59 3.42 3.29 3.18
0.005 9.41 6.54 5.41 4.79 4.38 4.10 3.89 3.73 3.60
0.001 13.74 9.12 7.36 6.41 5.80 5.38 5.07 4.83 4.64
0.100 2.90 2.51 2.30 2.17 2.07 2.00 1.95 1.91 1.87
0.050 4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.31 2.25
27 0.025 5.63 4.24 3.65 3.31 3.08 2.92 2.80 2.71 2.63
0.010 7.68 5.49 4.60 4.11 3.78 3.56 3.39 3.26 3.15
0.005 9.34 6.49 5.36 4.74 4.34 4.06 3.85 3.69 3.56
0.001 13.61 9.02 7.27 6.33 5.73 5.31 5.00 4.76 4.57
0.100 2.89 2.50 2.29 2.16 2.06 2.00 1.94 1.90 1.87
0.050 4.20 3.34 2.95 2.71 2.56 2.45 2.36 2.29 2.24
28 0.025 5.61 4.22 3.63 3.29 3.06 2.90 2.78 2.69 2.61
0.010 7.64 5.45 4.57 4.07 3.75 3.53 3.36 3.23 3.12
0.005 9.28 6.44 5.32 4.70 4.30 4.02 3.81 3.65 3.52
0.001 13.50 8.93 7.19 6.25 5.66 5.24 4.93 4.69 4.50
134
TABLA 50 Percentiles de la distribucin F de Fisher
G.L.
ERROR 1 2 3 4 5 6 7 8 9
0.100 2.89 2.50 2.28 2.15 2.06 1.99 1.93 1.89 1.86
0.050 4.18 3.33 2.93 2.70 2.55 2.43 2.35 2.28 2.22
29 0.025 5.59 4.20 3.61 3.27 3.04 2.88 2.76 2.67 2.59
0.010 7.60 5.42 4.54 4.04 3.73 3.50 3.33 3.20 3.09
0.005 9.23 6.40 5.28 4.66 4.26 3.98 3.77 3.61 3.48
0.001 13.39 8.85 7.12 6.19 5.59 5.18 4.87 4.64 4.45
0.100 2.88 2.49 2.28 2.14 2.05 1.98 1.93 1.88 1.85
0.050 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21
30 0.025 5.57 4.18 3.59 3.25 3.03 2.87 2.75 2.65 2.57
0.010 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07
0.005 9.18 6.35 5.24 4.62 4.23 3.95 3.74 3.58 3.45
0.001 13.29 8.77 7.05 6.12 5.53 5.12 4.82 4.58 4.39
0.100 2.84 2.44 2.23 2.09 2.00 1.93 1.87 1.83 1.79
0.050 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12
40 0.025 5.42 4.05 3.46 3.13 2.90 2.74 2.62 2.53 2.45
0.010 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89
0.005 8.83 6.07 4.98 4.37 3.99 3.71 3.51 3.35 3.22
0.001 12.61 8.25 6.59 5.70 5.13 4.73 4.44 4.21 4.02
0.100 2.79 2.39 2.18 2.04 1.95 1.87 1.82 1.77 1.74
0.050 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04
60 0.025 5.29 3.93 3.34 3.01 2.79 2.63 2.51 2.41 2.33
0.010 7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72
0.005 8.49 5.79 4.73 4.14 3.76 3.49 3.29 3.13 3.01
0.001 11.97 7.77 6.17 5.31 4.76 4.37 4.09 3.86 3.69
0.100 2.75 2.35 2.13 1.99 1.90 1.82 1.77 1.72 1.68
0.050 3.92 3.07 2.68 2.45 2.29 2.18 2.09 2.02 1.96
120 0.025 5.15 3.80 3.23 2.89 2.67 2.52 2.39 2.30 2.22
0.010 6.85 4.79 3.95 3.48 3.17 2.96 2.79 2.66 2.56
0.005 8.18 5.54 4.50 3.92 3.55 3.28 3.09 2.93 2.81
0.001 11.38 7.32 5.78 4.95 4.42 4.04 3.77 3.55 3.38
0.100 2.71 2.30 2.08 1.94 1.85 1.77 1.72 1.67 1.63
0.050 3.84 3.00 2.60 2.37 2.21 2.10 2.01 1.94 1.88
0.025 5.02 3.69 3.12 2.79 2.57 2.41 2.29 2.19 2.11
0.010 6.63 4.61 3.78 3.32 3.02 2.80 2.64 2.51 2.41
0.005 7.88 5.30 4.28 3.72 3.35 3.09 2.90 2.74 2.62
0.001 10.83 6.91 5.42 4.62 4.10 3.74 3.47 3.27 3.10
135
TABLA 50 Percentiles de la distribucin F de Fisher
G.L. G.L. DEL NUMERADOR
ERROR 10 12 15 20 24 30 40 60 120
0.100 60.19 60.71 61.22 61.74 62.00 62.26 62.53 62.79 63.06 63.33
0.050 241.88 243.90 245.95 248.02 249.05 250.10 251.14 252.20 253.25 254.32
1 0.025 968.63 976.72 984.87 993.08 997.27 1001.40 1005.60 1009.79 1014.04 1018.26
0.010 6055.93 6106.68 6156.97 6208.66 6234.27 6260.35 6286.43 6312.97 6339.51 6365.59
0.005 24221.84 24426.73 24631.62 24836.51 24937.09 25041.40 25145.71 25253.74 25358.05 25466.08
0.001 605583.19 610351.56 616073.61 620841.98 623703.00 626087.19 628471.37 631332.40 634193.42 636577.61
0.100 9.39 9.41 9.42 9.44 9.45 9.46 9.47 9.47 9.48 9.49
0.050 19.40 19.41 19.43 19.45 19.45 19.46 19.47 19.48 19.49 19.50
2 0.025 39.40 39.41 39.43 39.45 39.46 39.46 39.47 39.48 39.49 39.50
0.010 99.40 99.42 99.43 99.45 99.46 99.47 99.48 99.48 99.49 99.50
0.005 199.39 199.42 199.43 199.45 199.45 199.48 199.48 199.48 199.49 199.51
0.001 999.31 999.31 999.31 999.31 999.31 999.31 999.31 999.31 999.31 999.31
0.100 5.23 5.22 5.20 5.18 5.18 5.17 5.16 5.15 5.14 5.13
0.050 8.79 8.74 8.70 8.66 8.64 8.62 8.59 8.57 8.55 8.53
3 0.025 14.42 14.34 14.25 14.17 14.12 14.08 14.04 13.99 13.95 13.90
0.010 27.23 27.05 26.87 26.69 26.60 26.50 26.41 26.32 26.22 26.13
0.005 43.68 43.39 43.08 42.78 42.62 42.47 42.31 42.15 41.99 41.83
0.001 129.22 128.32 127.36 126.43 125.93 125.44 124.97 124.45 123.98 123.46
0.100 3.92 3.90 3.87 3.84 3.83 3.82 3.80 3.79 3.78 3.76
0.050 5.96 5.91 5.86 5.80 5.77 5.75 5.72 5.69 5.66 5.63
4 0.025 8.84 8.75 8.66 8.56 8.51 8.46 8.41 8.36 8.31 8.26
0.010 14.55 14.37 14.20 14.02 13.93 13.84 13.75 13.65 13.56 13.46
0.005 20.97 20.70 20.44 20.17 20.03 19.89 19.75 19.61 19.47 19.32
0.001 48.05 47.41 46.76 46.10 45.77 45.43 45.08 44.75 44.40 44.05
0.100 3.30 3.27 3.24 3.21 3.19 3.17 3.16 3.14 3.12 3.11
0.050 4.74 4.68 4.62 4.56 4.53 4.50 4.46 4.43 4.40 4.37
5 0.025 6.62 6.52 6.43 6.33 6.28 6.23 6.18 6.12 6.07 6.02
0.010 10.05 9.89 9.72 9.55 9.47 9.38 9.29 9.20 9.11 9.02
0.005 13.62 13.38 13.15 12.90 12.78 12.66 12.53 12.40 12.27 12.14
0.001 26.91 26.42 25.91 25.39 25.13 24.87 24.60 24.33 24.06 23.79
0.100 2.94 2.90 2.87 2.84 2.82 2.80 2.78 2.76 2.74 2.72
0.050 4.06 4.00 3.94 3.87 3.84 3.81 3.77 3.74 3.70 3.67
6 0.025 5.46 5.37 5.27 5.17 5.12 5.07 5.01 4.96 4.90 4.85
0.010 7.87 7.72 7.56 7.40 7.31 7.23 7.14 7.06 6.97 6.88
0.005 10.25 10.03 9.81 9.59 9.47 9.36 9.24 9.12 9.00 8.88
0.001 18.41 17.99 17.56 17.12 16.90 16.67 16.44 16.21 15.98 15.75
0.100 2.70 2.67 2.63 2.59 2.58 2.56 2.54 2.51 2.49 2.47
0.050 3.64 3.57 3.51 3.44 3.41 3.38 3.34 3.30 3.27 3.23
7 0.025 4.76 4.67 4.57 4.47 4.41 4.36 4.31 4.25 4.20 4.14
0.010 6.62 6.47 6.31 6.16 6.07 5.99 5.91 5.82 5.74 5.65
0.005 8.38 8.18 7.97 7.75 7.64 7.53 7.42 7.31 7.19 7.08
0.001 14.08 13.71 13.32 12.93 12.73 12.53 12.33 12.12 11.91 11.70
136
TABLA 50 Percentiles de la distribucin F de Fisher
G.L. G.L. DEL NUMERADOR
ERROR 10 12 15 20 24 30 40 60 120
0.100 2.54 2.50 2.46 2.42 2.40 2.38 2.36 2.34 2.32 2.29
0.050 3.35 3.28 3.22 3.15 3.12 3.08 3.04 3.01 2.97 2.93
8 0.025 4.30 4.20 4.10 4.00 3.95 3.89 3.84 3.78 3.73 3.67
0.010 5.81 5.67 5.52 5.36 5.28 5.20 5.12 5.03 4.95 4.86
0.005 7.21 7.01 6.81 6.61 6.50 6.40 6.29 6.18 6.06 5.95
0.001 11.54 11.19 10.84 10.48 10.30 10.11 9.92 9.73 9.53 9.33
0.100 2.42 2.38 2.34 2.30 2.28 2.25 2.23 2.21 2.18 2.16
0.050 3.14 3.07 3.01 2.94 2.90 2.86 2.83 2.79 2.75 2.71
9 0.025 3.96 3.87 3.77 3.67 3.61 3.56 3.51 3.45 3.39 3.33
0.010 5.26 5.11 4.96 4.81 4.73 4.65 4.57 4.48 4.40 4.31
0.005 6.42 6.23 6.03 5.83 5.73 5.62 5.52 5.41 5.30 5.19
0.001 9.89 9.57 9.24 8.90 8.72 8.55 8.37 8.19 8.00 7.81
0.100 2.32 2.28 2.24 2.20 2.18 2.16 2.13 2.11 2.08 2.06
0.050 2.98 2.91 2.85 2.77 2.74 2.70 2.66 2.62 2.58 2.54
10 0.025 3.72 3.62 3.52 3.42 3.37 3.31 3.26 3.20 3.14 3.08
0.010 4.85 4.71 4.56 4.41 4.33 4.25 4.17 4.08 4.00 3.91
0.005 5.85 5.66 5.47 5.27 5.17 5.07 4.97 4.86 4.75 4.64
0.001 8.75 8.45 8.13 7.80 7.64 7.47 7.30 7.12 6.94 6.76
0.100 2.25 2.21 2.17 2.12 2.10 2.08 2.05 2.03 2.00 1.97
0.050 2.85 2.79 2.72 2.65 2.61 2.57 2.53 2.49 2.45 2.40
11 0.025 3.53 3.43 3.33 3.23 3.17 3.12 3.06 3.00 2.94 2.88
0.010 4.54 4.40 4.25 4.10 4.02 3.94 3.86 3.78 3.69 3.60
0.005 5.42 5.24 5.05 4.86 4.76 4.65 4.55 4.45 4.34 4.23
0.001 7.92 7.63 7.32 7.01 6.85 6.68 6.52 6.35 6.18 6.00
0.100 2.19 2.15 2.10 2.06 2.04 2.01 1.99 1.96 1.93 1.90
0.050 2.75 2.69 2.62 2.54 2.51 2.47 2.43 2.38 2.34 2.30
12 0.025 3.37 3.28 3.18 3.07 3.02 2.96 2.91 2.85 2.79 2.72
0.010 4.30 4.16 4.01 3.86 3.78 3.70 3.62 3.54 3.45 3.36
0.005 5.09 4.91 4.72 4.53 4.43 4.33 4.23 4.12 4.01 3.90
0.001 7.29 7.00 6.71 6.40 6.25 6.09 5.93 5.76 5.59 5.42
0.100 2.14 2.10 2.05 2.01 1.98 1.96 1.93 1.90 1.88 1.85
0.050 2.67 2.60 2.53 2.46 2.42 2.38 2.34 2.30 2.25 2.21
13 0.025 3.25 3.15 3.05 2.95 2.89 2.84 2.78 2.72 2.66 2.60
0.010 4.10 3.96 3.82 3.66 3.59 3.51 3.43 3.34 3.25 3.17
0.005 4.82 4.64 4.46 4.27 4.17 4.07 3.97 3.87 3.76 3.65
0.001 6.80 6.52 6.23 5.93 5.78 5.63 5.47 5.30 5.14 4.97
0.100 2.10 2.05 2.01 1.96 1.94 1.91 1.89 1.86 1.83 1.80
0.050 2.60 2.53 2.46 2.39 2.35 2.31 2.27 2.22 2.18 2.13
14 0.025 3.15 3.05 2.95 2.84 2.79 2.73 2.67 2.61 2.55 2.49
0.010 3.94 3.80 3.66 3.51 3.43 3.35 3.27 3.18 3.09 3.00
0.005 4.60 4.43 4.25 4.06 3.96 3.86 3.76 3.66 3.55 3.44
0.001 6.40 6.13 5.85 5.56 5.41 5.25 5.10 4.94 4.77 4.60
137
TABLA 50 Percentiles de la distribucin F de Fisher
G.L. G.L. DEL NUMERADOR
ERROR 10 12 15 20 24 30 40 60 120
0.100 2.06 2.02 1.97 1.92 1.90 1.87 1.85 1.82 1.79 1.76
0.050 2.54 2.48 2.40 2.33 2.29 2.25 2.20 2.16 2.11 2.07
15 0.025 3.06 2.96 2.86 2.76 2.70 2.64 2.59 2.52 2.46 2.40
0.010 3.80 3.67 3.52 3.37 3.29 3.21 3.13 3.05 2.96 2.87
0.005 4.42 4.25 4.07 3.88 3.79 3.69 3.59 3.48 3.37 3.26
0.001 6.08 5.81 5.54 5.25 5.10 4.95 4.80 4.64 4.48 4.31
0.100 2.03 1.99 1.94 1.89 1.87 1.84 1.81 1.78 1.75 1.72
0.050 2.49 2.42 2.35 2.28 2.24 2.19 2.15 2.11 2.06 2.01
16 0.025 2.99 2.89 2.79 2.68 2.63 2.57 2.51 2.45 2.38 2.32
0.010 3.69 3.55 3.41 3.26 3.18 3.10 3.02 2.93 2.84 2.75
0.005 4.27 4.10 3.92 3.73 3.64 3.54 3.44 3.33 3.22 3.11
0.001 5.81 5.55 5.27 4.99 4.85 4.70 4.54 4.39 4.23 4.06
0.100 2.00 1.96 1.91 1.86 1.84 1.81 1.78 1.75 1.72 1.69
0.050 2.45 2.38 2.31 2.23 2.19 2.15 2.10 2.06 2.01 1.96
17 0.025 2.92 2.82 2.72 2.62 2.56 2.50 2.44 2.38 2.32 2.25
0.010 3.59 3.46 3.31 3.16 3.08 3.00 2.92 2.83 2.75 2.65
0.005 4.14 3.97 3.79 3.61 3.51 3.41 3.31 3.21 3.10 2.98
0.001 5.58 5.32 5.05 4.78 4.63 4.48 4.33 4.18 4.02 3.85
0.100 1.98 1.93 1.89 1.84 1.81 1.78 1.75 1.72 1.69 1.66
0.050 2.41 2.34 2.27 2.19 2.15 2.11 2.06 2.02 1.97 1.92
18 0.025 2.87 2.77 2.67 2.56 2.50 2.44 2.38 2.32 2.26 2.19
0.010 3.51 3.37 3.23 3.08 3.00 2.92 2.84 2.75 2.66 2.57
0.005 4.03 3.86 3.68 3.50 3.40 3.30 3.20 3.10 2.99 2.87
0.001 5.39 5.13 4.87 4.59 4.45 4.30 4.15 4.00 3.84 3.67
0.100 1.96 1.91 1.86 1.81 1.79 1.76 1.73 1.70 1.67 1.63
0.050 2.38 2.31 2.23 2.16 2.11 2.07 2.03 1.98 1.93 1.88
19 0.025 2.82 2.72 2.62 2.51 2.45 2.39 2.33 2.27 2.20 2.13
0.010 3.43 3.30 3.15 3.00 2.92 2.84 2.76 2.67 2.58 2.49
0.005 3.93 3.76 3.59 3.40 3.31 3.21 3.11 3.00 2.89 2.78
0.001 5.22 4.97 4.70 4.43 4.29 4.14 3.99 3.84 3.68 3.51
0.100 1.94 1.89 1.84 1.79 1.77 1.74 1.71 1.68 1.64 1.61
0.050 2.35 2.28 2.20 2.12 2.08 2.04 1.99 1.95 1.90 1.84
20 0.025 2.77 2.68 2.57 2.46 2.41 2.35 2.29 2.22 2.16 2.09
0.010 3.37 3.23 3.09 2.94 2.86 2.78 2.69 2.61 2.52 2.42
0.005 3.85 3.68 3.50 3.32 3.22 3.12 3.02 2.92 2.81 2.69
0.001 5.08 4.82 4.56 4.29 4.15 4.00 3.86 3.70 3.54 3.38
0.100 1.92 1.87 1.83 1.78 1.75 1.72 1.69 1.66 1.62 1.59
0.050 2.32 2.25 2.18 2.10 2.05 2.01 1.96 1.92 1.87 1.81
21 0.025 2.73 2.64 2.53 2.42 2.37 2.31 2.25 2.18 2.11 2.04
0.010 3.31 3.17 3.03 2.88 2.80 2.72 2.64 2.55 2.46 2.36
0.005 3.77 3.60 3.43 3.24 3.15 3.05 2.95 2.84 2.73 2.61
0.001 4.95 4.70 4.44 4.17 4.03 3.88 3.74 3.58 3.42 3.26
138
TABLA 50 Percentiles de la distribucin F de Fisher
G.L. G.L. DEL NUMERADOR
ERROR 10 12 15 20 24 30 40 60 120
0.100 1.90 1.86 1.81 1.76 1.73 1.70 1.67 1.64 1.60 1.57
0.050 2.30 2.23 2.15 2.07 2.03 1.98 1.94 1.89 1.84 1.78
22 0.025 2.70 2.60 2.50 2.39 2.33 2.27 2.21 2.14 2.08 2.00
0.010 3.26 3.12 2.98 2.83 2.75 2.67 2.58 2.50 2.40 2.31
0.005 3.70 3.54 3.36 3.18 3.08 2.98 2.88 2.77 2.66 2.55
0.001 4.83 4.58 4.33 4.06 3.92 3.78 3.63 3.48 3.32 3.15
0.100 1.89 1.84 1.80 1.74 1.72 1.69 1.66 1.62 1.59 1.55
0.050 2.27 2.20 2.13 2.05 2.01 1.96 1.91 1.86 1.81 1.76
23 0.025 2.67 2.57 2.47 2.36 2.30 2.24 2.18 2.11 2.04 1.97
0.010 3.21 3.07 2.93 2.78 2.70 2.62 2.54 2.45 2.35 2.26
0.005 3.64 3.47 3.30 3.12 3.02 2.92 2.82 2.71 2.60 2.48
0.001 4.73 4.48 4.23 3.96 3.82 3.68 3.53 3.38 3.22 3.05
0.100 1.88 1.83 1.78 1.73 1.70 1.67 1.64 1.61 1.57 1.53
0.050 2.25 2.18 2.11 2.03 1.98 1.94 1.89 1.84 1.79 1.73
24 0.025 2.64 2.54 2.44 2.33 2.27 2.21 2.15 2.08 2.01 1.94
0.010 3.17 3.03 2.89 2.74 2.66 2.58 2.49 2.40 2.31 2.21
0.005 3.59 3.42 3.25 3.06 2.97 2.87 2.77 2.66 2.55 2.43
0.001 4.64 4.39 4.14 3.87 3.74 3.59 3.45 3.29 3.14 2.97
0.100 1.87 1.82 1.77 1.72 1.69 1.66 1.63 1.59 1.56 1.52
0.050 2.24 2.16 2.09 2.01 1.96 1.92 1.87 1.82 1.77 1.71
25 0.025 2.61 2.51 2.41 2.30 2.24 2.18 2.12 2.05 1.98 1.91
0.010 3.13 2.99 2.85 2.70 2.62 2.54 2.45 2.36 2.27 2.17
0.005 3.54 3.37 3.20 3.01 2.92 2.82 2.72 2.61 2.50 2.38
0.001 4.56 4.31 4.06 3.79 3.66 3.52 3.37 3.22 3.06 2.89
0.100 1.86 1.81 1.76 1.71 1.68 1.65 1.61 1.58 1.54 1.50
0.050 2.22 2.15 2.07 1.99 1.95 1.90 1.85 1.80 1.75 1.69
26 0.025 2.59 2.49 2.39 2.28 2.22 2.16 2.09 2.03 1.95 1.88
0.010 3.09 2.96 2.81 2.66 2.58 2.50 2.42 2.33 2.23 2.13
0.005 3.49 3.33 3.15 2.97 2.87 2.77 2.67 2.56 2.45 2.33
0.001 4.48 4.24 3.99 3.72 3.59 3.44 3.30 3.15 2.99 2.82
0.100 1.85 1.80 1.75 1.70 1.67 1.64 1.60 1.57 1.53 1.49
0.050 2.20 2.13 2.06 1.97 1.93 1.88 1.84 1.79 1.73 1.67
27 0.025 2.57 2.47 2.36 2.25 2.19 2.13 2.07 2.00 1.93 1.85
0.010 3.06 2.93 2.78 2.63 2.55 2.47 2.38 2.29 2.20 2.10
0.005 3.45 3.28 3.11 2.93 2.83 2.73 2.63 2.52 2.41 2.29
0.001 4.41 4.17 3.92 3.66 3.52 3.38 3.23 3.08 2.92 2.75
0.100 1.84 1.79 1.74 1.69 1.66 1.63 1.59 1.56 1.52 1.48
0.050 2.19 2.12 2.04 1.96 1.91 1.87 1.82 1.77 1.71 1.65
28 0.025 2.55 2.45 2.34 2.23 2.17 2.11 2.05 1.98 1.91 1.83
0.010 3.03 2.90 2.75 2.60 2.52 2.44 2.35 2.26 2.17 2.06
0.005 3.41 3.25 3.07 2.89 2.79 2.69 2.59 2.48 2.37 2.25
0.001 4.35 4.11 3.86 3.60 3.46 3.32 3.18 3.02 2.86 2.69
139
TABLA 50 Percentiles de la distribucin F de Fisher
G.L. G.L. DEL NUMERADOR
ERROR 10 12 15 20 24 30 40 60 120
0.100 1.83 1.78 1.73 1.68 1.65 1.62 1.58 1.55 1.51 1.47
0.050 2.18 2.10 2.03 1.94 1.90 1.85 1.81 1.75 1.70 1.64
29 0.025 2.53 2.43 2.32 2.21 2.15 2.09 2.03 1.96 1.89 1.81
0.010 3.00 2.87 2.73 2.57 2.49 2.41 2.33 2.23 2.14 2.03
0.005 3.38 3.21 3.04 2.86 2.76 2.66 2.56 2.45 2.33 2.21
0.001 4.29 4.05 3.80 3.54 3.41 3.27 3.12 2.97 2.81 2.64
0.100 1.82 1.77 1.72 1.67 1.64 1.61 1.57 1.54 1.50 1.46
0.050 2.16 2.09 2.01 1.93 1.89 1.84 1.79 1.74 1.68 1.62
30 0.025 2.51 2.41 2.31 2.20 2.14 2.07 2.01 1.94 1.87 1.79
0.010 2.98 2.84 2.70 2.55 2.47 2.39 2.30 2.21 2.11 2.01
0.005 3.34 3.18 3.01 2.82 2.73 2.63 2.52 2.42 2.30 2.18
0.001 4.24 4.00 3.75 3.49 3.36 3.22 3.07 2.92 2.76 2.59
0.100 1.76 1.71 1.66 1.61 1.57 1.54 1.51 1.47 1.42 1.38
0.050 2.08 2.00 1.92 1.84 1.79 1.74 1.69 1.64 1.58 1.51
40 0.025 2.39 2.29 2.18 2.07 2.01 1.94 1.88 1.80 1.72 1.64
0.010 2.80 2.66 2.52 2.37 2.29 2.20 2.11 2.02 1.92 1.80
0.005 3.12 2.95 2.78 2.60 2.50 2.40 2.30 2.18 2.06 1.93
0.001 3.87 3.64 3.40 3.15 3.01 2.87 2.73 2.57 2.41 2.23
0.100 1.71 1.66 1.60 1.54 1.51 1.48 1.44 1.40 1.35 1.29
0.050 1.99 1.92 1.84 1.75 1.70 1.65 1.59 1.53 1.47 1.39
60 0.025 2.27 2.17 2.06 1.94 1.88 1.82 1.74 1.67 1.58 1.48
0.010 2.63 2.50 2.35 2.20 2.12 2.03 1.94 1.84 1.73 1.60
0.005 2.90 2.74 2.57 2.39 2.29 2.19 2.08 1.96 1.83 1.69
0.001 3.54 3.32 3.08 2.83 2.69 2.55 2.41 2.25 2.08 1.89
0.100 1.65 1.60 1.55 1.48 1.45 1.41 1.37 1.32 1.26 1.19
0.050 1.91 1.83 1.75 1.66 1.61 1.55 1.50 1.43 1.35 1.25
120 0.025 2.16 2.05 1.94 1.82 1.76 1.69 1.61 1.53 1.43 1.31
0.010 2.47 2.34 2.19 2.03 1.95 1.86 1.76 1.66 1.53 1.38
0.005 2.71 2.54 2.37 2.19 2.09 1.98 1.87 1.75 1.61 1.43
0.001 3.24 3.02 2.78 2.53 2.40 2.26 2.11 1.95 1.77 1.54
0.100 1.60 1.55 1.49 1.42 1.38 1.34 1.30 1.24 1.17 1.00
0.050 1.83 1.75 1.67 1.57 1.52 1.46 1.39 1.32 1.22 1.00
0.025 2.05 1.94 1.83 1.71 1.64 1.57 1.48 1.39 1.27 1.00
0.010 2.32 2.18 2.04 1.88 1.79 1.70 1.59 1.47 1.32 1.00
0.005 2.52 2.36 2.19 2.00 1.90 1.79 1.67 1.53 1.36 1.00
0.001 2.96 2.74 2.51 2.27 2.13 1.99 1.84 1.66 1.45 1.00
140
TABLA 51 Percentiles de la prueba de rango mltiple de Duncan
G.L.
ERROR
NUMERO DE MEDIAS CONSIDERADAS
2 3 4 5 6 7 8 9 10 12 14 16 18 20
1
0.05
0.01
18.0
90.0
18.0
90.0
18.0
90.0
18.0
90.0
18.0
90.0
18.0
90.0
18.0
90.0
18.0
90.0
18.0
90.0
18.0
90.0
18.0
90.0
18.0
90.0
18.0
90.0
18.0
90.0
2
0.05
0.01
6.09
14.0
6.09
14.0
6.09
14.0
6.09
14.0
6.09
14.0
6.09
14.0
6.09
14.0
6.09
14.0
6.09
14.0
6.09
14.0
6.09
14.0
6.09
14.0
6.09
14.0
6.09
14.0
3
0.05
0.01
4.50
8.26
4.50
8.50
4.50
8.60
4.50
8.70
4.50
8.80
4.50
8.90
4.50
8.90
4.50
9.00
4.50
9.00
4.50
9.00
4.50
9.10
4.50
9.20
4.50
9.30
4.50
9.30
4
0.05
0.01
3.93
6.51
4.01
6.80
4.02
6.90
4.02
7.00
4.02
7.10
4.02
7.1
4.02
7.20
4.02
7.20
4.02
7.30
4.02
7.30
4.02
7.40
4.02
7.40
4.02
7.50
4.02
7.50
5
0.05
0.01
3.64
5.70
3.74
5.96
3.79
6.11
3.83
6.18
3.83
6.26
3.83
6.33
3.83
6.40
3.83
6.44
3.83
6.50
3.83
6.60
3.83
6.60
3.83
6.70
3.83
6.70
3.83
6.80
6
0.05
0.01
3.46
5.24
3.58
5.51
3.64
5.65
3.68
5.73
3.68
5.81
3.68
5.88
3.68
5.95
3.68
6.00
3.68
6.00
3.68
6.10
3.68
6.20
3.68
6.20
3.68
6.30
3.68
6.30
7
0.05
0.01
3.35
4.95
3.47
5.22
3.54
5.37
3.58
5.45
3.60
5.53
3.61
5.61
3.61
5.69
3.61
5.73
3.61
5.80
3.61
5.80
3.61
5.90
3.61
5.90
3.61
6.00
3.61
6.00
8
0.05
0.01
3.26
4.74
3.39
5.00
3.47
5.14
3.52
5.23
3.55
5.32
3.56
5.40
3.56
5.47
3.56
5.51
3.56
5.50
3.56
5.60
3.56
5.70
3.56
5.70
3.56
5.80
3.56
5.80
9
0.05
0.01
3.20
4.60
3.34
4.86
3.41
4.99
3.47
5.08
3.50
5.17
3.52
5.25
3.52
5.32
3.52
5.36
3.52
5.40
3.52
5.50
3.52
5.50
3.52
5.60
3.52
5.70
3.52
5.70
10
0.05
0.01
3.15
4.48
3.30
4.73
3.37
4.88
3.43
4.96
3.46
5.06
3.47
5.13
3.47
5.20
3.47
5.24
3.47
5.28
3.47
5.36
3.47
5.42
3.47
5.48
3.47
5.54
3.48
5.55
11
0.05
0.01
3.11
4.39
3.27
4.63
3.35
4.77
3.39
4.86
3.43
4.94
3.44
5.01
3.45
5.06
3.46
5.12
3.46
5.15
3.46
5.24
3.46
5.28
3.46
5.34
3.47
5.38
3.48
5.39
12
0.05
0.01
3.08
4.32
3.23
4.55
3.33
4.68
3.36
4.76
3.40
4.84
3.42
4.92
3.44
4.96
3.44
5.02
3.46
5.07
3.46
5.13
3.46
5.17
3.46
5.22
3.47
5.24
3.48
5.26
13
0.05
0.01
3.06
4.26
3.21
4.48
3.30
4.62
3.35
4.69
3.38
4.74
3.41
4.84
3.42
4.88
3.44
4.94
3.45
4.98
3.45
5.04
3.46
5.08
3.46
5.13
3.47
5.14
3.47
5.15
14
0.05
0.01
3.03
4.21
3.18
4.42
3.27
4.55
3.33
4.63
3.37
4.70
3.39
4.78
3.41
4.83
3.42
4.87
3.44
4.91
3.45
4.96
3.46
5.00
3.46
5.04
3.47
5.06
3.47
5.07
15
0.05
0.01
3.01
4.17
3.16
4.37
3.25
4.50
3.31
4.58
3.36
4.64
3.38
4.72
3.40
4.77
3.42
4.81
3.43
4.84
3.44
4.90
3.45
4.94
3.46
4.97
3.47
4.99
3.47
5.00
16
0.05
0.01
3.00
4.13
3.15
4.34
3.23
4.45
3.30
4.54
3.34
4.60
3.37
4.67
3.39
4.72
3.41
4.76
3.43
4.79
3.44
4.84
3.45
4.88
3.46
4.91
3.47
4.93
3.47
4.94
17
0.05
0.01
2.98
4.10
3.13
4.30
3.22
4.41
3.28
4.50
3.33
4.56
3.36
4.63
3.38
4.68
3.40
4.72
3.42
4.75
3.44
4.80
3.45
4.83
3.46
4.86
3.47
4.88
3.47
4.89
18
0.05
0.01
2.97
4.07
3.12
4.27
3.21
4.38
3.27
4.46
3.32
4.53
3.35
4.59
3.37
4.64
3.39
4.68
3.41
4.71
3.43
4.76
3.45
4.79
3.46
4.82
3.47
4.84
3.47
4.85
19
0.05
0.01
2.96
4.05
3.11
4.24
3.19
4.35
3.26
4.43
3.31
4.50
3.35
4.56
3.37
4.61
3.39
4.64
3.41
4.67
3.43
4.72
3.44
4.76
3.46
4.79
3.47
4.81
3.47
4.82
20
0.05
0.01
2.95
4.02
3.10
4.22
3.18
4.33
3.25
4.40
3.30
4.47
3.34
4.53
3.36
4.58
3.38
4.61
3.40
4.65
3.43
4.69
3.44
4.73
3.46
4.76
3.46
4.78
3.47
4.79
141
TABLA 51 Percentiles de la prueba de rango mltiple de Duncan
G.L.
ERROR
NUMERO DE MEDIAS CONSIDERADAS
2 3 4 5 6 7 8 9 10 12 14 16 18 20
22
0.05
0.01
2.93
3.99
3.08
4.17
3.17
4.28
3.24
4.36
3.29
4.42
3.32
4.48
3.35
4.53
3.37
4.57
3.39
4.60
3.42
4.65
3.44
4.64
3.45
4.71
3.46
4.74
3.47
4.75
24
0.05
0.01
2.92
3.96
3.07
4.14
3.15
4.24
3.22
4.33
3.28
4.39
3.31
4.44
3.34
4.49
3.37
4.53
3.38
4.57
3.41
4.62
3.44
4.64
3.45
4.67
3.46
4.70
3.47
4.72
26
0.05
0.01
2.91
3.93
3.06
4.11
3.14
4.21
3.21
4.30
3.27
4.36
3.30
4.41
3.34
4.46
3.36
4.50
3.38
4.53
3.41
4.58
3.43
4.62
3.45
4.65
3.46
4.67
3.47
4.69
28
0.05
0.01
2.90
3.91
3.04
4.08
3.13
4.18
3.20
4.28
3.26
4.34
3.30
4.39
3.33
4.43
3.35
4.47
3.37
4.51
3.40
4.56
3.43
4.60
3.45
4.62
3.46
4.65
3.47
4.67
30
0.05
0.01
2.89
3.89
3.04
4.06
3.12
4.16
3.20
4.22
3.25
4.32
3.29
4.36
3.32
4.41
3.35
4.45
3.37
4.48
3.40
4.54
3.43
4.58
3.44
4.61
3.46
4.63
3.47
4.65
40
0.05
0.01
2.86
3.82
3.01
3.99
3.10
4.10
3.17
4.17
3.22
4.24
3.27
4.30
3.30
4.34
3.33
4.37
3.35
4.41
3.39
4.46
3.42
4.51
3.44
4.54
3.46
4.54
3.47
4.59
60
0.05
0.01
2.83
3.76
2.98
3.92
3.08
4.03
3.14
4.12
3.20
4.17
3.24
4.23
3.28
4.27
3.31
4.31
3.33
4.34
3.37
4.39
3.40
4.44
3.43
4.47
3.45
4.50
3.47
4.53
100
0.05
0.01
2.80
3.71
2.95
3.86
3.05
3.98
3.12
4.06
3.18
4.11
3.22
4.17
3.26
4.21
3.29
4.25
3.32
4.29
3.36
4.35
3.40
4.38
3.42
4.42
3.45
4.45
3.47
4.48

0.05
0.01
2.77
3.64
2.92
3.80
3.02
3.90
3.09
3.98
3.15
4.04
3.19
4.09
3.23
4.14
3.26
4.17
3.29
4.20
3.34
4.26
3.38
4.31
3.41
4.34
3.44
4.38
3.47
4.41
142

TABLA 52 Percentiles de la Distribucin Chi-Cuadrado.
G.L. 0.995 0.990 0.975 0.950 0.900 0.750 0.500 0.250 0.100 0.050 0.025 0.010 0.005 0.001
1 0.001 0.001 0.001 0.004 0.02 0.10 0.45 1.32 2.71 3.84 5.02 6.63 7.88 10.83
2 0.01 0.02 0.05 0.10 0.21 0.58 1.39 2.77 4.61 5.99 7.38 9.21 10.60 13.82
3 0.07 0.11 0.22 0.35 0.58 1.21 2.37 4.11 6.25 7.81 9.35 11.34 12.84 16.27
4 0.21 0.30 0.48 0.71 1.06 1.92 3.36 5.39 7.78 9.49 11.14 13.28 14.86 18.47
5 0.41 0.55 0.83 1.15 1.61 2.67 4.35 6.63 9.24 11.07 12.83 15.09 16.75 20.51
6 0.68 0.87 1.24 1.64 2.20 3.45 5.35 7.84 10.64 12.59 14.45 16.81 18.55 22.46
7 0.99 1.24 1.69 2.17 2.83 4.25 6.35 9.04 12.02 14.07 16.01 18.48 20.28 24.32
8 1.34 1.65 2.18 2.73 3.49 5.07 7.34 10.22 13.36 15.51 17.53 20.09 21.95 26.12
9 1.73 2.09 2.70 3.33 4.17 5.90 8.34 11.39 14.68 16.92 19.02 21.67 23.59 27.88
10 2.16 2.56 3.25 3.94 4.87 6.74 9.34 12.55 15.99 18.31 20.48 23.21 25.19 29.59
11 2.60 3.05 3.82 4.57 5.58 7.58 10.34 13.70 17.28 19.68 21.92 24.73 26.76 31.26
12 3.07 3.57 4.40 5.23 6.30 8.44 11.34 14.85 18.55 21.03 23.34 26.22 28.30 32.91
13 3.57 4.11 5.01 5.89 7.04 9.30 12.34 15.98 19.81 22.36 24.74 27.69 29.82 34.53
14 4.07 4.66 5.63 6.57 7.79 10.17 13.34 17.12 21.06 23.68 26.12 29.14 31.32 36.12
15 4.60 5.23 6.26 7.26 8.55 11.04 14.34 18.25 22.31 25.00 27.49 30.58 32.80 37.70
16 5.14 5.81 6.91 7.96 9.31 11.91 15.34 19.37 23.54 26.30 28.85 32.00 34.27 39.25
17 5.70 6.41 7.56 8.67 10.09 12.79 16.34 20.49 24.77 27.59 30.19 33.41 35.72 40.79
18 6.26 7.01 8.23 9.39 10.86 13.68 17.34 21.60 25.99 28.87 31.53 34.81 37.16 42.31
19 6.84 7.63 8.91 10.12 11.65 14.56 18.34 22.72 27.20 30.14 32.85 36.19 38.58 43.82
20 7.434 8.260 9.591 10.851 12.44 15.45 19.34 23.83 28.41 31.41 34.17 37.57 40.00 45.31
21 8.03 8.90 10.28 11.59 13.24 16.34 20.34 24.93 29.62 32.67 35.48 38.93 41.40 46.80
22 8.64 9.54 10.98 12.34 14.04 17.24 21.34 26.04 30.81 33.92 36.78 40.29 42.80 48.27
23 9.26 10.20 11.69 13.09 14.85 18.14 22.34 27.14 32.01 35.17 38.08 41.64 44.18 49.73
24 9.89 10.86 12.40 13.85 15.66 19.04 23.34 28.24 33.20 36.42 39.36 42.98 45.56 51.18
25 10.52 11.52 13.12 14.61 16.47 19.94 24.34 29.34 34.38 37.65 40.65 44.31 46.93 52.62
26 11.16 12.20 13.84 15.38 17.29 20.84 25.34 30.43 35.56 38.89 41.92 45.64 48.29 54.05
27 11.81 12.88 14.57 16.15 18.11 21.75 26.34 31.53 36.74 40.11 43.19 46.96 49.65 55.48
28 12.46 13.56 15.31 16.93 18.94 22.66 27.34 32.62 37.92 41.34 44.46 48.28 50.99 56.89
29 13.12 14.26 16.05 17.71 19.77 23.57 28.34 33.71 39.09 42.56 45.72 49.59 52.34 58.30
30 13.79 14.95 16.79 18.49 20.60 24.48 29.34 34.80 40.26 43.77 46.98 50.89 53.67 59.70
40 20.71 22.16 24.43 26.51 29.05 33.66 39.34 45.62 51.81 55.76 59.34 63.69 66.77 73.40
50 27.99 29.71 32.36 34.76 37.69 42.94 49.33 56.33 63.17 67.50 71.42 76.15 79.49 86.66
60 35.53 37.48 40.48 43.19 46.46 52.29 59.33 66.98 74.40 79.08 83.30 88.38 91.95 99.61
70 43.28 45.44 48.76 51.74 55.33 61.70 69.33 77.58 85.53 90.53 95.02 100.43 104.21 112.32
80 51.17 53.54 57.15 60.39 64.28 71.14 79.33 88.13 96.58 101.88 106.63 112.33 116.32 124.84
90 59.20 61.75 65.65 69.13 73.29 80.62 89.33 98.65 107.57 113.15 118.14 124.12 128.30 137.21
100 67.33 70.06 74.22 77.93 82.36 90.13 99.33 109.14 118.50 124.34 129.56 135.81 140.17 149.45
120 83.85 86.92 91.57 95.70 100.62 109.22 119.33 130.05 140.23 146.57 152.21 158.95 163.65 173.62
143
TABLA 53 Arcoseno de la raz cuadrada de datos expresados en porcentaje.
% 0 1 2 3 4 5 6 7 8 9
0 0.00 1.81 2.56 3.14 3.63 4.05 4.44 4.80 5.13 5.44
1 5.74 6.02 6.29 6.55 6.80 7.03 7.27 7.49 7.71 7.92
2 8.13 8.33 8.53 8.72 8.91 9.10 9.28 9.46 9.63 9.80
3 9.97 10.14 10.30 10.47 10.63 10.78 10.94 11.09 11.24 11.39
4 11.54 11.68 11.83 11.97 12.11 12.25 12.38 12.52 12.66 12.79
5 12.92 13.05 13.18 13.31 13.44 13.56 13.69 13.81 13.94 14.06
6 14.18 14.30 14.42 14.54 14.65 14.77 14.89 15.00 15.12 15.23
7 15.34 15.45 15.56 15.68 15.79 15.89 16.00 16.11 16.22 16.32
8 16.43 16.54 16.64 16.74 16.85 16.95 17.05 17.15 17.26 17.36
9 17.46 17.56 17.66 17.76 17.85 17.95 18.05 18.15 18.24 18.34
10 18.43 18.53 18.63 18.72 18.81 18.91 19.00 19.09 19.19 19.28
11 19.37 19.46 19.55 19.64 19.73 19.82 19.91 20.00 20.09 20.18
12 20.27 20.36 20.44 20.53 20.62 20.70 20.79 20.88 20.96 21.05
13 21.13 21.22 21.30 21.39 21.47 21.56 21.64 21.72 21.81 21.89
14 21.97 22.06 22.14 22.22 22.30 22.38 22.46 22.54 22.63 22.71
15 22.79 22.87 22.95 23.03 23.11 23.18 23.26 23.34 23.42 23.50
16 23.58 23.66 23.73 23.81 23.89 23.97 24.04 24.12 24.20 24.27
17 24.35 24.43 24.50 24.58 24.65 24.73 24.80 24.88 24.95 25.03
18 25.10 25.18 25.25 25.33 25.40 25.47 25.55 25.62 25.70 25.77
19 25.84 25.91 25.99 26.06 26.13 26.21 26.28 26.35 26.42 26.49
20 26.56 26.64 26.71 26.78 26.85 26.92 26.99 27.06 27.13 27.20
21 27.27 27.34 27.42 27.49 27.56 27.62 27.69 27.76 27.83 27.90
22 27.97 28.04 28.11 28.18 28.25 28.32 28.38 28.45 28.52 28.59
23 28.66 28.73 28.79 28.86 28.93 29.00 29.06 29.13 29.20 29.27
24 29.33 29.40 29.47 29.53 29.60 29.67 29.73 29.80 29.87 29.93
25 30.00 30.07 30.13 30.20 30.26 30.33 30.40 30.46 30.53 30.59
26 30.66 30.72 30.79 30.85 30.92 30.98 31.05 31.11 31.18 31.24
27 31.31 31.37 31.44 31.50 31.56 31.63 31.69 31.76 31.82 31.88
28 31.95 32.01 32.08 32.14 32.20 32.27 32.33 32.39 32.46 32.52
29 32.58 32.65 32.71 32.77 32.83 32.90 32.96 33.02 33.09 33.15
30 33.21 33.27 33.34 33.40 33.46 33.52 33.58 33.65 33.71 33.77
31 33.83 33.89 33.96 34.02 34.08 34.14 34.20 34.27 34.33 34.39
32 34.45 34.51 34.57 34.63 34.70 34.76 34.82 34.88 34.94 35.00
33 35.06 35.12 35.18 35.24 35.30 35.37 35.43 35.49 35.55 35.61
34 35.67 35.73 35.79 35.85 35.91 35.97 36.03 36.09 36.15 36.21
35 36.27 36.33 36.39 36.45 36.51 36.57 36.63 36.69 36.75 36.81
36 36.87 36.93 36.99 37.05 37.11 37.17 37.23 37.29 37.35 37.41
37 37.46 37.52 37.58 37.64 37.70 37.76 37.82 37.88 37.94 38.00
38 38.06 38.12 38.17 38.23 38.29 38.35 38.41 38.47 38.53 38.59
39 38.65 38.70 38.76 38.82 38.88 38.94 39.00 39.06 39.11 39.17
40 39.23 39.29 39.35 39.41 39.47 39.52 39.58 39.64 39.70 39.76
41 39.82 39.87 39.93 39.99 40.05 40.11 40.16 40.22 40.28 40.34
42 40.40 40.45 40.51 40.57 40.63 40.69 40.74 40.80 40.86 40.92
43 40.98 41.03 41.09 41.15 41.21 41.27 41.32 41.38 41.44 41.50
44 41.55 41.61 41.67 41.73 41.78 41.84 41.90 41.96 42.02 42.07
45 42.13 42.19 42.25 42.30 42.36 42.42 42.48 42.53 42.59 42.65
TABLA 53 Arcoseno de la raz cuadrada de datos expresados en porcentaje. TABLA 53 Arcoseno de la raz cuadrada de datos expresados en porcentaje.
% 0 1 2 3 4 5 6 7 8 9
46 42.71 42.76 42.82 42.88 42.94 42.99 43.05 43.11 43.17 43.22
47 43.28 43.34 43.39 43.45 43.51 43.57 43.62 43.68 43.74 43.80
144
48 43.85 43.91 43.97 44.03 44.08 44.14 44.20 44.25 44.31 44.37
49 44.43 44.48 44.54 44.60 44.66 44.71 44.77 44.83 44.89 44.94
50 45.00 45.06 45.11 45.17 45.23 45.29 45.34 45.40 45.46 45.52
51 45.57 45.63 45.69 45.74 45.80 45.86 45.92 45.97 46.03 46.09
52 46.15 46.20 46.26 46.32 46.38 46.43 46.49 46.55 46.61 46.66
53 46.72 46.78 46.83 46.89 46.95 47.01 47.06 47.12 47.18 47.24
54 47.29 47.35 47.41 47.47 47.52 47.58 47.64 47.70 47.75 47.81
55 47.87 47.93 47.98 48.04 48.10 48.16 48.22 48.27 48.33 48.39
56 48.45 48.50 48.56 48.62 48.68 48.73 48.79 48.85 48.91 48.97
57 49.02 49.08 49.14 49.20 49.26 49.31 49.37 49.43 49.49 49.55
58 49.60 49.66 49.72 49.78 49.84 49.89 49.95 50.01 50.07 50.13
59 50.18 50.24 50.30 50.36 50.42 50.48 50.53 50.59 50.65 50.71
60 50.77 50.83 50.89 50.94 51.00 51.06 51.12 51.18 51.24 51.30
61 51.35 51.41 51.47 51.53 51.59 51.65 51.71 51.77 51.83 51.88
62 51.94 52.00 52.06 52.12 52.18 52.24 52.30 52.36 52.42 52.48
63 52.53 52.59 52.65 52.71 52.77 52.83 52.89 52.95 53.01 53.07
64 53.13 53.19 53.25 53.31 53.37 53.43 53.49 53.55 53.61 53.67
65 53.73 53.79 53.85 53.91 53.97 54.03 54.09 54.15 54.21 54.27
66 54.33 54.39 54.45 54.51 54.57 54.63 54.69 54.76 54.82 54.88
67 54.94 55.00 55.06 55.12 55.18 55.24 55.30 55.37 55.43 55.49
68 55.55 55.61 55.67 55.73 55.80 55.86 55.92 55.98 56.04 56.10
69 56.17 56.23 56.29 56.35 56.41 56.48 56.54 56.60 56.66 56.73
70 56.79 56.85 56.91 56.98 57.04 57.10 57.17 57.23 57.29 57.35
71 57.42 57.48 57.54 57.61 57.67 57.73 57.80 57.86 57.92 57.99
72 58.05 58.12 58.18 58.24 58.31 58.37 58.44 58.50 58.56 58.63
73 58.69 58.76 58.82 58.89 58.95 59.02 59.08 59.15 59.21 59.28
74 59.34 59.41 59.47 59.54 59.60 59.67 59.74 59.80 59.87 59.93
75 60.00 60.07 60.13 60.20 60.27 60.33 60.40 60.47 60.53 60.60
76 60.67 60.73 60.80 60.87 60.94 61.00 61.07 61.14 61.21 61.27
77 61.34 61.41 61.48 61.55 61.61 61.68 61.75 61.82 61.89 61.96
78 62.03 62.10 62.17 62.24 62.31 62.37 62.44 62.51 62.58 62.65
79 62.73 62.80 62.87 62.94 63.01 63.08 63.15 63.22 63.29 63.36
80 63.43 63.51 63.58 63.65 63.72 63.79 63.87 63.94 64.01 64.08
81 64.16 64.23 64.30 64.38 64.45 64.52 64.60 64.67 64.75 64.82
82 64.90 64.97 65.05 65.12 65.20 65.27 65.35 65.42 65.50 65.57
83 65.65 65.73 65.80 65.88 65.96 66.03 66.11 66.19 66.27 66.34
84 66.42 66.50 66.58 66.66 66.74 66.81 66.89 66.97 67.05 67.13
85 67.21 67.29 67.37 67.46 67.54 67.62 67.70 67.78 67.86 67.94
86 68.03 68.11 68.19 68.28 68.36 68.44 68.53 68.61 68.70 68.78
87 68.87 68.95 69.04 69.12 69.21 69.30 69.38 69.47 69.56 69.64
88 69.73 69.82 69.91 70.00 70.09 70.18 70.27 70.36 70.45 70.54
89 70.63 70.72 70.81 70.91 71.00 71.09 71.19 71.28 71.37 71.47
90 71.56 71.66 71.76 71.85 71.95 72.05 72.15 72.24 72.34 72.44
91 72.54 72.64 72.74 72.84 72.95 73.05 73.15 73.26 73.36 73.46
TABLA 53 Arcoseno de la raz cuadrada de datos expresados en porcentaje. TABLA 53 Arcoseno de la raz cuadrada de datos expresados en porcentaje.
% 0 1 2 3 4 5 6 7 8 9
92 73.57 73.68 73.78 73.89 74.00 74.11 74.21 74.32 74.44 74.55
93 74.66 74.77 74.88 75.00 75.11 75.23 75.35 75.46 75.58 75.70
94 75.82 75.94 76.06 76.19 76.31 76.44 76.56 76.69 76.82 76.95
95 77.08 77.21 77.34 77.48 77.62 77.75 77.89 78.03 78.17 78.32
96 78.46 78.61 78.76 78.91 79.06 79.22 79.37 79.53 79.69 79.86
97 80.03 80.19 80.37 80.54 80.72 80.90 81.09 81.28 81.47 81.67
98 81.87 82.08 82.29 82.51 82.73 82.96 83.20 83.45 83.71 83.98
145
99 84.26 84.56 84.87 85.20 85.56 85.94 86.37 86.86 87.44 88.19
100 90.00
146
TABLA 54 Coeficientes de Correlacin. TABLA 54 Coeficientes de Correlacin.
G.L. del
Error
Variables independientes
1 2 3 4 1 2 3 4
1 0.05 0.997 0.999 0.999 0.999 10 0.576 0.671 0.726 0.763
0.01 1.000 1.000 1.000 1.000 0.708 0.776 0.814 0.840
2 0.05 0.950 0.975 0.983 0.987 11 0.553 0.648 0.703 0.741
0.01 0.990 0.995 0.997 0.998 0.684 0.753 0.793 0.821
3 0.05 0.878 0.930 0.950 0.961 12 0.532 0.627 0.683 0.722
0.01 0.959 0.976 0.983 0.987 0.661 0.732 0.773 0.802
4 0.05 0.811 0.881 0.912 0.930 13 0.514 0.608 0.664 0.703
0.01 0.917 0.949 0.962 0.970 0.641 0.712 0.755 0.785
5 0.05 0.754 0.836 0.874 0.898 14 0.497 0.590 0.646 0.686
0.01 0.874 0.917 0.937 0.949 0.623 0.694 0.737 0.768
6 0.05 0.707 0.795 0.839 0.867 15 0.482 0.574 0.630 0.670
0.01 0.834 0.886 0.911 0.927 0.606 0.677 0.721 0.752
7 0.05 0.666 0.758 0.807 0.838 16 0.468 0.559 0.615 0.655
0.01 0.798 0.855 0.885 0.904 0.590 0.662 0.706 0.738
8 0.05 0.632 0.726 0.777 0.811 17 0.456 0.545 0.601 0.641
0.01 0.765 0.827 0.860 0.882 0.575 0.647 0.691 0.724
9 0.05 0.602 0.697 0.750 0.786 18 0.444 0.532 0.587 0.628
0.01 0.735 0.800 0.836 0.861 0.561 0.633 0.678 0.710
19 0.05 0.433 0.520 0.575 0.615 28 0.361 0.439 0.490 0.529
0.01 0.549 0.620 0.665 0.698 0.463 0.530 0.573 0.605
20 0.05 0.423 0.509 0.563 0.604 29 0.355 0.432 0.482 0.521
0.01 0.537 0.608 0.652 0.685 0.456 0.522 0.565 0.598
21 0.05 0.413 0.498 0.522 0.592 30 0.349 0.426 0.476 0.514
0.01 0.526 0.596 0.641 0.674 0.449 0.514 0.558 0.591
22 0.05 0.404 0.488 0.542 0.582 35 0.325 0.397 0.445 0.482
0.01 0.515 0.585 0.630 0.663 0.418 0.481 0.523 0.556
23 0.05 0.396 0.479 0.532 0.572 40 0.304 0.373 0.419 0.455
0.01 0.505 0.574 0.619 0.652 0.393 0.454 0.494 0.526
24 0.05 0.388 0.470 0.523 0.562 45 0.288 0.353 0.397 0.432
0.01 0.496 0.565 0.609 0.642 0.372 0.430 0.470 0.501
25 0.05 0.381 0.462 0.514 0.553 50 0.273 0.336 0.379 0.412
0.01 0.487 0.555 0.600 0.633 0.354 0.410 0.449 0.479
26 0.05 0.374 0.454 0.506 0.545 60 0.250 0.308 0.348 0.380
0.01 0.478 0.546 0.590 0.624 0.325 0.377 0.414 0.442
27 0.05 0.367 0.446 0.498 0.536 70 0.232 0.286 0.324 0.354
0.01 0.470 0.538 0.582 0.615 0.302 0.351 0.386 0.413
147
TABLA 54 Coeficientes de Correlacin TABLA 54 Coeficientes de Correlacin
G.L. del Variables independientes
Error 1 2 3 4
80 0.05 0.217 0.269 0.304 0.332
0.01 0.283 0.330 0.362 0.389
90 0.05 0.205 0.254 0.288 0.315
0.01 0.267 0.312 0.343 0.368
100 0.05 0.195 0.241 0.274 0.300
0.01 0.254 0.297 0.327 0.351
150 0.05 0.159 0.198 0.225 0.247
0.01 0.208 0.244 0.270 0.290
200 0.05 0.138 0.172 0.196 0.215
0.01 0.181 0.212 0.234 0.253
300 0.05 0.113 0.141 0.160 0.176
0.01 0.148 0.174 0.192 0.208
400 0.05 0.098 0.122 0.139 0.153
0.01 0.128 0.151 0.167 0.180
500 0.05 0.088 0.109 0.124 0.137
0.01 0.115 0.135 0.150 0.162
1000 0.05 0.062 0.077 0.088 0.097
0.01 0.081 0.096 0.106 0.115

You might also like