You are on page 1of 41

Captulo 2

2. MARCO TERICO
A travs de este captulo, podremos obtener informacin respecto de las
tcnicas usadas para la organizacin, representacin grfica y anlisis
de un grupo considerado de variables aleatorias.
2.1. TCNICAS MULTIVARIADAS
Son un conunto de tcnicas !ue sirven como "erramienta para el
tratamiento de dos o ms variables aleatorias de manera
simultnea, siendo estas discretas o continuas, y as realizar
anlisis del comportamiento de las mismas en su conunto.
#stas tcnicas se refieren a mtodos descriptivos debido a !ue
no refieren el uso de ninguna clase de "iptesis probabilstica. $or
33
otro lado, estas nos dan una orientacin para la interpretacin de
ciertos factores !ue influyen sobre un conunto determinado de
variables. Adems, estas tcnicas nos permiten tratar toda la
informacin disponible de manera simultnea y efectiva.
#l uso de stas tcnicas supone un progreso con relacin a los
mtodos ms clsicos en los !ue slo "ubiramos podido calcular
dos caractersticas o calcular un coeficiente de correlacin !ue
proporciona una cifra global.
2.1.1. MATRIZ DE DATOS
#s un arreglo rectangular al !ue se lo denominar X y !ue
consistir n filas y p columnas donde n ser el n%mero de
unidades de investigacin o individuos , y p &' ser el n%mero de
variables aleatorias !ue sern obeto de nuestra investigacin.
As tendremos la siguiente representacin(
)onde(
* i + medida de la ,sima variable del i,simo individuo.
*
- -
- -
n n

1
]
1
1
1
1
1
11 12
1 2

-
- - -
-
1p
21 22 2p
np
34
#ntonces, el arreglo X .matriz de datos/ contiene todas las
observaciones de todas las variables !ue sern parte de nuestro
estudio.
2.1.2. VECTOR DE MEDIAS
#s una representacin matricial de p filas por una columna en
donde se e-ponen los valores de las medias aritmticas de cada
una de las variables aleatorias.
0enemos la representacin de este 1ector de la siguiente manera(
)onde(
*

1
]
1
1
1
1
1

*
*
*
1
2
p

*
i
+
1
n
* i + 1,2,....., p
+1
n
i

*
i
es la media de la i , esima variable
35
2sta es la representacin matemtica de la media para la i,sima
variable !ue ser calculada tomando las n mediciones de cada
una de las p variables.
2.1.3. MATRIZ DE VARIANZAS Y COVARIANZAS
#ste es un arreglo de p filas y p columnas, es decir es una matriz
cuadrada !ue tiene la propiedad de ser simtrica. Se nota de la
siguiente manera(
)onde(
4 adems (
S
i
+
S S S
S S S
S S S
11 12 1p
21 22 2p
p1 p2 pp

1
]
1
1
1
1
1
S
i
+
covarianza entre la variable i , cuando i
varianza de la variable i , cuando i +

'

S
i
S
i
36
5a frmula matemtica para el clculo de estos valores es la
siguiente(
#n este modo de organizacin de datos, las varianzas de cada una
de las variables de estudio se encontrarn en la diagonal de dic"a
matriz, y las covarianzas en la matriz triangular superior o inferior,
tomando en cuenta !ue es una matriz simtrica.
2.1.. MATRIZ DE CORRELACIONES
#ste tambin es un arreglo matricial !ue consta de p filas y p
columnas, de acuerdo al n%mero de variables. 0ambin es una
matriz cuadrada y simtrica !ue tiene por caracterstica principal el
"ec"o de !ue su diagonal principal se compone de unos .1/, y en
la matriz triangular superior o inferior se encuentran los
coeficientes de correlacin entre las variables en estudio.
Se nota de la siguiente manera(
S *
i 6
+
1
n
.* * *
6 i i
6+1
n

/. /
7
r
r
p 2
i
1 2 1 p
2 1 p
p 1

1 r r
r
r 1

1
]
1
1
1
1

1
2
37
)onde (
4 la representacin matemtica de este clculo est dada por la
siguiente ecuacin(
)onde ! " 1,2,....., p y # " 1,2,....., p
8abe indicar !ue la correlacin muestral $ debe estar entre
91 y :1.
2.1.%. RE&RESENTACIONES 'R()ICAS.
5os grficos son muy importantes debido a !ue dan una nueva
perspectiva en el anlisis de datos. Sin embargo, es imposible
graficar en forma simultnea todas las mediciones de las variables
de estudio. Se pueden "acer grficos de variables estadsticas en
j la y i variable la entre n correlaci de e coeficient el es
j

i
r
r
S
* * *
* * * *

i 6
6 i i
6
n
6
6
n
i
i
i i
6 i
6+1
n

S
S

.*




/. /
. / . /
2
1
2
1
38
forma individual, pero tambin pueden ser de muc"a utilidad y
brindar buena informacin los grficos de pares de variables.
;ediante los programas sofisticados de los computadores
podemos darnos el luo de e-aminar visualmente los datos en una,
dos o tres dimensiones con relativa facilidad.
2.1.%.1. DIA'RAMAS DE DIS&ERSIN
#s una representacin grfica en dos dimensiones cuyo ee
"orizontal X corresponde al de una variable, y el ee vertical Y le
corresponde al de la otra variable con la cual se desea "acer el
anlisis.
8ada punto del grfico corresponde a un par ordenado formado
por los valores de las dos variables .1ariable 1, 1ariable 2/, y los
valores !ue toman estas variables corresponden a las de un
individuo diferente en cada punto.
$onemos a disposicin un grfico como el !ue se muestra a
continuacin(
'R()ICO 2.1.
E*EM&LO DE DIA'RAMA DE DIS&ERSIN
39
#ste tipo de grfico posee diferentes tipos de informacin. Seg%n
el eemplo !ue ponemos a disposicin podemos concluir !ue estas
variables tienen una tendencia lineal positiva, lo !ue implica una
relacin directa entre *1 y *2.
2.1.%.2. ESTRELLAS
#sta es una representacin grfica !ue trata de mostrar una
perspectiva diferente de todas las variables obeto de estudio.
$ara ste tipo de grfico no e-isten restricciones por el n%mero de
variables como en el diagrama de dispersin en la !ue slo se
pueden representar grficamente "asta tres variables.
'
2
<
=
>
1'
12
' ? 1'
X1
X
2
40
#n el grfico de estrellas se pueden mostrar todas las variables
posibles !ue son de nuestro inters, en donde cada punta de esta
estrella representa una variable estadstica, y cada grfico
resultante, representa un individuo, es decir si tenemos n+2'
tendremos como resultado 2' grficas de estrellas.
#l procedimiento para realizar un grfico de ste tipo se muestra a
continuacin(
@. Se estandarizan los datos de cada una de las variables, de
acuerdo a su respectiva media y desviacin estndar.
@@. #l mnimo valor observado de estos datos anteriormente
estandarizados corresponde a cero.
@@@. Se realiza una resta en valor absoluto de los datos
estandarizados menos el mnimo valor encontrado !ue
corresponda a cero, por cada individuo.
@1. 8on estos resultados procedemos a realizar la grfica
correspondiente. Se muestra un eemplo(
'R()ICO 2.2.
E*EM&LO DE 'R()ICO DE ESTRELLAS
41
#n el eemplo e-puesto, tratamos un caso "ipottico de p+< y n+2,
es decir cuatro variables y dos individuos. ;ediante este grfico se
pueden "acer comparaciones entre individuos, de acuerdo a los
valores !ue toman en cada una de las variables.
2.1.+. AN(LISIS DE COM&ONENTES &RINCI&ALES ,AC&-.
#l mtodo de Anlisis de 8omponentes $rincipales, tambin
conocido como A8$, es utilizado para describir una matriz X
.matriz de datos/, es decir una matriz de variables continuas del
tipo individuos - variables.
42
#s tambin un obetivo del A8$, reducir el n%mero de variables,
adems de buscar correlaciones entre grupos de variables
llamados .a/to$01, y no solamente entre variables como lo
muestra la matriz de correlaciones e-puesta en la seccin 2.1..
y en la !ue se indica la relacin !ue e-iste entre una y otra
variable, y no entre grupos de variables, como por eemplo la
correlacin !ue pueda e-istir entre factores como nivel
socioeconmico, nivel de vida, nivel educacional, entre otros.
5a matriz de datos X puede ser muy disimtrica, y las variables
muy "eterogneas, tanto en media como en desviacin, por
eemplo, una variable puede medir los activos de una empresa, y
otra los tipos de rendimiento, con lo cual las diferencias de medias
seran enormes.
$or esta razn, antes de realizar el anlisis general, el A8$ realiza
una transformacin de la matriz, es decir, trabaa con variables
estandarizadas.
2.1.+.1. ES2UEMA &ARA EL DESARROLLO DE UN AC&
43
a- E1tan3a$!4a/!5n 30 la Mat$!4 30 Dato1
$ara evitar !ue las variables !ue toman valores muy altos, tengan
un peso muy importante en la determinacin de los ees de
componentes principales, se realiza una transformacin !ue
consiste en centrar los datos de la siguiente forma(
j j i j i
x x ' x


)onde (


j variable la de media
j
X
)e esta manera se elimina la influencia del nivel general de las
variables. #!uivale a una traslacin del origen al centro de
gravedad de la nube de datos.
Si adems, las dispersiones de las variables son muy diferentes,
se "ar necesario realizar otra transformacin en los datos de
partida. Se tipifican dividiendo para su desviacin.

44
j
j j i
j i
s
x x
' x

)onde(

j variable la de estandar desviacin la es S
j

Ana vez realizada la transformacin de la tabla mediante la
estandarizacin, se procede al anlisis usando la nueva tabla.
6- O6t0n/!5n 30 la Mat$!4 30 Va$!an4a1 7 Co8a$!an4a1
$ara el efecto, se toma la matriz de datos estandarizada y se
procede seg%n el es!uema utilizado en la seccin 2.1.9.
#n esta seccin se especifican los pasos para la obtencin de la
matriz en cuestin. 0ambin se puede utilizar un es!uema
matricial para obtener dic"a matriz, mediante nuestro grupo de
datos.

( )
1
1
1
1
1
]
1

,
_

p p
p p
x x x
x
x
x
E S

2 2 1 1
2 2
1 1
/- Valo$01 7 V0/to$01 &$op!o1
45
#ste proceso para "allar los valores y los vectores propios desde
la ;atriz de 1arianzas y 8ovarianzas se lo conoce como
diagonalizacin de la matriz en mencin.
Se define de la siguiente manera(
Sea S una matriz cuadrada de orden p . #l n%mero es
llamado valor propio de S si e-iste un vector * !ue pertenece al
conunto de los vectores !ue se encuentran en el espacio n,
dimensional, no nulo tal !ue S* + * en tal caso, al vector * se lo
llama vector propio correspondiente o asociado al valor propio .
Sea S una matriz p-p, el n%mero es un valor propio de S si y
solamente si(
|S,I| + '
#-puesto en forma matricial obtenemos lo siguiente(
det
S S S
S S S
S S S
11 12 1p
21 22 2p
p1 p2 pp

1
]
1
1
1
1
1

1
]
1
1
1
1

1
]
1
1
1
1
1

1 ' ' '
' 1 ' '
' ' ' 1
'
46
)esarrollando el determinante de la matriz resultante,
obtendremos los valores propios con sus correspondientes
vectores propios.
#l clculo de la determinante da como resultado un polinomio
llamado polinomio caracterstico de la matriz S.
$ara el desarrollo de un A8$, los vectores caractersticos
obtenidos anteriormente deben tener la caracterstica de ser
perpendiculares entre s. #n caso contrario debern pasar por un
proceso de ortonormalizacin.
8ada componente resultante de un A8$ ser una combinacin
lineal de cada uno de los vectores caractersticos
ortonormalizados.

2.1.+.2. ELECCIN DEL N:MERO DE COM&ONENTES
#-isten diferentes mtodos para elegir el n%mero de 8omponentes
!ue se "an de retener, aun!ue ninguno de ellos es determinante.
a/ Se puede fiar el porcentae mnimo de inercia !ue se !uiere
conservar y retener el n%mero de ees necesario para ello.
b/ Btras reglas son empricas.
47
@. Si la nube de datos inicial no tiene ninguna direccin
privilegiada, los valores propios sern pr-imos( no diferirn
muc"o. Se conservar entonces un ee cuyo porcentae de
varianza sea netamente superior a 1C p D 1'', ya !ue ste es el
valor !ue le corresponder si todos los ees e-plicasen
e-actamente la misma cantidad.
@@. 5a inercia e-plicada por cada ee debe ser decreciente.
#sto !uiere decir !ue si representamos grficamente los valores
propios obtenidos de la matriz de 1arianzas y 8ovarianzas, nos
deberamos !uedar con el n%mero de ees !ue se encuentran
anteriores al Ecodo E !ue se produce en la curva de la grfica en el
plano de las ordenadas - abscisas. $odemos mostrar un eemplo(
'R()ICO 2.9.
E*EM&LO DE 'R()ICA DE LOS VALORES &RO&IOS.
0
1
2
3
4
5
6
7
E1 E2 E3 E4 E5 E6 E7
48
Seg%n ste grfico, deberamos retener los tres primeros ees !ue
se encuentran anteriores al EcodoF.
8omo se puede apreciar, se puede adoptar el criterio de escoger el
n%mero de componentes, seg%n el n%mero de valores propios !ue
sean mayores a 1. #n el grfico, los tres valores propios !ue se
grafican son mayores a uno.
#n la prctica, estas reglas dan el mismo resultado.
2.1.+.9. INTER&RETACIN DE UN AC&
$ara interpretar el anlisis se representan las nubes de puntos
sobre planos formados por pareas de ees de 8omponentes.
As entonces, se podr representar grficamente 81-82, 81-83,
82-83, , etc., sucesivamente "asta lograr una representacin
suficiente.
Seg%n criterios de e-pertos, se consideran importantes solamente
las grficas de 81 vs 82 y de 81 vs 83.
#s %til representar sobre el mismo grfico las nubes de puntos
individuo y puntos variables superpuestos .para ello debe
49
multiplicarse por un coeficiente para !ue estn en la misma
escala/. 5a disposicin de los puntos variables en proyeccin
permite interpretar la nube de puntos individuo.
#n la interpretacin de un Anlisis de 8omponentes $rincipales es
conveniente seguir el siguiente orden(
1. @nterpretacin de los factores en funcin de su correlacin
con las variables.
2. @nterpretacin de la nube de variables.
3. @nterpretacin de la nube de individuos.
<. @nterpretacin de la representacin simultnea.
Son de importancia para nuestro trabao, las interpretaciones de
las nubes de variables y de individuos. $ara ello presentaremos un
anlisis de estas interpretaciones.
a- Int0$p$0ta/!5n 30 la nu60 30 8a$!a6l01
Sobre los planos factoriales los puntos variables estn situados en
el interior de un crculo de radio unidad . 5os puntos variables
50
estn meor representados en el plano cuando estn pr-imos al
borde del crculo.
5a nube de variables no est centrada en el origen, sino !ue las
variables pueden estar situadas todas al mismo lado del origen si
se correlacionan positivamente. #n el grfico !ue mostraremos a
continuacin, podremos observar !ue las variables *1, *2, *3, *<,
*?, *= y *1' estn bien representadas sobre el plano .1,2/
mientras !ue *G, *>, *H, lo estn mal .aleadas del crculo/.
*1 y *2 estn muy correlacionadas positivamente entre s con
la componente 1.
*3 y *< estn muy correlacionadas positivamente entre s y
negativamente con la componente 1.
*? y *2 estn incorrelacionadas.
'R()ICO 2..
E*EM&LO DE 'R()ICO DE LA NU;E DE VARIA;LES.
51
#l primer factor .componente/ opone las variables *1 y *2 a *3 y
*< ser apro-imadamente funcin lineal creciente de *1 y *2, y
decreciente de *3 y *<. $uede interpretarse como ligado a estas
variables.
Se puede sustituir las variables *1 a *< por 81 sin !ue se pierda
muc"a informacin.
#l segundo factor .componente/ recoge informacin !ue no
recoga el primer factor, por ser perpendiculares. #sta componente
est ligada a la variable *? y se interpretara en funcin de ella.
5a interpretacin de las variables *G, *> y *H "abr !ue buscarla
en otros ees, pues estn muy mal representados sobre el plano
.1,2/. Io sirven para la interpretacin de estos factores, pues su
correlacin es muy pe!ueJa.
6- Int0$p$0ta/!5n 30 la nu60 30 !n3!8!3uo1.
Ana vez interpretada la nube de variables, se puede pasar a la de
individuos, representados por sus coordenadas sobre los factores
.componentes/.
52
5a nube de individuos estar centrada en el origen por la
transformacin !ue "emos realizado en los datos iniciales.
Si dos individuos estn bien representados en el plano, su
pro-imidad se interpreta como comportamiento semeante, es decir
!ue si se observa un grupo de individuos, y estn bien
representados, significa !ue toman valores pr-imos para todas
las variables medidas.
#s necesario tener en cuenta !ue los ees factoriales se obtienen a
partir de la informacin suministrada por todos los individuos, y uno
puede estar mal representado sobre este planoK por eso es
necesario comprobar siempre su calidad de representacin.
2.1.+. A&LICACIONES M(S IM&ORTANTES DEL AC&.
#l A8$ puede ser utilizado para realizar gran variedad de trabaos
y se puede complementar con otros mtodos. 5as aplicaciones
ms importantes son(
@. Bbtencin e interpretacin de factores.
53
#l A8$ permite combinar variables con el obeto de obtener unos
factores o variables latentes, !ue si bien no se pueden medir
directamente, s tienen un significado. $ermite establecer si e-iste
una estructura latente.
@@. $ara seleccionar y reducir el n%mero de variables.
#l anlisis se puede aplicar a una prueba piloto con gran n%mero
de variables para seleccionar un grupo reducido de ellas, las !ue
ms importancia tienen en la descripcin del fenmeno, y para un
anlisis ms amplio se utilizan las variables ms correlacionadas
con los primeros factores.
@@@. Atilizacin de los factores .componentes/ como nuevas
variables. Se puede reducir el n%mero de variables a considerar en
un estudio si se utilizan los factores resultantes de A8$. 5os
anlisis posteriores son ms sencillos al ser menor el n%mero de
variablesK adems stas estn incorrelacionadas, lo !ue evita
algunos problemas !ue surgen en anlisis como el de regresin
cuando las variables estn correlacionadas.
@1. Agrupacin de variables !ue tienen comportamientos
anlogos.
54
2.1.<. AN(LISIS DE DISCRIMINACIN.
#ste Anlisis de )iscriminacin es una tcnica multivariada !ue se
enfoca en la separacin de grupos de observaciones.
5os obetivos principales del anlisis de discriminacin son los
siguientes(
)escribir grficamente .en tres o algunas dimensiones/ o
algebraicamente, las diferentes caractersticas de observaciones
de varias poblaciones consideradas conocidas. 0rataremos de
encontrar una funcin !ue dependa de valores numricos de tal
forma !ue los grupos de datos se puedan separar tanto como sea
posible.
8lasificar observaciones dentro de dos o ms grupos eti!uetados
anteriormente. #l nfasis en obtener una regla !ue pueda ser
usada para asignar de manera ptima, nuevas observaciones en
los grupos clasificados.
Ana funcin !ue clasifica observaciones puede servir algunas
veces como un distribuidor, y una regla !ue distribuye
55
observaciones sugiere un procedimiento discriminatorio. #n la
prctica, los obetivos anteriormente e-puestos, coinciden
frecuentemente y la diferencia entre separacin y distribucin se
vuelve confusa. 5os valores observados de X difieren en algunos
puntos de una poblacin respecto de la otra.
#ntonces, se puede pensar !ue los valores de = pueden definir la
poblacin
2.1.<.1. SE&ARACIN Y CLASI)ICACIN DE DOS
&O;LACIONES.
#stablecer ideas, nos permiten "acer una lista de situaciones en
las cuales puede ser interesante separar dos clases de
poblaciones o asignar una nueva observacin a una de dos
poblaciones.
#s conveniente eti!uetar las poblaciones como 1 y 2 . 5as
observaciones son com%nmente separadas o clasificadas en base
a mediciones asociadas a p variables aleatorias
X> " ? *1, *2, ......*p@.
56
5os valores observados de X difieren en algunos puntos de una
poblacin respecto de la otra. #ntonces, se puede pensar !ue los
valores de = pueden definir la poblacin 1 o 2. #stas dos
poblaciones pueden entonces ser descritas por funciones de
densidad f1.=/ y f2.=/.
A!u presentamos algunos eemplos !ue sugieren anlisis de
separacin o clasificacin de observaciones.
TA;LA I
E*EM&LOS DE CASOS 2UE SU'IEREN UN ESTUDIO
MEDIANTE AN(LISIS DISCRIMINANTE.
$oblaciones 1 y 2
1ariables de medida X
1. 8ompradores potenciales
de un nuevo producto y
rezagados .referido a
personas !ue ad!uieren un
producto de manera lenta/
#ducacin, bienes !ue posee,
tamaJo de familia.
2. ;asculinos y femeninos. ;ediciones Antropolgicas tales
como circunferencia y volumen de
crneos ancianos
3. 8ompaJas de riesgo
financiero o compaJas
estables econmicamente.
0otal de Activos, capital privado,
capital prestado, ndices
financieros, ingresos por ventas.
57
8omo podemos apreciar, en el primer tem !ue se propone como
eemplo para anlisis discriminante, se muestran dos poblaciones
eti!uetadas . EcompradoresF y Erezagados o compradores
de %ltima "oraF /, y las variables relevantes para la discriminacin
podran ser( educacin, bienes !ue posee, tamaJo de la familia de
la !ue procede, entre otras . #n todo caso, lo !ue se tratar de
clasificar sern observaciones de la forma
X> + L *1 .#ducacin/, *2 .Mienes !ue posee/, *3 .0amaJo de
familia/N como poblacin 1 , compradores, o poblacin 2,
rezagados.
Se concentrar en una clasificacin para dos poblaciones.
Asualmente, las reglas de clasificacin son obtenidas desde las
muestras .
2.1.<.2. CLASI)ICACIN CON DOS &O;LACIONES
NORMALES MULTIVARIADAS. )UNCIN DE
DISCRIMINACIN DE )ISAER
5os procedimientos de clasificacin basados en poblaciones
normales predominan en la prctica estadstica.
58
Se asume !ue f1.=/ y f2.=/ son funciones de densidad normales
multivariadas, la primera con vector de medias 1 y matriz de
covarianzas S1 y la segunda con vector de medias 2 y matriz de
covarianzas S 2.
#l caso de matrices de covarianza iguales es muy usual y est
relacionado con una estadstica de clasificacin lineal simple.
#ntonces en este caso asumimos S1 + S2. + S.
Se toman dos tamaJos de muestra n1 y n2 de poblaciones
normales con parmetros especificados anteriormente. )eseamos
construir una .un/!5n l!n0al !ue discrimine entre observaciones
de dos poblaciones por alg%n tipo de medida de separacin.
$ara el efecto se debe determinar a !ue proporciona la m-ima
razn cuadrtica media (

( ) [ ] { } a S a a a t
T T
/ ) (
2
2 1
2

#fectuando la ma-imizacin con
1 a S a
T
59
resulta lo siguiente(
y la funcin lineal discriminante (
#ntonces adoptamos la siguiente regla de clasificacin(
, Asigne la observacin X " ? *1, *2, O.. , *p@ a la poblacin 1
si(
,Asigne la observacin X " ? *1, *2, O.. , *p@ a la poblacin 2
si(
4 donde S pool03 es (
) - (
2 1
1

S a

1 T
2 1
) ( ) - ( pooled S y
) ( ) ( ) - (
2
1
) ( ) - (
2 1
1 T
2 1
1 T
2 1
+ >

pooled pooled S S
) ( ) ( ) - (
2
1
) ( ) - (
2 1
1 T
2 1
1 T
2 1
+

pooled pooled S S
60

2
2 1
2
1
2 1
1
) 1 ( ) 1 (
1
) 1 ( ) 1 (
1
S
n n
n
S
n n
n
S pooled
1
]
1

+
1
]
1

#n el caso de una diferencia entre matrices de covarianza de las


poblaciones, es decir S1 S2 , la razn de verosimilitud nos
conduce a una funcin discriminante cuadrtica(

,
_



2
1
1
1
1 1 2
1
2 2
det
det
ln ) ( ) ( ) ( ) ( ) (
S
S
X S X X S X X g
T T

4 se adopta la siguiente regla de clasificacin(
Asigne X a la poblacin 1 si(
g.*/ & '
Asigne X a la poblacin 2 si(
g.*/ '
#n resumen, la idea de Pis"er era transformar las observaciones
de la matriz multivariada X a observaciones univariadas 4, tales
!ue las 4 provenientes de las poblaciones 1 y 2 tanto como sea
posible.
61
Pis"er sugiri el empleo de combinaciones lineales de X para
crear 4.
2.1.<.9. DISTANCIA CUADR(TICA DE MAAALANO;IS.
5a funcin discriminante para la clasificacin con parmetros
conocidos es(
X S y pooled
T 1
2 1
) ( ) (



entonces(
[ ]
i
pooled
T
y
S y E
1
2 1
) ( ) (


[ ]
2
2 1
1
2 1
) ( ) ( ) (

poolde
T
y
S y VAR
y de donde es la distancia cuadrtica de ;a"alanobis. ;ientras
ms grande sea sta, ser menos probable !ue la funcin
discriminante clasifi!ue observaciones de manera errnea.
2.1.<.. SELECCIN DE VARIA;LES &ARA LA
DISCRIMINACIN.
#n este punto se e-aminar alg%n tipo de mtodo para la seleccin
de una o ms variables independientes cuantitativas.
62
Si se utiliza un mtodo de seleccin de variables para la
discriminacin, los resultados deberan ser
interpretados con precaucin. Io e-isten garantas de !ue el sub,
grupo de variables seleccionado, es el meor, indiferentemente de
los criterios usados para dic"a seleccin.
5os problemas asociados con procedimientos para la seleccin de
variables se incrementan cuando e-iste una gran correlacin entre
las variables o entre combinaciones lineales de las mismas.

#n el anlisis discriminante, se puede seleccionar a!uel
subconunto de las variables independientes !ue ms discrimine
los grupos establecidos por los valores de la variable dependiente.
#n este caso se puede utilizar el criterio 5ambda de Qil6s.
LAM;DA DE BILCS.
Seg%n este criterio, para elegir el subconunto de variables
independientes ms discriminantes, sera adecuado considerar
a!uel tal !ue, al representar el conunto de toda la muestra en el
subespacio generado por los valores de las variables, por un lado,
los centros de los grupos estuvieran muy separados entre s y, por
63
otro, dentro de cada grupo el comportamiento fuera muy
"omogneo, con valores poco dispersos y cercanos al centro.
5a 5ambda de Qil6s para un conunto de p variables
independientes mide las desviaciones dentro de cada grupo
respecto a las desviaciones totales sin distinguir grupos, en el
espacio p,dimensional generado por los valores de las p variables.
Si su valor es pe!ueJo , la variabilidad total ser debida a las
diferencias entre grupos y, por tanto, el conunto de variables
correspondiente discriminar los grupos. $or el contrario, si su
valor es pr-imo a 1 los grupos estarn mezclados y el conunto de
variables independientes no ser adecuado para construir las
funciones discriminantes.
#l "ec"o de !ue una variable sea la candidata a ser seleccionada
no implica !ue vaya a serlo. #s decir, !ue la 5ambda de Qil6s
tome el mnimo valor no implica !ue ste sea pe!ueJo. )espus,
"abr !ue establecer un criterio para determinar si la informacin
aportada por la variable candidata a ser seleccionada en un paso
es significativa.
64
2.1.D. AN(LISIS DE CONTIN'ENCIA
#l anlisis de contingencia es una tcnica estadstica !ue permite
determinar dependencia entre dos variables aleatorias.
Su anlisis se realiza a partir de la tabla de contingencia !ue es un
arreglo matricial de r filas y c columnas, donde r es el n%mero de
niveles del factor 1 o de la variable * y c el n%mero de niveles del
factor 2 o de la variable 4. 5a dependencia o independencia se
concluye mediante un contraste de "iptesis del siguiente tipo(
Ho H
vs
ntes independie son Y y X Ho
:
:
1
#l procedimiento para verificar la validez del siguiente contraste es
el siguiente(
7ealizar la tabla bivariada de c filas - r columnas.
Mao la "iptesis nula, determinar los valores esperados para
cada celda i de la tabla bivariada.
65
Se "alla el estadstico de prueba para el contraste mencionado
anteriormente. #ste estadstico se lo "alla de la siguiente
manera(

( )

r
i
c
j
ij
ij ij
E
E X
X
1 1
2
2
donde(
*
i
( valor observado en la celda i .
#
i
( valor esperado de la celda i .
r ( R de filas de la tabla.
c ( R de columnas de la tabla.
Se rec"aza Ho en favor de H
1
con un .1,/1''S si(

( ) ( ) 1 1
2 2
> c r X

2.1.E. )UNDAMENTOS DE AN(LISIS )INANCIERO.


66
;ediante este punto daremos a conocer algunos conceptos !ue
estn ntimamente relacionados con las variables numricas a
utilizarse en nuestro anlisis estadstico, por lo cual considero
importante mencionarlos.
#ntre los preceptos ms importantes, podemos mencionar a (
2.1.E.1. LAS CUENTAS
#l dispositivo bsico del resumen de contabilidad es la cuenta.
2sta es el registro detallado de los cambios !ue "an ocurrido en un
activo, pasivo o patrimonio, durante un perodo. 5as cuentas se
agrupan en tres amplias categoras de acuerdo con la ecuacin
contable(
ACTIVOS " &ASIVOS F &ATRIMONIO
ACTIVOS
Activos son los recursos econmicos !ue benefician al negocio y
continuarn "acindolo en el futuro. 5a mayora de las empresas
usan las siguientes cuentas de activos(
67
,#fectivo. ,)ocumentos por 8obrar.
,8uentas por 8obrar ,#dificios.
#ntre otros.
&ASIVOS
#l $asivo es una deuda, es parte de la empresa !ue le pertenece a
terceras personas. Ana empresa tiene generalmente menos
cuentas de pasivos !ue cuentas de activos, por!ue los pasivos del
negocio pueden resumirse bao relativamente pocas categoras.
#ntre las ms importantes tenemos(
,)ocumentos por $agar
,8uentas por $agar.
,$asivos acumulados.
&ATRIMONIO
#s el derec"o del propietario a los activos de un negocio o
empresa. 0ambin se lo conoce como Ecapital contableF. #n una
compaJa de propietario %nico o una sociedad , el $atrimonio se
divide a menudo en cuentas separadas( para el lado del capital del
propietario y para los retiros del propietario.
68
IN'RESOS &OR VENTAS
#s considerada una cuenta del $atrimonio. #s el aumento en el
capital contable debido a la entrega de bienes o servicios a los
clientes. Si un negocio presta dinero a una persona aena al
negocio, necesitar una cuenta por intereses para el inters
ganado por el prstamo.
2.1.E.2. TI&OS DE RAZONES )INANCIERAS
8ada tipo de anlisis tiene un propsito o un uso !ue determina las
diferentes relaciones !ue destaca. An analista puede ser un
ban!uero, y los ban!ueros estn preocupados en la li!uidez a
corto plazo de una empresa a la !ue se podra otorgar un
prstamo a corto plazo. #n contraste, los acreedores a largo plazo
dan muc"o ms nfasis al poder de generacin de utilidades y a la
eficacia de operacin. #llos saben !ue las operaciones no
rentables erosionan los valores de los activos. 5os inversionistas
del 8apital 8ontable estn similarmente interesados en la
rentabilidad a largo plazo y en la eficacia. $or esto, es muy %til
clasificar a las razones financieras dentro de seis
tipos fundamentales(
69
1., 7azones de 5i!uidez.
;iden la capacidad de la empresa para satisfacer las operaciones
!ue venzan a corto plazo.
2., 7azones de Apalancamiento Pinanciero.
;iden el grado en !ue la empresa "a sido financiada mediante
deudas a terceros.
3., 7azones de Actividad.
;ide la eficacia con la cual la empresa usa sus recursos.
<., 7azones de 7entabilidad.
;iden la eficacia de la administracin y cmo se muestra en los
rendimientos !ue se "an generado con las ventas, la inversin y
los activos.
?., 7azones de 8recimiento.
;iden la capacidad de la empresa para mantener su posicin
econmica en el crecimiento de la economa y de la industria.
=., 7azones de 1aluacin.
;iden la capacidad !ue tiene la administracin para crear valores
de mercado en e-ceso de los desembolsos del costo de la
inversin. 5as razones de valuacin son la medida ms completa
del desempeJo, en tanto !ue reflean las razones de riesgo y las
razones de rendimiento.
70
$or el "ec"o de !ue en nuestra matriz de datos encontramos
razones de rentabilidad, pondremos nfasis en los conceptos
respecto de estas razones financieras.
2.1.E.9. RAZONES DE RENTA;ILIDAD
5a rentabilidad es el resultado neto de un buen n%mero de polticas
y decisiones. 5as razones de rentabilidad dan las respuestas
finales acerca de la eficacia con !ue se manea la empresa.
R0n3!G!0nto 1o6$0 lo1 A/t!8o1 Total01.
#l rendimiento sobre los activos totales pretende medir la eficacia
con la cual la empresa "a empleado sus recursos totalesK alguna
veces se denomina rendimiento sobre la inversin. Se calcula
mediante la siguiente ecuacin(
7endimiento + .Atilidad o $rdida C Activos 0otales./D1''.
Si tenemos un rendimiento del >S, podemos entender !ue por
cada 1'' unidades monetarias !ue la empresa invierte en la
compra de activos, gana > unidades monetarias sobre estos.
71
R0n3!G!0nto 1o6$0 0l &at$!Gon!o
5a razn de la utilidad neta despus de las impuestos al patrimonio
o capital contable mide la tasa de rendimiento sobre la inversin de
los accionistas. Se calcula as(
7endimiento + .Atilidad o $rdida C 8apital 8ontable/D1''.
Si se obtuviera un rendimiento del 12S se podr entender !ue por
cada 1'' unidades !ue invierten los accionistas de la empresa,
ganan 12 unidades.

R0n3!G!0nto 1o6$0 lo1 InH$01o1.
0ambin se lo conoce como Emargen de utilidadF sobre las ventas.
Se lo calcula dividiendo las Atilidades Ietas despus de @mpuestos
entre los @ngresos por ventas , y nos da como resultado la utilidad o
prdida por 1'' unidades monetarias de ventas.
7endimiento + .Atilidad o $rdida C @ngresos por ventas/D1''.
Si tuviramos como resultado de esta ecuacin un porcentae del
?S, y este se por debao del promedio de la industria, podramos
72
decir !ue los precios de la empresa son relativamente baos o !ue
sus costos son relativamente altos, o ambas cosas a la vez.