LICENCIATURA EN ESTADISTICA
PROGRAMACION CON SAS
TAREA 2
Fecha de entrega: 22 de Abril del 2014.
Instrucciones: mostrar eédigos y salidas de SAS.
1. Las medidas de distancia es una forma de medir el parecido de objetos (plantas,
Arboles, personas). Estas medidas son basadas en la expresi6n de caracteres morfoldgicos
y fisioldgicos. Algunos de los caracteres a evaluar son nominales, es decir, los objetos
presentan o no el cardcter. La presencia/ausencia de un caricter especifico en un objeto
dado se denota con un 1 si el cardcter esta presente, y con un 0 si el cardcter esta ausente.
Note que la codificacién 0 y 1 en realidad representa un ensayo Bernoulli( p).
La siguiente tabla muestra la probabilidad p, de presencia del cardcter j en el objeto i
para dos poblaciones:
Probabilidad
_,_|Caracter 1 | Caracter 2 | Caracter 3 | Cardcter 4)
Poblacion
Qo. (Pa) (Ps) (Pa)
1 | 64 | 040 | 093 | 0.65
220} 029 | 098 [09
a) Simular Ia presencia o ausencia de los cuatro caracteres en 13 individuos de cada
poblacién.
b) Dos de las medidas de similitud entre dos objetos (O, y Q,) son el coeficiente de
coincidencia (simple matching coeffient, SM) y coeficiente de Sokal y Sneath (SS1):
SM = Nut No | Sst 2(Ny + Ne.
Nut No + Nor + Noo 2M + Noo) Nor + Mo
Donde:
‘N, : No. de caracteres presentes en ambos objetos.
Nig: No. de caracteres presentes en O, pero no en O,
Vy, : No. de caracteres presentes en O, pero no en O,
Nyy No. de caracteres ausentes en ambos objetos.
1. Eseribir el programa para obtener las distancias SM y SSI entre los 13 individuos de
cada poblacién simulados en a). Las distancias deben ser calculadas unicamente para
individuos de la misma poblacién (por ejemplo, las distancias entre los objetos 1, 2, 3 de
la poblacién 1).
2. Eseribir el programa para obtener las distancias SM y SS1 entre los 13 objetos de la
poblacién 1 y los 13 objetos de la poblacién 2 (por ejemplo, la distancia entre el
individuo I de la poblacién 1 y el individuo 1 de la poblacién 2),