You are on page 1of 15

PAQUETES ESTADISTICOS GUIA DE MANEJO DE STATA _____________________________________________________________________ Maestra en Ciencias de la Salud con rea de Concentracin en Epidemiologa El presente documento

resume los principales comandos utilizados para el anlisis de bases de datos en STATA 1. ADMINISTRACIN GENERAL DE BASES DE DATOS COMANDOS PARA ABRIR BASE DE DATOS: USO Estos comando se utilizan para abrir una base de datos. Es importante mencionar ue STATA solo puede e!ecutar bases con e"tensin dta. #ara trans$ormar las bases se utiliza un pa uete ane"o denominado STATA T%A&S'E%. Esta opcin *ace uso del menu propuesto por el programa

COMANDO using unidad:/nombre de la base.dta use a:/ nombre de la base.dta

Clic( a $ile ) Arc*i+o ,pen - Abrir Seleccionar el arc*i+o a e!ecutar Abrir .cono de carpeta Seleccionar el arc*i+o a e!ecutar Abrir

COMANDOS PARA GUARDAR INFORMACIN ARCHIVO LOG USO #ara abrir arc*i+o log ue permite grabar automticamente toda la in$ormacin de comandos 1 resultados generados en el anlisis de la base de datos. #uede ser ledo en el procesador de te"to 2ord.

COMANDO Clic( al icono /pergamino0 Elegir localizacin para guardar el arc*i+o Asignar nombre al arc*i+o con e"tensin log Abrir #ara cerrar clic( en el icono 1 en close log $ile 3og using a:/nombre del archivo.log Clic( al icono /pergamino0 Elegir localizacin del arc*i+o Elegir el arc*i+o Clic( a la opcin de append to e"isting $ile #ara cerrar clic( en el icono 1 en close log $ile

#ara abrir un arc*i+o log 1a e"istente en el cual se uieren ane"ar nue+os resultados.

COMANDO PARA DESCRIPCIN DE LA BASE DE DATOS

COMANDO (DIFERENTES OPCIONES) USO Se utiliza para describir las generalidades de describe la base de datos /numero de obser+aciones4 de

desc d codeboo(

numero de +ariables 1 tama5o de la base0

Se utiliza para ubicar +alores perdidos o $altantes 1 obser+ar generalidades de las +ariables list i$ Se utiliza para listar cual uier obser+acin E!. list i$ edad66. contenida en la base de datos. En este caso 3ist i$ edad 7. se e!empli$ica la b8s ueda de +alores $altantes de la +ariable edad COMANDOS PARA EDICIN DE LA BASE DE DATOS COMANDO bro2se .cono data bro2ser edit list label +ar +ariable E!. label +ar edad 9edad en a5os: label de$ine E!. label de$ine edad ;:</=<: =:=;/><: ?:>;/ma": label +alue E!. label +alue edad edad generate gen gene gener E!. gen edad=6edad recode rec reco recod E!. recode edad= min/>A6; >A/ma"6= replace rep repl E!. replace edad6; i$ edad76=< Beep drop E!. drop all /borra todas las +ariables0 drop edad /borra la +ariable edad0 Sort E!. sort $olio /ordena num@ricamente por $olio la base de datos0 order E!. order edad talla genero Mo+e E! mo+e peso sa+e as sa+e4 replace USO Se utiliza para +er la *o!a con los datos /tabla0 #ara edicin de la base de datos #ara listar obser+aciones 1 las +ariables de cada indi+iduo #ara eti uetar +ariables #ara cambiar la codi$icacin de la +ariable #ara asignar los +alor eti uetados a las +ariables #ara genera una nue+a +ariable id@ntica a partir de una e"istente en la base de datos. En este caso se e!empli$ica la generacin de una +ariable id@ntica a la edad #ara recodi$icar los +alores o categoras de una +ariable. En este caso se e!empli$ica la recategorizacin de +ariable edad= generada.

#ara reemplazar +alores o categoras de una +ariable. En este caso se e!empli$ica el reemplazo de las edades menores o iguales a =< por el +alor ; en la +ariable edad. #ara guardar +ariables4 principalmente con el $in de construir una nue+a base de datos a partir de una e"istente #ara borrar +ariables #ara ordenar las +ariables de la base de datos #ara cambiar orden de las +ariables dentro de la base de datos #ara mo+er o ubicar una +ariable en la *o!a de datos al comienzo #ara guardar los cambios de la base de datos #ara guardar los cambios de la base de datos

clear

#ara cerrar base de datos o limpiar comandos anteriores COMANDOS PARA PEGAR BASES DE DATOS COMANDO using a:/nombre de la base principal.dta sort $olio Beep $olio +ar; +ar=.... +arp sa+e as a:/nombre de la base de datos hija.dta using a:/nombre de la base.dta Sort $olio merge $olio using a:/ nombre de la base de datos hija.dta tabFmerge sa+e4 replace describe drop Fmerge USO #ara abrir una base gen@rica localizada en A ,rganizar esta base de datos de acuerdo con el n8mero de $olio Seleccin de las +ariables ue se desean conser+ar Cuardar arc*i+o de las +ariable seleccionadas en el punto anterior #ara abrir la base a la cual deseamos pegar las +ariables seleccionadas arc*i+o: nombre de la base de datos hija.dta ,rganizar esta base de datos con base en la +ariable $olio. 3a +ariable $olio debe ser igual en todos los arc*i+os #ara unir las +ariables al arc*i+o en uso. 3a unin se e+idencia por la creacin automtica de la +ariable Fmerge #ara +eri$icar la unin. Hebe obser+arse una sola categora /?0 con el total de las obser+aciones #ara guardar los cambios *ec*os en la base de datos nombre de la base principal.dta #ara re+isar ue la nue+as +ariables $ueron incluidas #ara borrar la +ariable creada Fmerge4 de!ando la posibilidad de nue+a uniones

PASO ; = ? > A D E G I ;< ;;

CREACIN DE UN ARCHIVO DO

Es un arc*i+o ue constru1e inclu1e la relacin de todos los comandos necesarios para abrir4 e!ecutar 1 analizar una base de datos. Es una rutina de comandos. 2. ANALISIS DE BASES DE DATOS COMANDOS DESCRIPCIN UNIVARIADA USO #ara estimar de una o ms +ariables continuas numero de obser+aciones4 media4 des+iacin estndar 1 rango. En el e!emplo se describirn las +ariables edad4 peso 1 talla #ara estimar de una o mas +ariables continuas numero de obser+aciones4 medidas de tendencia central4 +alores mnimos 1 m"imos4 medidas de dispersin4 #ercentiles4 curtosis 1 sesgo /ma1or detalle0.

COMANDO summarize summ sum E!. summ edad peso talla summarize summ sum adicionando +ar4 detail E!. summ edad4de

E!. E!. l+

tabulate tab tab raza tabulate; tab; tab; raza ni+elsoc genero

grap* +ar Crap* +ar4 bo" grap* +ar4 norm norm +ar S(test +ar

s2il( +ar ladder +ar

#ara estimar en una +ariable categrica n8mero de obser+aciones4 porcenta!e 1 $recuencia acumulada #ara estimar simultneamente en mas de una +ariable categrica n8mero de obser+aciones4 porcenta!e 1 $recuencia acumulada #ara obser+ar dispersin de los datos 1 +alores aberrantes #ara +er la distribucin de una +ariable continua #ara +er la distribucin en ca!a de una +ariable continua #ara +er la distribucin de una +ariable continua comparada con el patrn de distribucin normal #ara realizar la prueba estadstica de normalidad de una +ariable continua /Jo: distribucin normal0. ,$rece los datos de curtosis 1 sesgo /la distribucin normal tiene una curtosis de ? 1 un sesgo de cero0 #rueba de S*apiro Kil( para probar normalidad de una +ariable continua /Jo: la +ariable tiene distribucin normal0 #ara comprobar ob!eti+amente la normalidad de una +ariable continua 1 e+aluar sus posibles tras$ormaciones en b8s ueda de normalidad en su distribucin. Jo: la +ariable continua trans$ormada tiene distribucin normal

COMADOS PARA AN LISIS BIVARIADO

COMANDO USO RELACIN VARIABLE CONTINUA VS. DICOTMICA sdtest +ar4 b1/+ar0 Se utiliza para comparar las +arianzas una E!. sdtest edad4 b1/genero0 +ariable continua con una dicotmica. Jo: las +arianzas son iguales ttest +ar4 b1/+ar0 Si las +arianzas son iguales. Compara las medias una +ariable continua con una dicotmica. Jo: las medias de las categricas son iguales. ttest +ar4 b1/+ar0 une ual Si las +arianzas no son iguales. Compara las medias una +ariable continua con una dicotmica. Jo: las medias de las categricas son iguales. tab +ar4 summ /+ar0 Muestra una tabla de contingencia ue E!. tab genero4 summ /edad0 relaciona una +ariable dicotmica con una continua %egresin lineal con un slo regresor regress reg reg +ardep +arindep RELACIN VARIABLE DICOTMICA VS. DICOTMICA

tab +ar +ar4c*i=

%elaciona dos +ariables dicotmicas mediante una prueba de c*i= tab +ar +ar4 ro2 cell e"act4 all %elaciona dos +ariables categricas4 calcula porcenta!e dentro de las $ilas 1 las columnas4 adems de la prueba e"acta de 'is*er cuando se tiene una celda con menos de A obser+aciones. tabi a b c d %ealiza una tabla de contingencia con los +alores e"actos de las celdas4 adems de la prueba de c*i= cc +ar +ar #ermite obtener la razn de momios relacionando dos +ariables dicotmicas cci a b c d %elaciona una tabla de contingencia con los +alores e"actos de las celdas4 adems de la prueba de c*i=. ,$rece el ,% cs +ar +ar #ermite obtener %% relacionando dos +ariables dicotmicas csi a b c d #ara realizar una tabla de contingencia con los +alores de agrupados de la tabla. Calcula el %% logit +ardep +arindep #ermite realizar una regresin logstica con un slo regresor 3ogistic +ardep +arindep RELACIN VARIABLE CONTINUA VS. CATEGRICA DE MAS DE DOS CATEGORIAS tab +ar4 summ /+ar0 ano+a %ealiza una tabla de contingencia ue E!. tab genero4 summ /edad0 relaciona una +ariable categrica con una continua. ,$rece di$erencia de medias 1 +arianza entre las categoras one2a1 +ar +ar4 means bon$erroni #ermite comparar medias 1 +arianzas entre los grupos. #ara medias: Jo: 3as medias son di$erentes J;: Al menos una media es di$erente. #rueba Larttlet /+arianzas0: Jo: 3as +arianzas son iguales J;: Al menos una +arianza es di$erente. RELACIN VARIABLE CONTINUA VS. CONTINUA Correlacin de #earsn. Esta correlacin p2corr +ar +ar4 sig a!usta por el numero de regresores. El corr +ar +ar4 sig calculo toma en cuenta el numero de obser+aciones completas. pcorr +ar +ar Correlacin parcial. El calculo se realiza sin ponderar por otras +ariables plot +ar; +ar= #ermite gra$icar en diagrama de dispersin dos +ariables continuas (sm +ar; +ar=4 lo" #ermite gra$icar en diagrama de dispersin dos +ariables continuas con t@cnica de sua+izamiento CONTRUCCIN DE VARIABLES DUMM! PARA VARIABLES DE MAS DE DOS CATEGORIAS

COMANDO tab +ar4gen /+ar0

USO #ara generar +ariables indicadoras de una +ariable de ms de dos categoras

AN LISIS MULTIVARIADO USO Correlacin de #earsn. Esta correlacin a!usta por el numero de regresores. Solo se usa para +ariables continuas Correlacin parcial. Sin ponderacin por otras +ariables. Solo se usa para +ariables continuas Comando para regresin lineal m8ltiple para anlisis multi+ariado con una +ariable dependiente continua 1 n +ariables independientes de cual uier tipo Comando para regresin logstica m8ltiple con una +ariable dependiente dicotmica 1 n +ariables independientes de cual uier tipo. 3os resultados estimados estn en escala logartmica4 lo ue permite estimar probabilidades 1 proporciones a!ustadas en estudios de co*orte 1 trans+ersales respecti+amente Comando para regresin logstica m8ltiple con una +ariable dependiente dicotmica 1 n +ariables independientes de cual uier tipo. 3os resultados estimados estn en escala real /razones de momios en estudios de casos 1 controles 1 razones de momios de pre+alencia en estudios trans+ersales0. Comando para usar el modelo lineal generalizado para una +ariable con distribucin poisson medida como conteo /regresin poisson0 1 n +ariables independientes de cual uier tipo Comando para regresin poisson m8ltiple para anlisis multi+ariado con una +ariable dependiente de conteo 1 n +ariables independientes de cual uier tipo. 3os resultados estn en escala logartmica Comando para regresin poisson m8ltiple para anlisis multi+ariado con una +ariable dependiente de conteo 1 n +ariables independientes de cual uier tipo. 3os resultados estn en escala real /riesgos relati+os0 &ota: la +ariable e"posure se utiliza para a!ustar4 cuando los denominadores no son iguales El uso de nolog es opcional4 omite las iteraciones de realiza el pa uete estadstico.

COMANDO p2corr +ardep +arindep; +arindep=M.. +arindepp4 sig pcorr +ardep +arindep; +arindep=M.. +arindepp ,pciones: regress/reg reg +ardep +arindep; +arindep= +arindep?..........+arindepp logit +ardep +arindep; +arindep=M. +arindepp

3ogistic +ardep +arindep; +arindep=M. Narindepp

glm +ardep +arindep; +arindep=.... +arindepp4 $amil1 /poisson0 lin( /log0 lno$$/e"posure0 nolog #oisson +ardep +arindep; +arindep=..... +arindepp4 e"p/e"posure0 nolog

#oisson +ardep +arindep; +arindep=..... +arindepp4 e"p/e"posure0 nolog irr

s2 E!. s2 logit +ardep +arindep; +arindep=.... +arindepp4 pr/<.=0 'or2ard 6 pe Lac(2ard 6 pr

El step2ise es un comando ue le solicita al pa uete estadstico la b8s ueda de un modelo per$ecto estadsticamente. Se a!usta con los +alores de p esperados en las relaciones. Osado para cual uier tipo de regresin

". DIAGNOSTICO DE MODELOS MULTIVARIADOS REGRESIN LINEAL MULTIPLE COMANDO USO VERIFICACIN DE SUPUESTOS / ANLISIS DE RESIDUOS predict nombre de la variable de Ona +ez corrido el modelo propuesto4 residuos4 rstudent generar residuos estudentizados r+pplot +arind; #ermite gra$icar los residuos estudentizados con cada +ariable independiente norm nombre de la variable de residuos #ermite comprobar la normalidad de los residuos generados s2il( nombre de la variable de residuos r+$plot4 1line/<0 #ermite comprobar el supuesto de ue la media de los residuos es cero 1 la +arianza es constante Jettest Esta prueba es la de *eterocedasticidad /Coo()Keisberg04 se usa para comprobar el supuesto de ue los residuos tienen +arianza constante. Jo: los residuos no tienen +arianza constante DETERMINACIN DE PUNTOS INFLUYENTES predict nombre de la variable4 *at #ara predecir los +alores de la matriz sombrero count nombre de la variable P=Qp/n #ara contra los +alores ma1ores a =p/n 3ist i$ nombre de la variable P=Qp/n #ara listar los $olios de los puntos ma1ores de =p/n #O&T,S .&'3ORE&TES E& E3 NECT,% LETA /distancia de Coo(0 predict nombre del archivo4 coo(sd Jabiendo corrido el modelo propuesto se predicen los +alores entre cada obser+acin 1 la nube de puntos Count nombre de la variable P; #ara contar los puntos $uera con una distancia ma1or de ; PUNTOS INFLUYENTES EN CADA BETA d$beta #ermite calcular los dbeta de cada regresor sum d$+arind; d$+arind=..... d$+arindp #ermite obser+ar el rango 1 la media de los dbeta de cada regresor $or +ar d$+arind; d$+arind=....... #ermite identi$icar los puntos in$lu1entes de d$+arindp:count i$ abs/S0P=/s rt/n0 cada regresor &ota: Cuando *a1 una incongruencia de detectar puntos in$lu1entes en cada beta4 pero no en el +ector se calculan los puntos in$lu1entes en los +alores predic*os H$it predict nombre de la variable4 d$its #ermite predecir los +alores predic*os sum nombre de la variable #ermite la obser+acin de los rangos 1 la media de los +alores predic*os count i$ abs/d$it0P=Qs rt/p/n0 #ermite contar los +alores predic*os ma1ores de =s rt/p/n0 list +ardep +arind; +arind=M.+arindp i$ #ermite listar los +alores predic*os ma1ores

abs/d$it0P=QQs rt/p/n0

+i$

de =s rt/p/n0 &ota: luego de omitir los puntos in$lu1entes debe correrse nue+amente el modelo. ANLISIS DE MULTICOLINEALIDAD Ona +ez corrido el modelo propuesto se calcula el $actor de in$lacin de la +arianza. Nalores ma1ores de ;< indican multicolinealidad

REGRESIN POISSON COMANDO USO PRUEBAS DE BONDAD DE AJUSTE poisgo$ Ona +ez corrido el modelo propuesto 1 posteriormente el modelo nulo se realiza esta prueba de bondad de a!uste ue compara estos modelos. Jo: el modelo propuesto a!usta los datos /los regresores incluidos e"plican a R0. 3rtest4 s/<0 Ona +ez corrido el modelo propuesto se escribe el comando 9lrtest4 s/<0:4 luego se corre el modelo nulo 1 el comando 9lrtest:. Esta prueba de bondad de a!uste compara los dos modelos4 ba!o la Jo: los dos modelos e"plican igualmente el comportamiento de R ANLISIS DE RESIDUOS glmpred nombre de la variable de los #ermite generar los residuos de de+ianza residuos4 de+ sum nombre de la variable de los #ermite la obser+acin de las caractersticas residuos de los residuos de de+ianza norm nombre de la variable de los #ermite determinar la distribucin de los residuos residuos de de+ianza s2il( +ar #rueba de S*apiro Kil( para probar normalidad de los residuos de de+ianza /Jo: los residuos de de+ianza tiene distribucin normal0 REGRESIN LOGISTICA COMANDO USO PRUEBAS DE BONDAD DE AJUSTE l$it Ona +ez corrido el modelo propuesto se utiliza esta prueba para +eri$icar si el modelo a!usta los datos. Jo: el modelo a!usta los datos l$it4 group/;<0 Modi$icacin propuesta por Josmer 1 3emes*o2. Oa +ez corrido el modelo propuesto se utiliza esta prueba para +eri$icar si el modelo a!usta los datos. Jo: el modelo a!usta los datos lstat #ermite e+aluar sensibilidad 1 especi$icidad del modelo4 adems de los $alsos positi+os 1 negati+os.

GRAFICAS DIAGNOSTICAS #ermite e+aluar el +alor predicit+o del modelo. On modelo sin +alor predicti+o tiene rea <.A 1 un modelo per$ecto tendra rea ; lsens A tra+@s de una gra$ica4 relaciona sensibilidad 1 especi$icidad del modelo. ANLISIS DE RESIDUOS lpredict nombre de la variable de los #ermite generar residuos estandarizados residuos grap* res nombre de la variable de los #ermite gra$icar los residuos residuos grap* res nombre de la variable de los residuos4 1line/<0 sum nombre de la variable de los #ermite la obser+acin del rango 1 la media residuos de los residuos estandarizados lpredict dbetas4 dbeta #ermite generar dbetas4 en b8s ueda de puntos in$lu1entes de cada regresor /beta0 sum dbeta #ermite obser+ar el rango 1 la media de los dbetas grap* res nombre de la variable de los residuos4 t2o2a1 one2a1 bo" border 1line/<0 lroc #. ANALISIS DE SUPERVIVENCIA la estimacin de super+i+encia se *ace con m@todos no param@tricos4 usaremos Baplan Meier. Anlisis utilizado para estudios longitudinales. Tiene las siguientes caractersticas: #resencia $undamental de censura #resencia de $allas /e+ento0 3a +ariable dependiente o respuesta es el tiempo El e+ento esta medido categricamente COMANDO stset tiemdd censura; tab censura; . sum tiemdd4 detail . sts list USO #repara a STATA para el anlisis de super+i+encia. Se le indica la +ariable tiempo 1 censura #ermite la obser+acin de la +ariable censura #ermite la obser+acin de los +alores m"imos 1 mnimos de la +ariable tiempo. .nclu1e $allas 1 censuras 3a descripcin se *ace mediante la construccin de tablas de +ida. 3os principales parmetros son: Time: tiempo de super+i+encia Legtotal6 indi+iduos +i+os !usto antes de este tiempo. $ail6&umero de $allas $ail/beg total6 probabilidad estimada de super+i+encia en el tiempo S estimada6 producto de el &o. de su!etos +i+os antes del tiempo ) &o. de

. sts list4 b1/pap0

. sts grap* . sts grap*4 b1/etapa0 . sts test etapa4logran(

$allas / &o. de indi+iduos ue estn +i+os antes del tiempo. S estimada es la $uncin de super+i+encia. Este analisis esta a!ustado por el tiempo de las censuras. #ermite la construccin de una tabla de +ida estrati$icando por una +ariable. En este e!emplo +emos la super+i+encia de las mu!eres con antecedente de pap &ota: &o se pueden *acer anlisis de in$erencias en bi+ariados. 3os anteriores comandos gra$ican. las ra1as *orizontales muestran las censuras 1 las +erticales las $allas. 3ogran( se usa para +er di$erencias en las cur+as de super+i+encia obser+adas en Bapplan M. Jo6 no *a1 di$erencia entre las lneas

&,TA: El anlisis bi+ariado 1 multi+ariado se *ace mediante el modelo de riesgos proporcionales de co".

10

Comandos 1 su descripcin:

Ma. Esperanza 3ucas %esendiz A$$%&'. Este comando permite unir a las obser+aciones de dos bases de datos 1 no a tra+@s de +ariables completas. B()*+%. 'a+orece la +isualizacin de datos de la base en la *o!a de captura sin la posible opcin de modi$icacin. ,- ./(: +01 ./(2 '%3/45 Como +ariante del sum condiciona por cual uier +ariable la descripcin en detalle de cual uier otra 6%&345% #ermite obser+ar los percentiles ue se deseen de S +ariable con caracterstica de continua para ue de esta $orma pueda ser poder di+idirla en categoras. C5%/( Este comando oculta la base de datos sin ue se sal+e 1 sin ue sea necesario salir del programa C)'%,))7 A tra+@s de este comando se e"plora una +ariable S a1udando a recordar sus +alores. 6)(( ./( ./( A tra+@s de este comando se establece la correlacin entre dos o ms +ariables 6)0&3 48 /,+ (6))7)91 Se despliega el +alor entre los residuos 1 beta 6)0&3 48 /,+('843+)92:+;(3($<&) Cuenta los puntos in$lu1entes de los +alores predic*os mismos ue no deben sobrepasar de =Qs rt/p/n0. 6)0&3 48 /,+(DF./(1)92<+;(3(&) Cuenta los puntos in$lu1entes en cada una de las +ariables independientes /S0 del modelo4 mostrando el n8mero de ellos4 ue no debe sobrepasar de =/s rt/n0 6)0&3 48 /,+((%+4')91.=> #resente el conteo de residuales ma1ores a ;.ID '%+6(4,% Es la descripcin de una base de datos en general 1 de una +ariable /S0 en particular '8,%3/ Se generan las distancias de di$erentes +ariables independientes incluidas en el modelo /S04 es decir las distancias entre residuos 1 el beta)! '4+$5/Este comando sir+e para realizar cual uier operacin matemtica. '()$ Lorra +ariables a indicacin del in+estigador. '()$ ./(?./( Lorra desde una +ariable inicial *asta una +ariable $inal. %'43 Este comando permite la +isualizacin de los datos de la base en la *o!a de captura con opcin de alg8n tipo de modi$icacin. %@432 65%/( Este comando se emplea para salir del programa preser+ando el log pero sin sal+ar la base. 8$(%'463 '843+2 '843+ A tra+@s de este comando se generan las distancias e"istentes entre los +alores obser+ados o predic*os 1 los esperados. A%&

11

Se genera una nue+a +ariable ue puede ser independiente o bien ser origen de otra. A(/$B DF./(1 DF./(22 ,)@ -54&% #ermite realizar un gr$ico de ca!a condicionado con la $inalidad de +isualizar puntos in$lu1entes. A(/$B (%+ $(%' Se gra$ican los residuos estandarizados A(/$B (%+ $(%'2 -54&% 3*)*/- )&/*/- ,)@ ,)('%( Se gra$ican los residuos estandarizados4 con una lnea paralela al e!e de las "Ts perpendicular al e!e de las /104 inclu1endo adems4 a un bo" plot paralelo a ambos e!es4 mostrando +alores aberrantes. A(/$B (%+ $(%'2 -54&%(C) Esta gra$ica permite +er los residuos estandarizados4 con una lnea paralela al e!e de las S perpendicular al e!e de las R. A(/$B ./( #ermite realizar de $orma sencilla4 un *istograma de una +ariable/S4 R0. A(/$B ./( ./( #ermite realizar un gr$ico de correlacin entre dos +ariables +isualizando la tendencia A(/$B ./( ./(2 6)&&%63(5) Se realiza un gr$ico de correlacin entre dos +ariables con una lnea ue permite unir todas las obser+aciones. A(/$B ./(2 ,)@ Hiagrama o gr$ico de ca!a. A(/$B ./(2 ,)@ ,Hiagrama o gr$ico de ca!a condicionado por +alores de cual uier otra +ariable A(/$B ./(2 ,)@ ,-(./() -54&% #resenta una lnea paralela al e!e de las /S0 1 compatible en +alores con e!e de las /R0 en diagrama de ca!a ue compara dos +ariables. A(/$B ./(2 B4+ Se realiza un *istograma sencillo de la +ariable solicitada. A(/$B ./(2 B4+ &)(1 #ermite realizar un *istograma con lnea de distribucin +isible. A(/$B ./(2 B4+ &)(1 &)/@4+ #ermite realizar un diagrama de $recuencias con lnea de distribucin +isible. A(/$B ./(2 B4+ -5/,%5 @5/,%5 Eti ueta un diagrama de $recuencias/*istograma0 en sus e!es de manera automtica. D%%$ %etiene en la base de datos4 solo las +ariables ue se deseen4 eliminando automticamente todas a uellas +ariables ue no se escribieron posterior al comando. 7%%$ 48 %etiene los +alores de una +ariable /S0 de $orma condicionada. 7+1 ./( ./( #ermite realiza una diagrama de correlacin entre dos +ariables continuas4 presentando una lnea sua+izada ue se emplea para *acer un promedio de los +alores de ambas +ariables4 pudiendo obser+arse una tendencia. 5/,%5 '/3/ Eti ueta la base de datos completa con el nombre ue el in+estigador asigne. 5/,%5 '%84&% Este comando permite eti uetar categoras de e"posicin o grupos pre+iamente re) codi$icados. 5/,%5 ./50%+ A tra+@s de este comando es posible obser+ar como $ueron nombradas las categoras de e"posicin 1 sus +alores despu@s de *aberse eti uetado. 5/,%5 ./( Eti ueta +ariables. 5/''%(

12

#ermite +isualizar los di$erentes tipos de trans$ormaciones de una +ariable para as4 poder elegir la me!or trans$ormacin. 5843 A tra+@s de este comando se permite e+aluar la prueba de Josmer 3emes*o2 1 +er si los datos se a!ustan al modelo. 54&6)1 ./(?./( %ealiza un prueba de asociacin /,%4 p4 .C0 entre las di$erentes categoras de una +ariable e+aluando su igualdad 1 de esta $orma se agrupen con la condicin de *aber corrido pre+iamente un modelo de regresin. L4+3 #ermite e"plorar a la +ariable. 54+3 8)54) 48 /,+ (DF./(1)92<+;(3(&) Enlista los $olios con puntos in$lu1entes de una +ariable H' en particular. 54+3 8)54) 48 6))791 .ndica $olios de +alores in$lu1entes. 54+3 8)54) 48 '843+92:+;(3($<&) Muestra a los $olios con +alores in$lu1entes. 54+3 8)54) 48 (%+4'91.=> Muestra $olios ue contienen los residuos condicionados a P;.ID. 54+3 48 Condiciona la obser+acin a un +alor espec$ico. 54+3 48 /,+('843+)92:+;(3($<& 3ista puntos in$lu1entes en los +alores predic*os. 54+3 48 /,+(DF./(1)92<+;(3(&) 3ista puntos in$lu1entes de la primera +ariable H' mostrando los datos de todas las +ariables de la base4 inclu1endo las nue+as +ariables ue reci@n $ueron generadas. 54+3 48 /,+((%+4')91.=> 3ista los residuos ma1ores a ;.ID. 54+3 ./(?./( 48 3ista las +ariables desde una inicial *asta una $inal /condicional0. 5)A )88 Hes*abilitar el log. 5)A )& Jabilita el log. 5)A4+346 ./( ./( %ealiza un modelo de regresin logstica bi+ariado as como multi+ariado. 5$(%'463 ',%32 ',%3/ Sir+e para generar residuos generando las distancias de di$erentes +ariables independientes incluidas en el modelo. 5$(%'463 (%+2 (+3/&'/(' Muestra los residuos estandarizados. 5$(%'463 +3/&' Cenera los residuos estandarizados. 5()6 Hiagnstico del modelo atra+@s de la interpretacin del rea ba!o la cur+a condicionado por puntos de corte en su sensibilidad as como de su especi$icidad. 5+3/3 Jace diagnstico del modelo a tra+@s de una prueba de tamiz. 5. ./( Cr$ico de letras4 mostrando +alores aberrantes. 1%(A% #ermite reunir dos bases de datos ue tienen al menos una +ariable en com8n. $(%'463 6))72 6))7+' #untos in$lu1entes en beta por la distancia de cook. $(%'463 (_+302 (+30

13

Cenera los residuos estudentizados posterior a correr un modelo de regresin m8ltiple. $*6)(( ./( ./( Correlacin entre dos o ms +ariables. $*6)(( ./( ./( 48 A tra+@s de este comando se puede establecer una correlacin condicionada entre dos o ms +ariables por +alor/es0 de una de ellas con o sin signi$icancia estadstica. $*6)(( ./( ./(2 +4A #ermite establecer correlacin entre dos o ms +ariables4 con +alor de signi$icancia estadstica. ;&)(1 (%+4' Cr$ica de los residuos a!ustndolos a una lnea de distribucin normal. ;&)(1 ./( Cr$icos ue muestran el a!uste en una cur+a de distribucin normal a los datos por obser+acion. (%6)'% %ecodi$ica los +alores de una +ariable /grupos o categoras de e"posicin0 de acuerdo a determinados puntos de corte biolgicamente plausibles o por estadstica. (%A(%++ %ealiza una regresin lineal simple o m8ltiple. (%A(%++ ./( ./( 48 %ealiza una regresin lineal simple o m8ltiple de manera condicionada. (%&/1% Cambia el nombre a una +ariable. (%$5/6% %eemplaza/modi$ica categoras de una +ariable. (%$5/6% ./( 48 %eemplaza/modi$ica categoras de una +ariable/condicionada0 por la misma o por otra +ariable. +/.%2 (%$5/6% Sal+a la base de datos por las 8ltimas modi$icaciones. +)(3 ,rdena los datos de una +ariable ue pueden e+aluarse con la indicacin UbyU +3%1 ./( Hiagramas de tallo 1 *o!a. +01 6))7 %esumen de datos ue permiten obser+ar el tama5o de la distancia a la beta siendo deseable ue esta distancia de cook 7;. +01 '843 Nisualiza las distancias entre +alores predic*os 1 esperados. +01 DF./(1 DF./(2 DF./(" Nisualiza los puntos in$lu1entes en beta)!. +01 ./( 48 Hescripcin de la +ariable acotada a +alor/es0 considerados por el in+estigador. +01/(4E% A tra+@s de este comando se pueden describir una)mas +ariables resumiendo medidas de tendencia central 1 la distribucin. +01/(4E% ./(2 '%3/45 Hescribe una)mas +ariables resumiendo sus medidas de tendencia central 1 su distribucin. 3/, ./( 48 #ermite a tra+@s de este comando obser+ar datos de una +ariable acotados a cierto +alor/es0. 3/, ./( ./( E"plora dos +ariables. 3/, ./(2 A%& (./()

14

A tra+@s de este comando se producen a las +ariables indicadoras o dummies para cada una de las categoras de la +ariable. 3/, ./(2 +01 ./( Cruza datos descripti+os /medidas de tendencia central de la segunda +ariable0 por categoras de la primera +ariable permitiendo *acer un anlisis de las +ariables por grupos. 3/,_1%(A% Nisualiza la +ariable generada del comando merge. 3/,05/3% E"plora +ariable/s0. 3/,05/3% ./(2 &)5/,%5 Lorra la eti ueta de las categoras ue tenga la +ariable. 33%+ ./( 48 #rueba de t de student condicionada por un +alor/es0. 33%+3 #rueba de t de student de comparacin de dos medias muestrales. 33%+3 ./(2 ,-(./() #rueba de t de student condicionada a la +ariable dependiente .48 .n$lacin de la +arianza /multicolinealidad0. #ara descartar multicolinealidad el +i$ debe ser 7;<.

15