You are on page 1of 59

STATA BÁSICO

NUESTRAS MODALIDADES
PANORAMA GENERAL DE STATA

El escritorio de STATA se divide en cuatro partes:

1. Revisión muestra los commandos ejecutados


2. Resultados muestra los resultados de los comandos
3. Variables lista actual de variables del conjunto de datos
4. Comandos aquí se escriben los comandos
MENÚS Y EDITORS EN STATA:
❑ El menu de escritorio : Donde puede ejecutar todos los comandos.

❑ Editor de datos : Acá puede editar datos que ha cargado

❑ Navegador de datos : Acá úede navegar por los datos que tiene
cargados,pero no editarlos

❑ Editor de archive DO : El archivo Do es aquel donde puede escribir y


ejecutar todos los tipos de comandos. Muy
usado
para la replicación y guardado de lo que ejecuta
con
frecuencia.
~ Do-file Editor -
bestcs.dc
Re TooIs
Edt 'Iiew ..
/' basks.doIl!Ilcta
tJ3 l- .x
:7"trt""iIled;-;-;.do' ,
31 ••••••• tttttttttttttttttttttttttttt
2 .tt scarc session and load data
S ttt
6 .tttttttttttttttttttttttttttttttttt
set more
7
oH
6 use "e:, Users' Herbert' Oocuments\ STATA\
9 lJagecurve\dacsset. dca" I clear
10
11
.ttttttttttttttttttttttttttttttttttttttttttttttttttttt**ttt*ttttt*t****
12
• ttt Noce: load data by O'ive exact path after use command in "
13
11 ..."
.t.t.t.ttttttttttttttttttttttttttttt*
or load tor
• ttttprepare
.tt datapanel
by hand using the File menue
15 .t.t.t.tttttttttttttttttttttttttttttttttt**ttttttttt****t*tt*tttt*****
reO'ressions ttt
16
17
18
ttttt •• tttttttttttttttttttttttttttttt
tsset
vear
index Editor de archivo DO.
19
24
20 Note: STATA neads variables to identitv
Puede tipear
25
21 data
26
22
27
•••••
•••••
year
(1
Qive
Qive second
tirst che che Qroup
cime variable:
period variable:
ttt •••tttttttttttttttttttttttttttttttttttttttttttttttttt
here
here index comandos y
(1980,198 ...
1 2004)
•• t.t•• ttttttttttttttttttttttttttttttttt as panel daca
26
29
30
• t.t Generace variables
•t.t•• ttttttttttttttttttttttttttttttttt
ttttttttttttttt
,2, e j e c utarlos.
. . . 3 2)

*tttttt***t**
31 Qen m_qkc • lfqkcl (lfqkc+
32
33
lhqkt)
Qen ln_uqk1; 10Q(OIqkc) .
34
35
Qen ln_uhqk1; •
10Q(whqk1;)
(Las palabras escritas después
Qen ln_utqk1; •
36
37
36
10Q(wtqk1;)
Qen ln_uqk-C • de * no son reconocidas como
10Q(uqk1;)
39
40
Qen ln_uhqk1; •
10Q(uhqkc)
Qen ln_utqk1; •
comandos,
ejem. * Nota que … *).
41 10Q(utqk1;)
42 tttttt.ttttttttttttttttttttttttttttttttttttttt

43 tttt. Generace dummy variables ttttttttttttttt


44 ttttt •• ttttttttttttttttttttttttttttttttttttttt
45 Qen ed1 •
46 O
17 replace edl • 1 i:tea •• "no voc
18 train"
49
Ready """: 1, Col: O '"
50
J 51Start 1
52
Manuskript •
'" Postehgong ... 1 _¡ Re: Llzenzen... _¡ ........ '---' ........_....:....;.:.........J'>=- ---'=- --',...._.._. ;_--'=- -"--'.--:---- mll .. _¡
¡,p
J\ ,..~ 11:11

53
54
LA GRAMÁTICA EN STATA
Estructura general

[prefix :] command [varlist] [if] [in] [weight] [, options]

Nos concentramos en:

[prefix :] command [varlist] [if] [in] [weight] [, options]


ESTRUCTURA GENERAL

Nos concentramos en:

[prefix :] command [varlist] [if] [in] [weight] [, options]

¿Què quieres hacer?


[prefix :] command [varlist] [if] [in] [weight] [, options]

Primer paso: como cargar datos:


> use “Path:\Filename” , clear

Practique:

> use “Path:\Hogares00.dta” , clear

Otra opción:
-> File -> Open -> Elije tus datos
ESTRUCTURA GENERAL
Dos tipos de variables:

Variable numérica, e.j.: 0, 1, 501, 0.5, -12 etc.

Variable cadena, e.j.: no voy en tren , masculine, femenino, etc.

Cómo lidiar con los tipos e datos:

Variables numéricas: Todas las operaciones matemáticas,


e.j. var1 + var2, var1/var2, var1*var2 etc.

Variables cadena: Usar comillas para la identificación, e.j.


var1 = 1 if sex == “femenino”
[prefix :] command [varlist] [if] [in] [weight] [, options]

Ya que cargo los datos –

Cómo obtener una vision general de los datos?

> describe

“describe” da información general de los datos como: número


de observaciones, la etiqueta de la variables, tipo de
variable, etc.
[prefix :] command [varlist] [if] [in] [weight] [, options]

Cómo obtener una vision general de los datos?


> list

enlista los datos de cada celda (e.j. personas, grupos, clases) en el


conjunto de datos.
ESTRUCTURA GENERAL

Nos concentramos en:

[prefix :] command [varlist] [if] [in] [weight] [, options]

¿Qué le interesa?
[prefix :] command [varlist] [if] [in] [weight] [, options]

[varlist] variable o lista de variables sobre la cual tiene interés.

[varlist] en caso no exista variables STATA ejecutará el commando


sobre todas las variables

Practique:

Con el fin de obtener información del tipo de vivienda y dominio en el


conjunto de datos:

> list dominio p101


ESTRUCTURA GENERAL
Nos concentramos en:

[prefix :] command [varlist] [if] [in] [weight] [, options]

¿Qué se debe cumplir?


[prefix :] command [varlist] [if] [in] [weight] [, options]

Con [if] se puede establecer una condición al conjunto de datos, o


restricciones.

e.j. conocer sólo el ingreso promedio de los migrantes con la educación


más baja (sin formación profesional )
[prefix :] command [varlist] [if] [in] [weight] [, options]

Cómo crear variables indicadoras?

Qué es una variable dummy? Una variable dummy tiene valor 0 o 1.

Los comandos “generate” y “replace”

> gen dom1 = 0

> replace dom1 = 1 if dominio == 1 /* costa norte

Otro ejemplo:

> gen region = 0

> replace region= 1 if dominio <= 3 /*costa


[prefix :] command [varlist] [if] [in] [weight] [, options]

Calcular y transformer variables numéricas


> generate newvar = var1 – var2

STATA conoce las reglas de operaciones matemáticas (+, -, /, logs, etc.)

Practica: Crear el logaritmo de gashog2d:


> generate ln_gashog2d = ln(gashog2d)
[prefix :] command [varlist] [if] [in] [weight] [, options]

Cómo modificar variables?


> replace var = (var1 – var2)/2

STATA conoce las reglas de las operaciones matemáticas (+, -, /, log,


etc.)

Practica: Reemplace ln_gashog2d por log de inghog2d solo para el


dominio “costa sur”
> replace ln_gashog2d = ln_gashog2d*uniform*1000 if dominio
== 3
[prefix :] command [varlist] [if] [in] [weight] [, options]

Cómo crear gráficos?


> graph twoway line var1 year [if] [in]

STATA construye gráficos bidimensionales con lineas, barras, puntos, gráficos


de dispersion, etc. con el comando “graph twoway”, el tipo de gráfico se
asigna después, e.j. “line”

Practica:

> sort dominio gashog2d


> g id=_n
> g gasto=uniform()*10000+gashog2d
> graph twoway line gashog2d gasto id if dominio
== 1
EL ARCHIVO DO

STATA provee un archivo donde se puede escribir los commandos para


luego guardarlos y volverlos a utilizar.

- Los archivos DO se pueden abrir con el comando “doedit”.

Cómo se ejecutan los commandos en un archive do?

- Escribe el commando en el editor de texto, marca el texto y presiona


“CTRL + d”
- si no hay texto marcado, se ejecuta todo el archive do.
El archive Do

Rasones para usar archivos DO:

- su trabajo es documentado y reproducible!

- necesita incluir comentarios en las sintaxis:

e.j.
> *leer datos
> use “C:\User\...data1.dta” , clear
> *obtener una vision general
> describe

- para grabar el archive Do ->File ->Save


- para abrir un archive Do ->File ->Open
- los archivos Do tienen extensión “.do”
,;1Oo-file Editor -
bastes.do
File Edit Tools View

4 *** atart session and load data sss

7 set more off


8
9 use "e: \ Users\ Herbert\ Documents\STATAV
\ agecurve\daeasee.dta" I clear
10
12 ***** Note: load data by give exact path after use conmand in n ...

Este es un ejemplo de archivo Do.


Ir

13 ****** or load data by hand using the File menue


14 ****************************************************%*********zzzzz***
15 *************************************
16
*** prepare for panel regressions ss*
17
*************************************
18
19
20
tsset index year Primero desactiva el “more“ y
21
24
22
***** as
Note: STATA neada variables
give first the group variable:
to identify
here index (1,2,
data panel data “carga“ un conjunto de datos.
2S ... 32)
26 ***** give seconct the time period variable: here (1980,1981 ... 2004)
***********************************tttttttttttttttttttttttt
year ••••••••••
27 t
28 **********************************t*t*t*
29
30
***** Generate variables
***************
Segundo usa el comando para
31 ****************************************
32
33
gen m_qke = lfqktl (ltqkt +
gen ln_wqkt lhqkt) ~ log
regresión panel.
31 (wqkt)
gen ln_whqkt • log
35
(whqkt)
36 gen ln_wtqke • log
37
38
(wtqkt)
gen ln_uqkt • Tercero genera algunas variables.
39 log(uqkt)
gen ln_uhqkt •
10 log(uhqkt)
11 gen ln_utqkt •
12 log(utqkt)
13 ~***~~~~~~~~~~~~~~~~~~~~~•~•~•~•ttttttttttttt.
11 ~****Generace dummy •••••••••••
~~~~~~~~~~~~~.ttttttt
variables ttttttttttttttt
tttttttttttttt
15
16 gen eel1 •
i7 O
48 replace ed.1 • 1 ed •• "no voc era
49 it in"
50
51
Llne: 1, Col: O CAP NUM
52 k Postelng.ng .. ·1 .::J Re: LIzen.en···1 ,;.J Monuslollt - ... 1 @staI2dof ... 1 2 WindoM... -1 G'lMicrosoft OVR

53
·p···1 @STATA_I.PQtx
Word 1 ~ St.t.¡SE 11.···1 'LID 1
O.t. Editor (···Ir"II::f-:""o-o-.n-Ie-E-dl-t.-. .
51
i31_FtJ ,\ v lila 11:14
lQ Do-file Edito-rb
Fil EdltTool.
estes.do
e
Vlew

4 ~~~ stare session and load data


ww~

7 set more off


8
9 use "e:\ Usera\ Herberc\DocWl'Ients\STATA\lJagecurve\ dataset. dea" I clear
10

12 ***** Note: load data by give exact path after use conunand1D " ••• "
13 ****** or load data by hand using che File menue
14 ************************#************************************t ••• ****
15 t
16 ******************
17 ••• tttt************
18 *** prepare tor panel
19
20
regress10ns
index year
111111
*******************.t.t*w*.**********
tsset Seleccionamos las líneas de
21
22
comando que queremos que se
panel daca
24 Note: STATA neada variables te idencifydaca
2S
26
***** as
***** give first che group variable: here index (1,2, give second
ejecute.
... 32 )
(1980,1981 ... 2004)
27 *~*~~~~~~~~**~**:~~~~~~~~#*****~*****~~~~~~~~*~**~***~**~~~~~~~~##***
che time period variable: here year
28 *
29 ***~~~~~~~~~~~~::~~~~~:s##::::**:**::***
30
31
32
***~* Generate variables ::::::*********
***************:ss~::s:s:*************** Luego presionamos el botón
33
34
lfqkt/jlfqkt + lhqkt)
“ejecutar“.
3S • 109(uqkt)
36
37 109 (uhqkt)
39
39 109("tqkt)
40
41 ln_uqkt • 10g(uqkt)
42
43
44
45
46
47 **:***~~*~~~~~~.:.~~.~~~:**************~*****
48 *
49 ***** Generate dummy variables ********~~****~
50 *~~~~~~*~~~~~~**~•~••••••*********:~:********~
51 gen ed1 = O
52
S3 replace edl 1 if ed Uno voc trainlt
S4

lineo 46, Col: O CAP NU~l OVR

~====Q:==~~~~~~~R~.~ .~.I¿:~~~====lb~~·~$~t.=t2=d=Of=iI.~.P=p=tx~I~~~·~S=T~A~TA~_~I.~~==~==~======~====~====~~~~
:~=·~~.= ==~~._.~.l~r=lD~.~=~t~=D.-=OE-d-=fi.ot.-_=o_omIr_e=l_-(~E=~
-d~-~i~
t-~o.-
INTRODUCCIÓN AL
STATA
Objetivos

• Visión general del programa.


• Familiarizándonos con algunas bases de datos
de la Encuesta Nacional de Hogares (ENAHO).
• Aprendizaje de algunos comandos mediante
una breve preparación y análisis de datos.

28
1. VISIÓN GENERAL DEL STATA
• ¿Qué es el STATA?¿Y que utilidad tiene?
• ¿SPSS, STATA o R?
• Ventanas de STATA
• Tipo de archivos
• Menú o sintaxis
• Recursos de STATA
• La sintaxis de STATA
¿QUÉ ES STATA?
• Software estadístico útil para el manejo de datos, análisis de
datos y creación de gráficos.

• Comprende aplicaciones a la ciencias de comportamiento,


bioestadística, economía, entre otros.
http://www.stata.com/disciplines/
Max. No. Max. No. Of Max. No. Of
• Tipos: Of right-hand observacion
variables variables es
Stata/MP 32 767 10 998 20 billion
Stata/SE 32 767 10 998 2.14 billion
Stata/IC 2 047 798 2.14 billion
Small stata 99 98 1 200
¿SPSS, STATA o R?
Dificultad de
Potencia Precio Uso prioritario
uso

Docencia/
SPSS Alta Baja Muy alto
profesional
Investigación
STATA Muy alta Media Medio/Alto
aplicada
Investigación
R Máximo Alta Gratuito básico y
aplicada

Es importante destacar que uno puede decidir usar


el programa según la necesidad y el uso podría ser
complementario con los otros programas
VENTANAS DEL STATA
Stata se organiza en diversas ventanas que nos aportan
información y nos permiten realizar diferentes operaciones. Las
principales ventanas son las siguientes:

Historial de
Comandos
(Review)
Resultados
(Stata result)

Base activa
(Variables)

Comandos
(Stata
Command)
VENTANAS DEL STATA
Comandos o stata command: Parte inferior derecha. En esta ventana se
pueden escribir las órdenes que queremos que ejecute el programa. Es
uno de los principales mecanismos de relación usuario hacia el
programa.
Resultados o stata result: Parte superior derecha. En esta ventana
apareceran los resultados de las ordenes que vayamos ejecutando. En
esta ventana es donde el programa “responde” a nuestras ordenes.
Review: Parte superior izquierda, archiva las ordenes que se escriben en
la ventana de comandos. La utilidad de esta ventana es porque nos
permite repetir operaciones ya realizadas.
Variables: Parte inferior izquierda, muestra el listado de las variables de
la base de la base de datos.
VENTANAS DEL STATA
Ventana Editor de datos: Se puede abrir en dos modos. En edit o
browse. Nos permite inspeccionar la base de datos y ver que
información tenemos.
VENTANAS DEL STATA
Do-file editor: Editor de texto similar al block de notas en la que se
puede crear, modificar, abrir y ejecutar archivos de sintaxis de stata .
VENTANAS DEL STATA
Ayuda: La ventana de ayuda (que abrimos mediante el menú o la orden Help
en la línea de comando) nos ofrece ayuda sobre todos los comandos y
funciones de stata
TIPO DE ARCHIVOS
Los principales archivos de stata son:

– Datos (.dta)
– Sintaxis (.do)
– Output (.log)
– Extensiones (.ado)

Hay otras extensiones de datos pero no se usaran se


verán según se requiera.
MENÚ O SINTAXIS
• En principio hay dos formas de relacionarse con el
programa. Mediante menús y mediante sintaxis.
• Con el menú, nos relacionamos mediante las ventanas
del menú desplegable. Es la forma más fácil de
interactuar con el stata.
• Con la sintaxis, debemos escribir nosotros mismos los
comandos. Es más dificil de aprender, pero tiene una
serie de ventajas: Replicabilidad , Eficiencia y Control
RECURSOS DE STATA

• Ayuda de stata
• Manual de stata
• Lista de correos:
http://www.statalist.org/
• UCLA:
http://www.ats.ucla.edu/stat/stata/
• Google y otros…
LA SINTAXIS: ELEMENTOS BÁSICOS
• Stata speaks English: Comands like “Use, Close, describe,
count, mean,Summarize, list, regress, predict”. In a lot of
cases is simple!!
• Case sensitive, distinción de mayúsculas y minúsculas
• Tiene una estructura básica general: comando variable
subgrupo, opciones.
• Se usa abreviaciones en muchos comandos.
• Se puede trabajar con muchas variables con * al final.
• Podemos en do-files ingresar comentarios.
2. INTRODUCCIÓN A LOS COMANDOS DE
STATA: BREVE PREPARACIÓN Y ANÁLISIS
• Creando, cambiando y verificando el directorio de trabajo
• Comandos usuales al iniciar.
• Abriendo bases.
• Inspección de datos. Análisis exploratorio de datos.
• Subgrupos: if, in, by e introducción a operadores lógicos.
• Análisis gráfico básico.
• Comandos usuales al terminar.
• Estructura básica al trabajar con base de datos: Resumen
DIRECTORIO DE TRABAJO

Directorio de trabajo
DIRECTORIO DE TRABAJO
Nos referimos a directorio de trabajo a la ruta donde trabajaremos los
archivos. Es necesario establecerlo desde un comienzo.
Creando un directorio de
trabajo:
Tipear en la ventana de stata
command.
mkdir c:\clase1
Cambio el directorio de trabajo:
Tipear el directorio de trabajo
cd c:\clase1
Verificando el directorio de
trabajo: Directorio de trabajo
pwd
COMANDOS USUALES AL COMENZAR
• clear: Limpia la memoria
de STATA.
• set mem: Modifica la
memoria para trabajar.
• cd: cambia el directorio
de trabajo.
• log using: Crea una
bitácora para trabajar.
Guarda los resultados.

El log esta abierto. De aquí en adelante


se grabaran los resultados aquí.
ABRIENDO DATOS
• Para este apartado trabajaremos
con base de datos proveniente de
la Encuesta Nacional de Hogares
• Para ello primero entraremos a
www.inei.gob.pe
• Luego click donde esta escrito
Base de Datos
• Luego click a Microdatos.
ABRIENDO DATOS
• Después de dar click a microdatos nos redirecciona a la siguiente
web donde tendremos que dar click en consulta por encuesta
ABRIENDO DATOS
Después seleccionamos la encuesta ENAHO metodología
ACTUALIZADA y las demás alternativas del gráfico. Descargamos el
archivo de características de los miembros del hogar referente al
código 2. Luego guardamos los archivos en la ruta: C:\clase1
ABRIENDO DATOS
Hay dos formas de abrir. La primera se logra por la pestaña file que esta
en la barra de menú del programa. Y la segunda con el comando “use”
ABRIENDO DATOS
INSPECCIÓN DE DATOS:
• browse: Nos muestra la ventana de Data editor. Vemos la base
de datos.
• describe: Nos muestra información sobre la variable como tipo
de variable, formato y etiqueta.
• codebook: produce información sobre los valores que toma la
variable, el rango, los casos perdidos.
• lookfor: permite hacer búsqueda en los nombres y etiquetas de
las variables.
• tabulate (tab1, nola): genera tabla de frecuencia
• summarize (detail): proporciona información de número de
casos, media, desviación típica, máximo y mínimo.
SUBGRUPOS
• Algunos instrucciones nos permitirán aplicar los comandos a la
parte de la muestra que nos interesa trabajar.

- if: Permite que el comando se aplique solo a los casos que


cumplen una condición lógica.
- in: Permite que el comando se aplique solo a las observaciones
que se encuentren en una determinada posición.
- by: No filtra sino segmenta la ejecución del comando aplicado.
Necesita previamente que se ordene la data.
- bysort: Similar al by, solo que con esta expresión, se ordena la
data.
CONDICIÓN LÓGICA
Es necesario entender cuales son los operadores lógicos que
permiten establecer una condición lógica. Esto último es muy
importante cuando se utiliza el if.
ANALIZANDO LA BASE
AHORA SI!!! ANALICEMOS LA BASE!!!

1- Hallar la cantidad de personas que componen la muestra del


capitulo200.
2- Encontrar que variables almacenan los valores de edad y sexo.
3- Hallar la proporción de hombres y mujeres en la muestra.
4- Hallar la edad promedio, la edad mínima y la edad máxima.
5- Replicar el ejercicio anterior pero segmentado por sexo.
6- Replicar el ejercicio anterior pero solo para los miembros del
hogar.
1- 4-

2-
5-

3-
COMANDOS USUALES AL TERMINAR
• save: usada para guardar
base de datos.
• log close: Cierra la
bitácora que se comenzó
a trabajar cuando se uso
el log using.
• clear: Limpia la memoria
de STATA. El log se cerro. Se grabaron los
resultados.
• exit: salgo de STATA.
REVISIÓN DEL TEMA
• Revisión general del programa. Utilidad, tipo de archivos,
ventanas, sintaxis del stata, etc.
• Se ingreso a microdatos, se trabajó la base enaho01-2014-
200 correspondiente a las personas entrevistadas en la
encuesta. Se vieron dos variables p207(sexo), p208a
(edad), p203 (relación de parentesco) y p204 (miembro
del hogar).
• Comandos aprendidos. Clear, log using, cd, mkdir, pwd,
use, describe, lookfor, codebook, tab, summary, log close,
save.

56
Descarga el certificado Digital del curso

Al terminar todo curso en la


Escuela del INEI recibirás
un correo con los datos de
acceso para poder
descargar tu certificado
Digital a nombre del INEI.

https://sistemas.inei.gob.pe/WebCerEnei/

You might also like