P. 1
Stata Manual 0 Introduccion

Stata Manual 0 Introduccion

|Views: 336|Likes:
Published by Victor Alva Flores
Manual de Stata
Manual de Stata

More info:

Published by: Victor Alva Flores on Jul 06, 2012
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

09/08/2014

pdf

text

original

Manual de Stata

5

INDICE
1 Introducción .............................................................................................................. 8 2 Primeros pasos con Stata ........................................ 2.1 La información en los archivos de Stata.......... 2.2 La interfaz de Stata .......................................... 2.3 Las ventanas de Stata....................................... 2.4 Modos de trabajo en Stata................................ 2.5 El fichero de resultados.................................... 2.6 Las variables del fichero de dato ..................... 3 Introducción de datos.............................................. 3.1 Introducción manual de datos .......................... 3.2 Lectura de datos con Stata ............................... 3.3 Fusión de ficheros............................................ 4 Estadísticas de una sola variable............................. 4.1 Clasificación de variables ................................ 4.2 La tabla de distribución de frecuencias............ 4.3 Estadísticos resúmenes de distribuciones ........ 4.4 Obtención de las medidas características de una distribución

4.5 La ponderación de los datos............................. 4.6 El error típico ................................................... 5 Manipulación y modificación de datos................... 5.1 Manipulación de datos ..................................... 5.2 Generación y modificación de variables.......... 6 Gráficos con Stata................................................... 6.1 Gráficos unidimensionales...............................

......6 Regresión múltiple............ ...................... 8 Confección y análisis de tablas con Stata .................. 9 La Regresión ........ 7........... 7...........1 Nube de puntos..... 9.......... varianza y correlación entre dos variables 9...............1 Pruebas de una sola variable..... 7.........9 Otras relaciones funcionales de la regresión..... 9.........2 Gráficos bidimensionales................................................................2 Comparación de dos variables ............................5 Regresión en el origen ....................3 Comparaciones de dos muestras (independientes) 7.......... 8....8 Regresiones con interacción ....5 Comparaciones de k muestras dependientes....... 9.......10 Regresiones con selección automática de variables 10 Diagnósticos de la regresión ...........................1 Tablas de contingencia de dos variables...2 La regresión simple..2 Más de dos variables...........4 Comparaciones de k muestras independientes....4 Inferencias en la regresión simple ........ 7 La prueba estadística y las comparaciones ... 7........................7 Regresión con variables ficticias ..... 9........................... 9.. 9......... 9......................3 Bondad del ajuste de la regresión ........................ 9..3 Otras tablas especiales ........3 Opciones gráficas............. 9..................................... 8................................... 8......... 6............Manual de Stata 6 6.

............................... 12.................4 Comparación de modelos....... ........ 12 Análisis de datos de encuesta con Stata.....2 Ponderaciones.2 Estimación del modelo............................1 El modelo estadístico ... estratos y conglomerados ..... 10............................... 10..........3 Diagnóstico del modelo .................5 Regresión por bandas............................... 10.5 Interpretación del modelo .............................1 Análisis de los casos en la regresión.......4 Regresión de cuantiles ........ 12......................... Un ejemplo práctico con Stata..................... Las órdenes svy......... 12........ 11...Manual de Stata 7 10...1 Ajustes en el análisis de muestras complejas.... 11......... 11....................3 3..... 11.... 11 La regresión logística.........................3 Regresión robusta ..............2 Regresiones especiales..... 11....... 10........

por el otro. por extensión. evitando la programación en Forrtan para la resolución de los problemas estadísticos. Aunque el objetivo central de estás páginas es enseñar a utilizar un programa estadístico determinado –no muy distinto de otros que existen en el mercado-. más pensados para procesos por lotes. a la investigación bio-sanitaria o epidemiológica. Estos nacieron concebidos en entornos de grandes ordenadores.8 Manual de Stata 1 Introducción Es innegable que la estadística se ha convertido en una herramienta fundamental para la investigación en las Ciencias Sociales. dos desarrollos casi paralelos han cambiado las posibilidades de aplicación de la estadística a la investigación.S. una parte considerable de estudios necesita aplicar conocimientos de esta rama del saber. y.la interpretación de los resultados de aplicar técnicas estadísticas a un conjunto de datos. que ha permitido la ejecución de tareas de enorme complejidad a personas con escasos conocimientos matemáticos. esta obra también explica cuáles son los requerimientos. los procedimientos y –ante todo. Stata es una aplicación estadística nacida en el año 1985 en el entorno Unix. e incluso Macinstosh. era capaz de calcular raíces cuadradas. el lápiz o bolígrafo y. el SPSS (Statistical Programs for the Social Sciences) y el SAS. este libro pretende ser un manual que permita a quien lo trabaje un uso aplicado y racional de las herramientas estadísticas usadas en la investigación social y. sólo en los modelos más exclusivos. Este programa ha tenido tres importantes precursores: por orden de antigüedad destacan el BMDP (Biomedical Program). e inmediatamente se trasladó al sistema operativo D. De un lado. De acuerdo con este panorama. en el mejor de los casos. que ha puesto a disposición del bolsillo de los particulares la adquisición de un ordenador con capacidades de cálculo que antaño sólo estaban entonces a disposición de multinacionales y organismos públicos. Desde entonces.O. la aparición de programas especializados en tareas estadísticas. que para instrucciones instantáneas presentes en un menú a disposición del usuario. Windows.. Tres son las características más sobresalientes que han permitido que Stata obtenga una posición destacada entre las aplicaciones estadísticas: en primer lugar. Entre estos tres y Stata también cabe destacar la aparición de otras aplicaciones estadísticas que se implementaron en el entorno DOS con una filosofía mucho más interactiva que los iniciales paquetes. para pasar a ejecutarse también en ordenadores personales. el empleo de . Aunque nadie niegue tampoco que puedan realizarse estudios sobre el mundo humano que recoja y analice datos sin necesidad de operaciones matemáticas. –aun siendo sólo de modo básico para contar ocurrencias o para extrapolar los resultados de una muestra al conjunto de elementos que se desean investigar. los autores han pretendido conjuntar lo que sería una introducción a la estadística aplicada con un manual de iniciación a Stata. el desarrollo de la informática. una calculadora que había que enchufar a la red eléctrica y. Hace cincuenta años todos los instrumentos que se disponían para las operaciones estadísticas eran el papel. Por ello.

las siguientes características. ampliando a su vez las posibilidades de análisis con este paquete estadístico. pero también sobresale en análisis de muestras complejas. La curva de aprendizaje es especialmente pronunciada en sus comienzos. También destaca Stata por una amplia gama de tareas. sino con una guía que le ayude a saber emplearlas y sacarles su jugo. pero compartibles en una variedad de situaciones por un conjunto de investigadores con el único requisito común de disponer de este programa. en series temporales. También es un punto fuerte de esta ampliación su carácter abierto. Ello. combinadas con las funciones y las órdenes de flujo. frente a otros programas de estadística. se ha escrito con la intención de que aquellos profesionales o académicos que quieran adentrarse en el empleo de la estadística aplicada no se encuentren sólo con un listado de instrucciones. En segundo lugar. pues no sólo permite al usuario experto generar o modificar programas. también se dice para qué sirven. permitían con facilidad para un técnico experto la confección de nuevas utilidades. especialmente a los que se están iniciando en el uso de Stata.9 Manual de Stata instrucciones con un lenguaje fácil de modo interactivo. y en análisis de sucesos históricos. Especialmente tras su versión 8 (enero de 2003) en la que se incorpora un sistema de menú que prácticamente integra todas las instrucciones disponibles. en qué condiciones han de usarse y. Frente al primer acercamiento de los programas clásicos a través de instrucciones escritas en conjunto en un fichero. Pero. A la vez que se explica el uso de las órdenes. sobre todo. después se aprende con mayor facilidad hasta un nivel en el que ya sólo pueden avanzar aquellos que sobresalgan sea en estadística. cómo han de interpretarse los resultados. podrían destacarse. Final y principalmente. pero sin duda en próximas versiones se podrán encontrar traducidos al menos en las principales lenguas occidentales. que éstos menús estén traducidos. Bien es cierto que donde destaca frente a otros programas estadísticos es en las regresiones. Stata –aunque no de modo exclusivo. sino que por la propia naturaleza de las instrucciones analíticas. ha generado una comunidad científica que comparte problemas y soluciones. Stata es un paquete de fácil uso. Stata se especializó en el análisis de regresiones. Este programa viene acompañado de un manual tan extenso (más de diez . abierto a nuevas programaciones. De este modo. no es sólo un manual de un programa de estadística. ofrece una amplia variedad de procedimientos que van desde la regresión simple hasta el análisis de panel. distintas de las implementadas. Quizá aún le falte para el usuario que no domine el inglés. Stata ofrecía un modelo en el que se escribía una instrucción e inmediatamente se veían los resultados. siempre y cuando fuera bien escrita. Por estas razones. o al más moderno estilo de dar órdenes a través de menús. El objetivo de las páginas que siguen a continuación es hacer menos costoso el aprendizaje inicial de esta herramienta de trabajo. sea en programación. no sólo se podía empaquetar todas las instrucciones en un fichero para su empleo contrastado y repetido. sino que también permite a los usuarios menos hábiles la importación de esas nuevas herramientas a su sistema. Este libro va dirigido a principiantes. En primer lugar sobresale por su facilidad de uso. Frente a otros programas estadísticos que prácticamente abarcaban un amplio elenco de análisis. junto a la extensión de las comunicaciones informáticas.se concentró especialmente en los diversos análisis de regresión y dentro de ella.

se dedica un capítulo a la introducción de datos. para muchos lectores las páginas que siguen a continuación no se tienen que leer o estudiar una por una. sino también en el interior de los mismos se ha pretendido ir de lo sencillo a lo complicado. las de dispersión. Bien es cierto que entre estos volúmenes hay una guía de inicio y otra para el usuario. y finalmente se clasifican y describen los distintos ficheros en los que se guardan los datos. con menús. El tercer capítulo es el que primero que se dedica al análisis estadístico propiamente dicho. Comienza con el interfaz. con lo que en lugar de un manual de un programa. Y no sólo entre capítulos. El primer capítulo está dedicado a los elementos básicos del programa. Se considera muy conveniente que cuando se llegue a un apartado complejo. Se analizan cada una de las ventanas y menús a través de los que el investigador puede solicitar o contemplar resultados. dentro de lo posible. con instrucciones o con ficheros. las órdenes o las ayudas del programa. en lugar de con una calculadora de bolsillo. comprendiendo las medidas de tendencia central. por lo que se estima que es mejor esta secuencia de aprendizaje. este libro presenta una estructura secuencial: de lo simple a lo complejo. también pueda ser considerado un manual de estadística en el que se aprende a resolver problemas mediante una aplicación de ordenador. Y se termina este apartado con una serie de instrucciones que permiten la manipulación del fichero propio de la aplicación. los resultados. mientras se planificaba y escribía se ha ajustado. aunque lamentablemente de crucial necesidad para cuando se trabaja con variables con contenido de fecha. que versa sobre los formatos de las variables. sea para añadirle casos o para adjuntarle variables procedentes de otros archivos. En consecuencia. Por todo ello. . A continuación. tema complejo donde los haya. al final del capítulo. Y. se realiza una introducción a la estadística inferencial explicando el error típico y los intervalos de confianza. Se explican los tres principales modos de trabajo con el programa. Desde la entrada manual de datos. para volver a él. hasta la lectura automática de otros ficheros en formato texto y la conversión de archivos escritos en otros programas o aplicaciones al formato propio de Stata. se pase a un capítulo siguiente. las de simetría y las de apuntamiento. cuando se esté más familiarizado con el programa. Además. Desde los rudimentos básicos a los planteamientos más avanzados.10 Manual de Stata volúmenes) que tienden a desanimar a quien se enfrenta por primera vez al programa. Como ejemplo claro de ello es el último apartado del primer capítulo. Aborda la estadística univariable descriptiva. que tiene más que ver con la presentación que con el contenido de un análisis y con más interés informático que estadístico. a los contenidos de un curso de estadística intermedio. imprescindibles para la estimación de los parámetros de la población. con el fin de estudiar las distribuciones y su comportamiento. A continuación se exponen los procedimientos más fáciles para la ponderación con Stata. es decir. reservando para el primer anexo los procedimientos complejos de ponderación de muestras. que constituye el modo de comunicación de la máquina con el usuario. pero la primera es más bien insuficiente y la segunda es desigual en la complejidad de los temas tratados. las de posición.

Debido a esta dificultad. la modificación de datos incluye tanto la recodificación de los valores de las variables del fichero. se explica el método de mínimos cuadrados para la extracción de una recta que pase lo más cerca posible del conjunto de puntos representados y se abordan los temas más espinosos de la estimación de los parámetros poblacionales. para estudiar la fuerza de la relación entre dos variables. se termina el capítulo con una consideración sobre las tablas de más de dos dimensiones en lo que puede considerarse una introducción al análisis multivariable. se enumeran los que contienen al menos dos escalas distintas. las pruebas estadísticas de significación y los coeficientes de asociación. Todo ello. Pero también en este capítulo se explican las pruebas estadísticas que sirven para las hipótesis comparativas. La versión 8 de Stata modificó radicalmente las instrucciones para la confección de gráficos y. Por otro lado. Se explican las pruebas paramétricas de proporciones y medias y la prueba de los signos. Aunque los menús pueden facilitar esta tarea. porque muy a menudo no interesan analizar los datos tal como fueron recogidos. dejando para un segundo apéndice todas las opciones que tienen que ver con el cambio de los elementos gráficos. Como se explica en un primer momento la regresión simple (con una sola variable independiente). se incluye el tema del tratamiento y modificación de datos. como no podía ser de otra manera. cuando se desea algo distinto de de lo estándar. Se estudian los distintos tipos de porcentajes que se pueden aplicar. por su uso. Primero se describen los gráficos unidimensionales que representan una o varias variables en una única escala y. A ella se le dedica todo un capítulo. sino mediante algunos cambios que mejoren su presentación. A partir del sexto capítulo se tratan las pruebas estadísticas más simples contenidas en Stata. a continuación. A este proceso se le denomina tratamiento y puede ser útil en muy amplia variedad de casos como cuando se desee realizar un análisis específico de jóvenes o de mujeres. Los dos siguientes capítulos están dedicados a lo que es el procedimiento más notable de Stata: la regresión. en el capítulo 5 sólo se ven los tipos de gráficos y el manejo esencial de éstos. la petición de un gráfico no es tarea fácil. Hay pruebas para 2 o más muestras independientes (una variable medida en grupos distintos) o para 2 o más dependientes (dos o más variables obtenidas en un único grupo). posteriormente se pasa a la regresión múltipla (más de una variable independiente). Se comienza con una introducción sobre la prueba estadística aplicada a una sola variable. Asimismo. se estudia la incidencia de . Se comienza con la representación de dos variables en la nube de puntos para explicar el concepto de covarianza y el de correlación. como puede ser el caso de presentar una tabla de la edad con sus valores recodificados. Con ellas. La presentación de los distintos tipos de gráficos es funcional. Stata contiene una serie de instrucciones que permiten ordenar y seleccionar los casos sin que nada quede alterado. los investigadores pueden comprobar si sus hipótesis descriptivas son congruentes con sus datos. principalmente.11 Manual de Stata Tras este primer capítulo de análisis. Una de las operaciones más empleadas en el análisis de cuestionarios son las tablas de contingencia. se dedica un capítulo a la realización de éstos. como la generación de nuevas variables mediante transformaciones algebraicas de otras ya existentes. los residuos.

logarítmicas. con el fin de que no sólo sea un manual de un programa. El noveno capítulo sea quizá el más complejo de esta obra. posteriormente. del comentario pertinente. finalmente. Obviamente no se tratan gran parte de los análisis que están disponibles en Stata. creadas por Long y Freese. cúbicas. sino que sea una introducción a la estadística y. Su inclusión implicaría doblar de páginas a este manual. las robustas y las realizadas por bandas o cuantiles. No se olvida incluir las fórmulas de las operaciones. para los casos en los que se desee efectuar una regresión con variable dependiente dicotómica. se cierra este manual introductorio con la regresión logística binaria. Posiblemente un segundo volumen dedicado a análisis más complejos debería escribirse para cubrir todas estas lagunas. en consecuencia. inversas. En cualquier caso. son de especial mención por su importancia las series temporales. Entre otros. y . el análisis factorial o el de conglomerados. Por ello.12 Manual de Stata determinados tipos de variables como las variables nominales y se presentan modelos con una relación funcional distinta de la lineal (regresiones cuadráticas. agradecer todas aquellas contribuciones que han ayudado a que este producto hay visto la luz. …). siempre están los excelentes manuales de Stata para el que desee ir más allá. las regresiones con ponderación. Lo que ha presidido en la redacción de este libro es ante todo la simplicidad. los datos dispuestos en panel y el análisis de sucesos históricos. opciones y subopciones de este programa. pues se dedica a analizar los supuestos de la regresión y las posibles soluciones a sus anomalías. Todo los resultados de análisis mostrados están acompañados previamente de la instrucción que los genera y. Y se acaba con un conjunto de regresiones especiales que evitan los problemas generados por el no cumplimiento de las asunciones de este análisis. se ofrece una guía rápida de instrucciones acompañadas del menú donde pueden encontrarse para facilitar su búsqueda al usuario. [¿Problemas?] Queda. Finalmente se hace mención al procedimiento de selección automática (añadiendo o eliminando) las variables independientes de la ecuación de regresión. sino también otras disponibles en Internet. y documentadas ampliamente en su obra Regression Models for Categorical Variables Using Stata. En último lugar. en las explicaciones se tiende a ir de lo simple a lo complejo y se insiste en el aprendizaje a través de los ejemplos. La Universidad de Salamanca y El Instituto Juan March de Estudios e Investigaciones son las instituciones que más han contribuido a que los autores hayan podido dedicar sus esfuerzos en este empeño didáctico. En el caso de las ciencias sociales abundan las variables nominales por lo que esta alternativa a la regresión común puede aplicarse evitando que las predicciones se salgan de los límites propios de este tipo de variables. cuya pretensión es introductoria. como complemento para navegar en el inmenso caudal de órdenes. En esta sección además se explican no sólo las órdenes del programa. Se presta atención a las medidas para la detección de casos anómalos que desvirtúan la obtención de la recta. Estudiantes de una y otra institución universitaria han recibido nuestras enseñanzas en estas materias. exponenciales. Se explican.

13 Manual de Stata no hay duda de que gracias a ellas se han reformulado el esquema. que seguro serán necesarias cuando próximas versiones del programa estén disponibles para los miles de usuarios que ya lo están utilizando y para aquellos que decidan hacer uso de esta herramienta en el futuro. la orientación y la didáctica presente en este texto. el uso de este manual lo siga perfeccionando en el caso de que sean necesarias nuevas ediciones. Casi con toda seguridad. .

You're Reading a Free Preview

Download
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->