Estadística Descriptiva: Puede definirse como aquellos métodos que incluyen la recol ección, presentación y caraterización de un conjunto de datos con el fin de describir apropiadamente las diversas características de ese conjunto. Estadística Inferencial: Puede definirse como aquellos métodos que hacen posible la estimación de una característica de una población o la toma de una decisión referente a una población basándose sólo en los resultados de una muestra. Para aclara este concepto se necesitan de las siguientes definiciones: Población: es la totalidad de elementos o cosas bajo consideración. Muestra: Es la porción de la población que se selecciona para su análisis. Parámetro: Es una medida de resumen que se calcula para describir una característica de toda una población. Estadística: Es una medida que se calcula para describir una característica de una s ola muestra de la población. Podemos encontrar dos tipos de estudios estadísticos que se emprenden: los estudio s enumerativos y los estudios analíticos. Los estudios enumerativos involucran la toma de decisiones respecto a una poblac ión y/o sus características. Los estudios analíticos involucran realizar alguna actividad sobre un proceso para mejorar el desempeño en el futuro. La atención de un estudio analítico está puesta sobr e la predicción del comportamiento futuro de un proceso y sobre la comprensión y per feccionamiento de ese proceso. En un estudio analítico no existe un universo ident ificable, como sucede en un estudio enumerativo y en consecuencia tampoco hay un marco. 2. Resumen Capítulo 2 del Libro Recolección de Datos La necesidad de datos: los datos se necesitan para: Proporcionar la introducción imprescindible para un estudio de investigación. Medir el desempeño en un servicio o proceso de producción en curso. Ayudar en la formulación de cursos alternativos de acción en un proceso de toma de d ecisiones. Satisfacer nuestra curiosidad. ¿Que es un dato? Los datos pueden concebirse como información numérica necesaria para ayudarnos a tom ar una decisión con más bases en una situación particular. ¿Cómo obtenemos los datos? Existen muchos métodos mediante los cuales podemos obtener los datos necesarios. P rimero, podemos buscar datos ya publicados por fuentes gubernamentales, industri ales o individuales. Segundo, podemos diseñar un experimento. En tercer lugar, pod emos conducir un estudio. Cuarto, podemos hacer observaciones del comportamiento , actitudes u opiniones de los individuos en los que estamos interesados. Utilización de fuentes de datos publicadas Sin importar la fuente utilizada, se hace una distinción entre el recolector origi nal de los datos y la organización o individuos que compilan éstos en tablas y diagr amas. El recolector de datos es la fuente primaria; el compilador de los datos e s la fuente secundaria. Diseño de un experimento En un experimento se ejerce control sobre el tratamiento de los dado a los parti cipantes. Conducción de una encuesta Aquí no se ejerce ningún control sobre el comportamiento de la gente encuestada. Sim plemente se formulan preguntas respecto a sus opiniones, actitudes, comportamien to y otras características. Realización de un estudio observacional El investigador observa el comportamiento de interés directamente, por lo común en s u entorno natural. La importancia de obtener buenos datos: GIGO GIGO: Entra Basura, sale basura. No importa el método utilizado para obtener los d atos, si un estudio ha de ser útil, si el desempeño debe controlarse apropiadamente o si el proceso de la toma de decisiones debe ampliarse, los datos recabados deb en ser válidos: es decir, las respuestas correctas deben valorarse de manera que s e obtengan mediciones significativas. Obtención de datos mediante investigación de encuesta Tipos de datos Existen básicamente dos tipos de variables aleatorias que producen dos tipos de da tos: categóricas y numéricas. Las variables aleatorias categóricas producen respuestas categóricas, mientras que las variables numéricas producen respuestas numéricas. Las variables numéricas pueden considerarse como discretas o continuas. Los datos disc retos son respuestas numéricas que surgen de un proceso de conteo, mientras que lo s datos continuos son respuestas numéricas que surgen de un proceso de medición. La necesidad de definiciones operacionales. Una definición operacional proporciona un significado a un concepto o variable que puede comunicarse a otros individuo s. Es algo que tiene el mismo significado ayer, hoy y mañana para todos los indivi duos. Diseño del cuestionario El objetivo de un cuestionario es permitirnos recabar información significativa qu e nos ayude en el proceso de toma de decisiones. Selección de temas amplios - Longitud del cuestionario Los amplios temas de los cuestionarios deben enumerarse. Mientras más largo sea el cuestionario, menor será el cociente de respuesta. Por tanto, se deben evaluar cu idadosamente las preguntas. Las preguntas deben ser lo más cortos posibles. Modo de Respuesta Existen tres modos mediante los cuales se realiza el trabajo de encuesta: la ent revista persona, telefónica y por medio del correo. La personal es la que tiene un a tasa de respuesta mayor, pero es más costosa. Formulación de preguntas Cada pregunta debe presentarse claramente en el menor número de palabras y cada pr egunta debe considerarse esencial para la encuesta. Además, deben ser libres de am bigüedades. Prueba del cuestionario Una vez analizadas los pros y contras de cada pregunta se debe realizar una prue ba piloto de manera que puedan examinarse en cuanto a claridad y longitud. Elección del tamaño de muestra para la encuesta Existen tres razones para extraer una muestra. Antes que todo, por lo general ll eva demasiado tiempo realizar un censo completo. En segundo lugar, es demasiado costoso hacer un censo completo. Tercero, es demasiado molesto e ineficiente obt ener un conteo completo de la población objeto Selección de los sujetos respondientes: tipos de muestras Existen básicamente dos tipos de muestras: las muestra no probabilística y la muestr a de probabilidad. Una muestra de probabilidad es aquella en la que los sujetos de la muestra se el igen sobre la base de probabilidades conocidas. En una muestra aleatoria simple cada individuo o elemento tiene la misma oportun idad de selección que cualquier otro, y la selección de un individuo o elemento part icular no afecta la probabilidad de que se elija cualquier otro. Extracción de la muestra aleatoria simple La clave de la selección de muestras apropiada es obtener y mantener una lista act ualizada de todos los individuos o elementos de los cuales se extraerá la muestra. Tal lista se conoce como el marco de la población. Este listado de población servirá como la población objetivo, de tal manera que si se extrajeran muchas muestrasde p robabilidades diferentes de tal lista, en el mejor de los casos cada muestra sería una representación de la población. - Muestreo con o sin reemplazo de poblaciones finitas Para seleccionar la muestra pueden usarse dos métodos básicos: con reemplazo o sin r eemplazo. Digamos que N representa la población y n la muestra. Al extraer con ree mplazo la probabilidad de cualquier miembro de la población de ser seleccionado en la primera extracción es 1/N. La probabilidad de ser seleccionado en otra extracc ión sigue siendo 1/N debido a que una vez registrado el dato, el individuo seguirá f ormando parte de la población. Sin embargo, al muestrear poblaciones humanas generalmente se considera más apropi ado tener una muestra de persona diferentes que permitir mediciones repetidas de la misma persona. La probabilidad en este caso es 1/N en la primera extracción. L a probabilidad de que cualquier individuo no seleccionado previamente sea selecc ionado en la segunda extracción es 1/N-1. La encuesta de la muestra El primer pasa para evaluar una encuesta es determinar si se basó en una muestra d e probabilidad o en una no probabilístico. Aun cuando las encuestas emplean métodos de muestreo de probabilidad aleatorios, e stán sujetas a errores potenciales. Existen cuatro tipo de errores de encuesta: 1 - Error de cobertura o sesgo de selección. Este error resulta de la exclusión de c iertos sujetos del listado de población, de tal manera que no tienen oportunidad d e ser seleccionados en la muestra. El error de cobertura provoca el sesgo de sel ección. 2- Error de no-respuesta o sesgo de no-respuesta. El error de no-respuesta resul ta del fracaso de recolectar datos sobre todos los sujetos de la muestra. Y el e rror de no-respuesta da como resultado el sesgo de no-respuesta. 3- Error de Muestreo. Este error refleja la heterogeneidad o las diferencias de oportunidad de muestra a muestra basándose en la probabilidad de los sujetos que e stán siendo seleccionados en las muestras particulares. El error de muestreo puede reducirse tomando tamaños de muestra mayores, aunque esto incrementará el costo de aplicación de la encuesta. 4- Error de Medición. Este error se refiere a inexactitudes en las respuestas regi stradas que ocurren debido a una mala formulación de las preguntas, el efecto de u n entrevistados sobre el encuestado o el esfuerzo hecho por el encuestado. Organización y Resumen de Datos Organizacion, Resumen Y Presentacion De Datos Estadisticos Conceptos que deben reforzarse POBLACION: es el conjunto formado por todas las unidades elementales que proporc ionarán las mediciones de interés. Pueden ser personas, cosas, objetos abstractos. CENSO: Cuando se estudia la totalidad de las unidades elementales que componen l a población. Desventaja: errores de observación. Ej.: omisiones, duplicaciones, no-ubicación (no medibles) del encuestado, volumen de información MUESTRA: se estudia una parte representativa de la población Desventaja: errores de observación (no medibles) errores de estimación (medible, cua ntificable)