Diseño de la investigación

Plan de tratamiento de datos

Dra. María Hinalaf

Datos Teoría Hipótesis Análisis Interpretación corrobora refuta .

Posición Medidas de Dispersión Forma . una sola cifra y que representan el promedio o valor típico de un conjunto de puntuaciones. Trabaja con ciertas medidas que caracterizan a una población o a una muestra. que informan cómo se encuentran distribuidos en torno a un valor central. denominadas: Posición Medidas de Dispersión Forma Permiten por medio de un valor conocer la posición de tendencia central del conjunto Las medidas de tendencia central son índices que se expresan mediante de datos y se acompañan de otras medidas denominadas dispersión.Proporcionar el instrumento para el análisis.

18 Normal Es adecuado para variables cualitativas en escala nominal u ordinal. 19 Moderada 20 Moderada .MEDIA ARITMÉTICA O PROMEDIO: se calcula como la suma de todos los valores que toma la característica en estudio dividida por el número total de unidades experimentales observadas. Sujeto Hipoacusia Hipoacusia Frecuencia Absoluta 1 Leve 2 Profunda Leve 6 3 Moderada Moderada 5 4 Leve 5 Severa Normal 4 6 Moderada Profunda 4 7 Profunda 8 Leve Severa 1 9 Normal Total 20 10 Profunda 11 Leve ¿Cuál es el modo? 12 Normal Modo = Mo =Leve 13 Profunda 14 Moderada Podemos decir entonces que la categoría Leve presenta mayor frecuencia. 15 Leve El Modo es un buen indicador del centro de los datos sólo si hay una frecuencia 16 Normal 17 Leve dominante.

Jueves 35 Miércoles 25 Viernes 42 Sábado 29 Jueves 35 Viernes 42 Ej. Si el promedio de la respuesta total de las OAEs es 12 en un grupo investigado. ¿Qué pasa si incluimos las consultas del sábado? Permite una interpretación más ajustada a la realidad.5. implica que el 50 % de ese grupo tiene un valor menor a ese valor. ¿Cuál es la mediana? Consultas 25 28 29 30 35 42 Consultas de de Días lenguaje Días lenguaje 25 28 30 35 42 29+30 Lunes 28 Me = 29. y la mediana es 10. ¿Cuál es la mediana? .5 2 Lunes 28 Martes 30 Me = 30 consultas Miércoles 25 Martes 30 Si n es par. la mediana es igual al promedio de los dos datos centrales.

Posición Medidas de Dispersión Forma .Permiten por medio de un valor conocer la posición de tendencia central del conjunto de datos y se acompañan de otras medidas denominadas dispersión. que informan cómo se encuentran distribuidos en torno a un valor central.

600 0.900 0.300 -0.300 0.800 0.900 3.640 3.360 3.090 3.800 0.50/5 = 0.400 0.300 0.500 0.800 -0.300 -0. Se restan Desviación al Pesos Promedio Desviación cuadrado 2.500 0.250 2.090 3.600 3.30 Kg2 .600 0.500 3.600 0.700 3.700 0.250 Desviación al Pesos Desviación cuadrado 3.500 2.500 0.000 1.400 0.300 0.300 0.800 3.360 Elevar cada diferencia al cuadrado hace que todos los números sean positivos (para evitar que los números negativos reduzcan la varianza) 16.500 0.640 3.500 -0.000 1.300 0.160 16.500 V(x) = 1.160 2.

nos ha quedado alterada la unidad de medida. expresada en las mismas unidades de los datos de la variable objeto de estudio. .50/5 = 0. La desviación estándar es la raíz cuadrada de la varianza.30 = 0. distribuciones que se dispersan y la muestra o población es más heterogénea con respecto a la variable.30 Kg2 Al elevar las desviaciones al cuadrado. Para evitar este inconveniente la desviación estándar.55 Kg Los desvíos estándares pequeños en relación al valor de la media indican distribuciones que se concentran y la muestra o población es mas homogénea. D(x) = V(x) = 0. desvíos grandes. V(x) = 1.

Otro ejemplo: Media=53. Se calcula realizando un cociente entre el desvío estándar y la el año 2014 media de los datos multiplicado por cien. Se extrae una muestra de 10 niños recién nacidos y 10 niños con 1 año de edad Ej. Traten de hacer el ejercicio: CV= DE * 100 X .1 Desviación estándar=10.3 La varianza y la desviación éstandar son adecuadas para variables cuantitativas.

modo y mediana . Forma Medidas de forma Simétrica: presenta un solo valor modal (unimodal). Coincide la media. Consiste en estudiar la forma de la distribución. lo cual indica que Posición el peso es más homogéneo en este grupo que en el de recién Medidas de Dispersión nacidos. su coeficiente de variación es menor. Si bien el desvío estándar de los niños al año de edad es mayor al nacer. a ambos lados de dicho valor muestra igual frecuencia para valores equidistantes.18% cómo se encuentran distribuidos en torno a un valor central. CVRN: 25% Permiten por medio de un valor conocer la posición de tendencia central del conjunto de datos y se acompañan de otras medidas denominadas dispersión. que informan CV1A: 18.

La pregunta que el investigador se hace es si estas diferencias son reales o sólo producto del azar. En este nivel de análisis: se calcula la probabilidad de que las diferencias halladas (media. la media. El histograma de una distribución positivamente Tal distribución tiene una media que es menor a la sesgada generalmente tendrá una cola más larga a la mediana. sesgada tiene más observaciones mayores o iguales a esto indica que la media es mayor que la mediana. El histograma de una distribución derecha de la distribución. El investigador se pregunta si las diferencias encontradas en los resultados pueden ser pequeñas. porcentaje). obtenido en dos o más muestras independientes. más larga a la izquierda de la distribución por eso se la conoce como sesgada a la izquierda. El sesgo es positivo si la mayor proporción de las Por otro lado. . se considerarán a las diferencias como reales o estadísticamente significativas. distribuido esta sesgado.Asimétricas: un conjunto de observaciones no se encuentra simétricamente Asimétricas: un conjunto de observaciones no se encuentra simétricamente distribuido esta sesgado. una distribución negativamente observaciones son menores o iguales que la media. por ello esta distribución negativamente sesgada generalmente tiene una cola se conoce como sesgada a la derecha. si la probabilidad es muy pequeña. sean resultados del azar. medianas o grandes en magnitud.

01. 0.10 (10%) o p <0. = 0.1 = Probabilidad de aceptar una diferencia que no existe. p < 0. .05.01 (1%). p < 0. 0.05 (5%).Generalmente se representa por el símbolo griego (alfa) y tiene un valor numérico que expresa la probabilidad de equivocarnos al rechazar una HN.

05 Existe siempre una probabilidad de rechazarla siendo que es verdadera. significa que es poco probable que se deban al azar de la muestra.01 o 1% en cuyo caso solo admitimos la probabilidad de equivocarnos en una ocasión de cada cien. 0. nunca como imposible. p<0. 95% Ese riesgo de error se puede estrechar optando por un nivel de significación más exigente como por ej. Nivel de Nivel de Confianza Significación p<0. La HN se rechaza como improbable.1 90% . p<0.01 99% Si los resultados obtenidos en el Test caen dentro de alguna de las zonas de rechazo.

.

Por medio de la estadística inferencial se pueden extraer conclusiones respecto de una población con los datos obtenidos de una muestra. . El análisis en este nivel permite establecer si los parámetros de una variable en dos o más grupos difieren estadísticamente o si dos variables son independientes entre sí.