You are on page 1of 60

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR (MESU 05

)

Del 16/03 al 06/04/2009

Por: Ing. M.Sc. Francisco Martínez Solaris Mgs. Educación Superior martinezsolaris@cotas.com.bo martinezsolaris@hotmail.com

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Nociones Generales
Masculino n 134 32 166 % 42.41 41.03 42.13 n 316 78 394 Total % 80.2 19.8 100 Sexo HAI n Negativo Positivo Total 182 46 228 Femenino % 57.59 58.97 57.87

200 150 100 50 0

182 134 Femenino 46 Masculino 32

Negativo

Positivo

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Nociones Generales
ESTADÍSTICA ¿Qué es?...

DESCRIPTIVA PROPOSITO METODOS

INFERENCIAL PROPOSITO METODO

Características

• TABULARES • GRAFICOS • NUMERICOS

PROBABILISTICO

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Nociones Generales

Ciencia encargada de la Recolección, Manipulación, Organización y Presentación de información de manera tal que ésta tenga una Confiabilidad determinada

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Nociones Generales INFERENCIA ESTIMACION

Población N Parámetro s µ, σ2, p, etc

Deducción

Muestra n=? Estadísticos Estadígrafos

TECNICAS DE MUESTREO

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Nociones Generales
Probabilístico MUESTREO No Probabilístico Tipos No Probabilística
Arbitraria

MAS, MAP y MAE Probabilística
Azar

MUESTRA

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR

Nociones Generales
MUESTRA

POBLACION Atributo Cambiar Variable Tipos

• Nombre • Definición • Rango de Valores • Clasificación

Elementos Cualitativas Cuantitativas
Categorías Discretas Continuas

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR

Nociones Generales
Elementos

• Nombre

Variable

• Definición • Rango de Valores • Clasificación

+
Medirse Escalas de Medición

Nominal Ordinal De Intervalo De Razón

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR

Métodos Tabulares

DESCRIPTIVA METODOS

Sea X y Y dos variables y sea x1, x2, … xn y y1, y2, … yn, valores que toman las variables X y Y, y sean “a” y “b” dos constantes. Entonces: x1 + x2 + x3 + …xn y1 + y2 + y3 + …yn

TABULARES

Sumatoria

n i =1

xi
Propiedades

n i =1

yi

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR

Propiedades de Sumatoria

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR

Métodos Tabulares/Ordenamiento
Edad (años)
15 16 16 17 17 18 18 18 18 19 20 21

Edad (años)
17 18 18 16 21 15 17 19 20 18 16 18

Valores extremos

Ordenándolo Desventaja

Valores mas frecuente

Valores extremos

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Cuadro de Frecuencia
fi 1 2 2 4 1 1 1 12 fr 8.3 16.7 16.7 33.3 8.3 8.3 8.3 100 Fia 1 3 5 9 10 11 12 Edad (años) 15 16 17 18 19 20 21 Total Fra 8.3 25.0 41.7 75.0 83.3 91.7 100

Cuadros de Frecuencia

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Cuadro de Frecuencia
n 19 87 31 137 Lugar de realización del Diplomado Extranjero Universidad Objeto de Estudio Otras universidades bolivianas Total

% 13.87 63.50 22.63 100

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR

Cuadro de Frecuencia
52.5 45.7 52.4 52.6 53.3 42.3 41.7 41.9 42.7 45.5

67.7 63.9 64.9 68.3 68.3

39.2 37.2 38.9 39.2 39.2

69.8 69.1 69.2 70.0 70.1

61.2 55.5 58.9 61.9 63.2

Cuadro de Frecuencia

La Estadística ofrece otra alternativa Tablas de Frecuencias Absolutas y Relativas

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR

Tabla de Frecuencia
Procedimiento

Definir el Número de Intervalos Ac = A/k A = Valor Máx.- Valor Mín.

≥ 5 ó ≤ 20 ó 25 Sturges K = 1 + 3.33* log n

Tipo de Intervalos Ac = Ajustada

(Li - LS] RI = Ac*K > A

MD = (RI – A)/2

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Tabla de Frecuencia
PMC 39.85 45.35 50.85 56.35 61.85 67.35 fi 8 3 4 2 4 9 30 fr 0.27 0.10 0.13 0.07 0.13 0.30 1 Intervalos de Clases 37.1 a 42.6 42.6 a 48.1 48.1 a 53.6 53.6 a 59.1 59.1 a 64.6 64.6 a 70.1 Fia 8 11 15 17 21 30 Fra 0.27 0.37 0.50 0.57 0.70 1

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Métodos Gráficos
Diagrama de Puntos Histograma Métodos Gráficos Clásicos Polígono de Frecuencias Ojiva Diagrama de Sectores

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Diagrama de Puntos

15

16

17

18

19

20

21

Edad (años)

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Histograma

Número de Estudiantes (fi)

10 8 6 4 2 0
37 .1

Histograma de Frecuencias Absolutas

2.6

8.1

3.6

9.1

4.6 a6 64 .6

a4

a5

a4

37 .1

48 .1

a5

Tiempo (minutos)

59 .1

42 .6

53 .6

a7

0.1

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Polígono de Frecuencias

10 Número de Estudiantes (fi) 8 6 4 2 0

Polígono de Frecuencias Absoluta

39.85 39.85 45.35 50.85 56.35 61.85 67.35 72.85 Puntos Medios de Clases

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Ojiva

40 30 fia 20 10 0

Ojiva/Polígono de Frecuencias Acumuladas

37.1

42.6

48.1

53.6

59.1

64.6

70.1

Tiempos (minutos)

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Diagrama de Sectores
X= 137
n 19 87 31 137 Grados 50 229 81 360

1 -------360 19 ------- x

(19*360) = 49.9

Lugar de realización de estudios Postgraduales Extranjero Universidad de Interés Otras universidades bolivianas Total

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Diagrama de Sectores

Lugar de realización de estudios postgraduales
Otras universidades bolivianas 22.63% Extranjero 13.87%

Universidad de Interés 63.50%

Métodos Numéricos (Medidas de Tendencia Central)
Cuando se desea comparar dos o más poblaciones o bien muestras, y si las variables de interés son de carácter numérico … Los métodos tabulares no son los más recomendables

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR

La Estadística oferta otra herramienta llamada Métodos Numéricos

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Medidas de Tendencia Central
Localizan el centro de una base de datos numéricas

Medidas de Tendencia Central
Cuantifican cuánto se dispersan los datos de una medida de tendencia central

Métodos Numéricos

Medidas de Dispersión

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Medidas de Tendencia Central

Promedio Media Ponderada Medidas de Tendencia Central Mediana Moda

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Medidas de Tendencia Central/Promedio
Población Media µ Poblacional

Promedio

Es la sumatoria de las observaciones que toma una variable dividido entre el total de éstas Media Muestral

Muestra

x

Se interpreta como el punto de equilibrio de una base de datos numéricas

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Medidas de Tendencia Central
Desviaciones ( xi − x ) -4.15 -17.85 11.55 10.45 7.15 8.15 11.55 -17.55 -14.45 5.15 0 Tiempo (minutos) 52.6 38.9 68.3 67.2 63.9 64.9 68.3 39.2 42.3

Propiedad

∑ ( xi − x ) = 0
i =1

n

Suma Promedio

61.9 567.5 56.75

Suma

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Tendencia Central
Media en datos tabulados Si la tabla no presenta clases abierta es posible hacer una estimación de la media tomando en cuenta lo siguiente: • PMC es el promedio de las observaciones de las observaciones que caben dentro del intervalos. • PMC*fi proporciona una estimación de la suma de las observaciones que caben en el intervalo y como una tabla tiene k-ésimo intervalos entonces:

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Tendencia Central
Intervalos de Clases 37.1 a 42.6 42.6 a 48.1 48.1 a 53.6 53.6 a 59.1 59.1 a 64.6 64.6 a 70.1 PMC*fi 318.8 136.05 203.4 112.7 247.4 606.15 1624.5

PMC 39.85 45.35 50.85 56.35 61.85 67.35

fi 8 3 4 2 4 9 30

x=

1624.5 = 54.15 30

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Tendencia Central
Cuando los datos tienen diferente peso dentro de la base de datos, si desea obtener el promedio, la media aritmética no es la más indicada
Cargo Rector Asesores Vic. Académico Vic. Administrativo Jefe de Carrera C.S Jefe de Carrera Administrativo Secretarias fi 1 2 1 1 2 5 2 9 Salario 2000 1200 1150 1250 1000 800 600 120

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Tendencia Central
Salario (xi) 2000 1200 1150 1250 1000 800 600 120 Xiwi 2000 2400 1150 1250 2000 4000 1200 1080 15080 15080 23

Cargo Rector Asesores Vic. Académico Vic. Administrativo Jefe de Carrera C.S Jefe de Carrera Administrativo Secretarias

fi (wi) 1 2 1 1 2 5 2 9

xw =

= 655.65

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Tendencia Central
Si los datos no se distribuyen simétricamente (curva simétrica) el promedio no es la mejor medida para localizar el centro de los mismos

•Ordenar Impar n Par Me = xn/2 + 0.5

Datos sin tabular

Mediana (Me)

Me = (xn/2 + x n/2 + 1 )/2 (b-a)(0.5- c) d

Datos tabulados

Me = a +

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Tendencia Central
Tiempo (minutos)
38.9 39.2 42.3

Tiempo (minutos)
38.9 39.2 42.3 52.6 61.9 63.9 64.9 67.2 68.3

Me = xn/2 + 0.5

n es impar

52.6 61.9 63.9 64.9 67.2 68.3

Me

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Tendencia Central
Tiempo (minutos)
38.9 39.2 42.3

Tiempo (minutos)
38.9 39.2 42.3 52.6 61.9 63.9 64.9 67.2 68.3 68.3

Me = (xn/2 + x n/2 + 1 )/2 61.9 + 63.9 2

n es par

52.6 61.9 63.9 64.9 67.2 68.3 68.3

Me = 62.9

= 62.9

Mediana es aquella medida de tendencia central que antes y después de ella no existe más del 50% de la información

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Tendencia Central
Me = a + (b-a)(0.5- c) d Clase de la Mediana • Complete la columna Fia • Localice la menor Fia > n/2 • La clase a la que pertenece esta frecuencia es la clase de la mediana (Nj) • La Clase antes de Nj es Nj -1

a = Límite inferior de la clase de la Me b = Límite superior de la clase de la Me c = Fra una clase antes de la clase de la Me (Nj-1) d = fr de la clase de la Me

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Tendencia Central
Me = a + (b-a)(0.5- c) d a = Límite inferior de la clase de la Me b = Límite superior de la clase de la Me c = Fra una clase antes de la clase de la Me (Nj-1) d = fr de la clase de la Me

Me = 53.6 + Intervalos de Clases 37.1 a 42.6 42.6 a 48.1 48.1 a 53.6 53.6 a 59.1 59.1 a 64.6 64.6 a 70.1

(59.1-53.6)(0.5- 0.5) = 53.6 0.07 PMC 39.85 45.35 50.85 56.35 61.85 67.35 fi 8 3 4 2 4 9 fr 0.27 0.10 0.13 0.07 0.13 0.30 Fia 8 11 15 17 21 30 Fra 0.27 0.37 0.50 0.57 0.70 1

Ubicación de la clase de la Me
n = 30 n/2 = 15 Nj = 17… (53.6 – 59.1) Nj- 1 = (48.1 – 53.6)

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Medidas de Tendencia Central
Connotancia de Moda (Mo) en Estadística Tiempo (minutos)
38.9 39.2 42.3 52.6 61.9 63.9 64.9 67.2 68.3 68.3

En caso de existir es la (s) observación (nes) que más se repiten en una base de datos Distribuciones: Unimodales Bimodales Etc.

Mo

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Tendencia Central
(ficmo- ficpremo) Mo = Licmo + Acmo (ficmo-ficpremo) + (ficmo – ficpostmo) Donde: Licmo: Límite inferior de la Clase Modal Acmo: Ancho de clase de la Clase Modal Ficmo: Frecuencia absoluta de la Clase Modal Ficpremo: Frecuencia absoluta de la Clase Premodal Ficpostmo: Frecuencia absoluta de la Clase Postmodal Clase Modal es la (s) que tiene(n) la mayor (es) fi

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Tendencia Central
(ficmo- ficpremo) Mo = Licmo + Acmo (ficmo-ficpremo) + (ficmo – ficpostmo)
Intervalos de Clases 37.1 a 42.6 42.6 a 48.1 48.1 a 53.6 53.6 a 59.1 59.1 a 64.6 64.6 a 70.1 PMC 39.85 45.35 50.85 56.35 61.85 67.35 fi 8 3 4 2 4 9 Mo = 64.6 + 5.5 (9 - 4) + (9 – 0) (9 - 4) = 66.56

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Medidas de Dispersión
Una medida de tendencia central por si sola no es tan importante. Por esta razón debe estar acompañada de una medida de dispersión
Rango/Distancia/Amplitud o Recorrido

Varianza (Variancia)

Medidas de Dispersión
Desviación Típica o Estándar

Coeficiente de Variación

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Medidas de Dispersión

Rango

Rango = Valor Máximo – Valor Mínimo Población ( σ²)

σ =
2

∑ ( xi − µ )
N i=1

2

N

Varianza

Es el promedio de las desviaciones al cuadrado de las observaciones que toma una variable respecto a su media

Muestra (S²)

 ∑ n xi  n xi 2 −  i = 1  ∑ i =1  n    S2 = n−1

2

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Dispersión
xi 52.6 38.9 68.3 67.2 63.9 64.9 68.3 39.2 42.3 61.9 Sumatoria Promedio 567.5 56.75   (Desviaciones)2 17.2225 318.6225 133.4025 109.2025 51.1225 66.4225 133.4025 308.0025 208.8025 26.5225 1372.725 S² = 10 - 1 1372.725 = 152.525mi²/est²

Desventaja Desviación Típica S = √S²

S = √152.525 = 12.35 min/est

Interpretación
56.75 ± 12.35 min/est.

x±S

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Dispersión
Si la tabla no presenta clases abierta es posible hacer una estimación de la varianza de la siguiente forma: Intervalos de Clases 37.1 a 42.6 42.6 a 48.1 48.1 a 53.6 53.6 a 59.1 59.1 a 64.6 64.6 a 70.1 PMC 39.85 45.35 50.85 56.35 61.85 67.35 fi 8 3 4 2 4 9

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR Medidas de Dispersión
(1624.5) 2 91693.475 −
30 −1 30

S2 =

= 124.774

Intervalos de Clases 37.1 a 42.6 42.6 a 48.1 48.1 a 53.6 53.6 a 59.1 59.1 a 64.6 64.6 a 70.1

PMC 39.85 45.35 50.85 56.35 61.85 67.35

fi 8 3 4 2 4 9

PMC*fi 318.8 136.05 203.4 112.7 247.4 606.15 1624.5

PMC2*fi 12704.18 6169.8675 10342.89 6350.645 15301.69 40824.203 91693.475

S = 124.774 = .70 11

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Medidas de Dispersión
Todas las medidas de dispersión expuestas anteriormente son dimensionales (toman las unidades de medidas de las variables) Existe otra medida de dispersión pero adimensional llamadas Coeficiente de Variación o Dispersión Relativa

S C.V =   x

S C.V =   * 100 x

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Medidas de Dispersión
Las medidas de dispersión cuantifican cuánto se dispersan los datos alrededor de una medida de tendencia central, pero,¿Para donde se desvían los datos?, a la izquierda de la media, a la derecha o se distribuyen simétricamente. Existen otras medidas aplicable solo a curvas unimodales que tratan de las deformación de curvas tanto de forma horizontal como vertical

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Deformación de Curvas Unimodales
Asimetría Positiva Curvas Simétricas

x x x

> Me > Mo = Me = Mo

Asimetría

Asimetría Negativa

< Me < Mo

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Deformación de Curvas Unimodales
Curva Leptocúrtica Curva Mesocúrtica Kur > 3 Kur = 3

Curtosis

Curva Platicúrtica

Kur < 3

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Regresión Lineal Simple
En el desarrollo de los eventos, puede ser que una variable sea afectada por el comportamiento de otra (s) variable (s) Es de interés poder cuantificar este tipo de relación de manera que se pueda predecir una variable en función de otra En Regresión Lineal Simple es de interés cuando una variable afecta el comportamiento de otra variable
Propósito de la R.L.S: Predicción

X1 Y X2
. . .

Xi

Y: Variable Dependiente X: Variable Independiente

Y = f(X)

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Regresión Lineal Simple
Por análisis de regresión se entiende al conjunto de métodos estadísticos que tratan con la formulación de modelos matemáticos que describen la relación entre variables y el uso de estas relaciones modeladas con el propósito de predecir e inferir. Por Regresión Lineal Simple se entiende al conjunto de cambios que experimenta una variable dependiente por un único cambio en la variable independiente “Y” es una variable aleatoria cuya distribución probabilística depende de “X” Modelo de la Línea Recta Homogeneidad de Varianza Normalidad Independencia

Supuestos del Análisis de Regresión Lineal Simple

Regresión Lineal Simple/Diagrama de Dispersión
Llamado también Ploteo de Datos, tiene como propósito mostrar la posible tendencia (en caso de existir) entre las variables “X” y “Y”. Consiste en llevar los pares de valores “x, y” a un sistema de coordenadas (bidimensional) Y (x, y)

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR

X

Regresión Lineal Simple/Diagrama de Dispersión

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Regresión Lineal Simple/Métodos de Mínimos Cuadrados El supuesto No 2 de RLS plantea que de existir una relación entre “X” y “Y”, ésta es una línea recta, por lo tanto se puede pensar en una ecuación de la siguiente forma: Parámetros

Estimación De tal manera que se llegue a obtener una ecuación de la siguiente naturaleza:

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Regresión Lineal Simple/Métodos de Mínimos Cuadrados Uso de Mínimos Gauss) la Técnica de Cuadrados (Carl

A partir de muestras (x1, y1), (x2, y2), …(xi, yi) de las variables “X” y “Y”, se trata de obtener los estimadores . Para ello la Técnica de Mínimos Cuadrados minimiza la suma de cuadrado de las distancias entre los valores observados y los estimados de tal manera que :

Y

X

Regresión Lineal Simple/Recta de Estimación

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR

Estimada una vez la recta de Predicción y teniendo en cuenta que el propósito de la R.L.S es la predicción, se hace necesario estar seguro que la ecuación estimada es capaz de predecir. Por esta razón es necesario validar la ecuación estimada

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Regresión Lineal Simple/Validación de la Recta de Estimación

Validación Cálculo de Coeficiente de Determinación R² Análisis de Varianza de la Regresión “ANARE”

Cuantifica la cantidad de la variabilidad de “Y” que puede ser explicada por “X” R² ≥ 70%

METODOS ESTADISTICO PARA LA EDUCACION SUPERIOR
Regresión Lineal Simple/Validación de la Recta de Estimación/ANARE

Por análisis de Varianza se entiende, de forma general, a la partición de la variación total en fuente de variación conocida que en el caso de R.L.S son de acuerdo al siguiente modelo aditivo lineal:
xi= Variación debida a Regresión εi = Variación debida al Error
FV Regresión Error Total gl 1 n-2 n.1 SC SCRegresión SCError SCTotales CM CMRegresión CMError Fc CMRegresión /CMError Ft (Pr>F)

Regla de Decisión NRHo : Fc ≤ Ft RHo : Fc > Ft