You are on page 1of 74

Qu procedimiento

se sigue para
analizar los datos?

Dra. Hilda Guevara Gmez


Mgr. Juana Rosa Vera Jurez
Revisando la clase
anterior.

Grficos para v. cualitativas

Diagramas de barras
Alturas proporcionales a las frecuencias (abs. o rel.)
Se pueden aplicar tambin a variables discretas

Diagramas de sectores (paste, polares)


No usarlo con variables ordinales.
El rea de cada sector es proporcional a su frecuencia (abs. o rel.)

Pictogramas
Fciles de entender.
El rea de cada modalidad debe ser proporcional a la frecuencia.
De los dos, cul es incorrecto?.

2
419
400 375

Grficos diferenciales para variables numricas 300

255

Recuento
215

Son diferentes en funcin de que las variables


200

127
sean discretas o continuas. Valor con frec. 100

absolutas o relativas. 54
24 23
Diagramas barras para v. discretas
17

Se deja un hueco entre barras para


0 1 2 3 4 5 6 7 Ocho o ms

Nmero de hijos

indicar los valores que no son


posibles 250

Histogramas para v. continuas


200

Recuento
El rea que hay bajo el histograma 150

entre dos puntos cualesquiera indica 100

la cantidad (porcentaje o frecuencia) 3


de individuos en el intervalo. 50

20 40 60 80

Edad del encuestado


Diagramas integrales

Cada uno de los anteriores diagramas tiene su correspondiente diagrama integral. Se realizan a
partir de las frecuencias acumuladas. Indican, para cada valor de la variable, la cantidad (frecuencia)
de individuos que poseen un valor inferior o igual al mismo. No los construiremos en clase. Se pasan
de los diferenciales a los integrales por integracin y a la inversa por derivacin (en un sentido ms
general del que visteis en bachillerato.)

4
+ Proceso de Investigacion Cuantitativa

Decidir el program a utilizar.


Explorar los datos obtenidos en
la recoleccion.
Analizar descriptivamente los
datos por variable.
Evaluar confiabilidad, validez
y objetividad.
Analizar la hipotesis.

Realizar analisis adicionales.


Preparar los resultados para
presentarlos.
+ Que procedimiento se sigue para
analizar cuantitativamente los datos?

Analisis se lleva por


computadora.

Mediante matriz de datos


computarizado.
+
Que procedimiento se sigue
para
analizar los datos?

Programa de computador.

Incluye dos partes:


Definicion de las variables
que explican los datos.
Matriz de datos.
+
Programas de analisis

Satatistical Package for Social


Minitab
Sciences (SPSS)
Univ Chicago Bajo costo

+ utilizados/ Ingles Incluye un considerable # de


estadisticas
Contiene todos los analisis
estadisticos Tiene tutorial en linea

Vista de variables con Sencillo de manejar


definiciones de variables y
datos

Vista de datos (matriz de datos)


+
Otros pogramas de analisis

Sistema de analisis Estadistico Conclusion:

Universidad de Carolina del Cualquier programa nos sirve.


Norte.
Todos los mencionados son
Muy poderoso. excelentes opciones.

Paquete completo para


computadoras personales que
contienen una variedad de
pruebas estadisticas.
Para qu sirve la estadstica?
La Ciencia se ocupa en general de fenmenos observables

La Ciencia se desarrolla observando hechos, formulando leyes que los explican y realizando
experimentos para validar o rechazar dichas leyes

Los modelos que crea la ciencia son de tipo determinista o aleatorio (estocstico)

La Estadstica se utiliza como tecnologa al servicio de las ciencias donde la variabilidad y la


incertidumbre forman parte de su naturaleza

La Bioestadstica [...] ensea y ayuda a investigar en todas las reas de las Ciencias de la Vida
donde la variablidad no es la excepcin sino la regla
Carrasco de la Pea (1982)
11
Definicin
La Estadstica es la Ciencia de la

Sistematizacin, recogida, ordenacin y presentacin de los


datos referentes a un fenmeno que presenta variabilidad o
incertidumbre para su estudio metdico, con objeto de

deducir las leyes que rigen esos fenmenos,

y poder de esa forma hacer previsiones sobre los mismos,


tomar decisiones u obtener conclusiones.
12

12
TIPOS DE ESTADSTICA
Estadstica Descriptiva Estadstica Inferencial
Mtodo de recolectar, organizar, Mtodos usados para determinar algo
resumir y presentar los datos en acerca de la poblacin, basado en una
forma informativa. muestra.
Ejemplo 1: Una encuesta desarrollada
Ejemplo 1: Los datos del Censo de para saber sobre los beneficios de los
poblacin de ao. celular.
Ejemplo 2: Cual es el promedio de Ejemplo 2: Investigacin sobre la
accidentes ocurridos en seis meses motivacin y la produccin de una
en la empresa Electro Per. empresa.
OBJETIVOS DE LA INVESTIGACIN CIENTFICA

Describir la realidad Explicar la realidad Predecir la realidad

Descriptiva Inferencial

ESTADSTICA

Rama de la estadstica que trata sobre la


descripcin y anlisis estadstico de una Rama de la estadstica que estudia el comportamiento y propiedades de las
poblacin o muestra. muestras, y la posibilidad y lmites de la generalizacin de los resultados
Tiene como objetivo caracterizar los datos, de obtenidos a partir de aquellas a las poblaciones que representan.
manera grfica o analtica, para resaltar las Se basa en la probabilidad.
propiedades de los elementos bajo estudio El propsito principal de los mtodos estadsticos es legitimar
generalizaciones sobre poblaciones usando datos de muestras.
Los mtodos estadsticos inferenciales emplean el razonamiento inductivo,
es decir, razonan de lo particular a lo general.
14
DISTRIBUCIONES MUESTRALES

Uno de los objetivos de la estadstica es conocer acerca del comportamiento de parmetros poblacionales
tales como:

la media ( ),
la varianza ( )
o la proporcin ( p ).

DISTRIBUCIN DISTRIBUCIN
MUESTRAL DE LA MEDIA MUESTRAL DE LA
POPORCIN

La distribucin muestral es la
distribucin de los resultados que se
presentan si en realidad se seleccionaron
todas las muestras posibles

15
DISTRIBUCIONES MUESTRALES
1 Distribucin Muestral de la Media

- Es la distribucin de todas las medias posibles que surgen si en realidad se


seleccionaran todas las muestras posibles de cierto tamao, es decir, es una
distribucin de frecuencias, no de valores brutos, sino de medias de la
muestra, donde cada media de la muestra est basada en una muestra
aleatoria de n valores brutos

2
2 3
1

La media muestral es imparcial porque la media de todas las medias mustrales


posibles (de una muestra dada con tamao n) es igual a la media poblacional .
3
16
El error estndar de la media, es el valor de la desviacin estndar de todas las
medias mustrales posibles, es decir, expresa cunto vara la media muestral
entre una muestra y otra.
1 Distribucin Muestral de la Media

DISTRIBUCIONES MUESTRALES

1. a. Muestreo de poblaciones con distribucin


normal

Si se est muestreando una poblacin que tiene una distribucin normal con media y desviacin estndar
conocida, independientemente del tamao de la muestra n, la distribucin muestral de la media tendr una
distribucin normal con media muestral igual a la media poblacional y un error estndar de la media muestral.

La distribucin normal
tiene un promedio La prueba de Hiptesis para la
terico de 0 y una media poblacional se realizar
desviacin estndar haciendo uso de los puntajes
terica de 1. z de la curva normal.

Si se est muestreando una poblacin que tiene una distribucin normal con media y desviacin estndar desconocida, la
distribucin muestral de la media que se utilizar es la t de student siempre que el n sea inferior a 30. Cuando la muestra es mayor a
ese nmero, la distribucin se asemeja a la distribucin normal y el contraste de hiptesis se realizacin con la distribucin z.

La distribucin t de La prueba de Hiptesis para la


student cuyo promedio media poblacional se realizar
terico es 1 y la desviacin haciendo uso de los puntajes t 17
estndar es mayor a 1 de la curva t.
DISTRIBUCIONES MUESTRALES

1 Distribucin Muestral de la Media

1. a. Muestreo de poblaciones sin distribucin normal (Teorema del Lmite central)


Dispone que cuando el tamao de la muestra (es decir, el nmero de valores en cada muestra) es lo bastante grande, la distribucin
muestral de la media tiene una distribucin aproximadamente normal. Esto es vlido sin importar la forma de la distribucin de los
valores individuales en la poblacin (La distribucin de muestreo de la media se aproxima a la normalidad conforme n se
incrementa.
N 30

1) Para la mayor parte de las distribuciones poblacionales, sin importar su forma, la distribucin muestral de la
media tiene una distribucin aproximadamente normal cuando se seleccionan muestras de por lo menos 30
elementos.
2) Si la distribucin poblacional es bastante simtrica, la distribucin muestral de la media es aproximadamente
normal en muestras tan pequeas como las de 5 elementos.
3) SI la poblacin tiene una distribucin normal, la distribucin muestral de la media tambin tiene una
distribucin normal, independientemente del tamao de la muestra.

La prueba de Hiptesis para la


media poblacional se realizar
haciendo uso de los puntajes z de 18
la curva normal.
DISTRIBUCIONES MUESTRALES
2 Distribucin Muestral de la Proporcin

La distribucin muestral de la proporcin


generalmente sigue el modelo de una
distribucin probabilstica para variables
cuantitativas discretas denominada Distribucin
Binomial, sin embargo cuando ocurre que n * P
y n * Q son 5, la distribucin binomial puede
aproximarse al modelo de la curva normal y en
consecuencia realizar el contraste de hiptesis
para la proporcin poblacional a travs de los 19
puntajes z de la curva normal.
CALCULO DE INTERVALO DE CONFIANZA
FORMULA PARA INTERVALOS DE CONFIANZA
Formula para la
varianza
Sujeto Puntajes Pje.2
s

1 101 10201
2 98 9604
3 76 5776 374,64
4 123 15129
5 143 20449
6 98 9604
7 88 7744 1- 19,35
8 100 10000 0,9
5
9 105 11025
639,17 663,16
10 132 17424
106,4 116956 20
ALGUNOS CONCEPTOS ASOCIADOS A LA PRUEBA DE HIPOTESIS

Error tipo I
Rechazar una Hiptesis nula (Ho) siendo esta verdadera. Tiene asociada una probabilidad

Error tipo II
Aceptar una Hiptesis nula (Ho) siendo esta falsa. Tiene asociada una probabilidad .

Nivel de confianza
Es aceptar una Hiptesis nula (Ho) siendo esta verdadera por lo tanto es una decisin acertada; tiene
asociada una probabilidad de 1 . Los niveles de confianza ms usados son el 0,99 (99%) y el 0,95 (95%)

Potencia de Prueba
Rechazar una Hiptesis nula (Ho) siendo esta falsa (Acierto). Tiene asociado una probabilidad que es 1
(Es la probabilidad de estar en potencia de prueba). Es un complemento al error tipo II.
21
PASOS PARA LA PRUEBA DE HIPOTESIS

1) Formular la Hiptesis de Investigacin

2) Plantear las correspondientes hiptesis estadsticas


- Hiptesis nula (Ho): Es la que se somete a prueba (Es la que contrastamos o verificamos). Es la nica que
pasa por la igualdad, por lo tanto las relaciones que plantea un hiptesis nula son las siguientes: =, , .
- Hiptesis alterna (Ha): Platea diferencia y generalmente coincide con la hiptesis de investigacin o del
investigador, a menos que la hiptesis del investigacin sea formulada en trminos de igualdad, por lo que de ser as
est coincide con la nula.

3) Determinar un nivel de significacin (), la cual es la probabilidad de cometer el error tipo I (Rechazar una
hiptesis siendo esta verdadera).
- ms usados: 0,01 (1%) y 0,05 (5%).
- SPSS: el programa calcula y entrega automticamente un nivel de error que tcnicamente se denomina p
value o valor p (nivel de significacin mnima o mnimo para poder rechazar la Ho.
- si p 0,01: se rechaza la Ho con un p < 0,01 (1% de significacin)
- si p > 0,01 y 0,05: se rechaza Ho con un p < 0,05
- si p > 0,05: se acepta Ho con un p > 0,05 (95% de confianza)

4) Adoptar una decisin estadstica (D.E.) Se acepta o se rechaza la Ho.


https://youtu.be/YrJ9nNHQcIA
5) Concluir: confirmando o desconfirmando la Hiptesis de Investigacin https://www.youtube.com/watch?v=tCb7Mpcvj6c

22
DISTRIBUCION VARIABLE VARIABLE RELACIN ENTRE LAS PRUEBA ESTADSTICA
INDEPENDIENTE DEPENDIENTE MUESTRAS
(PREDICTORA) (RESULTADO)
No normal Una sola muestra (se Binomial
(No paramtricos) compara con valor Chi-cuadrado de Pearson
terico) Chi-cuadrado de Mantel-Haenzsel
Prueba de Kolmogorow-Smirnov
Prueba de las Rachas

Dicotmica Categrica Relacionadas Test exacto de McNemar


Prueba de los Signos
No relacionadas Chi-cuadrado de Pearson,Test exacto de Fisher,Test de
Wilcoxon,Prueba de los signos

Policotmica Cuantitativa Relacionadas Mann-Whitney


Mediana
Categrica No relacionadas Z Kolmogorov-Smirnov

Cuantitativa No relacionadas Rachas de Wald-Wolfowitz


Valores extremos de Moses

Relacionadas Prueba Q de Cochran

No relacionadas Prueba de Friedman


W de Kendall (concordancia)
Prueba de Kruskal-Wallis
Mediana K variables
ANOVA de dos vas por rangos

COVARIACION (medidas de dos variables en los mismos sujetos o unidades de anlisis del estudio)
Paramtrico Cuantitativa Cuantitativa Correlacin de Pearson
No paramtrico Cuantitativa Cuantitativa Correlacin de Spearman
CORRELACIONES

Procedimiento estadstico que intenta probar el grado de asociacin que hay entre dos o
ms variables

Correlaciones Correlaciones
Bivariadas Mulivariadas

Es un nmero que nos dice hasta donde los cambios o variaciones que presenta una variable se explican
por las variaciones o cambios que presenta otra variables (Juego de varianzas)

La correlacin no implica causalidad, la nica vez que yo puedo atribuir causalidad es cuando la
correlacin es perfecta (-1 o +1).

Tiene que ver con la fuerza de la copelacin, las que


monto pueden ser: fuertes (0,66 a 1), moderada (0,35 a 0,65) y
dbiles (0 0,34)
Caractersticas de
las correlaciones Tiene que ver con el signo de la correlacin. Pueden ser
direccin positivas (directa) o negativas (inversa). No todos los
coeficientes asumen valores positivos y negativos

24
COEFICIENTES DE CORRELACIN

- Dos variables cuantitativas continuas con un nivel de medicin a lo mnimo


intervalar
1 Pearson (rxy) - La relacin de las variables debe ser de naturaleza lineal
- Asume valores que van del -1 a +1, pasando por el 0 que significa ausencia de
correlacin.

- Dos variables cuantitativas con un nivel de medicin a lo mnimo ordinal


2 Spearman (rs) - La relacin de las variables debe ser de naturaleza lineal
- Asume valores que van del -1 a +1, pasando por el 0 que significa ausencia de
correlacin.
- Spearman es un derivado de Pearson, Kendall no lo es.
- Kendall se utiliza para determinar una correlacin parcial (control de variables
intervinientes)
3 Kendall () - Spearman es aproximadamente 1,5 veces ms grandes que Kendall en el mismo
conjunto de datos.

- Es un derivado de Pearson
- Correlacin entre una variables dicotmica real o genuina (nominal) con otra
4 Punto Biserial (rpb) variable que es cuantitativa continua medida a lo menos en una escala intervalar.
- El signo no se interpreta, sino que hay que ver las medias de los grupos
- En SPSS se realiza mediante el coeficiente de correlacin de Pearson

- Es un derivado de Pearson
25
5 Biserial (rb) - Correlacin entre una variable es que cuantitativa medida a lo menos en una escala
intervalar con otra variable que es dicotmica aparente o artificial
COEFICIENTES DE CORRELACIN

- Sirve para calcular la correlacin entre dos variables dicotmicas reales o una
dicotmica real y una aparente.
6 Phi (r) - El signo no se interpreta, pues son variables cualitativas. Para interpretar hay que
recurrir a la tabla de contingencia.
- Condicin: Si existe una frecuencia esperada menor a 5, se interpreta mediante el
estadstico exacto de Fisher (Chi cuadrado)

- Es un derivado de Pearson
- Tradicionalmente se utiliza para calcular la correlacin entre 2 variables
7 Contingencia (C) dicotmicas (reales o aparentes), dos policotmicas (reales o aparentes) o una
dicotmicas y una policotmicas..
- Su uso se restringir a dos variables policotomicas o una policotmica y una
dicotmica
- Toma valores que van entre 0 y 1
- Condicin: si ms del 20% de las frecuencias esperadas son inferiores a 5, no se
puede calcular.

8 Tetracorico (rt) - Se utiliza para calcular la correlacin entre dos variables dicotmicas aparentes
- Es derivado de Pearson
- La dicotoma por lo general se realiza en la mediana.

26
COEFICIENTES DE CORRELACIN

9 Eta (xy; yx)

- Se utiliza para calcular la correlacin entre una variable (criterio) y 2 o mas


variables (predictoras).
10 Correlacin Mltiple - El coeficiente se denomina coeficiente de correlacin mltiple .
- Asume valores que van de -1 a +1 pasando por el 0
- El signo no se interpreta, slo establece si existe o no correlacin.

- Se utiliza para calcular la correlacion entre dos variables cuantitativas continuas


manteniendo controlada los efectos de una tercera variables que se sabe que
11 Correlacin Parcial influye (correlacin previa).
- La correlacin parcial obtenida se denomina correlacin pura.
- La influencia de la variables controlada puede ser:
- Positiva: cuando esta controlada baja el monto de la correlacin
- Negativa: cuando esta controlada aumenta el monto de la correlacin

27
Identifica y grafica los diagramas de
dispersin, analiza e interpreta la correlacin
positiva y negativa.

TALLER DE APLICACIN
REYNALDO CARVAJAL ORTIZ

CAPITULO 5

METODOS ESTADISTICOS PARA


ANALISIS BIVARIADO

El anlisis bivariado permite examinar si existe relacin (asociacin) entre


dos variables. Las variables pueden ser ambas numricas, una numrica y
la otra categrica o ambas categricas

En el rea de la Higiene y Seguridad Industrial el anlisis bivariado permite


examinar si existe asociacin estadstica entre exposicin y efecto.

La estadstica proporciona los mtodos (Pruebas de significancia) para


determinar si la asociacin o diferencia observada entre los grupos es o no
estadsticamente significante.

Estadsticamente significante quiere decir es poco probable o


improbable que la diferencia observada entre los grupos pueda ser
explicada por efectos del azar. Por consiguiente, existe asociacin
estadstica entre exposicin y efecto.

Si se demuestra que el estudio tiene validez interna (control de sesgos) y


precisin, es posible concluir que la asociacin observada es real, o que los
hallazgos obtenidos con el estudio son verdaderos.
La aplicacin de pruebas de significancia estadstica requiere el
conocimiento de los siguientes conceptos:

93
REYNALDO CARVAJAL ORTIZ

5.1. DECISIONES ESTADSTICAS


Son aquellas que se toman a partir de la informacin obtenida en el estudio
(informacin muestral).
5.2. HIPTESIS ESTADSTICAS
Son enunciados de relacin entre variables (exposicin efecto) que
pueden ser verdaderos o falsos.

5.3. HIPTESIS NULA


Se nota por Ho. y puede ser verdadera o falsa.
La Hiptesis nula consiste en una proposicin de no diferencia. Se
establece con el nimo de rechazarla con base con los resultados del
estudio.
Rechazar una Hiptesis nula significa que es muy poco probable que la
Hiptesis nula sea cierta y que los resultados obtenidos en el estudio se
deban a simple azar.

La Ho se rechaza o no se rechaza pero nunca se debe hablar de


aceptarla

5.4. HIPTESIS ALTERNA

Se nota por Ha. y puede ser verdadera o falsa.


Cuando se rechaza la Hiptesis nula, el investigador por descarte acepta la
hiptesis alterna (Ha.)

Aceptar una Hiptesis alterna significa que existe una verdadera asociacin
entre exposicin efecto o que las diferencias obtenidas en el estudio
son reales.

94
REYNALDO CARVAJAL ORTIZ

El contraste de la Ho., se basa en distribuciones de probabilidad por lo cual


siempre se llega a conclusiones con mrgenes pequeos de probabilidad
de error. (nivel de significancia )

5.5. PRUEBAS DE SIGNIFICANCIA ESTADSTICA

Son procedimientos que facilitan decidir si una Hiptesis nula se rechaza o


no se rechaza.
La aplicacin de estas pruebas parte del supuesto de que se ha utilizado un
diseo de muestreo probabilstico (al azar, sistemtico, estratificado o
conglomerados) para obtener la informacin muestral que permita tomar
decisiones estadsticas.

5.6. Errores en la Prueba de Hiptesis

En el contraste de la Ho., se puede cometer dos tipos de error:

Error Tipo I (). Consiste en rechazar una Hiptesis nula verdadera.


Este error se conoce como nivel de significancia estadstica a partir del
cual se toma la decisin de rechazar o no rechazar la Hiptesis nula.

Generalmente se considera un nivel de significancia igual o menor a 5%


(= 0.05, =0.01, etc.).

Error Tipo II (). Consiste en no rechazar una Hiptesis nula falsa.

El cuadro siguiente resume los dos tipos de error.

95
REYNALDO CARVAJAL ORTIZ

Estado Real de la Ho.


Verdadera Falsa
Rechazar Poder del
Ho.
Conclusin con Error Estudio
base en la prueba (1- )
de significancia No rechazar Decisin
estadstica Ho. Correcta Error
(1-)

5.7. PODER ESTADSTICO DE UN ESTUDIO (POTENCIA)

Capacidad que tiene el estudio para rechazar una Hiptesis nula falsa.
Capacidad que tiene el estudio de detectar diferencias cuando
realmente las hay
Probabilidad de que los resultados del estudio sean verdaderos

Usualmente en el diseo de una muestra, se establecen apriori valores de


poder iguales o mayores a 80%.
Los errores y son inversamente proporcionales y su punto de equilibrio
sucede cuando = 0.05 (confianza del 95%) y = 0.20 (poder del 80%).

96
DATOS BIVARIADOS
Son valores de dos diferentes variables que se obtienen a partir del mismo
elemento de poblacin (es decir, de la misma unidad estadstica). No se trata
de elegir dos variables cualesquiera, es una observacin simultnea de
variables que tengan entre s alguna relacin. Se representan como pares
ordenados (X;Y).

Variables cualitativas Variables cualitativas


Gnero Grado de Material - Color
instruccin

Variable cualitativa y Variable cualitativa y cuantitativa


cuantitativa Material Tiempo de duracin
Profesin Ingreso mensual
Variables cuantitativas:
Variables cuantitativas Precio de costo Precio de venta
Estatura - Peso
DISTRIBUCIONES BIDIMENSIONALES
Son tablas que sirven para organizar datos bivariados. Estas tablas de acuerdo a las caractersticas que
se estudian, pueden estar formadas por:
Dos variables cualitativas o categricas (Tabla de contingencia).
Una variable cualitativa y otra cuantitativa.
Dos variables cuantitativas.
EJEMPLO: se realiza una investigacin a los estudiantes de la facultad de ingeniera si fuman o no
fuman. los resultados son los siguientes de acuerdo a genero.
VARIABLES : Adiccin al tabaco por gnero.
TIPO DE DATOS: Cualitativos ambos 35%
33%
30%
31%
Mujeres Varones Total 25%
19%
20%
fi pi% fi pi% fi pi%
15%
Fuman 18 19% 32 33% 50 52% 10%
18%

No Fuman 30 31% 17 18% 47 48% 5%

Total 48 49% 49 51% 97 100% 0%


MUJERES Fuman No Fuman VARONES

Interpretacin: de los 97 estudiantes entrevistados el 31% son mujeres que no fuman.


Caso 1: Dos variables cualitativas
Gnero Estado Civil
Mujer Soltero
Estado civil
Varn Soltero Gnero Casado Soltero Viudo Totales
Mujer Casado
Mujer Soltero 5 5 3 13
Varn Viudo Mujer
Varn Soltero
20% 20% 12% 52%
Mujer Casado 3 5 4 12
Mujer Viudo Varn
Mujer Soltero 12% 20% 16% 48%
Varn Soltero
Varn Casado
Totales 8 10 7 25
Mujer Casado
Mujer Viudo
Varn Viudo
Frecuencia absoluta conjunta
Varn Soltero * 100% 5
Mujer Casado Total general de los datos * 100% 20%
Varn Viudo 25
Mujer Soltero
Varn Casado
Varn Viudo
Mujer Soltero
Varn Casado
Mujer Viudo
Mujer Casado
Varn Soltero
Interpretaciones
El 20% de los casados son mujeres.
El 20% de los varones son solteros.
TABLAS BASADOS AL TOTAL DE COLUMNAS

Pueden calcularse
Porcentajes basados en el total porcentajes
basados en el total
de columnas: de la columna

Frecuencia absoluta conjunta


100
Total general de la columna

6
100 75%
8
TABLAS BASADOS AL TOTAL DE LAS FILAS

Porcentajes basados en el total Tambin pueden


de filas: calcularse
porcentajes basados
en el total de la fila
Frecuencia absoluta conjunta
100
Total general de la fila

2
100 16, 7%
12
EJEMPLO N3 :VARIABLE MIXTAS
VARIABLES:
Una variable cualitativa y una variable
cuantitativa.

TIPO DE DATOS: cualitativo y cuantitativa


(MIXTAS)
Grfico N 2: Gnero y nmero de
hijos de los trabajadores

0
3
5

5
2

N DE HIJOS
5

4
1
1

3
0
2

0 1 2 3 4 5 6
N DE TRABAJADORES
Interpretaciones Varn Mujer

5 trabajadores de ambos sexo solo tienen 2 hijos.


5 trabajadoras tiene slo 3 hijos, mientras los varones tienen como mximo
dos hijos.
El mayor porcentaje (20%) de varones tienen solo 2 hijos, al igual que las
mujeres.
Comparando dos variables cuantitativas
EJEMPLO: SE MUESTA A CONTINUACION DOS VARIABLES NUMERO DE CIGARROS
CONSUMIDOS POR DA Y EL NDICE DE MORTALIDAD.
CALCULAR QUE TIPO DE CORRELACIN ES:

N cigarrillos al da 3 6 8 20 25

ndice de mortalidad 0.2 0.5 0.5 1.2 1.7


INTERPRETACIN:
1.8
25, 1.7
A mayor
1.6
consumo de
NDICE DE MORTALIDAD

1.4
1.2
1
20, 1.2
cigarros al da es
0.8
0.6 6, 0.5
mayor el ndice
0.4
8, 0.5
de mortalidad.
Correlacin
0.2 3, 0.2
0
0 5 10 15 20 25 30
N de CIGARRILLOS POR DA positiva.
Comparando dos variables cuantitativas: N de
horas de estudios y N horas de ver televisin
N de horas de estudio 1 2 3 4 5
N de horas de televisin 5 4 3 3 1

GRAFICA E INTERPRETA LOS RESULTADOS


Qu tipo de correlacin tiene?

6
CORRELACIN NEGATIVA INTERPRETACIN:
A mayor N
N DE HORAS DE VER TELEVISIN

5 1, 5

4 2, 4
horas de estudio,
3 3, 3 4, 3

2
menor N de ver
1 5, 1 televisin
0
0 1 2 3 4 5 6 Correlacin
N DE HORAS DE ESTUDIO Negativa.
EJEMPLON4: Dos variables cuantitativas
Pares
ordenados DIAGRAMA DE DISPERSIN
(4;5)
(1;2)
(0;2)

.
.
NUBE DE PUNTOS
.
Recuerda: Las grficas para comparar variables.
Barras agrupadas
Comparar dos variables cualitativas.
Comparar una variable cuantitativa y
otra cualitativa. (mixtas).

Diagrama de dispersin
Cuando comparamos dos variables
cuantitativas.

Series de tiempo.
Comparamos dos variables que
involucre el tiempo.
GRFICOS ESTADSTICOS
Carl Friedrich Gauss
(1777-1855)
PROPSITO DE CLASE
Diferencia un cuadro estadstico de un
grfico estadstico.
Identifica los grficos estadsticos.
Construye grficos estadsticos y analiza e
interpreta los resultados.
Valora la utilidad de los grficos estadsticos
para la organizacin de datos y la
informacin que estas brindan.
Cuadro Estadstico

Llamado tambin tabla estadstica

Presentar los resultados de la conceptualizacin y cuantificacin


aspectos particulares de la realidad.

Presentar la informacin estadstica en forma ordenada y de fcil lectura


para cualquier usuario, que permite leer, comparar e interpretar las
caractersticas de una o mas variables.

Los datos son el resultado de la ejecucin de una investigacin estadstica o


el aprovechamiento de un registro administrativo con fines estadsticos.
Ttulo adecuado
Claro y conciso, que responda a las preguntas: Qu relaciona?, cmo?,

COMPONENTES DE UN CUADRO
cundo?, y dnde se hicieron las observaciones?.

El cuerpo
El cuadro en s, donde debe considerar el o los tipos de variables a relacionar, el
pblico a quien va dirigido y presentarse las frecuencias que sean ms necesarias.

Fuente
Corresponde al rea de la empresa o institucin responsable de la elaboracin de
la informacin.

Notas Explicativas
En ella se presentan aclaraciones respecto a la informacin que se est
presentando. Este componente es opcional..
Ejemplo
Qu
grfico
elegir?
GRFICO ESTADSTICO
Una grfica o diagrama estadstico es un dibujo complementario a una tabla o cuadro, que permite
observar las tendencias de un fenmeno en estudio y facilita el anlisis estadstico de las variables ah
relacionadas.

Componentes

Ttulo adecuado: Claro y conciso, que responda a las


preguntas: Qu relaciona?, cmo?, cundo?, y
dnde se hicieron las observaciones?

El cuerpo: Es el grfico en s, cuya eleccin debe considerar el o


los tipos de variables a relacionar, el pblico a quien va dirigido y
el diseo artstico del grfico.

Fuente: Corresponde al rea de la empresa o institucin


responsable de la elaboracin de la informacin
Ejemplo:
Principales tipos de grficas
1. Barras
Est constituido por barras rectangulares de
igual ancho, conservando la misma distancia de
separacin entre s.

Se utiliza bsicamente para mostrar y comparar


frecuencias de variables cualitativas o
comportamientos en el tiempo, cuando el
nmero de tems es reducido.
Tipos de barras
Barras Simples: Compara valores entre categoras de una variables.
Barras Dobles: Compara valores entre categoras de dos variables.
Barras Mltiples: Compara valores entre categoras de dos variables.
Barras Verticales: Las categoras de la variable deben ubicarse en el eje X.
Barras Horizontales: Las categoras de la variable deben ubicarse en el eje Y.
Barras Apiladas: Compara entre categoras el aporte de cada valor en el total.
2. Grfico de Sectores Circulares (Pie):
Llamado grfico de pastel, debido a su forma de una circunferencia dividida en sectores, por medio de radios que dan la
sensacin de un pastel tajado en porciones.
Se usa para representar variables cualitativas en porcentajes o cifras absolutas cuando el nmero de tems no es superior
a 5 y se quiere resaltar uno de ellos.
Ejemplo:

Fuente: DATUM INTERNACIONAL


3. Grfico de Lneas o Tendencia
Usado bsicamente para mostrar el comportamiento de una variable cuantitativa a travs del tiempo. El grfico
de lneas consiste en segmentos rectilneos unidos entre s, los cuales resaltan las variaciones de la variable por
unidad de tiempo.
Cuando se tienen varias variables a representar, con el fin de establecer comparaciones entre ellas (siempre que
su unidad de medida sea la misma); se utiliza plasmarlos en un slo grfico, el cual es el resultado de
representar varias variables en un mismo plano. A este tipo de grfico se le conoce como grfico de lneas
compuesto.
Ejemplo:

Fuente: DATUM INTERNACIONAL


4. Histograma de frecuencias

Es una grfica de la distribucin de un conjunto de datos. Es un tipo especial de grfica de barras, en


la cual una barra va pegada a la otra, es decir no hay espacio entre las barras. Cada barra representa
un subconjunto de los datos.

Un histograma muestra la acumulacin tendencia, la variabilidad o dispersin y la forma de la


distribucin.

Un histograma es una grfica adecuada para representar variables continuas, aunque tambin
se puede usar para variables discretas. Es decir, mediante un histograma se puede mostrar
grficamente la distribucin de una variable cuantitativa o numrica.

Los datos se deben agrupar en intervalos de igual tamao, llamados clases. Para
construir el polgono de frecuencia se toma la marca de clase que coincide con el punto
medio de cada rectngulo.
Ejemplo:

Fuente: Organizacin de los estados Iberoamericanos (OEI)


5. Polgono de frecuencias
Se utiliza bsicamente para mostrar la distribucin de frecuencias de variables cuantitativas. Es un diagrama
de lneas que representa los puntos medios y las respectivas frecuencias de una distribucin de frecuencia de
clase.
6. Histograma de frecuencias acumuladas (ojiva)

Se utiliza bsicamente para mostrar la distribucin de frecuencias acumulada


de variables cuantitativas.

Es una grfica que se elabora con los valores de las frecuencias acumulados (menor
que y mayor que) y los lmites de las clases de una distribucin de frecuencia.

La ojiva es una representacin grfica que consiste en una lnea, que puede ser
ascendente o descendente y se utiliza para representar las distribuciones de frecuencias
acumuladas menor que y mayor que, segn los datos utilizados.

En los estudios de anlisis estadsticos la ojiva es de gran utilidad porque permite obtener con gran
aproximacin cierta informacin requerida, en un momento determinado.
Ejemplo:
Ejemplo:
7. Tallo y Hojas

El diagrama de Tallo y hojas permite obtener simultneamente una distribucin de frecuencias de la variable y su
representacin grfica. Para construirlo basta separar en cada dato el ltimo dgito de la derecha (que constituye la hoja) del
bloque de cifras restantes (que formar el tallo).

Esta representacin de los datos es semejante a la de un histograma pero adems de ser fciles de elaborar, presentan ms
informacin que estos.

36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40

Ejemplo: Edad de 20 personas


Comenzamos seleccionando los Tallos que en nuestro caso son las cifras de decenas; es decir 3; 2; 4 que reordenadas son 2; 3
y 4.
A continuacin efectuamos un recuento y vamos aadiendo cada hoja a su tallo.
Ejemplo:
8. Diagrama de Pareto
.

El diagrama de Pareto es una representacin grfica que permite identificar y seleccionar los
aspectos prioritarios que hay que tratar en un determinado problema. Tambin se conoce como
diagrama ABC o Ley de las prioridades 20-80, que dice: el 80% de los problemas que ocurren en
cualquier actividad son ocasionados por el 20% de los elementos que intervienen en producirlos.
Sirve para conseguir el mayor nivel de mejora con el menor esfuerzo posible. El objetivo de esta
representacin es clasificar dichos elementos es en dos grupos: los pocos vitales y los muchos
triviales.
Los pasos para la elaboracin del diagrama de Pareto son:
a. Construya una tabla de distribucin de frecuencias ordenando las categoras en forma
descendente respecto a la frecuencia.
b. La categora Otros deber ser colocada en la ltima posicin, no importa cun grande sea,
porque est compuesta de un grupo de categoras cuyas frecuencias son menores en relacin al
valor de la variable con frecuencia ms pequea listado individualmente.
c. Agregue a la tabla de distribucin de frecuencias una columna para las frecuencias acumuladas
absolutas F.
d. Elabore un diagrama de barras y agregue la lnea de frecuencias acumuladas relativas Hi.
Ejemplo:
Para crear un diagrama de Pareto debemos preparar los datos. Posteriormente insertar una
grfica de columnas seleccionando toda la tabla de datos.
Ahora debemos convertir el grfico del porcentaje acumulado en un grfico de lnea. Tambin
debemos agregar el eje secundario. Para ello se selecciona la grfica de lnea y en las opciones de
Formato elige trazar el eje secundario. As mismo tenemos un diagrama de Pareto bsico;
podemos terminar dndole algn formato especial y de manera opcional agregar una lnea que
muestre una constante del 80%
Distintos diagramas de dispersin