You are on page 1of 55

DATOS Y

FRECUENCIAS
Cr. Jorge de Souza Martinez
crjdesouzamartinez@gmail.com
097351538
NOMINAL Y ORDINAL
Los datos nominales y ordinales pueden ser de
cadena (alfanuméricos) o numéricos. Nominal . Una
variable puede ser tratada como nominal cuando sus
valores representan categorías que no obedecen a una
clasificación intrínseca. Por ejemplo, el departamento
de la compañía en el que trabaja un empleado.
VARIABLES CUALITATIVAS NOMINALES

Las variables cualitativas nominales son aquellas


que carecer de o no admiten un criterio de orden y no
cuentan con un valor numérico asignado.
Un ejemplo de este tipo de variables puede ser el
estado civil (casado, soltero, divorciado, viudo).
DATOS NOMINALES
La escala de medida nominal, puede
considerarse la escala de nivel más bajo, la que
menos información proporciona. Consiste en la
asignación arbitraria de números o símbolos a
cada una de las diferentes categorías en las
cuales podemos dividir los datos, sin que
puedan establecerse relaciones entre dichas
categorías.
DATOS ORDINALES
La escala ordinal es uno de los
niveles de medición que nos otorga la
clasificación y el orden de los datos sin
que realmente se establezca el grado
de variación entre ellos. La escala de
medición ordinal es la segunda de las
4 escalas de medición.
VARIABLE CUALITATIVA NOMINAL
Una variable cualitativa
nominal presenta modalidades no
numéricas que no admiten un
criterio de orden. Ejemplo: El
estado civil, con las siguientes
modalidades: soltero, casado,
separado, divorciado y viudo.
ESCALA NOMINAL
Una escala nominal es
una escala de medición en la cual los
números sirven como “etiquetas”
solamente para identificar o clasificar
un objeto. Una escala de
medición nominal normalmente
trata sólo con variables no numéricas
(no cuantitativas).
ESCALA ORDINAL
Las variables de las escalas nominal
y ordinal se denominan también
categóricas, por otra parte las variables
de escala de intervalo o de razón se
denominan variables numéricas. Con los
valores de las variables categóricas no
tiene sentido o no se puede efectuar
operaciones aritméticas. Con las variables
numéricas sí.
.

 RELACIÓN ENTRE
VARIABLES CUALITATIVAS
DICOTÓMICAS Y MÚLTIPLES
Las variables cualitativas pueden ser

 dicotómicas cuando sólo pueden tomar dos valores


posibles, como sí y no, hombre y mujer

o politómicas o mùltiples cuando pueden adquirir


tres o más valores.
EJERCICIO
 Vamos a ver ahora cómo evaluar la relación entre
variables cualitativas. Nos centraremos en variables
dicotómicas (con dos valores posibles) pero los
conceptos que veremos a continuación son fácilmente
exportables a variables cualitativas con más de dos
valores posibles.
Supongamos que queremos evaluar la relación entre la variable
sexo y la variable tener o no una determinada enfermedad. Se trata
evidentemente de dos variables cualitativas.
variables cualitativas con dos
valores posibles en cada una de
ellas (variables dicotómicas).
La variable Sexo: Hombre o
Mujer.
La variable Enfermedad: Sí la
tiene o No la tiene
 Supongamos los siguientes datos
TABLA DE CONTINGENCIAS
Tenemos, pues, una muestra con 60 hombres
enfermos y con 40 que no. Y tenemos, también, en la
muestra 20 mujeres enfermas y 80 que no. A partir de
estos valores, ¿podemos decir que están relacionadas
estas variables?
 A los datos de dos variables cualitativas expresados en
frecuencias absolutas, en una tabla como esta, se le
denomina “tabla de contingencias”.
Vamos ahora a analizar una
tabla de contingencias como
ésta y, así, detectar si hay
relación entre la variable sexo y
la variable tener o no esa
enfermedad.
Para evaluar esta relación vamos a suponer que
en lugar de estos datos tuviésemos estos otros
Y, ahora, comparemos las dos tablas de
contingencias. ¿Qué diferencias hay?
TABLA 1 TABLA 2
 Sin embargo, en la primera tabla  Si comparamos las dos tablas
la proporción de enfermos y no de contingencias podemos
enfermos es muy distinta en ver que en esta última no hay
hombres y en mujeres. en absoluto indicios de
  Esta diferencia de proporciones relación.
es lo que hace pensar que en la
 No hay relación en esta tabla
primera tabla sí que hay
relación, que esa enfermedad no porque en hombres y en
se presenta independiente al mujeres hay una proporción
sexo, sino que hay asociación, muy similar de enfermos y de
que hay una relación en los no enfermos.
datos de aquella tabla.
INDICE DE CRAMER
HAROLD CRAMER matemático y estadístico Sueco

 
Coeficiente utilizado para ver la
asociación de las variables
nominales
Se encuentra dentro de las
pruebas pertenecientes a la
estadística descriptiva

Concretamente aplicada al
estudio de dos variables.
Me permite analizar variables
nominales o cualitativas
VALOR DE MEDIDA
independiente del tamaño de la
muestra
ULTILIDAD

determinar la existencia o no de
independencia entre dos
variables
OBJETIVO

Demostrar la independencia
que no tienen relación, y que
por lo tanto una no depende de
la otra, ni viceversa
INDICE DE CRAMER

Es una corrección que aplicamos al Coeficiente CHI


CUADRADO
Por tanto debemos calcular en primer término este
coeficiente
Para evaluar la independencia entre las
variables, se calculan los valores que
indicarían la independencia absoluta,
lo que se denomina “frecuencias
esperadas” , comparándolos con las
frecuencias de la muestra
EJERCICIO
Supongamos que un investigador está interesado en
evaluar la asociación entre uso de cinturón de
seguridad en vehículos particulares y el nivel
socioeconómico del conductor del vehículo. Con este
objeto se toma una muestra de conductores a quienes
se clasifica en una tabla de asociación
PROCEDIMIENTO DE
CALCULO

Ji cuadrado (Χ2)
 
1

A partir de los valores y frecuencias


observados, obtenemos en una primer tabla

TABLA DE FRECUENCIAS OBSERVADAS


FRECUENCIAS OBSERVADAS
NIVEL SOCIO ECONÒMICO
CINTURÒN BAJO MEDIO ALTO TOTAL

SI 8 15 28 51
NO 13 16 14 43

TOTAL 21 31 42 94
2

Planteo de las 2 Hipòtesis

H0 Hipòtesis de INDEPENDENCIA
H1 Hipòtesis de DEPENDENCIA
Como es habitual, la hipótesis nula
(H0) indica que ambas variables
son independientes, mientras que
la hipótesis alternativa (H1) indica
que las variables tienen algún
grado de asociación o relación
3

A partir de los valores y frecuencias


observados, calculamos los valores esperados y los presentamos en
una segunda tabla

TABLA DE FRECUENCIAS ESPERADAS


QUE SON?

Son las frecuencias que deberían darse si las variables


fueran independientes, o sea cierta la Ho o hipótesis
nula
COMO LAS CALCULO?
Se obtendrán de la distribución de frecuencias del
total de casos
51 personas de un total de 94 usan cinturón
43 personas de un total de 94 no lo usan

RAZONAMIENTO
Si de 94 personas 51 usan cinturón
De 21 cuàntos deberían usarlo?
Regla de 3 o porcentajes
FRECUENCIAS ESPERADAS

NIVEL SOCIO ECONÒMICO


CINTURÒN BAJO MEDIO ALTO TOTAL

SI 11,4 16,8 22,8 51


NO 9,6 14,2 19,2 43

TOTAL 21 31 42 94
Para evaluar la independencia entre
las variables, se calcularon los valores
que indicarían la independencia
absoluta, lo que se denomina
“frecuencias esperadas” , y los
comparamos con las frecuencias de la
muestra, “frecuencias observadas”
COMO LO HAGO?
4 𝑥
2
=
∑ ( 𝑜𝑖 − 𝑒 𝑖 ) 2

se debe calcular el estadístico de prueba


𝑒𝑖
COEFICIENTE DE
CRAMER
V de CRAMER
PERMITE OBTENER UN ÍNDICE QUE INDICA EL
GRADO DE ASOCIACIÓN ENTRE LAS VARIABLES:
Parámetros
N = número total de observaciones en la tabla

n = mín (f-1 , c-1)

f filas
c columnas
FORMULA


2
𝑥
𝑣=
𝑁 ⋅𝑚
VALORES DEL INDICE
VALOR MÀXIMO = 1
Mayor asociación entre las variables

VALOR MÌNIMO = 0
Ausencia de asociación entre las variables
Ejemplo
UN INDICE DE CHI CUADRADO = 19,44 (usar cinturón y
nivel socio económico)
SEÑALA QUE EXISTE RELACIÒN PERO NO INFORMA SU
MAGNITUD (MUCHA, MODERADA, POCA,…)

HALLO LA V DE CRAMER Y ME DA IGUAL A 0,62


AHORA SI A LA VISTA DE ESTOS RESULTADOS PODEMOS
DECIR QUE LA RELACIÒN ENTRE ESTAS VARIABLES ES
FUERTE YA QUE EL CRAMER ES SUPERIOR A 0,6
EJER CLASE

Se tomará una tabla de contingencia o valores


observados 3x3 donde se evaluará que tan fuerte es la
relación entre el nivel socio económico y el consumo
de comida rápida.
TABLA de valores observados
CONSUMO DE COMIDA RAPIDA
VARIABLE SUSHI PIZZA HOT DOG TOTAL
ALTO 15 8 3 26
MEDIO ALTO 7 10 5 22
MEDIO BAJO 1 3 8 12
TOTAL 23 21 16 60
1
CALCULO TABLA DE VALORES ESPERADOS EN
BASE A LOS VALORES OBSERVADOS

Razonamiento:
Si de 60 personas relevadas, 23 comen sushi, de 26 de
nivel socio económico alto cuantos se espera que lo
hagan?

23 / 60 * 26
TABLA de valores esperados
CONSUMO DE COMIDA RAPIDA
VARIABLE SUSHI PIZZA HOT DOG TOTAL
ALTO 10 9 7 26
MEDIO ALTO 8 8 6 22
MEDIO BAJO 5 4 3 12
TOTAL 23 21 16 60
2 𝑥 =
2∑ ( 𝑜𝑖 − 𝑒 𝑖 ) 2

=19,10
𝑒 𝑖
se debe calcular el estadístico de prueba
3 APLICO LA FORMULA

4 CALCULO V DE CRAMER
 = 0,4
INTERPRETACIÓN
RESULTADO ENTRE 0 y 0,2 indica que no hay
asociación

RESULTADO 0,2 indica que asociación débil

RESULTADO ENTRE 0,2 y 0,6 indica una asociación

 RESULTADO ENTRE 0,6 y 1 indica asociación fuerte


V DE CRAMER 0,4

Existe una asociación moderada entre el consumo de


comida rápida y el nivel socio económico

You might also like