You are on page 1of 8

UNIVERSIDADE ESTADUAL DO MARANHÃO-UEMA

CENTRO DE CIÊNCIAS TECNOLÓGICAS-CCT


CURSO DE ENGENHARIA MECÂNICA

WADSON GUSTAVO RIBEIRO MACIEL

PESQUISA SOBRE: MEDIDAS DE ASSOCIAÇÃO ENTRE VARIÁVEIS


QUALITATIVAS E QUANTITATIVAS

SÃO LUIS
2023
WADSON GUSTAVO RIBEIRO MACIEL

PESQUISA SOBRE: MEDIDAS DE ASSOCIAÇÃO ENTRE VARIÁVEIS


QUALITATIVAS E QUANTITATIVAS

Pesquisa apresentado à Universidade


Estadual do Maranhão, como requisito para
obtenção de nota na disciplina: estatística

Orientador:

SÃO LUIS

2023
SUMÁRIO
1.INTRODUÇÃO ................................................................................................ 6
1.2 Variáveis qualitativas ........................................................................... 6
1.3 Variáveis quantitativas......................................................................... 7
2 EXEMPLO NO R STUDIO VARIÁVEIS QUALITATIVAS .............................. 9
3 EXEMPLO NO R STUDIO VARIÁVEIS QUANTITATIVAS ........................ 10
1. INTRODUÇÃO

As variáveis nos estudos estatísticos são os valores que assumem


determinadas características dentro de uma pesquisa e podem ser classificadas
em qualitativas ou quantitativas.

1.1. Variáveis qualitativas

não podem ser expressas numericamente, pois relacionam situações


como a cor da pele, cor dos olhos, marca de refrigerante, marca de automóvel,
preferência musical entre outras. Elas podem ser divididas em ordinais e
nominais. As variáveis qualitativas ordinais, apesar de não serem numéricas,
obedecem a uma relação de ordem, por exemplo: conceitos como ótimo, bom,
regular e ruim, classe social, grau de instrução, etc. Já as variáveis qualitativas
nominais não estão relacionadas à ordem, elas são identificadas apenas por
nomes, por exemplo, as cores: vermelho, amarelo, preto, azul, rosa, verde, etc.

Existem várias medidas de associação entre variáveis qualitativas, que


são utilizadas para analisar a relação entre esses tipos de variáveis. Algumas
das medidas mais comumente utilizadas são:

Coeficiente de contingência

O coeficiente de contingência é uma medida de associação usada para


avaliar a relação entre duas variáveis categóricas. Varia de 0 a 1, onde 0 indica
ausência de associação e 1 indica associação perfeita. Por exemplo, podemos
calcular o coeficiente de contingência para determinar se existe uma associação
entre a preferência alimentar (vegetariano, vegano, onívoro) e a preferência de
leitura (romance, ficção científica, não-ficção) em uma determinada amostra.

Qui-quadrado (χ²)

O teste qui-quadrado é uma medida de associação estatística utilizada


para determinar se existe uma associação significativa entre duas variáveis
categóricas. Ele compara as frequências observadas com as frequências
esperadas para determinar se há uma associação estatisticamente significativa.
Por exemplo, podemos usar o teste qui-quadrado para avaliar se há uma
associação entre o nível educacional (ensino fundamental, ensino médio, ensino
superior) e a preferência de esportes (futebol, basquete, tênis) em uma amostra.

Coeficiente de correlação de Cramér (V)

O coeficiente de correlação de Cramér é uma medida de associação


que varia de 0 a 1, onde 0 indica ausência de associação e 1 indica associação
perfeita. É utilizado para medir a força da associação entre duas variáveis
categóricas. Por exemplo, podemos calcular o coeficiente de correlação de
Cramér para determinar a associação entre a escolha de transporte (carro,
ônibus, bicicleta) e a distância da residência ao trabalho (curta, média, longa) em
uma amostra.

Odds Ratio: O Odds Ratio (OR)

é uma medida de associação utilizada em estudos de caso-controle


para determinar a relação entre uma variável binária dependente e uma variável
binária independente. O OR representa a chance de ocorrência de um evento
em um grupo em relação a outro grupo. Por exemplo, em um estudo sobre
tabagismo e câncer de pulmão, podemos calcular o OR para avaliar a
associação entre o hábito de fumar (sim ou não) e o desenvolvimento de câncer
de pulmão (presente ou ausente).

1.2. Variáveis quantitativas

usamos a representação numérica. Elas podem ser classificadas em


discretas e contínuas. As variáveis quantitativas discretas acontecem
relacionadas a situações limitadas, por exemplo: número de revistas vendidas,
quantidade de consultas médicas, número de filhos de um casal. No caso
das variáveis quantitativas contínuas, a abrangência pertence a um intervalo que
se caracteriza por infinitos valores, como exemplo podemos citar: o peso de um
produto, altura dos alunos de uma escola, velocidade de objetos, entre outras
situações.

Coeficiente de correlação de Pearson:


É uma medida paramétrica que avalia a relação linear entre duas
variáveis quantitativas. Varia de -1 a 1, onde -1 indica uma correlação negativa
perfeita, 1 indica uma correlação positiva perfeita e 0 indica ausência de
correlação. Por exemplo, podemos calcular o coeficiente de correlação de
Pearson para determinar a relação entre a idade de uma pessoa e sua renda
anual.

Coeficiente de correlação de Spearman:

É uma medida não paramétrica de associação que avalia a relação


monotônica entre duas variáveis quantitativas. Também varia de -1 a 1, seguindo
a mesma interpretação do coeficiente de Pearson. É utilizado quando não se
pode assumir uma relação linear entre as variáveis ou quando há presença de
outliers. Por exemplo, podemos calcular o coeficiente de correlação de
Spearman para determinar a relação entre a classificação de desempenho de
estudantes e seus níveis de ansiedade.

Coeficiente de determinação (R²):

É uma medida que indica a proporção da variabilidade da variável


dependente que pode ser explicada pela variável independente em um modelo
de regressão. Varia de 0 a 1, onde 0 indica que a variável independente não
explica a variabilidade da variável dependente e 1 indica uma explicação perfeita.
Por exemplo, em um modelo de regressão linear simples, o R² informa a
proporção da variabilidade da variável dependente (por exemplo, vendas) que é
explicada pela variável independente (por exemplo, preço do produto).

Coeficiente de correlação de Kendall:

É uma medida não paramétrica que avalia a relação ordinal entre duas
variáveis quantitativas. Varia de -1 a 1, com a interpretação semelhante ao
coeficiente de Pearson. É utilizado quando as variáveis não podem ser
assumidas como distribuídas normalmente ou quando a relação não é linear. Por
exemplo, pode-se calcular o coeficiente de correlação de Kendall para avaliar a
relação entre a ordem de classificação dos candidatos em um exame e o tempo
de conclusão.
2. EXEMPLO NO R STUDIO VARIAVEIS QUALITATIVAS

1. Neste exemplo, temos um dataframe chamado "dados" com duas


variáveis qualitativas: "preferencia_filme" e "preferencia_musica".
Assumimos que coletamos informações sobre as preferências de filme e
música de algumas pessoas.
2. Para calcular o coeficiente de contingência, primeiro criamos uma
tabela de contingência usando a função table() para contar as frequências de
cada combinação de categorias. Em seguida, aplicamos o teste qui-quadrado
usando chisq.test() para obter a estatística do qui-quadrado. Em seguida,
usamos a fórmula para calcular o coeficiente de contingência e armazenamos
o resultado na variável coef_contingencia.
3. Para calcular o teste qui-quadrado, usamos novamente a função
chisq.test() diretamente na tabela de contingência. A estatística do qui-
quadrado é armazenada na variável chi_square.
4. Para calcular o coeficiente de correlação de Cramér, usamos a
fórmula que envolve a estatística do qui-quadrado, o tamanho da amostra e
o número de categorias. Armazenamos o resultado na variável coef_cramer.
5. Por fim, usamos a função print() para imprimir os resultados na tela.
3. EXEMPLO NO R STUDIO VARIAVEIS QUANTITATIVAS

Neste exemplo, temos um dataframe chamado "dados" com duas variáveis


quantitativas: "idade" e "renda". Usamos a função cor() para calcular o
coeficiente de correlação de Pearson entre essas duas variáveis. O argumento
method = "pearson" é usado para especificar o coeficiente de Pearson. O
resultado é armazenado na variável coef_pearson e, em seguida, impresso na
tela.

You might also like