You are on page 1of 6

EST AV PSI Extensões do modelo de Regressão Linear DMat 2022

1 Regressão Linear com variáveis qualitativas

Os modelos de regressão linear podem incluir variáveis independentes qualitativas (nominais

ou ordinais) recorrendo a variáveis auxiliares booleanas, também designadas por variáveis

dummy.

Para incluir no modelo uma variável com k classes, é necessário definir k−1 variáveis dummy.

Por exemplo, considerando os dados iris, para incluir a variável Species num modelo de

regressão linear, basta definir duas variáveis auxiliares. De facto, se x1 toma o valor 1 quando

o lı́rio é virginica e 0 nos restantes casos e se x2 toma o valor 1 quando o lı́rio é versicolor

e 0 nos restantes casos, tem-se a seguinte interpretação dos valores de (x1 , x2 ):

• (1, 0) – espécie virginica

• (0, 1) – espécie versicolor

• (0, 0) – espécie setosa

Notas importantes

Os modelos de regressão são Modelos Lineares Gerais, pelo que se podem usar proced-

imentos GLM para regressões lineares.

No SPSS as opções disponı́veis para os procedimentos GLM e Regression não são todas

iguais.

O procedimento GLM tem opções que Regression não tem:

1. Não é necessário codificar as variáveis categóricas – o procedimento GLM faz a codi-

ficação internamente.

2. É possı́vel adicionar interações sem necessidade de de definir e incluir os dados das

interações no ficheiro de dados.

DMat 2022 1 cecilia castro


EST AV PSI Extensões do modelo de Regressão Linear

O procedimento Regression tem diversas opções que GLM não tem, como, por exemplo:

1. Devolve os coeficientes de regressão estandardizados.

(a) Os coeficientes de regressão estandardizados associados aos preditores quantita-

tivos são estatı́sticas padronizadas do tamanho do efeito. Permitem comparar os

efeitos relativos de preditores medidos em diferentes escalas. Quanto maior for o

seu valor, em módulo, mais importante é o preditor.

(b) Os coeficientes de correlação estandardizados não fazem sentido para variáveis

dummy apesar do SPSS os devolver.

2. Permite regressão sequencial ou hierárquica.

3. Faz o diagnóstico de colinearidade.

Quando se está a fazer um estudo exploratório, este procedimento as vantagens deste pro-

cedimento devem ser consideradas.

Além disso, o procedimento Analize > Regression > Linear

Devolve 3 tipos de coeficientes de correlação (apenas devem ser considerados os val-

ores correspondentes a preditores quantitativos, apesar de serem devolvidos também

correlações com as variáveis dummy):

(a) zero-order correlation: correlação de Pearson entre a resposta e cada um dos

preditores.

(b) partial correlation: correlação entre cada variável independente e a variável de-

pendente, depois de controlada a influencia das outras variáveis, quer na variável

independente, quer na variável dependente.

(c) part correlation: correlação entre cada variável independente e a variável depen-

dente, depois de controlada a influencia das outras variáveis na variável indepen-

dente. Com este indicador é possı́vel contabilizar a percentagem de variabilidade

DMat 2022 2 cecilia castro


EST AV PSI Extensões do modelo de Regressão Linear DMat 2022

da variável independente que explica a variabilidade da variável dependente. Esta

medida por ser usada para medir o efeito da variável independente na resposta,

tal como os coeficientes de correlação estandardizados. É usual categorizar o

tamanho do efeito do preditor na resposta em função do valor de part correlation:

i. se o valor é <= 0.1, o efeito é baixo;

ii. se o valor está entre 0.1 e 0.35, o efeito é moderado.

iii. valores superiores a 0.35 correspondem a efeito elevado.

2 Médias Marginais

Num modelo linear com preditores categóricos, faz sentido reportar as médias marginais

da variável resposta em cada nı́vel do fator. De facto, esta média é ajustada para as

outras variáveis no modelo. São médias calculadas tendo como base o modelo linear.

As médias marginais correspondem às médias das previsões em cada uma das células

(obtidas pelo cruzamento dos valores de referência das variáveis independentes).

(a) Se o modelo apenas tem um preditor categórico, as médias marginais da resposta

coincidem com a média da resposta em cada um dos nı́veis do fator.

(b) Se o modelo também inclui preditores quantitativos, covariáveis, as médias marginais

estimadas são ajustadas para a covariável, pelo que diferem das médias obser-

vadas. A média marginal é a média da resposta Y em cada nı́vel do preditor

qualitativo num valor especı́fico da covariável.

Na maior parte dos casos, esse valor especı́fico é a média da covariável. Portanto

a interpretação da média marginal é a média das observações em cada nı́vel do

fator, na média da covariável correspondente.

Exercı́cio: Dados iris

DMat 2022 3 cecilia castro


EST AV PSI Extensões do modelo de Regressão Linear

1. Ajuste um modelo linear de Petal.Lenght em função de Species.

(a) Efetue o ajustamento usando três maneiras diferentes no SPSS.

(b) Interprete os coeficientes do modelo ajustado.

(c) Indique os valores das médias marginais de Petal.Lenght.

(d) Verifique se as condições de aplicabilidade do modelo são verificadas.

(e) Proceda à análise dos testes de comparação múltipla.

2. Ajuste um modelo de regressão linear de Petal.Lenght em função de Sepal.Length

e Petal.Width, usando as variáveis independentes quantitativas centradas.

(a) Interprete os coeficientes do modelo ajustado.

(b) Verifique se as condições de aplicabilidade do modelo são verificadas.

(c) Use o procedimento Analyze > General Linear Model e compare os resultados

obtidos.

3. Ajuste um modelo de regressão linear de Petal.Lenght em função de Sepal.Length,

Petal.Width e Species, com as variáveis independentes quantitativas centradas.

(a) Proceda à leitura das estimativas dos parâmetros do modelo.

(b) Indique os valores das médias marginais de Petal.Lenght em cada uma das

espécies de lı́rios. Note que as médias marginais são diferentes das médias ob-

servadas de Petal.Lenght em cada uma das espécies de lı́rios. Porquê?

(c) Use o procedimento Analyze > General Linear Model e compare os resultados

obtidos.

DMat 2022 4 cecilia castro


EST AV PSI Extensões do modelo de Regressão Linear DMat 2022

3 Moderação

Num modelo de regressão, além dos efeitos diretos (ou principais) que cada preditor tem na

resposta, é importante estudar também a possı́vel influência que cada preditor pode exercer

na resposta, dependendo dos valores de outro preditor. Esse efeito combinado de duas

variáveis numa outra variável é designado efeito de moderação, sendo o termo estatı́stico

usual efeito de interação.

Diz-se que existe moderação se a magnitude e/ou o sentido da relação entre duas variáveis,

X e Y , depende de uma terceira variável, designada por moderador M . Este moderador M

interage com a variável independente X para predizer (ou explicar) a variável dependente

Y . A moderação é testada usando um modelo linear em que onde a resposta é modelada

a partir de um preditor, do moderador e da interação entre preditor e moderador. Assim,

o modelo de moderação inclui quer os efeitos diretos, quer os efeitos de interação entre as

variáveis independentes. Se no modelo o preditor X1 e o moderador X2 são quantitativos,

tem-se:

Yj = β0 + β1 X1j + β2 X2j + β3 X1j X2j + ϵj

No ajuste deste modelo, devem usar-se as variáveis independentes centradas de forma a

eliminar a multicolinearidade não essencial entre os efeitos diretos e o efeito de interação. Se

o coeficiente β3 for estatı́sticamente significativo, pode-se concluir que o efeito de X1 sobre Y

é moderado por X2 (ou vice-versa), ou seja, existe interação entre as variáveis independentes.

Neste caso, não se interpretam os coeficientes associados aos efeitos diretos.

Exercı́cio: Dados iris

1. Verifique que Sepal.Lenght produz efeito significativo em Sepal.Width. Interprete o

valor do coeficiente de regressão.

2. Considere agora um modelo para Sepal.Width com preditores Sepal.Lenght, Petal.Width

DMat 2022 5 cecilia castro


EST AV PSI Extensões do modelo de Regressão Linear

e interação entre Sepal.Lenght e Petal.Width (use variáveis centradas). Pode-se afir-

mar que Petal.Width é moderador na relação entre Sepal.Width e Sepal.Lenght?

3. Verifique que Sepal.Lenght e Species produzem efeito significativo em Sepal.Width.

Pode-se afirmar que Species é moderador na relação entre Sepal.Width e Sepal.Lenght?

Elabore um gráfico elucidativo.

Exercı́cio: Dados musclePercentMales

4. Verifique que a idade, age, e o exercı́cio fı́sico semanal, thours, produzem efeito signi-

ficativo na percentagem de massa muscular dos homens, mperc. Proceda à leitura dos

coeficientes de regressão.

5. Pode-se afirmar que age é moderador na relação entre thours e mperc? Justifique

completamente. Organize a idade em classes adequadas e elabore um gráfico elucida-

tivo.

DMat 2022 6 cecilia castro

You might also like