You are on page 1of 44

IBM SPSS Regression 24

IBM
Comunicado
Antes de usar estas informaes e o produto suportado por elas, leia as informaes nos Avisos na pgina 33.

Informaes sobre o produto


Esta edio aplica-se verso 24, liberao 0, modificao 0 do IBM SPSS Statistics e a todas as liberaes e
modificaes subsequentes at que seja indicado de outra forma em novas edies.
ndice
Captulo 1. Escolhendo um Modelos comuns de regresso no linear . . . . 21
Procedimento para Regresso Logstica Funo de perda de regresso no linear . . . . 21
Restries paramtrica de regresso no linear. . . 22
Binria . . . . . . . . . . . . . . . 1
Regresso no linear - Salvar novas variveis . . . 22
Opes de regresso no linear . . . . . . . . 22
Captulo 2. Regresso logstica. . . . . 3 Interpretando resultados de regresso no linear . . 23
Regra do conjunto de regresso logstica . . . . . 4 Recursos adicionais do comando NLR . . . . . 23
Mtodos de seleo de variveis de regresso
logstica . . . . . . . . . . . . . . . . 4 Captulo 6. Estimao Ponderada . . . 25
Definir variveis categricas de regresso logstica . . 5
Opes de estimao ponderada . . . . . . . 26
Regresso logstica - Salvar novas variveis . . . . 5
Recursos adicionais do comando WLS . . . . . 26
Opes de regresso logstica . . . . . . . . . 6
Recursos adicionais do comando LOGISTIC
REGRESSION . . . . . . . . . . . . . . 7 Captulo 7. Regresso por quadrados
mnimos de dois estgios . . . . . . 27
Captulo 3. Regresso logstica Opes de regresso de quadrados mnimos de dois
estgios. . . . . . . . . . . . . . . . 28
multinomial . . . . . . . . . . . . . 9
Recursos adicionais do comando 2SLS . . . . . 28
Regresso logstica multinomial . . . . . . . . 9
Criar termos . . . . . . . . . . . . . 10
Categoria de referncia de regresso logstica Captulo 8. Esquemas de codificao
multinomial . . . . . . . . . . . . . . 10 de varivel categrica . . . . . . . . 29
Estatsticas de regresso logstica multinomial . . . 11 Desvio . . . . . . . . . . . . . . . . 29
Critrios de Regresso logstica multinomial . . . 11 Simples. . . . . . . . . . . . . . . . 29
Opes de regresso logstica multinomial . . . . 12 Helmert . . . . . . . . . . . . . . . 30
Regresso logstica multinomial - Salvar . . . . . 12 Diferena . . . . . . . . . . . . . . . 30
Recursos adicionais do comando NOMREG . . . 13 Polinomial. . . . . . . . . . . . . . . 30
Repetido . . . . . . . . . . . . . . . 31
Captulo 4. Anlise de probitos . . . . 15 Especial . . . . . . . . . . . . . . . 31
Definir intervalo de Anlise de probito . . . . . 16 Indicador . . . . . . . . . . . . . . . 32
Opes de anlise de probit . . . . . . . . . 16
Recursos adicionais do comando PROBIT . . . . 17 Avisos . . . . . . . . . . . . . . . 33
Marcas comerciais . . . . . . . . . . . . 35
Captulo 5. Regresso no linear . . . 19
Lgica condicional (Regresso no linear) . . . . 20 ndice Remissivo . . . . . . . . . . 37
Parmetros de regresso no linear . . . . . . 20

iii
iv IBM SPSS Regression 24
Captulo 1. Escolhendo um Procedimento para Regresso
Logstica Binria
Os modelos de regresso logstica binrios podem ser ajustados usando o procedimento Regresso
logstica e o procedimento Regresso logstica multinomial. Cada procedimento possui opes no
disponveis nos outros. Uma distino terica importante que o procedimento Regresso logstica
produz todas as predies, resduos, estatsticas de influncia e testes de qualidade do ajuste usando
dados no nvel de caso individual, independentemente de como os dados so inseridos e se o nmero de
padres de covarivel ou no menor que o nmero total de casos, enquanto o procedimento Regresso
logstica multinomial agrega casos internamente para formar subpopulaes com padres de covarivel
idnticos para os preditores, produzindo predies, resduos e testes de qualidade do ajuste com base
nessas subpopulaes. Se todos os preditores forem categricos ou os preditores contnuos usarem
somente um nmero limitado de valores para que haja vrios casos em cada padro de covarivel
distinto a abordagem da subpopulao pode produzir testes de qualidade do ajuste vlidos e resduos
informativos, enquanto a abordagem de nvel de caso individual no pode.

A Regresso logstica fornece os seguintes recursos exclusivos:


v Teste de qualidade do ajuste de Hosmer-Lemeshow para o modelo
v Anlises stepwise
v Contrastes para definir a parametrizao de modelo
v Pontos de corte alternativos para classificao
v Grficos de classificao
v Modelo ajustado em um conjunto de casos para um conjunto de casos eficaz
v Salva predies, resduos e estatsticas de influncia

A Regresso logstica multinomial fornece os seguintes recursos exclusivos:


v Testes qui-quadrado de Pearson e deviance para qualidade do ajuste do modelo
v Especificao de subpopulaes para agrupamento de dados para testes de qualidade do ajuste
v Listagem de contagens, contagens preditas e resduos por subpopulaes
v Correo de estimativas de varincia para sobredisperso
v Matriz de covarincias das estimativas paramtrica
v Testes de combinaes lineares paramtricas
v Especificao explcita de modelos aninhados
v Ajustar modelos de regresso logstica condicionais correspondentes a 1-1 usando variveis
diferenciadas

Nota: Dois desses procedimentos ajustam um modelo para dados binrios que um modelo linear
generalizado com uma distribuio binomial e funo de ligao logit. Se uma funo de ligao diferente
for mais apropriada para seus dados, voc dever usar o procedimento Modelos lineares generalizados.

Nota: Se voc tiver medidas repetidas de dados binrios ou registros que, de outra forma, so
correlacionados, dever considerar os procedimentos de Modelos Lineares Generalizados Mistos ou de
Equaes de Estimativa Generalizada.

Copyright IBM Corporation 1989, 2016 1


2 IBM SPSS Regression 24
Captulo 2. Regresso logstica
A regresso logstica til para situaes nas quais voc deseja poder prever a presena ou ausncia de
uma caracterstica ou resultado com base em valores de um conjunto de variveis preditoras.
semelhante a um modelo de regresso linear, mas adequado para modelos em que a varivel
dependente dicotmica. Os coeficientes de regresso logstica podem ser usados para estimar razes de
chances para cada uma das variveis independentes no modelo. A regresso logstica aplicvel a um
intervalo mais amplo de situaes de pesquisa do que de anlise discriminante.

Exemplo. Quais caractersticas de estilo de vida so fatores de risco para doena coronariana (CHD)? Em
uma amostra de pacientes em que foram registrados o status de fumante, dieta, exerccios, uso de bebidas
alcolicas e status de CHD, foi possvel construir um modelo usando as quatro variveis de estilo de vida
para prever a presena ou ausncia de CHD em uma amostra de pacientes. O modelo pode ento ser
usado para derivar estimativas das razes de chances para cada fator para informar, por exemplo, quanto
mais probabilidades tm os fumantes de desenvolver CHD do que os no fumantes.

Estatsticas. Para cada anlise: total de casos, casos selecionados, casos vlidos. Para cada varivel
categrica: codificao paramtrica. Para cada passo: variveis inseridas ou removidas, histrico de
iterao, 2 log da verossimilhana, qualidade do ajuste, estatsticas de qualidade de ajuste de
Hosmer-Lemeshow, qui-quadrado de modelo, qui-quadrado de melhoria, tabela de classificao,
correlaes entre variveis, grfico de grupos observados e de probabilidades preditas, qui-quadrado de
resduo. Para cada varivel na equao: coeficiente (B), erro padro de B, estatstica de Wald, razo de
chances estimada (exp(B)), intervalo de confiana para exp(B), log da verossimilhana se o termo tiver
sido removido do modelo. Para cada varivel no na equao: estatstica de escore. Para cada caso: grupo
observado, probabilidade predita, grupo predito, resduo, resduo padronizado.

Mtodos. possvel estimar modelos usando entrada de bloco de variveis ou qualquer um dos
seguintes mtodos stepwise: forward condicional, forward LR, forward Wald, backward condicional,
backward LR ou backward Wald.

Consideraes de dados de regresso logstica

Dados. A varivel dependente deve ser dicotmica. As variveis independentes podem ser de nvel de
intervalo ou categricas; se categricas, elas devem ser simulado ou codificadas por indicador (h uma
opo no procedimento para recodificar variveis categricas automaticamente).

Suposies. A regresso logstica no depende de suposies distributivas da mesma forma que a anlise
discriminante depende. No entanto, sua soluo pode ser mais estvel se seus preditores tiverem uma
distribuio normal multivariada. Alm disso, assim como com outras formas de regresso, a
multicolinearidade entre os preditores pode conduzir a estimativas parciais e a erros padro
desserializados. O procedimento mais eficiente quando a associao ao grupo de fato uma varivel
categrica; se a associao ao grupo for baseada em valores de uma varivel contnua (por exemplo, "QI
alto" versus "QI baixo"), deve-se considerar o uso de regresso linear para tirar vantagem das informaes
mais importantes oferecidas pela prpria varivel contnua.

Procedimentos relacionados. Use o procedimento Grfico de disperso para triar seus dados para
multicolinearidade. Se as suposies de normalidade multivariada e de matrizes de varincia-covarincia
iguais forem atendidas, ser possvel obter uma soluo mais rpida usando o procedimento Anlise
discriminante. Se todas as suas variveis preditoras forem categricas, tambm ser possvel usar o
procedimento Log linear. Se sua varivel dependente for contnua, use o procedimento Regresso linear.
possvel usar o procedimento Curva ROC para probabilidades de grfico salvas com o procedimento
Regresso logstica.

3
Obtendo uma anlise de regresso logstica
1. Nos menus, escolha:
Analisar > Regresso > Logstica binria...
2. Selecione uma varivel dependente dicotmica. Essa varivel pode ser numrica ou de sequncia de
caracteres.
3. Selecione uma ou mais covariveis. Para incluir termos de interao, selecione todas as variveis
envolvidas na interao e, em seguida, selecione >a*b>.

Para inserir variveis em grupos (blocos), selecione as covariveis para um bloco e clique em Avanar
para especificar um novo bloco. Repita at que todos os blocos tenham sido especificados.

Opcionalmente, possvel selecionar casos para anlise. Escolha uma varivel de seleo e clique em
Regra.

Regra do conjunto de regresso logstica


Os casos definidos pela regra de seleo so includos na estimao do modelo. Por exemplo, se voc
selecionou uma varivel e igual e especificou um valor 5, somente os casos para os quais a varivel
selecionada tem um valor igual a 5 sero includos na estimativa do modelo.

As estatsticas e resultados de classificao so gerados para casos selecionados e no selecionados. Isso


fornece um mecanismo para classificar novos casos com base nos dados existentes anteriormente, ou para
particionar seus dados em subconjuntos de treinamento e teste, para executar a validao no modelo
gerado.

Mtodos de seleo de variveis de regresso logstica


A seleo de mtodo permite especificar como as variveis independentes so inseridas na anlise.
Usando mtodos diferentes, possvel construir uma variedade de modelos de regresso a partir do
mesmo conjunto de variveis.
v Inserir. Um procedimento para seleo de variveis em que todas as variveis em um bloco so
inseridas em um nico passo.
v Seleo Forward (Condicional). Mtodo de seleo stepwise com o teste de entrada com base na
significncia da estatstica de escore e com o teste de remoo com base na probabilidade de uma
estatstica de razo de verossimilhana com base nas estimativas paramtrica condicional.
v Seleo Forward (Razo de Verossimilhana). Mtodo de seleo stepwise com o teste de entrada com base
na significncia da estatstica de escore e com o teste de remoo com base na probabilidade de uma
estatstica de razo de verossimilhana baseado nas estimativas de probabilidade parcial mximas.
v Seleo Forward (Wald). Mtodo de seleo stepwise com o teste de entrada com base na significncia
da estatstica de escore e com o teste de remoo com base na probabilidade da estatstica Wald.
v Eliminao Backward (Condicional). Seleo stepwise backward. O teste de remoo baseado na
probabilidade da estatstica de razo de verossimilhana com base nas estimativas paramtrica
condicionais.
v Eliminao Backward (Razo de Verossimilhana). Seleo stepwise backward. O teste de remoo
baseado na probabilidade da estatstica de razo de verossimilhana com base nas estimativas de
probabilidade parcial mxima.
v Eliminao Backward (Wald). Seleo stepwise backward. O teste de remoo baseado na
probabilidade da estatstica Wald.

Os valores de significncia em sua sada so baseados no ajuste de um nico modelo. Portanto, os valores
de significncia geralmente so invlidos quando usado um mtodo stepwise.

4 IBM SPSS Regression 24


Todas as variveis independentes selecionadas so includas em um nico modelo de regresso. No
entanto, possvel especificar diferentes mtodos de entrada para diferentes subconjuntos de variveis.
Por exemplo, possvel inserir um bloco de variveis no modelo de regresso usando a seleo stepwise
e um segundo bloco usando a seleo forward. Para incluir um segundo bloco de variveis no modelo de
regresso, clique em Avanar.

Definir variveis categricas de regresso logstica


possvel especificar detalhes de como o procedimento Regresso logstica tratar variveis categricas:

Covariveis. Contm uma lista de todas as covariveis especificadas na caixa de dilogo principal, por si
mesmas ou como parte de uma interao, em qualquer estrato. Se algumas dessas forem variveis de
sequncia de caracteres ou forem categricas, ser possvel us-las somente como covariveis categricas.

Covariveis categricas. Lista variveis identificadas como categricas. Cada varivel inclui uma notao
entre parnteses indicando a codificao de contraste a ser usada. As variveis de sequncia de caracteres
(denotadas pelo smbolo < aps seus nomes) j esto presentes na lista Covariveis categricas. Selecione
quaisquer outras covariveis categricas da lista Covariveis e mova-as para a lista Covariveis
categricas.

Mudar contraste. Permite mudar o mtodo de contraste. Os mtodos de contraste disponveis so:
v Indicador. Os contrastes indicam a presena ou a ausncia de associao de categoria. A categoria de
referncia representada na matriz de contraste como uma linha de zeros.
v Simples. Cada categoria da varivel preditora (exceto a categoria de referncia) comparada com a
categoria de referncia.
v Diferena. Cada categoria da varivel preditora, exceto a primeira categoria, comparada com o efeito
mdio de categorias anteriores. Tambm conhecido como contrastes de Helmert reversos.
v Helmert. Cada categoria da varivel preditora, exceto a ltima categoria, comparada com o efeito
mdio de categorias subsequentes.
v Repetido. Cada categoria da varivel preditora (exceto a ltima categoria) comparada com a prxima
categoria.
v Polinomial. Contrastes polinomiais ortogonais. As categorias so consideradas igualmente espaadas.
Os contrastes polinomiais esto disponveis apenas para variveis numricas.
v Desvio. Cada categoria da varivel preditora, exceto a categoria de referncia, comparada com o
efeito geral.

Se voc selecionar Desvio, Simples ou Indicador, selecione Primeiro ou ltimo como a categoria de
referncia. Observe que o mtodo no ser realmente mudado at voc clicar em Mudar.

As covariveis de sequncia de caracteres devem ser covariveis categricas. Para remover uma varivel
de sequncia de caracteres da lista Covariveis categricas, deve-se remover todos os termos contendo a
varivel da lista Covariveis na caixa de dilogo principal.

Regresso logstica - Salvar novas variveis


possvel salvar resultados da regresso logstica como novas variveis no conjunto de dados ativo:

Valores Preditos. Salva valores preditos pelo modelo. As opes disponveis so Probabilidades e
Associao ao grupo.
v Probabilidades. Para cada caso, salva a probabilidade predita da ocorrncia do evento. Uma tabela na
sada exibe o nome e o contedo de quaisquer novas variveis. O "evento" a categoria da varivel
dependente com o valor mais alto; por exemplo, se a varivel dependente usar os valores 0 e 1, a
probabilidade predita da categoria 1 ser salva.

Captulo 2. Regresso logstica 5


v Associao ao Grupo Predito. O grupo com a maior probabilidade posterior, com base nos escores
discriminantes. O grupo ao qual o modelo que prediz o caso pertence.

Influncia. Salva valores de estatsticas que medem a influncia de casos em valores preditos. As opes
disponveis so valores de Cook, de ponto de alavanca e DfBeta(s).
v de Cook. O analgico da regresso logstica da estatstica de influncia de Cook. Uma medida do
quanto os resduos de todos os casos seriam alterados se um caso especfico fosse excludo do clculo
dos coeficientes de regresso.
v Valor de Ponto de Alavanca. A influncia relativa de cada observao no ajuste do modelo.
v DfBeta(s). A diferena no valor beta a mudana no coeficiente de regresso resultante da excluso de
um caso especfico. Um valor calculado para cada termo no modelo, incluindo a constante.

Residuais. Salva resduos. As opes disponveis so No padronizado, Logit, Estudentizado,


Padronizado e Deviance.
v Resduos No Padronizados. A diferena entre um valor observado e o valor predito pelo modelo
v Logit Residual. O resduo para o caso se ele for predito na escala logit. O logit de resduo o resduo
dividido pela probabilidade predita vezes 1 menos a probabilidade predita.
v Resduo Estudentizado. A mudana no desvio do modelo, se um caso for excludo.
v Resduos Padronizados. O resduo dividido por uma estimativa do seu desvio padro. Resduos
padronizados, tambm conhecidos como resduos de Pearson, possuem uma mdia de 0 e um desvio
padro de 1.
v Deviance. Resduos com base no deviance do modelo.

Exportar informaes de modelo para arquivo XML. As estimativas paramtrica e (opcionalmente) suas
covarincias so exportadas para o arquivo especificado em formato XML (PMML). possvel usar esse
arquivo de modelo para aplicar as informaes de modelo a outros arquivos de dados para propsitos de
escoragem.

Opes de regresso logstica


possvel especificar opes para sua anlise de regresso logstica:

Estatsticas e grficos. Permite solicitar estatsticas e grficos. As opes disponveis so grficos de


Classificao, qualidade do ajuste de Hosmer-Lemeshow, listagem de resduos Casewise, Correlaes de
estimativas, Histrico de iterao e IC para exp(B). Selecione uma das alternativas no grupo Exibio para
exibir estatsticas e grficos Em cada passo ou somente para o modelo final, No ltimo passo.
v Estatsticas de qualidade de ajuste de Hosmer-Lemeshow. Essa estatstica de qualidade do ajuste mais
robusta que a estatstica de qualidade do ajuste tradicional usada em regresso logstica, especialmente
para modelos com covariveis e estudos contnuos com tamanhos pequenos de amostras. Baseia-se
casos de agrupamento em decis de risco e compara a probabilidade observada com a probabilidade
esperada em cada decil.

Probabilidade para stepwise. Permite controlar os critrios pelos quais as variveis so inseridas e
removidas da equao. possvel especificar critrios para entrada ou remoo de variveis.
v Probabilidade para Stepwise. Uma varivel ser inserida no modelo se a probabilidade de sua estatstica
de escore for menor que o valor de Entrada e ser removida se a probabilidade for maior que o valor
de Remoo. Para substituir as configuraes padro, insira valores positivos para Entrada e Remoo.
Entrada deve ser menor que Remoo.

Corte de Classificao. Permite determinar o ponto de corte para classificao de casos. Os casos com
valores preditos que excederem o corte de classificao so classificados como positivos, ao passo que
aqueles com valores preditos menores que o corte so classificados como negativos. Para alterar o padro,
insira um valor entre 0,01 e 0,99.

6 IBM SPSS Regression 24


Mximo de Iteraes. Permite mudar p nmero mximo de vezes que o modelo itera antes de finalizar.

Incluir constante no modelo. Permite indica se o modelo deve incluir um termo constante. Se desativado,
o termo constante ser igual a 0.

Recursos adicionais do comando LOGISTIC REGRESSION


O idioma da sintaxe de comando tambm permite:
v Identificar sada casewise pelos valores ou rtulos de variveis de uma varivel.
v Controlar o espaamento de relatrios de iterao. Em vez de imprimir estimativas paramtrica aps
cada iterao, possvel solicitar estimativas paramtrica aps cada ensima iterao.
v Mudar os critrios para finalizar a iterao e verificar a redundncia.
v Especificar uma lista de variveis para listagens casewise.
v Conservar a memria mantendo os dados para cada grupo de arquivos divididos em um arquivo
temporrio externo durante o processamento.

Consulte a Referncia da sintaxe de comando para obter informaes de sintaxe completa.

Captulo 2. Regresso logstica 7


8 IBM SPSS Regression 24
Captulo 3. Regresso logstica multinomial
A Regresso logstica multinomial til para situaes nas quais voc deseja poder classificar assuntos
com base em valores de um conjunto de variveis preditoras. Esse tipo de regresso semelhante
regresso logstica, mas mais geral porque a varivel dependente no est restrita a duas categorias.

Exemplo. Para comercializar filmes de forma mais eficiente, os estdios de cinema querem prever o tipo
de filme que um frequentador de cinema tem probabilidade de assistir. Ao executar uma Regresso
logstica multinomial, o estdio pode determinar a fora de influncia que a idade, o gnero e o estado
civil de uma pessoa tm sobre seu tipo de filme preferido. O estdio ento se concentra na campanha de
publicidade de um determinado filme voltado para um grupo de pessoas que tm probabilidade de
assisti-lo.

Estatsticas. Histrico de iterao, coeficientes paramtrica, covarincia assinttica e matrizes de


correlaes, testes de razo de verossimilhana para modelo e efeitos parciais, 2 log da verossimilhana.
Qualidade do ajuste de qui-quadrado de Pearson e de deviance. Cox e Snell, Nagelkerke e McFadden R 2.
Classificao: frequncias observadas versus preditas por categoria de resposta. Tabulao cruzada:
frequncias observadas e preditas (com resduos) e propores por padro de covarivel e categoria de
resposta.

Mtodos. Um modelo logit multinomial ajustado para o modelo fatorial completo ou um modelo
especificado pelo usurio. A estimao paramtrica executada por meio de um algoritmo de mxima
verossimilhana iterativo.

Consideraes de dados de regresso logstica multinomial

Dados. A varivel dependente deve ser categrica. As variveis independentes podem ser fatores ou
covariveis. Em geral, fatores devem ser variveis categricas e covariveis devem ser variveis
contnuas.

Suposies. considerado que a razo de chances de quaisquer duas categorias independente de todas
as outras categorias de resposta. Por exemplo, se um novo produto introduzido em um mercado, essa
suposio indica que as cotas de mercado de todos os outros produtos so afetas de forma
proporcionalmente igual. Alm disso, dado um padro de covarivel, as respostas so consideradas
variveis multinomiais independentes.

Obtendo um Regresso logstica multinomial


1. Nos menus, escolha:
Analisar > Regresso > Logstica multinomial...
2. Selecione uma varivel dependente.
3. Os fatores so opcionais e podem ser numricos ou categricos.
4. As covariveis so opcionais mas devem ser numricas se especificadas.

Regresso logstica multinomial


Por padro, o procedimento Regresso logstica multinomial produz um modelo com os efeitos principais
de fator e covarivel, mas possvel especificar um modelo customizado ou solicitar a seleo de modelo
stepwise com essa caixa de dilogo.

Especificar modelo. Um modelo dos principais efeitos contm os efeitos principais de covarivel e fator,
mas nenhum efeito de interao. Um modelo fatorial completo contm todos os efeitos principais e todas

Copyright IBM Corporation 1989, 2016 9


as interaes de fator por fator. Ele no contm interaes de covariveis. possvel criar um modelo
customizado para especificar subconjuntos de interaes de fatores ou interaes de covariveis, ou
solicitar a seleo stepwise de termos do modelo.

Fatores & covariveis. Os fatores e covariveis so listados.

Termos de entrada forada. Os termos includos na lista de entrada forada so sempre includos no
modelo.

Termos stepwise. Os termos includos na lista stepwise so includos no modelo, de acordo com um dos
seguintes mtodos stepwise selecionados pelo usurio:
v Entrada forward. Esse mtodo comea sem termos stepwise no modelo. Em cada passo, o termo mais
significativo includo no modelo at que nenhum dos termos stepwise restantes do modelo tenha
uma contribuio estatisticamente significativa, se includo no modelo.
v Eliminao backward. Este mtodo comea inserindo todos os termos especificados na lista stepwise
no modelo. Em cada passo, o termo stepwise menos significativo removido do modelo at que todos
os termos stepwise restantes tenham uma contribuio estatisticamente significativa para o modelo.
v Forward stepwise. Esse mtodo comea com o modelo que seria selecionado pelo mtodo de entrada
forward. De l, o algoritmo alterna entre eliminao backward nos termos stepwise no modelo e
entrada forward nos termos deixados de fora do modelo. Isso continuar at que nenhum termo
atenda aos critrios de entrada ou remoo.
v Stepwise backward. Esse mtodo comea com o modelo que seria selecionado pelo mtodo de
eliminao backward. De l, o algoritmo alterna entre a entrada forward nos termos que ficaram de
fora do modelo e a eliminao backward nos termos stepwise no modelo. Isso continuar at que
nenhum termo atenda aos critrios de entrada ou remoo.

Incluir intercepto no modelo. Permite incluir ou excluir um termo de intercepto para o modelo.

Criar termos
Para os fatores e covariveis selecionados:

Interao. Cria o termo de interao de nvel mais alto de todas as variveis selecionadas.

Efeitos principais. Cria um termo dos principais efeitos para cada varivel selecionada.

Todos de 2 fatores. Cria todas as possveis interaes de dois fatores das variveis selecionadas.

Todos de 3 fatores. Cria todas as possveis interaes de trs fatores das variveis selecionadas.

Todos de 4 fatores. Cria todas as possveis interaes de quatro fatores das variveis selecionadas.

Todos de 5 fatores. Cria todas as possveis interaes de cinco fatores das variveis selecionadas.

Categoria de referncia de regresso logstica multinomial


Por padro, o procedimento Regresso logstica multinomial torna a ltima categoria a categoria de
referncia. Esta caixa de dilogo fornece o controle da categoria de referncia e a forma em que as
categorias so ordenadas.

Categoria de Referncia. Especifique a primeiro, a ltima ou uma categoria customizada.

Ordem de categoria. Em ordem crescente, o valor mais baixo define a primeira categoria e o valor mais
alto define a ltima. Em ordem decrescente, o valor mais alto define a primeira categoria e o valor mais
baixo define a ltima.

10 IBM SPSS Regression 24


Estatsticas de regresso logstica multinomial
possvel especificar as seguintes estatsticas para sua Regresso logstica multinomial:

Sumarizao de processamento de caso. Esta tabela contm informaes sobre as variveis categricas
especificadas.

Modelo. Estatsticas para o modelo global.


v Pseudo R-quadrado. Imprime as estatsticas R 2 de Cox e Snell, Nagelkerke e McFadden.
v Sumarizao de passo. Essa tabela sumariza os efeitos inseridos ou removidos em cada passo em um
mtodo stepwise. Ele no ser produzido, a menos que um modelo stepwise seja especificado na caixa
de dilogo Modelo.
v Informaes de ajuste do modelo. Essa tabela compara os modelos ajustados e somente de interceptos
ou nulos.
v Critrios de informaes. Essa tabela imprime o critrio de informaes de Akaike (AIC) e o critrio
de informaes bayesiano (BIC) de Schwarz.
v Probabilidades de clula. Imprime uma tabela das frequncias observadas e esperadas (com resduos)
e propores por padro de covarivel e categoria de resposta.
v Tabela de classificao. Imprime uma tabela das respostas observadas versus preditas.
v Estatsticas qui-quadrado de qualidade do ajuste. Imprime estatsticas qui-quadrado de Pearson e de
razo de verossimilhana. As estatsticas so calculadas para os padres de covariveis determinados
por todos os fatores e covariveis ou por um subconjunto definido pelo usurio dos fatores e
covariveis.
v Medidas de monotonicidade. Exibe uma tabela com informaes sobre o nmero de pares
concordantes, pares discordantes e pares empatados. O Somers' D, Gama de Goodman e Kruskal, tau-a
de Kendall e o ndice C de Concordncia tambm so exibidos nessa tabela.

Parmetros. Estatsticas relacionadas aos parmetros do modelo.


v Estimativas. Imprime estimativas dos parmetros de modelo, com um nvel de confiana especificado
pelo usurio.
v Teste de razo de verossimilhana. Imprime testes de razo de verossimilhana para os efeitos parciais
do modelo. O teste para o modelo global impresso automaticamente.
v Correlaes assintticas. Imprime a matriz de correlaes de estimativas paramtrica.
v Covarincias assintticas. Imprime a matriz de covarincias de estimativas paramtrica.

Definir subpopulaes. Permite selecionar um subconjunto dos fatores e covariveis para definir os
padres de covarivel usados por probabilidades de clula e os testes de qualidade do ajuste.

Critrios de Regresso logstica multinomial


possvel especificar os seguintes critrios para sua Regresso logstica multinomial:

Iteraes. Permite especificar o nmero mximo de vezes que voc deseja percorrer o algoritmo, o
nmero mximo de passos na diviso do passo pela metade, as tolerncias de convergncia para
mudanas no log da verossimilhana e em parmetros, com que frequncia o progresso do algoritmo
iterativo impresso e em qual iterao o processo deve comear a verificar a separao completa ou
quase completa dos dados.
v Convergncia de log da verossimilhana. A convergncia ser considerada se a mudana absoluta na
funo de log da verossimilhana for menor que o valor especificado. O critrio no ser usado se o
valor for 0. Especifique um valor no negativo.
v Convergncia paramtrica. A convergncia ser considerada se a mudana absoluta nas estimativas
paramtrica for menor que esse valor. O critrio no ser utilizado se o valor for 0.

Captulo 3. Regresso logstica multinomial 11


Delta. Permite especificar um valor no negativo menor que 1. Esse valor includo em cada clula vazia
da tabulao cruzada da categoria de resposta por padro de covarivel. Isso ajuda a estabilizar o
algoritmo e evitar vis nas estimativas.

Tolerncia singularidade. Permite especificar a tolerncia usada na verificao de singularidades.

Opes de regresso logstica multinomial


possvel especificar as seguintes opes para Regresso logstica multinomial:

Escala de disperso. Permite especificar o valor de escala de disperso que ser usado para corrigir a
estimativa da matriz de covarincia paramtrica. Deviance estima o valor de escala usando a estatstica
da funo deviance (qui-quadrado de razo de verossimilhana). Pearson estima o valor de escala usando
a estatstica qui-quadrado de Pearson. Tambm possvel especificar seu prprio valor de escala. Ele
deve ser um valor numrico positivo.

Opes stepwise. Essas opes fornecem controle dos critrios estatsticos quando mtodos stepwise so
usados para construir um modelo. Elas so ignoradas, a menos que um modelo stepwise seja especificado
na caixa de dilogo Modelo.
v Probabilidade de entrada. Essa a probabilidade da estatstica de razo de verossimilhana para a
entrada de varivel. Quando maior a probabilidade especificada, mais fcil ser para uma varivel
entrar no modelo. Esse critrio ser ignorado, a menos que o mtodo de entrada forward, stepwise
forward ou stepwise backward seja selecionado.
v Teste de entrada. Este o mtodo para inserir termos em mtodos stepwise. Escolha entre o teste de
razo de verossimilhana e o teste de escore. Esse critrio ser ignorado, a menos que o mtodo de
entrada forward, stepwise forward ou stepwise backward seja selecionado.
v Probabilidade de remoo. Essa a probabilidade da estatstica da razo de verossimilhana para a
remoo de varivel. Quando maior a probabilidade especificada, mais fcil ser para uma varivel
permanecer no modelo. Esse critrio ser ignorado, a menos que o mtodo de eliminao backward,
stepwise forward ou stepwise backward seja selecionado.
v Teste de remoo. Este o mtodo para remover termos em mtodos stepwise. Escolha entre o teste de
razo de verossimilhana e o teste de Wald. Esse critrio ser ignorado, a menos que o mtodo de
eliminao backward, stepwise forward ou stepwise backward seja selecionado.
v Mnimo de efeitos graduais no modelo. Ao usar os mtodos de eliminao backward ou stepwise
backward, isso especifica o numero mnimo de termos a serem includos no modelo. O intercepto no
contado como um termo modelo.
v Mximo de efeitos graduais no modelo. Ao usar os mtodos de entrada forward ou stepwise forward,
isso especifica o nmero mximo de termos a serem includos no modelo. O intercepto no contado
como um termo modelo.
v Restringir hierarquicamente a entrada e remoo de termos. Essa opo permite escolher se colocar
restries na incluso de termos modelo. A hierarquia requer que, para qualquer termo a ser includo,
todos os termos de ordem inferior que fazem parte do termo a ser includo devem estar no modelo
primeiro. Por exemplo, se o requisito de hierarquia estiver em vigor, os fatores Estado civil e Gnero
devem estar no modelo antes da incluso da interao de Estado civil*Gnero. As trs opes de botes
de opes determinam a funo de covariveis na determinao da hierarquia.

Regresso logstica multinomial - Salvar


A caixa de dilogo Salvar permite salvar variveis no arquivo de trabalho e exportar informaes de
modelo para um arquivo externo.

Variveis salvas. As seguintes variveis podem ser salvas:

12 IBM SPSS Regression 24


v Probabilidades de resposta estimadas. Essas so as probabilidades estimadas de classificao de um
padro de fator/covarivel nas categorias de resposta. Existem tantas probabilidades estimadas quanto
categorias da varivel de resposta; at 25 sero salvas.
v Categoria predita. Essa a categoria de resposta com a maior probabilidade esperada para um padro
de covarivel/fator.
v Probabilidades de categoria predita. Este o mximo das probabilidades de resposta estimadas.
v Probabilidade de categoria real. Essa a probabilidade estimada de classificao de um padro de
covarivel/fator na categoria observada.

Exportar informaes de modelo em arquivo XML. As estimativas paramtrica e (opcionalmente) suas


covarincias so exportadas no arquivo especificado em formato XML (PMML). possvel usar esse
arquivo de modelo para aplicar as informaes de modelo a outros arquivos de dados para propsitos de
escoragem.

Recursos adicionais do comando NOMREG


O idioma da sintaxe de comando tambm permite:
v Especificar a categoria de referncia da varivel dependente.
v Incluir casos com valores omissos de usurio.
v Customizar testes de hiptese especificando hipteses nulas como combinaes lineares paramtricas.

Consulte a Referncia da sintaxe de comando para obter informaes de sintaxe completa.

Captulo 3. Regresso logstica multinomial 13


14 IBM SPSS Regression 24
Captulo 4. Anlise de probitos
Esse procedimento mede o relacionamento entre a intensidade de um estmulo e a proporo de casos
exibindo uma determinada resposta ao estmulo. Ele til para situaes nas quais voc tem uma sada
dicotmica que considerada como influenciada ou causada por nveis de algumas variveis
independentes e bem apropriado principalmente para dados experimentais. Esse procedimento
permitir estima a intensidade de um estmulo necessrio para induzir a uma determinada proporo de
respostas, como a dose efetiva mediana.

Exemplo. Qual a eficincia de um novo pesticida em matar formigas e qual a concentrao apropriada
a ser usada? Voc pode fazer uma experincia na qual expe amostras de formigas a diferentes
concentraes do pesticida e, em seguida, registra o nmero de formigas mortas e o nmero de formigas
expostas. Aplicando a anlise de probit a esses dados, possvel determinar a intensidade do
relacionamento entre a concentrao e a morte, e determinar qual seria a concentrao apropriada de
pesticida se voc quiser ter certeza de que matar, digamos que 95% das formigas expostas.

Estatsticas. Coeficientes de regresso e erros padro, interceptao e erro padro, qui-quadrado da


qualidade do ajuste de Pearson, frequncias observadas e esperadas e intervalos de confiana para nveis
efetivos de variveis independentes. Grficos: Grficos de respostas transformados.

Esse procedimento usa algoritmos propostos e implementados em NPSOL por Gill, Murray, Saunders &
Wright para estimar os parmetros de modelo.

Consideraes de dados da anlise de probit

Dados. Para cada valor da varivel independente (ou cada combinao de valores para diversas variveis
independentes), sua varivel de resposta deve ser uma contagem do nmero de casos com esses valores
que mostram a resposta de interesse, e a varivel observada total deve ser uma contagem do nmero
total de casos com esses valores para a varivel independente. A varivel de fator deve ser categrica,
codificada como nmeros inteiros.

Suposies. As observaes devem ser independentes. Se voc tiver um grande nmero de valores para
as variveis independentes relativas ao nmero de observaes, como possvel em um estudo
observacional, as estatsticas de qui-quadrado e de qualidade de ajuste podem no ser vlidas.

Procedimentos relacionados. A anlise de probit est estritamente relacionada regresso logstica; de


fato, se voc escolher a transformao logit, esse procedimento basicamente calcular uma regresso
logstica. Em geral, a anlise de probit apropriada para experincias projetadas, enquanto a regresso
logstica mais apropriada para estudos observacionais. As diferenas na sada refletem essas diferentes
nfases. O procedimento de anlise de probit relata estimativas de valores efetivos para vrias taxas de
resposta (incluindo a dose efetiva mediana), enquanto o procedimento de regresso logstica relata
estimativas de razes de chances para variveis independentes.

Obtendo uma anlise de probit


1. Nos menus, escolha:
Analisar > Regresso > Probit...
2. Selecione uma varivel de frequncia de resposta. Essa varivel indica o nmero de casos exibindo
uma resposta ao estmulo de teste. Os valores dessa varivel no podem ser negativos.
3. Selecione uma varivel observada total. Essa varivel indica o nmero de casos aos quais o estmulo
foi aplicado. Os valores dessa varivel no podem ser negativos e no podem ser menores que os
valores da varivel de frequncia de resposta para cada caso.

Copyright IBM Corporation 1989, 2016 15


Opcionalmente, possvel selecionar uma varivel de Fator. Se voc selecionar, clique em Definir
intervalo para definir os grupos.
4. Selecione uma ou mais covariveis. Esta varivel contm o nvel do estmulo aplicado a cada
observao. Se desejar transformar a covarivel, selecione uma transformao da lista suspensa
Transformao. Se nenhuma transformao for aplicada e houver um grupo de controle, o grupo de
controle ser includo na anlise.
5. Selecione o modelo Probit ou Logit.
v Modelo Probito. Aplica a transformao probito (o inverso da funo de distribuio normal padro
acumulativa) s propores de resposta.
v Modelo Logit. Aplica-se a transformao logit (chances de log) s propores de resposta.

Definir intervalo de Anlise de probito


Isso permite especificar os nveis da varivel fator que sero analisados. Os nveis do fator devem ser
codificados como nmeros inteiros consecutivos e todos os nveis no intervalo especificado sero
analisados.

Opes de anlise de probit


possvel especificar opes para sua anlise de probit:

Estatsticas. Permite solicitar as seguintes estatsticas opcionais: Frequncias, Potncia mdia relativa,
Teste de paralelismo e Intervalos de confiana fiducirios.
v Potncia Mdia Relativa. Exibe a razo das potncias mdias para cada par de nveis de fator. Alm
disso, mostra os limites de confiana de 95% para cada potncia mdia relativa. As potncias mdias
relativas no estaro disponveis se voc no tiver uma varivel de fator ou se voc tiver mais de uma
covarivel.
v Teste de Paralelismo. Um teste da hiptese de que todos os nveis do fator tm uma inclinao comum.
v Intervalos de Confiana Fiducirios. Intervalos de confiana para a dosagem do agente necessria para
produzir uma certa probabilidade de resposta.

Os intervalos de confiana fiducirios e a Potncia mdia relativa estaro indisponveis se voc tiver
selecionado mais de uma covarivel. A Potncia mdia relativa e o Teste de paralelismo estaro
disponveis apenas se voc tiver selecionado uma varivel de fator.

Taxa de resposta natural. Permite indicar uma taxa de resposta natural mesmo na ausncia do estmulo.
As alternativas disponveis so Nenhum, Calcular a partir de dados ou Valor.
v Calcular a partir dos Dados. Estima a taxa de resposta natural dos dados de amostra. Seus dados devem
conter um caso representando o nvel de controle para o qual o valor de uma ou mais covariveis 0.
O probit estima a taxa de resposta natural usando a proporo de respostas para o nvel de controle
como um valor inicial.
v Valor. Configura a taxa de resposta natural no modelo (selecione este item quando voc souber a taxa
de resposta natural antecipadamente). Insira a proporo de resposta natural (a proporo deve ser
menor que 1). Por exemplo, se a resposta ocorrer 10% do tempo quando o estmulo for 0, digite 0,10.

Critrios. Permite controlar parmetros do algoritmo de estimao paramtrica iterativo. possvel


substituir os padres para Mximo de iteraes, Limite de passos e Tolerncia de otimalidade.

16 IBM SPSS Regression 24


Recursos adicionais do comando PROBIT
O idioma da sintaxe de comando tambm permite:
v Solicitar uma anlise nos modelos probit e logit.
v Controlar o tratamento de valores omissos.
v Transformar as covariveis por bases em vez de base 10 ou logaritmo natural.

Consulte a Referncia da sintaxe de comando para obter informaes de sintaxe completa.

Captulo 4. Anlise de probitos 17


18 IBM SPSS Regression 24
Captulo 5. Regresso no linear
A regresso no linear um mtodo de localizar um modelo no linear do relacionamento entre a
varivel dependente e um conjunto de variveis independentes. Diferentemente da regresso linear
tradicional, que restrita estimativa de modelos lineares, a regresso no linear pode estimar modelos
com relacionamentos arbitrrios entre variveis independentes e dependentes. Isso feito usando
algoritmos de estimao iterativos. Observe que esse procedimento no necessrio para modelos
polinomiais simples do formato Y = A + BX**2. Ao definir W = X**2, obtemos um modelo linear simples,
Y = A + BW, que pode ser estimado usando mtodos tradicionais, como o procedimento Regresso linear.

Exemplo. A populao pode ser prevista com base no tempo? Um grfico de disperso mostra que parece
haver um forte relacionamento entre populao e tempo, mas o relacionamento no linear, portanto, ele
requer os mtodos de estimao especiais do procedimento Regresso no linear. Ao configurar uma
equao apropriada, como um modelo logstico de crescimento de populao, podemos obter uma boa
estimativa do modelo, permitindo fazer predies sobre a populao para os momentos que no foram
realmente medidos.

Estatsticas. Para cada iterao: estimativas paramtrica e soma de quadrados dos resduos. Para cada
modelo: soma de quadrados para regresso, resduos, total no corrigido e total corrigido, estimativas
paramtrica, erros padro assintticos e matriz de correlao assinttica de estimativas paramtrica.

Nota: A regresso no linear restrita usa os algoritmos propostos e implementados em NPSOL por Gill,
Murray, Saunders e Wright para estimar os parmetros de modelo.

Consideraes de dados de regresso no linear

Dados. As variveis dependentes e independentes devem ser quantitativas. Variveis categricas, como
religio, maioridade ou regio de residncia, precisam ser recodificadas para variveis binrias (fictcias)
ou outros tipos de variveis de contraste.

Suposies. Os resultados sero vlidos apenas se voc tiver especificado uma funo que descreve com
exatido o relacionamento entre variveis dependentes e independentes. Alm disso, a escolha de um
bons valores iniciais muito importante. Mesmo que tenha especificado o formato funcional correto do
modelo, se voc usar valores iniciais no adequados, seu modelo poder falhar ao convergir ou possvel
obter uma soluo ideal local em vez de uma ideal global.

Procedimentos relacionados. Muitos modelos que parecem ser no lineares inicialmente podem ser
transformados em um modelo linear, que pode ser analisado usando o procedimento Regresso linear. Se
voc no tiver certeza de como deve ser o modelo apropriado, o procedimento Curva de estimao pode
ajudar a identificar relaes funcionais teis em seus dados.

Obtendo uma anlise de regresso no linear


1. Nos menus, escolha:
Analisar > Regresso > No linear...
2. Selecione uma varivel dependente numrica da lista de variveis em seu conjunto de dados ativo.
3. Para construir uma expresso de modelo, insira a expresso no campo Modelo ou cole componentes
(variveis, parmetros, funes) no campo.
4. Identifique parmetros em seu modelo clicando em Parmetros.

Um modelo segmentado (um que usa diferentes formatos em diferentes partes de seu domnio) deve ser
especificado usando a lgica condicional na instruo de modelo nico.

Copyright IBM Corporation 1989, 2016 19


Lgica condicional (Regresso no linear)
possvel especificar um modelo segmentado usando a lgica condicional. Para usar a lgica condicional
em uma expresso de modelo ou em uma funo de perda, forme a soma de uma srie de termos, um
para cada condio. Cada termo consiste em uma expresso lgica (entre parnteses) multiplicada pela
expresso que deve resultar quando essa expresso lgica for verdadeira.

Por exemplo, considere um modelo segmentado que igual a 0 para X<=0, X para 0<X<1 e 1 para X>=1.
A expresso para isto :

(X<=0)*0 + (X>0 & X<1)*X + (X>=1)*1.

Todas as expresses lgicas entre parnteses so avaliadas como 1 (true) ou 0 (false). Portanto:

Se X<=0, a expresso acima ser reduzida para 1*0 + 0*X + 0*1 = 0.

Se 0<X<1, ela ser reduzida para 0*0 + 1*X + 0*1 = X.

Se X>=1, ela ser reduzida para 0*0 + 0*X + 1*1 = 1.

Exemplos mais complicados podem ser facilmente construdos, substituindo diferentes expresses lgicas
e expresses de resultado. Lembre-se de que desigualdades duplas, como 0<X<1, devem ser escritas como
expresses compostas, como (X>0 & X<1).

As variveis de sequncia de caracteres podem ser usadas em expresses lgicas:

(city='New York')*costliv + (city='Des Moines')*0.59*costliv

Isso gera uma expresso (o valor da varivel costliv) para nova-iorquinos e outro (59% desse valor) para
residentes de Des Moines. As constantes da sequncia devem ser colocadas entre aspas ou apstrofos,
conforme mostrado aqui.

Parmetros de regresso no linear


Parmetros so partes de seu modelo estimadas pelo procedimento Regresso no linear. Os parmetros
podem ser constantes aditivas, coeficientes multiplicativos, expoentes ou valores usados na avaliao de
funes. Todos os parmetros que foram definidos aparecero (com seus valores iniciais) na lista
Parmetros na caixa de dilogo principal.

Nome. Deve-se especificar um nome para cada parmetro. Esse nome deve ser um nome de varivel
vlido e deve ser o nome usado na expresso do modelo na caixa de dilogo principal.

Valor inicial. Permite especificar um valor inicial para o parmetro, preferencialmente o mais prximo
possvel da soluo final esperada. Valores de iniciais simples podem resultar em falha ao convergir ou
na convergncia em uma soluo que local (em vez de global) ou que fisicamente impossvel.

Usar valores iniciais de anlise anterior. Se voc j executou uma regresso no linear nessa caixa de
dilogo, ser possvel selecionar essa opo para obter os valores iniciais paramtricas de seus valores na
execuo anterior. Isso permite continuar a procura quando o algoritmo est convergindo lentamente. (Os
valores iniciais ainda aparecero na lista Parmetros na caixa de dilogo principal.)

Nota: Essa seleo persiste nessa caixa de dilogo durante o resto de sua sesso. Se voc mudar o modelo,
certifique-se de cancelar sua seleo.

20 IBM SPSS Regression 24


Modelos comuns de regresso no linear
A tabela a seguir fornece a sintaxe do modelo de exemplo para muitos modelos de regresso no linear
publicados. Um modelo selecionado aleatoriamente provavelmente no ajustar bem os seus dados. Os
valores iniciais apropriados para os parmetros so necessrios, e alguns modelos requerem restries
para convergir.
Tabela 1. Sintaxe do modelo de exemplo
Nome Expresso do modelo
Regresso assinttica b1 + b2 * exp(b3 * x)
Regresso assinttica b1 (b2 * (b3 ** x))
Densidade (b1 + b2 * x) ** (1 / b3)
Gauss b1 * (1 b3 * exp(b2 * x ** 2))
Gompertz b1 * exp(b2 * exp(b3 * x))
Johnson-Schumacher b1 * exp(b2 / (x + b3))
Modificado por log (b1 + b3 * x) ** b2
Logstica de log b1 ln(1 + b2 * exp(b3 * x))
Lei dos Retornos Decrescentes de b1 + b2 * exp(b3 * x)
Metcherlich
Michaelis Menten b1 * x / (x + b2)
Morgan-Mercer-Florin (b1 * b2 + b3 * x ** b4) / (b2 + x ** b4)
Peal-Reed b1 / (1+ b2 * exp((b3 * x + b4 * x **2 + b5 * x ** 3)))
Razo de cbicos (b1 + b2 * x + b3 * x ** 2 + b4 * x ** 3) / (b5 * x ** 3)
Razo de quadrticos (b1 + b2 * x + b3 * x ** 2) / (b4 * x ** 2)
Richards b1 / ((1 + b3 * exp(b2 * x)) ** (1 / b4))
Verhulst b1 / (1 + b3 * exp(b2 * x))
Von Bertalanffy (b1 ** (1 b4) b2 * exp(b3 * x)) ** (1 / (1 b4))
Weibull b1 b2 * exp(b3 * x ** b4)
Densidade de lucro (b1 + b2 * x + b3 * x ** 2) ** (1)

Funo de perda de regresso no linear


A funo de perda em regresso no linear a funo que minimizada pelo algoritmo. Selecione Soma
de resduos quadrados para minimizar a soma dos resduos quadrados ou Funo de perda definida
pelo usurio para minimizar uma funo diferente.

Se voc selecionar Funo de perda definida pelo usurio, dever definir a funo de perda cuja soma
(em todos os casos) deve ser minimizada pela opo de valores paramtrica.
v A maioria das funes de perda envolve a varivel especial RESID_, que representa o resduo. (A Soma
padro de funo de perda de resduos quadrados pode ser inserida explicitamente como RESID_**2.)
Se precisar usar o valor predito em sua funo de perda, ele igual varivel dependente menos o
resduo.
v possvel especificar uma funo de perda condicional usando a lgica condicional.

possvel digitar uma expresso no campo Funo de perda definida pelo usurio ou colar componentes
da expresso no campo. As constantes de sequncia devem ser colocadas entre aspas ou apstrofos e as
constantes numricas devem ser digitadas em formato norte-americano, com o ponto como um
delimitador decimal.

Captulo 5. Regresso no linear 21


Restries paramtrica de regresso no linear
Uma restrio uma restrio nos valores permitidos para um parmetro durante a procura iterativa por
uma soluo. As expresses lineares so avaliadas antes de um passo ser executado, portanto, possvel
usar restries lineares para evitar passos que podem resultar em estouros. As expresses no lineares
no avaliadas aps a execuo de um passo.

Cada equao ou desigualdade requer os seguintes elementos:


v Uma expresso envolvendo pelo menos um parmetro no modelo. Digite a expresso ou use o teclado
numrico, que permite colar nmeros, operadores ou parnteses na expresso. possvel digitar os
parmetros necessrios junto com o restante da expresso ou colar da lista Parmetros esquerda. No
possvel usar variveis ordinrias em uma restrio.
v Um dos trs operadores lgicos <=, = ou >=.
v Uma constante numrica, com a qual a expresso comparada usando o operador lgico. Digite a
constante. As constantes numricas devem ser digitadas em formato americano, com o ponto como um
delimitador decimal.

Regresso no linear - Salvar novas variveis


possvel salvar diversas novas variveis em seu arquivo de dados ativo. As opes disponveis so
Resduos, Valores preditos, Derivados e valores de Funo de perda. Essas variveis podem ser usadas
em anlises subsequentes para testar o ajuste do modelo ou para identificar casos de problemas.
v Residuais. Salva os resduos com o nome de varivel resid.
v Valores Preditos. Salva valores preditos com o nome de varivel pred_.
v Derivados. Um derivado salvo para cada parmetro de modelo. Os nomes derivados so criados ao
prefixar 'd.' nos seis primeiros caracteres de nomes do parmetro.
v Valores de Funo de Perda. Essa opo estar disponvel se voc especificar sua prpria funo de
perda. O nome de varivel _loss designado aos valores da funo de perda.

Opes de regresso no linear


As Opes permitem controlar vrios aspectos de sua anlise de regresso no linear:

Estimativas bootstrap. Um mtodo para estimar o erro padro de uma estatstica utilizando amostras
repetidas do conjunto de dados original. Isso feito por amostragem (com substituio) para obter muitas
amostras do mesmo tamanho que o conjunto de dados original. A equao no linear estimada para
cada uma destas amostras. Em seguida, o erro padro de cada estimativa paramtrica calculado como o
desvio padro das estimativas bootstrapped. Os valores dos parmetros dos dados originais so
utilizados como valores de incio para cada amostra bootstrap. Isso requer o algoritmo de programao
quadrtica sequencial.

Mtodo de estimao. Permite selecionar um mtodo de estimao, se possvel. (Algumas opes nessa
ou em outras caixas de dilogo requerem o algoritmo de programao quadrtica sequencial.) As
alternativas disponveis incluem programao quadrtica sequencial e Levenberg-Marquardt.
v Programao Quadrtica Sequencial. Este mtodo est disponvel para modelos restritos e irrestritos. A
programao quadrtica sequencial ser utilizada automaticamente se voc especificar um modelo
restrito, uma funo de perda definida pelo usurio ou bootstrapping. possvel inserir novos valores
para o Mximo de iteraes e limite de Passo, bem como alterar a seleo nas listas suspensas para
tolerncia de Otimalidade, preciso de Funo e o tamanho de passo Infinito.
v Levenberg-Marquardt. Esta o algoritmo padro para modelos irrestritos. O mtodo de
Levenberg-Marquardt no estar disponvel se voc especificar um modelo restrito, uma funo de

22 IBM SPSS Regression 24


perda definida pelo usurio, ou bootstrapping. possvel inserir novos valores para o mximo de
iteraes e tambm alterar a seleo nas listas suspensas para convergncia Soma de quadrados e
convergncia Parmetro.

Interpretando resultados de regresso no linear


Os problemas de regresso no linear geralmente apresentam dificuldades computacionais:
v A escolha de valores iniciais para os parmetros influencia a convergncia. Tente escolher valores
iniciais que sejam razoveis e, se possvel, prximos da soluo final esperada.
v s vezes, um algoritmo tem melhor desempenho do que o outro em um determinado problema. Na
caixa de dilogo Opes, selecione o outro algoritmo, se ele estiver disponvel. (Se voc especificar uma
funo de perda ou determinados tipos de restries, no ser possvel usar o algoritmo de
Levenberg-Marquardt.)
v Quando a iterao parar somente porque ocorreu o nmero mximo de iteraes, o modelo "final"
provavelmente no ser uma boa soluo. Selecione Usar valores iniciais de anlise anterior na caixa
de dilogo Parmetros para continuar a interao ou, melhor ainda, escolha valores iniciais diferentes.
v Os modelos que requerem exponenciao de ou por grandes valores de dados podem causar estouros
ou estouros negativos (nmeros muito grandes ou muito pequenos para o computador representar). s
vezes, possvel evit-los por uma escolha adequada de valores iniciais ou impondo restries nos
parmetros.

Recursos adicionais do comando NLR


O idioma da sintaxe de comando tambm permite:
v Nomeie um arquivo a partir do qual ler valores iniciais para estimativas paramtrica.
v Especifique mais de uma instruo de modelo e funo de perda. Isso facilita a especificao de um
modelo segmentado.
v Fornea seus prprios derivados em vez de usar os calculados pelo programa.
v Especifique o nmero de amostras bootstrap a serem geradas.
v Especifique critrios de iterao adicionais, incluindo a configurao de um valor crtico para a
verificao de derivados e a definio de um critrio de convergncia para a correlao entre os
resduos e os derivados.

Os critrios adicionais para o comando CNLR (regresso no linear restrita) permitem:


v Especificar o nmero mximo de iteraes menores permitidas em cada iterao principal.
v Configurar um valor crtico para a verificao de derivados.
v Configurar um limite de passos.
v Especificar uma tolerncia de travamento para determinar se os valores iniciais esto dentro de seus
limites especificados.

Consulte a Referncia da sintaxe de comando para obter informaes de sintaxe completa.

Captulo 5. Regresso no linear 23


24 IBM SPSS Regression 24
Captulo 6. Estimao Ponderada
Os modelos de regresso linear padro consideram que a varincia constante na populao em estudo.
Quando esse no for o caso -- por exemplo, quando casos que esto na parte superior em algum atributo
mostrarem maior variabilidade do que casos que esto na parte inferior nesse atributo -- a regresso
linear usando quadrados mnimos ordinrios (OLS) no fornecer mais estimativas de modelo ideais. Se
as diferenas em variabilidade puderem ser preditas a partir de outra varivel, o procedimento Estimao
ponderada poder calcular os coeficientes de um modelo de regresso linear usando quadrados mnimos
ponderados (WLS), de forma que as observaes mais precisas (ou seja, as com menor variabilidade)
recebem maior ponderao na determinao dos coeficientes de regresso. O procedimento Estimao
ponderada testa um intervalo de transformaes de ponderao e indica qual fornecer o melhor ajuste
para os dados.

Exemplo. Quais so os efeitos da inflao e do desemprego em mudanas de preos de aes? Como as


aes com valores mais altos geralmente mostram maior variabilidade do que as de valores mais baixos,
os quadrados mnimos ordinrios no produziro estimativas ideais. A estimao ponderada permite
contar com o efeito do preo de aes na variabilidade de mudanas de preo no clculo do modelo
linear.

Estatsticas. Valores de log da verossimilhana para cada potncia da varivel de origem de ponderao
testada, R mltiplo, R-quadrado, R-quadrado ajustado, tabela ANOVA para o modelo WLS, estimativas
paramtricas no padronizadas e padronizadas, e log da verossimilhana para o modelo WLS.

Consideraes de dados de estimao ponderada

Dados. As variveis dependentes e independentes devem ser quantitativas. Variveis categricas, como
religio, maioridade ou regio de residncia, precisam ser recodificadas para variveis binrias (fictcias)
ou outros tipos de variveis de contraste. A varivel de ponderao deve ser quantitativa e deve estar
relacionada variabilidade na varivel dependente.

Suposies. Para cada valor da varivel independente, a distribuio da varivel dependente deve ser
normal. O relacionamento entre a varivel dependente e cada varivel independente deve ser linear, e
todas as observaes devem ser independentes. A varincia da varivel dependente pode variar nos
nveis das variveis independentes, mas as diferenas devem ser previsveis com base na varivel de
ponderao.

Procedimentos relacionados. O procedimento Explorao pode ser usado para triar seus dados. A
Explorao fornece testes para normalidade e homogeneidade de varincia, bem como exibies grficas.
Se sua varivel dependente parecer ter uma varincia igual nos nveis de variveis independentes, ser
possvel usar o procedimento Regresso linear. Se seus dados parecerem violar uma suposio (como
normalidade), tente transform-los. Se seus dados no estiverem relacionados linearmente e uma
transformao no ajudar, use um modelo alternativo no procedimento Curva de estimao. Se sua
varivel dependente for dicotmica -- por exemplo, se uma determinada venda for concluda ou se um
item estiver com defeito -- use o procedimento Regresso logstica. Se sua varivel dependente for
censurada -- por exemplo, tempo de sobrevivncia aps a cirurgia -- use Tabelas de mortalidade,
Kaplan-Meier ou Regresso de Cox, disponvel na opo Estatsticas avanadas. Se seus dados no forem
independentes -- por exemplo, se voc observar a mesma pessoa em vrias condies -- use o
procedimento Medidas repetidas, disponvel na opo Estatsticas avanadas.

Obtendo uma anlise de estimao ponderada


1. Nos menus, escolha:
Analisar > Regresso > Estimao ponderada...

Copyright IBM Corporation 1989, 2016 25


2. Selecione uma varivel dependente.
3. Selecionar uma ou mais variveis independentes.
4. Selecione a varivel que a origem de heterocedasticidade como a varivel de ponderao.
v Varivel de ponderao. Os dados so ponderados pelo recproco desta varivel elevado a uma potncia.
A equao de regresso calculada para cada um dos valores de um intervalo de potncia especificado
e indica a potncia que maximiza a funo do log da verossimilhana.
v Intervalo de Potncias. Isso utilizado em conjunto com a varivel de ponderao para calcular
ponderaes. Vrias equaes de regresso sero ajustadas, uma para cada valor no intervalo de
potncias. Os valores inseridos na caixa de teste de intervalo de Potncia e na caixa de texto devem
estar entre -6,5 e 7,5, inclusive. Os valores de potncia variam do valor mais baixo para o mais alto, em
incrementos determinados pelo valor especificado. O nmero total de valores no intervalo de potncias
limitado a 150.

Opes de estimao ponderada


possvel especificar opes para sua anlise de estimao ponderada:

Salvar melhor ponderao como nova varivel. Inclui a varivel de ponderao no arquivo ativo. Essa
varivel chamada WGT_n, em que n um nmero escolhido para dar um nome exclusivo varivel.

Exibir ANOVA e estimativas. Permite controlar como as estatsticas so exibidas na sada. As alternativas
disponveis so Para melhor potncia e Para cada valor de potncia.

Recursos adicionais do comando WLS


O idioma da sintaxe de comando tambm permite:
v Fornecer um valor nico para a potncia.
v Especificar uma lista de valores de potncia, ou misturar um intervalo de valores com uma lista de
valores para a potncia.

Consulte a Referncia da sintaxe de comando para obter informaes de sintaxe completa.

26 IBM SPSS Regression 24


Captulo 7. Regresso por quadrados mnimos de dois
estgios
Os modelos de regresso linear padro consideram que os erros na varivel dependente no esto
correlacionados s variveis independentes. Quando esse no o caso (por exemplo, quando os
relacionamentos entre variveis so bidirecionais), a regresso linear usando quadrados mnimos
ordinrios (OLS) no fornece mais estimativas de modelo ideal. A regresso de quadrados mnimos de
dois estgios usa variveis instrumentais que no esto correlacionadas aos termos de erro para calcular
valores estimados dos preditores problemticos (o primeiro estgio) e, em seguida, usa esses valores
calculados para estimar um modelo de regresso linear da varivel dependente (o segundo estgio).
Como os valores calculados so baseados em variveis que no so correlacionadas aos erros, os
resultados do modelo de dois estgios so os ideais.

Exemplo. A demanda por uma mercadoria est relacionada a seu preo e s receitas de consumidores? A
dificuldade para este modelo que o preo e a demanda tm um efeito recproco entre si. Ou seja, o
preo pode influenciar a demanda e a demanda tambm pode influenciar o preo. Um modelo de
regresso de quadrados mnimos de dois estgios pode usar receitas de consumidores e preo defasado
para calcular o preo de um proxy que no est correlacionado ao erros de medio na demanda. Esse
proxy substitudo pelo prprio preo no modelo especificado originalmente, que ento estimado.

Estatsticas. Para cada modelo: coeficientes de regresso padronizados e no padronizados, R mltiplo, R


2
, R 2 ajustado, erro padro da estimativa, tabela de anlise de varincia, valores preditos e resduos.
Alm disso, 95% de intervalos de confiana para cada coeficiente de regresso e matrizes de correlao e
de covarincias de estimativas paramtrica.

Consideraes de dados de regresso de quadrados mnimos de dois estgios

Dados. As variveis dependentes e independentes devem ser quantitativas. Variveis categricas, como
religio, maioridade ou regio de residncia, precisam ser recodificadas para variveis binrias (fictcias)
ou outros tipos de variveis de contraste. As variveis explicativas endgenas devem ser quantitativas (no
categricas).

Suposies. Para cada valor da varivel independente, a distribuio da varivel dependente deve ser
normal. A varincia da distribuio da varivel dependente deve ser constante para todos os valores da
varivel independente. O relacionamento entre a varivel dependente e cada varivel independente deve
ser linear.

Procedimentos relacionados. Se voc acreditar que nenhuma de suas variveis preditoras esteja
correlacionada aos erros em sua varivel dependente, ser possvel usar o procedimento Regresso linear.
Se seus dados parecerem violar uma das suposies (como normalidade ou varincia constante), tente
transform-los. Se seus dados no estiverem relacionados linearmente e uma transformao no ajudar,
use um modelo alternativo no procedimento Curva de estimao. Se sua varivel dependente for
dicotmica, por exemplo, se uma determinada venda for ou no concluda, use o procedimento Regresso
logstica. Se seus dados no forem independentes -- por exemplo, se voc observar a mesma pessoa em
vrias condies -- use o procedimento Medidas repetidas, disponvel na opo Modelos avanados.

Obtendo uma anlise de regresso de quadrados mnimos de dois estgios


1. Nos menus, escolha:
Analisar > Regresso > Quadrados mnimos de dois estgios...
2. Selecione uma varivel dependente.
3. Selecione uma ou mais variveis explicativas (preditoras).

Copyright IBM Corporation 1989, 2016 27


4. Selecione uma ou mais variveis instrumentais.
v Instrumental. Essas so as variveis utilizadas para calcular os valores preditos para as variveis
endgenas no primeiro estgio de uma anlise de quadrados mnimos de dois estgios. As mesmas
variveis podem aparecer nas caixas de listagem Explicatria e Instrumental. O nmero de variveis
instrumentais deve ser pelo menos igual ao nmero de variveis explicatrias. Se todas as variveis
explicatrias e instrumentais listadas forem as mesmas, os resultados sero os mesmos que os
resultados do procedimento de Regresso Linear.

As variveis explicativas no especificadas como instrumentais so consideradas endgenas.


Normalmente, todas as variveis exgenas na lista Explicativa tambm so especificadas como variveis
instrumentais.

Opes de regresso de quadrados mnimos de dois estgios


possvel selecionar as seguintes opes para sua anlise:

Salvar novas variveis. Permite incluir novas variveis no arquivo ativo. As opes disponveis so
Preditos e Resduos.

Exibir covarincia paramtricas. Permite imprimir a matriz de covarincias das estimativas paramtrica.

Recursos adicionais do comando 2SLS


A linguagem da sintaxe de comando tambm permite estimar vrias equaes simultaneamente. Consulte
a Referncia de Sintaxe de Comando para obter informaes da sintaxe completa.

28 IBM SPSS Regression 24


Captulo 8. Esquemas de codificao de varivel categrica
Em muitos procedimentos, possvel solicitar a substituio automtica de uma varivel independente
categrica com um conjunto de variveis de contraste, que sero, ento, inseridos ou removidos de uma
equao como um bloco. possvel especificar como o conjunto de variveis de contraste deve ser
codificado, geralmente, no subcomando CONTRAST. Este apndice explica e ilustra quo diferentes os tipos
de contraste solicitados em CONTRAST realmente funcionam.

Desvio
Desvio da mdia global. Em termos de matriz, esses contrastes tm o formato:
mean (1/k 1/k ... 1/k 1/k)
df(1) (1-1/k -1/k ... -1/k -1/k)
df(2) ( -1/k 1-1/k ... -1/k -1/k)
. .
. .
df(k-1) ( -1/k -1/k ... 1-1/k -1/k)

em que k o nmero de categorias para a varivel independente e a ltima categoria omitida por
padro. Por exemplo, os contrastes de desvio para uma varivel independente com trs categorias so as
seguintes:
( 1/3 1/3 1/3)
( 2/3 -1/3 -1/3)
(-1/3 2/3 -1/3)

Para omitir uma categoria diferente da ltima, especifique o nmero da categoria omitida entre
parnteses aps a palavra-chave DEVIATION. Por exemplo, o subcomando a seguir obtm os desvios para
as categorias primeira e terceira e omite a segunda:
/CONTRAST(FACTOR)=DEVIATION(2)

Suponha que fator tem trs categorias. A matriz de contraste resultante ser
( 1/3 1/3 1/3)
( 2/3 -1/3 -1/3)
(-1/3 -1/3 2/3)

Simples
Contrastes simples. Compara cada nvel de um fator com o ltimo. O formulrio matriz geral
mean (1/k 1/k ... 1/k 1/k)
df(1) ( 1 0 ... 0 -1)
df(2) ( 0 1 ... 0 -1)
. .
. .
df(k-1) ( 0 0 ... 1 -1)

em que k o nmero de categorias para a varivel independente. Por exemplo, os contrastes simples para
uma varivel independente com quatro categorias so as seguintes:
(1/4 1/4 1/4 1/4)
( 1 0 0 -1)
( 0 1 0 -1)
( 0 0 1 -1)

Para usar outra categoria em vez da ltima como uma categoria de referncia, especifique entre
parnteses aps a palavra-chave SIMPLE o nmero de sequncia da categoria de referncia, que no
necessariamente o valor associado a essa categoria. Por exemplo, o seguinte subcomando CONTRAST obtm
uma matriz de contraste que omite a segunda categoria:
/CONTRAST(FACTOR) = SIMPLE(2)

Copyright IBM Corporation 1989, 2016 29


Suponha que fator tenha quatro categorias. A matriz de contraste resultante ser
(1/4 1/4 1/4 1/4)
( 1 -1 0 0)
( 0 -1 1 0)
( 0 -1 0 1)

Helmert
Contrastes de Helmert. Compara as categorias de uma varivel independente com a mdia das
categorias subsequentes. O formulrio matriz geral
mean (1/k 1/k ... 1/k 1/k 1/k)
df(1) ( 1 -1/(k-1) ... -1/(k-1) -1/(k-1) -1/(k-1))
df(2) ( 0 1 ... -1/(k-2) -1/(k-2) -1/(k-2))
. .
. .
df(k-2) ( 0 0 ... 1 -1/2 -1/2)
df(k-1) ( 0 0 ... 0 1 -1)

em que k o nmero de categorias da varivel independente. Por exemplo, uma varivel independente
com quatro categorias possui uma matriz de contraste de Helmert da seguinte forma:
(1/4 1/4 1/4 1/4)
( 1 -1/3 -1/3 -1/3)
( 0 1 -1/2 -1/2)
( 0 0 1 -1)

Diferena
Diferena ou contrastes de Helmert reversos. Compara as categorias de uma varivel independente com
a mdia das categorias anteriores da varivel. O formulrio matriz geral
mean ( 1/k 1/k 1/k ... 1/k)
df(1) ( -1 1 0 ... 0)
df(2) ( -1/2 -1/2 1 ... 0)
. .
. .
df(k-1) (-1/(k-1) -1/(k-1) -1/(k-1) ... 1)

em que k o nmero de categorias para a varivel independente. Por exemplo, os contrastes de diferena
para uma varivel independente com quatro categorias so os seguintes:
(1/4 1/4 1/4 1/4)
( -1 1 0 0)
(-1/2 -1/2 1 0)
(-1/3 -1/3 -1/3 1)

Polinomial
Contrastes polinominais ortogonais. O primeiro grau de liberdade contm o efeito linear em todas as
categorias; o segundo grau de liberdade, o efeito quadrtico; o terceiro grau de liberdade, o cbico, e
assim por diante, para o efeito de ordem mais alta.

possvel especificar o espaamento entre os nveis de tratamento medido pela varivel categrica
fornecida. O espaamento igual, que o padro, se voc omitir a mtrica, pode ser especificado como
nmeros inteiros consecutivos de 1 a k, em que k o nmero de categorias. Se a varivel drug possuir
trs categorias, o subcomando
/CONTRAST(DRUG)=POLYNOMIAL

o mesmo que
/CONTRAST(DRUG)=POLYNOMIAL(1,2,3)

O espaamento igual no sempre necessrio, no entanto. Por exemplo, suponha que drug representa
dosagens diferentes de um determinado medicamento para os trs grupos. Se a dosagem administrada ao
segundo grupo for duas vezes maior que a dosagem fornecida ao primeiro grupo, e a dosagem

30 IBM SPSS Regression 24


administrada ao terceiro grupo for trs vezes maior que para o primeiro grupo, as categorias de
tratamento sero igualmente espaadas e uma mtrica apropriada para esta situao consiste em nmeros
inteiros consecutivos:
/CONTRAST(DRUG)=POLYNOMIAL(1,2,3)

Se, no entanto, a dosagem administrada para o segundo grupo for quatro vezes maior que a fornecida
para o primeiro grupo, e a dosagem administrada para o terceiro grupo for sete vezes maior que a
fornecida para o primeiro grupo, uma mtrica apropriada seria
/CONTRAST(DRUG)=POLYNOMIAL(1,4,7)

Em ambos os casos, o resultado da especificao de contraste que o primeiro grau de liberdade para
drug contm o efeito linear dos nveis de dosagem e o segundo grau de liberdade contm o efeito
quadrtico.

Contrastes polinomiais so especialmente teis em testes de tendncias e para investigar a natureza das
superfcies de resposta. Tambm possvel usar os contraste polinomiais para executar o ajuste de curva
no linear, como regresso curvilinear.

Repetido
Compara nveis adjacentes de uma varivel independente. O formulrio matriz geral

mean ( 1/k 1/k 1/k ... 1/k 1/k)


df(1) ( 1 -1 0 ... 0 0)
df(2) ( 0 1 -1 ... 0 0)
. .
. .
df(k-1) ( 0 0 0 ... 1 -1)

em que k o nmero de categorias para a varivel independente. Por exemplo, os contrastes repetidos
para uma varivel independente com quatro categorias so os seguintes:
(1/4 1/4 1/4 1/4)
( 1 -1 0 0)
( 0 1 -1 0)
( 0 0 1 -1)

Esses contrastes so teis na anlise de perfil e sempre que os escores de diferena so necessrios.

Especial
Um contraste definido pelo usurio. Permite a entrada de contrastes especiais na forma de matrizes
quadradas com tantas linhas e colunas quanto existirem categorias da varivel independente fornecida.
Para MANOVA e LOGLINEAR, a primeira linha inserida sempre ser a mdia ou constante, efeito e representa
o conjunto de ponderaes, indicando como obter a mdia de outras variveis independentes, se houver,
sobre a varivel fornecida. Geralmente, esse contraste um vetor de uns.

As linhas restantes da matriz contm os contrastes especial indicando as comparaes entre as categorias
da varivel. Geralmente, contrastes ortogonais so os mais teis. Os contrastes ortogonais so
estatisticamente independentes e so no redundantes. Os contrastes so ortogonais se:
v Para cada linha, os coeficientes de contraste somarem 0.
v Os produtos de coeficientes correspondentes para todos os pares de linhas separadas tambm somarem
0.

Por exemplo, suponha que o tratamento possua quatro nveis e que voc deseja comparar os vrios nveis
de tratamento uns com os outros. Um contraste especial apropriado
(1 1 1 1) weights for mean calculation
(3 -1 -1 -1) compare 1st with 2nd through 4th
(0 2 -1 -1) compare 2nd with 3rd and 4th
(0 0 1 -1) compare 3rd with 4th

Captulo 8. Esquemas de codificao de varivel categrica 31


que especificado por meio do subcomando CONTRAST a seguir para o MANOVA, LOGISTIC REGRESSION e o
COXREG:
/CONTRAST(TREATMNT)=SPECIAL( 1 1 1 1
3 -1 -1 -1
0 2 -1 -1
0 0 1 -1 )

Para LOGLINEAR, necessrio especificar:


/CONTRAST(TREATMNT)=BASIS SPECIAL( 1 1 1 1
3 -1 -1 -1
0 2 -1 -1
0 0 1 -1 )

Cada linha excetua as somas de linha mdia para 0. Os produtos de cada par de linhas separadas somam
0 tambm:
Rows 2 and 3: (3)(0) + (1)(2) + (1)(1) + (1)(1) = 0
Rows 2 and 4: (3)(0) + (1)(0) + (1)(1) + (1)(1) = 0
Rows 3 and 4: (0)(0) + (2)(0) + (1)(1) + (1)(1) = 0

Os contrastes especiais no precisam ser ortogonais. No entanto, eles no devem ser combinaes lineares
uns dos outros. Se forem, o procedimento relata a dependncia linear e interrompe o processamento.
Helmert, diferena e contrastes polinomial so todos contrastes ortogonais.

Indicador
Codificao de varivel indicadora. Tambm conhecido como codificao simulada, esta codificao no
est disponvel em LOGLINEAR ou MANOVA. O nmero de novas variveis codificadas k1. Casos na
categoria de referncia so codificados como 0 para todas as variveis k1. Um caso na categoria i th
codificado como 0 para todas as variveis indicadoras, exceto o i th, que codificado como 1.

32 IBM SPSS Regression 24


Avisos
Essas informaes foram desenvolvidas para produtos e servios oferecidos nos Estados Unidos. Esse
material pode estar disponvel a partir da IBM em outros idiomas. No entanto, pode ser necessrio
possuir uma cpia do produto ou da verso do produto nesse idioma para acess-lo.

possvel que a IBM no oferea produtos, servios ou recursos discutidos neste documento em outros
pases. Consulte um representante IBM local para obter informaes sobre produtos e servios disponveis
atualmente em sua rea. Qualquer referncia a produtos, programas ou servios IBM no significa que
apenas produtos, programas ou servios IBM possam ser utilizados. Qualquer produto, programa ou
servio funcionalmente equivalente, que no infrinja nenhum direito de propriedade intelectual da IBM
poder ser utilizado em substituio a este produto, programa ou servio. Entretanto, a avaliao e
verificao da operao de qualquer produto, programa ou servio no IBM so de responsabilidade do
Cliente.

A IBM pode ter patentes ou solicitaes de patentes pendentes relativas a assuntos tratados nesta
publicao. O fornecimento desta publicao no lhe garante direito algum sobre tais patentes. Pedidos
de licena podem ser enviados, por escrito, para:

Gerncia de Relaes Comerciais e Industriais da IBM Brasil


Av. Pasteur, 138-146
CEP 22290-240
Rio de Janeiro, RJ
Brasil

Para pedidos de licena relacionados a informaes de DBCS (Conjunto de Caracteres de Byte Duplo),
entre em contato com o Departamento de Propriedade Intelectual da IBM em seu pas ou envie pedidos
de licena, por escrito, para:

Intellectual Property Licensing


Legal and Intellectual Property Law
IBM Japan Ltd.
19-21, Nihonbashi-Hakozakicho, Chuo-ku
Tokyo 103-8510, Japan

A INTERNATIONAL BUSINESS MACHINES CORPORATION FORNECE ESTA PUBLICAO "NO


ESTADO EM QUE SE ENCONTRA", SEM GARANTIA DE NENHUM TIPO, SEJA EXPRESSA OU
IMPLCITA, INCLUINDO, MAS NO SE LIMITANDO S GARANTIAS IMPLCITAS DE
NO-VIOLAO, COMERCIALIZAO OU ADEQUAO A UM DETERMINADO PROPSITO.
Alguns pases no permitem a excluso de garantias explcitas ou implcitas em certas transaes;
portanto, esta instruo pode no se aplicar ao Cliente.

Essas informaes podem conter imprecises tcnicas ou erros tipogrficos. So feitas alteraes
peridicas nas informaes aqui contidas; tais alteraes sero incorporadas em futuras edies desta
publicao. A IBM pode, a qualquer momento, aperfeioar e/ou alterar o(s) produto(s) e/ou programa(s)
descritos nesta publicao, sem aviso prvio.

Qualquer referncia nestas informaes a websites no IBM so fornecidas apenas por convenincia e no
representam de forma alguma um endosso a esses websites. Os materiais contidos nesses websites no
fazem parte dos materiais para esse produto IBM e o uso desses websites de inteira responsabilidade
do Cliente.

33
A IBM por usar ou distribuir as informaes fornecidas da forma que julgar apropriada sem incorrer em
qualquer obrigao para com o Cliente.

Licenciados deste programa que desejam obter informaes sobre o mesmo com o objetivo de permitir: (i)
a troca de informaes entre programas criados independentemente e outros programas (incluindo este) e
(ii) o uso mtuo de informaes trocadas, devem entrar em contato com:

Gerncia de Relaes Comerciais e Industriais da IBM Brasil


Av. Pasteur, 138-146
CEP 22290-240
Rio de Janeiro, RJ
Brasil

Tais informaes podem estar disponveis, sujeitas a termos e condies apropriadas, incluindo em alguns
casos o pagamento de uma taxa.

O programa licenciado descrito nesta publicao e todo o material licenciado disponvel so fornecidos
pela IBM sob os termos do Contrato com o Cliente IBM, do Contrato Internacional de Licena do
Programa IBM ou de qualquer outro contrato equivalente.

Os exemplos de dados de desempenho e do Cliente citados so apresentados apenas para propsitos


ilustrativos. Resultados de desempenho reais podem variar dependendo das configuraes especficas e
das condies operacionais.

Informaes relativas a produtos no IBM foram obtidas junto aos fornecedores dos respectivos produtos,
de seus anncios publicados ou de outras fontes disponveis publicamente. A IBM no testou esses
produtos e no pode confirmar a preciso de desempenho, compatibilidade nem qualquer outra
reivindicao relacionada a produtos no IBM. Perguntas sobre os recursos de produtos no IBM devem
ser endereadas aos fornecedores desses produtos.

Instrues relativas direo futura ou intento da IBM esto sujeitas a mudana ou retirada sem aviso e
representam metas e objetivos apenas.

Estas informaes contm exemplos de dados e relatrios utilizados nas operaes dirias de negcios.
Para ilustr-los da forma mais completa possvel, os exemplos podem incluir nomes de assuntos,
empresas, marcas e produtos. Todos esses nomes so fictcios e qualquer semelhana com pessoas ou
empresas reais mera coincidncia.

LICENA DE COPYRIGHT:

Estas informaes contm programas de aplicativos de amostra na linguagem fonte, ilustrando as tcnicas
de programao em diversas plataformas operacionais. O Cliente pode copiar, modificar e distribuir estes
programas de amostra sem a necessidade de pagar IBM, com objetivos de desenvolvimento, utilizao,
marketing ou distribuio de programas aplicativos em conformidade com a interface de programao de
aplicativo para a plataforma operacional para a qual os programas de amostra so criados. Esses
exemplos no foram testados completamente em todas as condies. Portanto, a IBM no pode garantir
ou implicar a confiabilidade, manuteno ou funo destes programas. Os programas de amostra so
fornecidos "NO ESTADO EM QUE SE ENCONTRAM", sem garantia de qualquer tipo. A IBM no ser
responsabilizada por quaisquer danos decorrentes do uso dos programas de amostra.

Cada cpia ou parte destes programas de amostra ou qualquer trabalho derivado deve incluir um aviso
de copyright com os dizeres:

nome de sua empresa) (ano). Partes deste cdigo so derivadas dos Programas de Amostra da IBM
Corp.

34 IBM SPSS Regression 24


Copyright IBM Corp. _inserir o ano ou anos_. Todos os direitos reservados.

Marcas comerciais
IBM, o logotipo IBM e ibm.com so marcas comerciais ou marcas registradas da International Business
Machines Corp., registradas em muitos pases no mundo todo. Outros nomes de produtos e servios
podem ser marcas comerciais da IBM ou de outras empresas. ma lista atual de marcas comerciais da IBM
est disponvel na web em "Copyright and trademark information" em www.ibm.com/legal/
copytrade.shtml.

Adobe, o logotipo Adobe, PostScript e o logotipo PostScript so marcas registradas ou marcas comerciais
da Adobe Systems Incorporated nos Estados Unidos e/ou em outros pases.

Intel, o logotipo Intel, Intel Inside, o logotipo Intel Inside, Intel Centrino, o logotipo Intel Centrino,
Celeron, Intel Xeon, Intel SpeedStep, Itanium e Pentium so marcas comerciais ou marcas registradas da
Intel Corporation ou de suas subsidirias nos Estados Unidos e em outros pases.

Linux uma marca registrada da Linus Torvalds nos Estados Unidos, e/ou em outros pases.

Microsoft, Windows, Windows NT e o logotipo Windows so marcas comerciais da Microsoft Corporation


nos Estados Unidos e/ou em outros pases.

UNIX uma marca registrada da The Open Group nos Estados Unidos e em outros pases.

Java e todas as marcas comerciais e logotipos baseados em Java so marcas comerciais ou marcas
registradas da Oracle e/ou suas afiliadas.

Avisos 35
36 IBM SPSS Regression 24
ndice Remissivo
A estimativas paramtrica
na Regresso logstica
modelo de Gompertz
na Regresso no linear 21
Anlise de probitos multinomial 11 modelo de Johnson-Schumacher
critrios 16 etapa pela metade na Regresso no linear 21
definir intervalo 16 na Regresso logstica modelo de Michaelis Menten
estatsticas 15, 16 multinomial 11 na Regresso no linear 21
example 15 modelo de Morgan-Mercer-Florin
intervalos de confiana fiducirios 16 na Regresso no linear 21
iteraes 16
potncia mdia relativa 16 F modelo de Peal-Reed
na Regresso no linear 21
recursos adicionais do comando 17 funo deviance
modelo de razo de cbicos
taxa de resposta natural 16 para estimar o valor de escala de
na Regresso no linear 21
teste de paralelismo 16 disperso 12
modelo de razo de quadrticos
na Regresso no linear 21
modelo de Richards
C H na Regresso no linear 21
categoria de referncia histrico de iterao modelo de Verhulst
na Regresso logstica na Regresso logstica na Regresso no linear 21
multinomial 10 multinomial 11 modelo de Von Bertalanffy
clulas com zero observaes na Regresso no linear 21
na Regresso logstica modelo de Weibull
multinomial 11 I na Regresso no linear 21
modelo modificado por log
classificao ID de Cook
na Regresso logstica multinomial 9 na Regresso no linear 21
em Regresso logstica 5
contrastes modelos customizados
intervalos de confiana
em Regresso logstica 5 na Regresso logstica multinomial 9
na Regresso logstica
covariveis modelos dos principais efeitos
multinomial 11
em Regresso logstica 5 na Regresso logstica multinomial 9
intervalos de confiana fiducirios
covariveis categricas 5 modelos fatoriais completos
em Anlise de probit 16
covariveis de sequncia de caracteres na Regresso logstica multinomial 9
iteraes
em Regresso logstica 5 modelos no lineares
em Anlise de probit 16
critrio de convergncia na Regresso no linear 21
em Regresso logstica 6
na Regresso logstica na Regresso logstica
multinomial 11 multinomial 11
O
ordenada na origem
D L incluir ou excluir 9
delta lei dos retornos decrescentes de
como correo para as clulas com Metcherlich
zero observaes 11 na Regresso no linear 21 P
DfBeta log da verossimilhana potncia mdia relativa
em Regresso logstica 5 em Estimao ponderada 25 em Anlise de probit 16
na Regresso logstica
multinomial 11
E Q
eliminao backward qualidade do ajuste
em Regresso logstica 4 M na Regresso logstica
estatsticas de qualidade de ajuste de matriz de correlaes multinomial 11
Hosmer-Lemeshow na Regresso logstica Qui-quadrado de Pearson
em Regresso logstica 6 multinomial 11 para estimar o valor de escala de
Estimao Ponderada 25 matriz de covarincias disperso 12
estatsticas 25 na Regresso logstica qualidade do ajuste 11
example 25 multinomial 11
exibir ANOVA e estimativas 26 modelo de densidade
histrico de iterao 26
log da verossimilhana 25
na Regresso no linear 21
modelo de densidade de lucro
R
recursos adicionais do comando 26 R-quadrado de Cox e Snell
na Regresso no linear 21
salvar melhores ponderaes como na Regresso logstica
modelo de Gauss
nova varivel 26 multinomial 11
na Regresso no linear 21

37
R-quadrado de McFadden Regresso no linear (continuao)
na Regresso logstica recursos adicionais do comando 23
multinomial 11 resduos 22
R-quadrado de Nagelkerke restries paramtrica 22
na Regresso logstica salvar novas variveis 22
multinomial 11 valores iniciais 20
razo de verossimilhana valores preditos 22
para estimar o valor de escala de Regresso por quadrados mnimos de
disperso 12 dois estgios 27
qualidade do ajuste 11 covarincia paramtricas 28
regresso assinttica estatsticas 27
na Regresso no linear 21 example 27
Regresso linear recursos adicionais do comando 28
estimao ponderada 25 salvando novas variveis 28
Regresso por quadrados mnimos de variveis instrumentais 27
dois estgios 27 regresso restrita
Regresso logstica 3 na Regresso no linear 22
binary 1 restries paramtrica
coeficientes 3 na Regresso no linear 22
contrastes 5
corte de classificao 6
covariveis categricas 5
covariveis de sequncia de
S
seleo forward
caracteres 5
em Regresso logstica 4
definir regra de seleo 4
seleo stepwise
estatsticas 3
em Regresso logstica 4
estatsticas de qualidade de ajuste de
na Regresso logstica multinomial 9
Hosmer-Lemeshow 6
separao
estatsticas e grficos 6
na Regresso logstica
example 3
multinomial 11
iteraes 6
singularidade
medidas de influncia 5
na Regresso logstica
mtodos de seleo de variveis 4
multinomial 11
opes de exibio 6
probabilidade para stepwise 6
recursos adicionais do comando 7
regra do conjunto 4 T
resduos 5 tabelas de classificao
salvando novas variveis 5 na Regresso logstica
termo constante 6 multinomial 11
valores preditos 5 tabelas de probabilidades de clula
regresso logstica binria 1 na Regresso logstica
Regresso logstica multinomial 9, 11 multinomial 11
categoria de referncia 10 termo constante
critrios 11 na regresso linear 6
estatsticas 11 teste de paralelismo
exportando informaes de em Anlise de probit 16
modelo 12
modelos 9
recursos adicionais do comando 13
salvar 12
V
valor de escala de disperso
Regresso no linear 19
na Regresso logstica
algoritmo de Levenberg-
multinomial 12
Marquardt 22
valores de ponto de alavanca
derivados 22
em Regresso logstica 5
estatsticas 19
estimativas bootstrap 22
example 19
funo de perda 21
interpretao de resultados 23
lgica condicional 20
mtodos de estimao 22
modelo segmentado 20
modelos comuns no lineares 21
parmetros 20
programao quadrtica
sequencial 22

38 IBM SPSS Regression 24


IBM

Impresso no Brasil