SERVIÇO PÚBLICO FEDERAL

INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DO PARÁ
COORDENAÇÃO DE MATEMÁTICA
LICENCIATURA PLENA EM MATEMÁTICA






EDNEY BARATA PANTOJA
ANTONIO JOSÉ BITTENCOURT








ESTIMANDO A PROBABILIDADE DE CURA DE PACIENTES OBESOS, VIA
REGRESSÃO LOGÍSTICA – UM ESTUDO DE CASO








BELÉM-PA
2014
Probabilidade
Matemática. PIBID/IFPA.
1
1. INTRODUÇÃO

Emprega-se esta técnica, quando se deseja estudar o comportamento de uma
variável dependente Y (variável resposta binária) em relação a outras variáveis
independentes X
i
(ou variáveis preditoras), que são responsáveis pela variabilidade
da variável resposta. As variáveis independentes podem ser qualitativas ou
quantitativas, porém o ajuste do modelo logístico é mais eficaz quando todas as
variáveis explicativas são categorizadas, a fim de evitar muitas freqüências nulas
nas categorias da variável resposta.




2. OBJETIVO

O objetivo deste trabalho é desenvolver um modelo para avaliar a evolução
de algumas comorbidades relacionadas com a obesidade em pacientes submetidos
à cirurgia de redução de estômago (BARIÁTRICA), com intuito de verificar se essa
evolução está associada ao resultado na pós-cirurgia.




3. MATERIAIS E MÉTODOS

Para o desenvolvimento desse trabalho será utilizado os dados cadastrais de
pacientes de uma Clínica de São Paulo, submetidos à Cirurgia Bariátrica (Cirurgia
da Obesidade), no período de 2003 a 2005, totalizando uma amostra de 105
pacientes, para que se possa estimar e ajustar um modelo que melhor represente a
probabilidade de cura. Para o tratamento dos dados utilizaremos a regressão
logística múltipla, pelo Software SPSS 13.0 WINDOWS.



Probabilidade
Matemática. PIBID/IFPA.
2
3.1 - MODELO DE REGRESSÃO LOGÍSTICA MÚLTIPLA

Segundo Cordeiro (1986), a regressão logística consiste em relacionar,
através de um modelo, as probabilidades das categorias de uma variável resposta
com fatores que influenciam na sua ocorrência. No caso de uma variável resposta
binária, assumindo valores “0” (fracasso) e “1” (sucesso), o modelo ajustado pela
regressão logística, relacionará a probabilidade de sucesso com variáveis, que
sejam significativas para a ocorrência do “sucesso”.
Considerando a existência de apenas uma variável independente

(variável
explicativa), tem-se o modelo de Regressão Logística Simples, sendo sua forma
usual dada por:

|

=

=

0
+
1

1+
0
+
1

3.1
Onde,

é a variável resposta binária p/ o i-ésimo individuo;

é a variável independente p/ o i-ésimo individuo
=
0
,
1
é o vetor de coeficientes do modelo.

é a Probabilidade de “sucesso”, dado o conhecimento de

.

O modelo de regressão logística multivariado é uma extensão do modelo
logístico simples, quando se considera duas ou mais variáveis explicativas

1
,
2
, ⋯,
−1
, sendo que o modelo é composto não só por variáveis preditoras, mas
também dos coeficientes de regressão
0
,
1
, ⋯,
−1
, ou seja,

=

0

1

2

−1

×1

=

1

,1

,2

,−1

×1


Logo temos:

=
0
+
1

,1
+
2

,2
+⋯+
−1

,−1



Probabilidade
Matemática. PIBID/IFPA.
3
E a função de resposta logística 3.1 pode ser expressa por

|

=

=

1 +

3.2

Com esta notação, a função de resposta logística simples estende-se à função de
resposta logística múltipla. A variável dependente

é dada por:

=

+

3.3
O termo

é o erro do modelo e representa a diferença entre o valor observado de

e o valor esperado condicionado de

dado

, sendo

uma variável dicotômica,
assumindo apenas valores 0 ou 1,
–Se

= 1 ⟹

= 1 −

, com probabilidade igual a

.
–Se

= 0 ⟹

= −

, com probabilidade igual a 1 −

.
Assim

tem distribuição com média 0 (zero), e variância

1 −

.


3.2 - ESTIMAÇÃO DOS PARÂMETROS:

Os parâmetros desconhecidos do modelo são
0
,
1
, ⋯,
−1
, esses
parâmetros são estimados pelo método de Máxima Verossi milhança (Bolfarine e
Sandoval, 2001).
Cada observação da variável aleatória

tem uma distribuição de Bernoulli, com:

= 1 =

e

= 0 = 1 −

, 3.4

ou seja, a função de probabilidade de

é dada por

=

=

=

1 −

1−

, com

= 0 1, = 1, ⋯, 3.5

Logo, a função de verossimilhança será a seguinte:
, ,

=

=1
=

=1
1 −

1−

3.6
Aplicando o logaritmo neperiano na função de verossimilhança, substituindo (3.2) e
fazendo algumas operações numéricas, obtêm-se:
Probabilidade
Matemática. PIBID/IFPA.
4
, ,

= ln

=

=1
−ln1 +

=1
3.7

Para encontrar as estimativas de
0
,
1
, ⋯,
−1
que maximizam a função (3.7),
devem-se utilizar métodos numéricos, sendo que suas estimativas serão denotadas
por

=
0
,
1
, ⋯,
−1
. E a função resposta logística ajustada será dada por:

=

1 +

3.8

3.3 - TESTE DE BONDADE DE AJUSTE
Após a estimação dos parâmetros deve-se investigar a significância
estatística dos mesmos no modelo.

3.3.1 - O teste de Wald (W)

É utilizado para avaliar se o parâmetro é estatisticamente significante, a
estatística deste teste é obtida pela razão do coeficiente pelo seu respectivo erro
padrão:
=

3.9

sendo que possui distribuição normal, e seu valor é comparado com valores
tabulados, de acordo com o nível de significância definido, e sua hipótese nula é que
os

são iguais a zero.

3.3.2 - Deviance (D)

É uma estatística de bondade de ajuste muito enfatizada na literatura e baseia-se
nas funções de log-verossimilhança maximizadas, sendo expressa por:
= ; = −2; −; 3.10
onde ; representa a máxima verossimilhança de um ajuste exato, e ;
representa a máxima verossimilhança do modelo sob estudo.

Probabilidade
Matemática. PIBID/IFPA.
5
3.4 - RESULTADOS

3.4.1 - Resumo Descritivo para os Pacientes com Comorbidades

Na Figura 3.1, observa-se que dentre os pacientes do sexo masculino, 27,8%
tiveram melhora da comorbidade, enquanto que 72,2% saíram curados da cirurgia.
Dentre o sexo feminino 55,3% foram curados caracterizando um resultado
satisfatório em relação ao esperado, quando se submete à cirurgia de vídeo ou
aberta.









Figura 3.1 – A evolução da comorbidade, segundo o sexo.

A Tabela 3.1, nos mostra a distribuição dos pacientes que apresentaram
alguma comorbidade, cruzando a evolução da comorbidade com o tipo de cirurgia.
Ela nos revela que dentre os indivíduos que realizaram cirurgia do tipo vídeo a
maioria teve cura, com cerca de 75%, enquanto dentre os que realizaram cirurgia do
tipo aberta a maioria teve melhora, com um percentual de 58,3%.

Tabela 3.1 – Distribuição do percentual do tipo de cirurgia segundo a evolução da
comorbidade

Evolução da Comorbidade
Total
Curado Melhorado
Tipo de
Cirurgia

Vídeo 75 25 100
Aberta 41,7 58,3 100

72,2
27,8
55,3
44,7
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
%
Masculino Feminino
Curado Melhorado
Probabilidade
Matemática. PIBID/IFPA.
6
Na Figura 3.2, observa-se o lógico, pois a maioria dos pacientes que
apresentaram cura ou melhora, encontram-se no grupo dos que não apresentaram
nenhum tipo de complicação, o que na prática isso é o esperado, quanto menos
complicação, melhor será o resultado final. Esse total de 43 equivale a 76,8% dos
pacientes que apresentaram alguma comorbidade.

Figura 3.2 – A evolução das comorbidades, segundo as complicações cirúrgicas.

A Tabela 3.2 mostra que, o peso inicial médio dos pacientes curados é de
128 , dos pacientes melhorados é 119 , ou seja, a análise da média sugere que
pacientes curados têm peso superior àqueles que saíram melhorados.
Os valores mínimos e máximos do peso dos pacientes curados correspondem
a 90 e 120 , respectivamente, enquanto que os pesos dos pacientes
melhorados variam de 92 a 173 . Fazendo uma análise dos quartis, observa-
se que 25% (
1
) dos pacientes curados possuem pesos menores que 110 e 25%
(
3
) dos pacientes curados possuem pesos maiores que 138 . Analisando os
pacientes melhorados, temos que 25% dos pacientes melhorados possuem pesos
menores que 108 e 25% possuem pesos maiores que 130 .

Tabela 3.2 – Resumo descritivo do Peso segundo a evolução da comorbidade
Média Moda DP Q
1
Q
2
Q
3
Mínimo Máximo
Curado 128 120 27 110 123 138 90 210
Melhorado 119 110 21 108 111 130 92 173

Não Apresentaram Apresentaram
24
19
10
3
0
5
10
15
20
25
Curado Melhorado
Probabilidade
Matemática. PIBID/IFPA.
7
Observando-se a Tabela 3.3, a idade média dos pacientes curados é de 39
anos, com idade mínima de 18 anos e a máxima, 59 anos, já a media de idade dos
pacientes melhorados é de 40 anos, cujas observações mínimas e máximas
correspondem a 25 anos e 58 anos, respectivamente.

Tabela 3.3 – Resumo descritivo da Idade segundo a evolução da comorbidade
Média Moda DP Q
1
Q
2
Q
3
Mínimo Máximo
Curado 39 32 10 31 36 47 18 59
Melhorado 40 31 10 31 40 47 25 58

A Tabela 3.4, mostra que, o IMC (Índice de Massa Corpórea) médio dos
pacientes curados é de 47,36, as observações mínimas e máximas são de 35,1 e
65,7, respectivamente. Já para os clientes melhorados o IMC médio é de 45,13,
cujas observações mínimas e máximas, correspondem a 38,3 e 63,6,
respectivamente.
Fazendo uma análise dos quartis, observa-se que 25% dos pacientes curados
possuem um IMC inferior a 42,45 e 25% possuem um IMC acima de 52,13.
Analisando os pacientes melhorados, 25% desses pacientes possuem um IMC
inferior a 39,6 e 50% dos pacientes melhorados possuem um IMC acima e abaixo de
41,85.
Tabela 3.4 – Resumo descritivo do IMC segundo a evolução da comorbidade
Média Moda DP Q
1
Q
2
Q
3
Mínimo Máximo
Curado 47,36 46,80 7,84 42,45 45,15 52,13 35,1 65,7
Melhorado 45,13 39,6 7,23 39,6 41,85 50,38 38,3 63,6


3.4.2 - Estimando a Probabilidade de Cura
Tabela 3.5 - Variáveis que entraram na Equação.



Coeficiente
Desvio
Padrão Wald
Grau de
Liberdade P-valor. Exp(B)
Constante -.435 .274 2.531 1 .112 .647

Probabilidade
Matemática. PIBID/IFPA.
8
Tabela 3.6 - Variáveis que não entraram na Equação.

As tabelas 3.5 e 3.6, acima nos mostram que o método forward inicia-se com
um modelo apenas com a constante. Em cada passo a variável independente com
maior valor de pontuação (score) é escolhida para entrar no modelo, desde que a
probabilidade de significância do teste seja superior à 5%.

Tabela 3.7 - Variáveis que entraram na Equação.

A Tabela 3.7, mostra a constante e a variável Cirurgia que foi incluída no
passo anterior.

Tabela 3.8 - Variáveis que entraram na Equação.



Score
Grau de
Liberdade p-valor.
Variáveis
Cirurgia 6.389 1 .011
Sexo 1.473 1 .225
Complicações Cirúrgicas 1.865 1 .172
Complicações Clínicas 1.865 1 .172
Idade .774 1 .379
IMC 1.476 1 .224
Overall Statistics
15.575 6 .016




Variáveis

Coeficiente

Desvio Padrão

Wald

Graus de
liberdade

p-valor.

Exp(B)

Cirurgia
1.435 .581 6.091 1 .014 4.200
Constante
-1.099 .408 7.242 1 .007 .333


Variáveis
Coeficiente

Desvio Padrão

Wald

Graus de
liberdade

p-valor

Exp(B)

Cirurgia
2.043 .695 8.629 1 .003 7.711

Complicações Cirúrgicas
1.893 .863 4.814 1 .028 6.637

Constante
-2.848 .929 9.388 1 .002 .058

Probabilidade
Matemática. PIBID/IFPA.
9
A Tabela 3.8, contém a constante, a variável Cirurgia que foi incluída no 1º
passo e passou no teste de exclusão e a nova variável incluída no passo seguinte,
Complicações Cirúrgicas.

Tabela 3.9 - Variáveis e Coeficientes Estimados no Modelo Ajustado.


A Tabela 3.9 mostra o conjunto de variáveis que compõem o modelo ajustado,
com suas respectivas categorias significativas, testadas pela estatística Wald (teste
de significância individual dos parâmetros) e, comprovado pelo p-valor dessa
estatística. As variáveis “Sexo”, “Complicações Clínicas” e “Idade” não foram
estatisticamente significativas para o modelo.

Tabela 3.10 - Teste de ajuste de Pearson, Deviance e Hosmer-Lemeshow.
Método Qui-Quadrado Graus de Liberdade P-valor
Pearson 18,902 19 0,463
Deviance 20,370 19 0,373
Hosmer-Lemeshow 4,577 5 0,470

Observa-se na Tabela 3.10, que as estatísticas de bondade de ajuste são unânimes
na aceitação do modelo, pois os métodos Deviance, Pearson e Hosmer-Lemeshow
indicam com p-valor

0,05 que há evidências suficientes para aceitação do modelo.



Variáveis

Categorias


Coeficientes
Erro
Padrão

Wald

Graus de
liberdade

p-
valor




Cirurgia
Vídeo (0)
Aberta (1) 2.434 .782 9.703 1 .002
Complicações
Cirúrgicas
Não (0)
Sim (1) 1.921 .889 4.671 1 .031
IMC*
Acima de
45 (0)

Abaixo de
45 (1)
1.276 .709 3.243 1 .072
Constante -3.748 1.134 10.918 1 .001
* A variável IMC, só é significativa a 10%.
Probabilidade
Matemática. PIBID/IFPA.
10
Logo, os valores probabilísticos exatos são estimados (P
i
) pela equação:
) 276 , 1 _ 921 , 1 434 , 2 748 , 3 ( exp 1
) 276 , 1 _ 921 , 1 434 , 2 748 , 3 ( exp
) ( ˆ
imc cirurg complic cirurgia
imc cirurg complic cirurgia
X
i
    
   
 


3.4.3 Validação do modelo ajustado.
A Tabela 3.11 apresenta as proporções de acertos de valores previstos com o
modelo ajustado, para diferentes valores do ponto de corte. Observa-se que o corte
45 produz a maior taxa de acerto (75%), e seria escolhido como ponto de corte
otimizado.

Tabela 3.11 - Taxa de acerto de valores previsto com o modelo ajustado
% de corte
Taxa de acerto
do Modelo
30 62,50%
35 62,50%
40 75,00%
45 75,00%
50 73,20%
55 73,20%
60 73,20%

Assim, para fazer a previsão de novos pacientes saírem de uma cirurgia
bariátrica com a classificação de “paciente curado” ou “paciente melhorado”, será
usada a seguinte regra:
- Se a probabilidade estimada for maior que o Score 45, então o paciente será
classificado como “curado”;
- Se a probabilidade estimada for menor que o Score 45, então o paciente será
classificado como “melhorado”;
Vale lembrar que a probabilidade estimada (em percentual) de cura do
paciente é representada pelo valor arredondado da seguinte fração:
= 100 ×

1 +


Probabilidade
Matemática. PIBID/IFPA.
11
4. CONCLUSÃO

A conclusão que pode ser feita a partir de todos os resultados observados é que a
probabilidade estimada de cura das comorbidades dos pacientes, gerada através da
regressão logística, para uma cirurgia de obesidade, é um modelo estatisticamente
válido, cujo poder resultante indica que a aplicação do modelo na prática será capaz
de prever corretamente as possibilidades de um paciente se submeter a uma
cirurgia bariátrica e sair curado ou não de algumas comorbidades, que possam a
aparecer devido a sua obesidade, esse modelo classifica corretamente cerca de
75% dos casos, ou seja, tem 75% de acerto. Esta probabilidade de acerto baseia-se
na validação realizada com os dados utilizados para o ajuste. O modelo ajustado
abaixo mostra que as variáveis que melhor caracterizam o paciente quanto a
“evolução da comorbidade”, foram: Tipo de cirurgia; IMC do paciente e
Complicações cirúrgicas.

) 276 , 1 _ 921 , 1 434 , 2 748 , 3 ( exp 1
) 276 , 1 _ 921 , 1 434 , 2 748 , 3 ( exp
) ( ˆ
imc cirurg complic cirurgia
imc cirurg complic cirurgia
X
i
    
   
 


5. BIBLIOGRAFIA

 BOLFARINE, H. e SANDOVAL, M. C. Introdução à Inferência Estatística, Rio de
Janeiro: SBM, 2001.
 CORDEIRO, M. G.,Modelos Lineares Generalizados, VII SINAPE, Campinas, São
Paulo, 1986;
 PORIES, W. J. K. Surgical treatment of obesity and its effect on diabetes: 10
year follow-up. 2003.
 SORBELLO, A. A., Desmistificando a Obesidade Severa, São Paulo: M. Books,
2005.
 SOUZA, G. S. (1998) Introdução aos Modelos Regressão Linear e Não-Linear.
Brasília, Embrapa 1ª edição.