You are on page 1of 10

MODELAGEM DE ESCOLHA DISCRETA E O MÉTODO DE PREFERÊNCIA

DECLARADA

Péterson Dayan Machado Gonçalves
Pastor Willy Gonzáles Taco
Universidade de Brasília – UnB
Departamento de Engenharia Civil e Ambiental – FT
Programa de Pós-graduação em Transportes

RESUMO
Este artigo trata da utilização da modelagem de escolha discreta e do método de preferência declarada para
auxiliar nas tomadas de decisões a partir do conhecimento do comportamento dos usuários de um determinado
produto ou serviço. Vários estudos na área de transportes podem ser desenvolvidos com auxílio dos métodos de
preferência declarada. Para tanto, são apresentados os conceitos do método e os modelos existentes para
modelagem de escolha discreta como ferramenta de utilização na área de transportes.

ABSTRACT
This article discusses the use of discrete choice modeling and stated preference method to assist in decision
making from the knowledge of the behavior of users of a particular product or service. Several studies in the area
of transport can be developed with the help of stated preference methods. To this end, we present the concepts of
method and models for discrete choice modeling as a tool for use in transport.

1. INTRODUÇÃO
Neste artigo pretende-se apresentar e discutir o método de preferência declarada e a modelagem de
escolha discreta amplamente utilizado nas tomadas de decisões em transportes. Os métodos
apresentados permitem revelar informações importantes e melhorar o conhecimento do
comportamento dos usuários para intervenções políticas mais acertadas.
O método de preferência declarada permite definir o comportamento entre os indivíduos pela coleta de
dados de tal maneira que se torne possível realizar uma modelagem via fatores aleatórios, como a
modelagem de escolha discreta tal como Morikawa (1989).
O objetivo do uso da modelagem de escolha discreta e do método de preferência declarada é de
primeiramente trazer mais informações sobre a opinião dos indivíduos, permitindo assim verificar a
utilidade de um produto ou serviço para a população, e por fim definir as medidas a serem tomadas
para atingir um maior potencial de acordo com a finalidade desejada, ou até mesmo, para evitar gastos
desnecessários.
Os modelos de escolha discreta são apresentados como forma de identificar a evolução da utilização
da modelagem partindo do conceito de utilidade.
2. MÉTODO DE PREFERÊNCIA DECLARADA
A pesquisa de preferência declarada é um experimento estatístico utilizado como alternativa
para coletar e analisar as preferências dos consumidores. Para isso, são combinados atributos
com valores variáveis de forma a cobrir a área de interesse, representando assim cenários
reais.
Estes cenários são apresentados no método de preferência declarada por Novaes et al (1996),
na forma de cartões (textos, esquemas), onde pede-se às pessoas entrevistadas que
classifiquem os cenários em ordem decrescente de preferência. Para isso é feita uma breve
explicação introdutória sobre a pesquisa. Após a coleta de dados é utilizada uma técnica de
calibração para ajustar os coeficientes de uma função utilidade.
O conceito de função utilidade adotado no método de preferência declarada é utilizado para
representar a atratividade das alternativas, oriundo da Teoria do Consumidor (Fergunson,
1976). Utilidade representa a satisfação ou benefício que um indivíduo percebe quando
consome seus recursos em diferentes bens ou serviços (Freitas, 1995).
Vários estudos na área de transportes podem ser desenvolvidos com auxílio dos métodos de
preferência declarada. Entre eles pode-se citar:
a. Estudo sobre as modalidades de transporte público;
b. Desenvolvimento de um busway;
c. Comparação dos sistemas ônibus e VLT (veículo leve sobre trilhos);
d. Sistemas de média e alta capacidade para transporte público;
e. Implantação de parâmetros condicionantes à implementação dos planos e
projetos cicloviários;
f. Análise da demanda por serviços ferroviários e a relação com a qualidade de
serviço prestado;
g. O valor do conforto nos serviços de transporte público urbano;
h. Demandas de viagens a shopping centers e outros pólos geradores de viágens;
i. O valor da "marca" no transporte aéreo.
2.1. PREFERÊNCIA DECLARADA E PREFERÊNCIA REVELADA
Qualquer que seja a forma de modelar a escolha dos usuários de transporte, a sua concepção é
fundamentada, principalmente, no planejamento de coleta de dados de preferência declarada
(PD) e/ou preferência revelada (PR). Os dados de PR representam as escolhas já realizadas
por usuários, portanto, representa o comportamento real de escolha. Os dados de preferência
declarada fornecem informações a respeito da escolha do indivíduo diante de um conjunto de
alternativas previamente definidas, hipotéticas ou não. Morikawa (1989) discute a
estabilidade e a validade dos dados, dividindo-os nos seguintes itens:
2. Questionamentos referentes às decisões em dados de PD e PR. Na confecção dos
questionários o pesquisador recai em quatro possibilidades;
a. “Prominence Hypothesis” onde se considera que o respondente escolhe
observando um ou poucos atributos no seu processo de avaliação da escolha,
desconhecendo que existe o efeito compensado entre os atributos que pode ser
incorporado na escolha;
b. “Policy-Response Bias” onde o respondente presume que poderá se beneficiar
da resposta que der (Morikawa, 1989);
c. Inércia das preferências relativa à situação onde o respondente não consegue
compreender como o novo produto influenciaria na sua vida (Morikawa,
1989); e
d. “Justification Bias” onde o respondente pode querer justificar comportamentos
passados na sua resposta.
3. Descrição imperfeita das alternativas:
a. Omissão de variáveis para simplificação dos questionários;
b. Ao associar a situação com uma imagem pode está perdendo a percepção do
respondente frente à situação vivida e o presente na imagem;
4. Omissão de situações restritas:
a. O respondente pode, consciente ou inconscientemente, ignorar suas restrições
pessoais, uma vez que o questionário se aplica a uma hipótese.
Como descrito acima, os resultados podem vir viesados da forma como os questionários
foram aplicados. Fora isso, cada uma das fontes de dados possui vantagens e limitações.
Ortúzar e Willuemsem, (1997) relatam os principais aspectos limitantes dos dados de PR,
podendo-se destacar:
- A existência de altas correlações entre os atributos, que impede a estimação isolada
dos efeitos dos atributos;
- A dificuldade de estimar variáveis qualitativas; e
- A não possibilidade de avaliar alternativas que ainda não atuam no mercado.
Dessa forma, as lacunas formadas pelas limitações dos dados de PR podem ser preenchidas
pelas vantagens advindas no uso de dados de PD, dentre as quais é possível destacar as
seguintes:
- Permitem o controle dos valores dos atributos através de projetos ortogonais, que
permitem a estimação dos efeitos de cada atributo isoladamente;
- Permitem a análise de variáveis qualitativas, com o alcance de resultados satisfatórios;
- Permitem a análise de alternativas que ainda não existem no mercado atual.
Por outro lado, a principal limitação dos dados de PD consiste no fato de não refletirem o
comportamento atual do mercado, característica peculiar dos dados de PR. Por isso a literatura
recomenda (Swait, Louviere e Williams (1994) e Hensher, Louviere e Swait (2000)), sempre
que viável a modelagem com dados de PR e de PD conjuntamente, pois assim seria possível
ao mesmo tempo unir as vantagens e diminuir as limitações de cada fonte de dados.
Em casos de estudos de previsão de demanda, especificamente, a modelagem conjunta de
dados de PD e PR é condição sine qua non para a obtenção de cenários consistentes. Em
estudos de análise trade-off, que permitem a determinação da importância relativa dos
atributos, é aconselhável somente a utilização de dados de PD (Swait, Louviere e Williams,
1994 e Hensher, Louviere e Swait, 2000).
Os métodos de estimação com dados conjuntos partem do princípio de explorar, por um lado,
as estimações dos efeitos isolados de cada atributo da função de utilidade, obtidas com os
dados de PD, e por outro, informações acerca da divisão atual de mercado, obtidas com os
dados de PR. Esses métodos também são chamados de “métodos de enriquecimento de
dados”. Morikawa (1989), Ben-Akiva e Morikawa (1990), Morikawa, Ben-Akiva e Yamada
(1991) propõem uma forma de juntar diferentes amostras (dados de PD e PR).
3. MODELOS DE ESCOLHA DISCRETA
Segundo Ortúzar e Willumsen (1997), o princípio básico dos modelos de escolha discreta
enuncia que a probabilidade de um indivíduo fazer uma certa opção é função de suas
características sócio-econômicas e da atratividade da alternativa em questão em comparação a
outras.
Os modelos de escolha discreta passaram por uma evolução partindo do conceito de utilidade
aleatória presente no trabalho de Thurnstone (1927), tendo como ponto culminante o axioma
de Luce (1959). Os modelos atuais descrevem de forma mais realista as diferenças entre as
demandas ou utilidades de indivíduos que demanda produtos ou serviços.
McFadden (2000) indica a vantagem do método por poder ser associado à teoria econômica,
principalmente na adequação da abordagem de Lancaster (1966) reduzindo a
dimensionalidade no tratamento de utilidades, não mais por produtos, mas por atributos.
Os modelos de escolha discreta tipo logit passaram por uma evolução do processo de
estimação às formas de aquisição dos dados. Isso propiciou modelos que podem descrever
comportamentos mais heterogêneos entre indivíduos ou entre grupos de indivíduos, com
destaque aos modelos: Multinomial Logit, Nested Logit e Mixed Logit (Train, 2003).
Na atualidade os modelos de escolha discreta tipo logit espacial se propõem a descrever
heterogeneidade entre indivíduos de regiões distintas tal como o Mixed Logit, mas associando
a estrutura espacial ao modelo (Klier e McMillen, 2006).
3.1 O MODELO LOGIT MULTINOMIAL
A função de utilidade que representa o grau de preferência de uma alternativa para certo
indivíduo é definida em função dos valores dos atributos das alternativas e das características
socioeconômicas do indivíduo, tal como na equação 3.1.
) , (
n in in
S z U U =
(3.1)
em que: U
in
:= Utilidade de uma alternativa i para um indivíduo n;
z
in
:= Vetor dos atributos relevantes da alternativa i;
S
n
:= Vetor das características socioeconômicas do indivíduo n;
Dado que a utilidade não pode ser prevista com total certeza, segundo Ben-Akiva e Lerman
(1985) trata-se a utilidade como uma variável aleatória, formada por uma componente
determinística e outra aleatória que reflete as “irracionalidades” da escolha do indivíduo. Esta
abordagem tem como base trabalhos de psicologia, inicialmente propostos por Thurstone em
1927 sobre utilidades aleatórias, onde se presume que os indivíduos não escolhem com 100%
de certeza as coisas, mas com uma idiossincrasia presente no termo erro.
Dessa forma, a utilidade de uma alternativa i para um indivíduo n (U
in
) pode ser representada
pela seguinte expressão:
in in in
V U c + =
(3.2)
Com: U
in
:= Utilidade global de uma alternativa i para um indivíduo n;
V
in
:= Componente sistemática da utilidade de uma alternativa i para um indivíduo n;
c
in
:= Componente aleatória da utilidade de uma alternativa i para um indivíduo n.
A escolha de uma alternativa i em relação à outra j se dá pela comparação entre duas
utilidades tal que j i U U
jn in
= ¬ > , . Como a utilidade possui um componente determinístico e
outro aleatório, a escolha do indivíduo se dará ao satisfazer a inequação descrita abaixo.
] , |
~
~
Pr[
] , | Pr[
] , | Pr[
] , | Pr[ ) , | Pr(
x z
x z
x z
x z x z
j i V
j i V V
j i V V
j i U U j y
in jn jn in
in jn in in
jn in
= ¬ ÷ > =
= ¬ ÷ > ÷ =
= ¬ + > + =
= ¬ > = =
c
c c
c c
(3.3)
Luce (1959) demonstrou, assumindo a parte determinística como uma forma linear descrita na
equação 3.4 e a distribuição de probabilidade dos termos aleatórios valor extremo do tipo II
para
ij
c
( ) ( ) ( )
ij ij
f c c exp exp ( ÷ = , que a probabilidade de escolha tem a forma funcional da
equação 3.4.

ink k in in in in
x x x x V | | | | | + + + + + = ...
3 3 2 2 1 1 0
(3.4)
Onde:
ink
x
: Atributo k da alternativa i para o indivíduo n;
|
0
:= Constante específica da alternativa e representa o efeito de escolha da alternativa
que não está incluída nos efeitos dos atributos;
|
k
:= Peso relativo do atributo
ink
x
na composição da função utilidade.
¿
e
=
) (
) (
h A j
V
V
n
jn
in
e
e
i P
(3.5)
em que: P
n
(i):= Probabilidade de escolha de uma alternativa i por um indivíduo n;
A(n):= Conjunto de alternativas j disponíveis para o indivíduo n;
V
in
:= Utilidade sistemática de uma alternativa i para um indivíduo n;
V
jn
:= Utilidade sistemática de uma alternativa j para um indivíduo n;
Segundo Novaes, et al (1996), algumas formas podem ser utilizadas de forma a ajustar o
modelo proposto, tais como: mínimos quadrados mais busca direta, linearização aproximada,
e máxima verossimilhança.
A estimação do modelo na forma binária é feita com a maximização da função 3.6.
Considerando uma amostra com N observações e definindo y
in
= 1 (se, na observação n, foi
escolhida a alternativa i) ou y
in
= 0 (caso contrário).
¿
=
÷ ÷ + =
N
n
ni
in
ni
in
P y P y LL
1
)) 1 log( ) 1 ( )) log( ) ( (3.6)
Onde: LL:= logarítmo da função de verossimilhança;
P
ni
:= Probabilidade do indivíduo n escolher a alternativa i, expressa em (3.5);
N:= tamanho da amostra.
As estatísticas para avaliar a qualidade de estimação dos modelos da família logit, conforme
Ben-Akiva e Lerman (1985), são as seguintes:
-
) 0 ( L
: valor da função logarítmica de verossimilhança quando todos os parâmetros são
zero;
-
) (c L
: valor da função logarítmica de verossimilhança quando somente a constante
específica da alternativa é incluída. Isto corresponde ao caso onde a probabilidade de
escolha é função apenas da fração de amostra que escolheu a determinada alternativa;
-
) (| L
: valor máximo da função logarítmica de verossimilhança;
-
)) ( ) 0 ( ( 2 | L L ÷ ÷
: estatística utilizada para testar a hipótese de que todos os
parâmetros são zero; é assintoticamente distribuída como
2
_
com k graus de
liberdade, onde k é igual ao número de parâmetros estimados;
-
)) ( ) ( ( 2 | L c L ÷ ÷
: estatística utilizada para testar a hipótese nula de que todos os
parâmetros são zero; é assintoticamente distribuída como
2
_
com k – J +1 graus de
liberdade, onde J é o número de alternativas;
-
2
zero
µ
: mede a fração do valor de verossimilhança explicado pelo modelo, definido
como
(
¸
(

¸

|
|
.
|

\
|
÷
) 0 (
) (
1
L
L |
.
Os valores de
2
zero
µ
dependerão do tipo de modelo a ser construído. Essa medida é mais
adequada na comparação de duas especificações desenvolvidas com o mesmo conjunto de
dados.
Adicional ao modelo logit tradicional, faz-se estimações das mesmas formas funcionais
utilizando da metodologia desenvolvida por Morikawa (1989) e depois a de estimações de
máxima verossimilhança simulada e bayesiana para modelo logit com fatores aleatórios
apresentada por Train (2003).
4. CONCLUSÃO
O método de preferência declarada permite o controle dos valores dos atributos através de
projetos ortogonais, que permitem a estimação dos efeitos de cada atributo isoladamente,
permitindo o alcance de resultados satisfatórios mesmo para as alternativas que ainda não
existem no mercado atual.
A principal limitação dos dados de preferência declarada consiste no fato de não
representarem o comportamento atual do mercado e sim em uma opinião dos usuários de
como seria seus comportamentos diante dos atributos definidos.
As técnicas utilizadas na modelagem de escolha discreta são intensivas em computação,
permitindo a ampliação dos problemas inerentes aos modelos estruturais. Desta forma os
métodos podem revelar informações importantes e melhorar o conhecimento do
comportamento dos usuários para intervenções políticas mais acertadas.
Os métodos de estimação de modelos de escolha discreta evoluíram, podendo gerar ganhos
em estimação pontual, dependendo da função geradora dos dados. Isso propiciou modelos que
podem descrever comportamentos mais heterogêneos entre indivíduos ou entre grupos de
indivíduos.
BIBLIOGRAFIA
Ben-Akiva, M. E., (1973) Structure of Travel Demand Model, Ph.D. Dissertation, Department of Civil
Engineering, MIT.
Ben-Akiva, M. E. e Lerman, S. R. (1985). Discrete Choice Analysis, The MIT Press, EUA.
Ben-Akiva. M. e T. Morikawa (1990) Estimation of Switching Models from Revealed Preferences and Stated
Intentions Transportation Research, 24A, 485-495.
Ferguson, C. E.. (1976). Microeconomia. Rio de Janeiro, 616p.
Freitas, A. A. F. F, (1995). Modelagem Comportamental dos Decisores Através de Técnicas de Preferência
Declarada: Uma Aplicação no Setor Imobiliário de Florianópolis-SC
Hensher, D., J. Louviere, e J. Swait (2000) Stated choice methods: analysis and applications. Cambridge
University.
Hensher, D., J. Louviere, e J. Swait (1999) Combining Sources of Preference Data Journal of Econometrics, 87,
97-221.
Klier, T. e McMillen, D. P., (2006) Clustering of Auto Supplier Plants in the U.S.: GMM Spatial Logit for Large
Samples. Mimeo.
Luce, R. (1959). Individual Choice Behavior. A Theoretical Analysis. Wiley, New York.
Lancaster, K. J. (1966) A New Approach to Consumer Theory. Journal of Political Economy, 74, 132-157.
McFadden, D. L. (2000) Disaggregate Behavioral Travel Demand’s RUM Side A 30-Year Retrospective. -
presentation at the International Association of Travel Behavior Analysts, Brisbane, Australia, July 2,
2000, and at RU2000, Duke University, Aug. 6, 2000.
Morikawa, T. (1989) Incorporating Stated Preference Data in Travel Demand Analysis, Ph.D. Dissertation,
Department of Civil Engineering, MIT.
Morikawa, T., M. Ben-Akiva, K. Yamada (1991) Forecasting Intercity Rail Ridership Using Revealed
Preference and Stated Preference Data. Transportation Research Record, 1328, 30-35.
Novaes, A. G., Efrón, A. J., Granemann, S. R., & Rodriguez, C. T. (1996). Técnicas de Preferência Declarada na
Análise do Nível de Serviço Hoteleiro. Departamento de Engenharia de Produção e Sistemas.
Florianópolis-SC
Swait, J., Louviere, J. & Williams, M. (1994) A Sequential Approach to Exploiting the Combined Strengths of
SP and RP Data: Application to Freight Shipper Choice. Transportation, 21:135-152.
Ortúzar, J. D. e Willumsen, L. G. (1997) Modelling Transport – Second Edition – John Wiley e sons.
Train, K. E., (2003), Discrete Choice Models with Simulation, Cambridge Press.
Thurstone, L. (1927). A Law of Comparative Judgement. Psychological Rev. 34: 273-286.

Péterson Dayan Machado Gonçalves (petersondayan@hotmail.com)
Pastor Willy Gonzáles Taco (pwgtaco@gmail.com)
Universidade de Brasília – UnB
Departamento de Engenharia Civil e Ambiental – FT
Programa de Pós-graduação em Transportes
Campus Universitário Darcy Ribeiro – Faculdade de Tecnologia – Bloco SG-12
CEP 70919-970, Brasília, Brasil