Abordagens e Considerações sobre

Amostragem
CAPÍTULO
CAPÍTULO 8 » ABORDAGENS E CONSÌDERAÇÕES SOBRE AMOSTRAGENS 2 3 7
ÌNTRODUÇÃO
Um censo envolve a coleta de dados de todos os membros de uma populacão. Na maio-
ria das situacões, o censo não é algo exeqüivel. Portanto, extrai-se uma amostra represen-
tativa da populacão.
Uma amostra é um subconiunto relativamente pequeno da populacão. E extraida uti-
lizando-se procedimentos probabilisticos ou não-probabilisticos. Se uma amostra proba-
bilistica suIicientemente grande é extraida, então é possivel Iazerem-se generalizacões e
inIerências estatisticas sobre aquela populacão. Mas é necessario que se considerem com
cuidado as questões de planeiamento da amostragem para garantir que seia extraida uma
amostra representativa.
A amostragem não-probabilística tradicionalmente é utilizada na Iase exploratoria
de um estudo. O obietivo, em tais situacões, é coletar dados rapidamente e a um baixo
custo. Os pesquisadores geralmente não estão interessados em generalizar as descober-
tas para a populacão. Além disso, os proietos não-probabilisticos são amplamente em-
pregados na selecão de individuos para grupos de Ioco e pré-testes de questionarios de
survevs.
O tamanho da amostra é uma importante consideracão no planeiamento da amostra.
Com a amostragem probabilística, a escolha do método de amostragem e o uso de uma
amostra de tamanho apropriado são Iundamentais para a generalizacão das descobertas
a partir da amostra para a populacão.
Neste capitulo, discutiremos os Iundamentos da amostragem. Isso inclui o que é
amostragem, a diIerenca entre proietos de amostragem probabilistica e não-probabilisti-
ca e a determinacão do tamanho da amostra. Daremos exemplos para ilustrar seu uso na
pratica.
AMOSTRAGEM
O proieto da amostragem é parte do processo basico de pesquisa em administracão. O
processo de planeiamento da amostragem envolve responder as seguintes questões: (1)
Deve-se utilizar um censo ou uma amostra? (2) No caso de amostra, qual é a melhor abor-
dagem de amostragem? e (3) Que tamanho deve ter a amostra? Ao responder essas per-
guntas, o pesquisador deve sempre considerar maneiras de minimizar o erro que pode-
ria ocorrer devido ao processo de amostragem.
A pesquisa em administracão envolve a coleta de inIormacões para melhorar a toma-
da de decisões. Essa coleta de inIormacões implica contatar pessoas que conhecam um
determinado topico. ReIerimo-nos ao grupo de pessoas com conhecimento como popu-
lacão ou universo. Uma populacão, portanto, é o total de todos os elementos que com-
partilham algum coniunto comum de caracteristicas. Os elementos em uma populacão
podem ser pessoas, Iarmacias, supermercados, igreias, hospitais, etc. Mas todos os ele-
mentos devem compartilhar um coniunto de caracteristicas que os une. Um censo inves-
tiga todos os elementos de uma populacão. Ja a amostra investiga um pequeno subcon-
iunto da populacão para dai derivar conclusões sobre suas caracteristicas.
Embora seia possivel conduzir um censo completo da populacão, os pesquisadores
em administracão raramente o Iazem. Contatar a populacão inteira seria dispendioso e de-
morado. Quase sempre é diIicil, ou mesmo impossivel, localizar todos os elementos (pes-
soas, obietos, empresas, etc). Além disso, o uso dos elementos pode destrui-los. Por exem-
plo, testes de controle de qualidade de produtos, como remédios, lubriIicantes, substân-
cias quimicas, etc, sempre usam a amostragem, pois os testes destroem o produto.
238 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
Amostras adequadamente selecionadas oIerecem inIormacões suIicientemente preci-
sas para serem usadas na decisão administrativa. Com a amostragem probabilistica, os
pesquisadores em administracão, no minimo, conseguem calcular o erro associado com
um determinado proieto de amostragem e podem tomar decisões com base nesse conhe-
cimento. Com a amostragem não-probabilistica, os pesquisadores não conseguem calcu-
lar o erro, mas Iazem iulgamentos com base em inIormacões em um esIorco para obter
dados de amostra utilizaveis. No estudo de caso deste livro, Phil Samouel teve que tomar
decisões quanto a amostragem para sua survev de clientes. Antes de realizar a survev. Phil
teve que deIinir seu problema de pesquisa. Seu restaurante grego tem um sucesso razoa-
vel, mas não tanto quanto ele esperava inicialmente. O Gino's Italian Ristorante, seu
maior concorrente, esta se saindo muito melhor em atrair e manter clientes. Phil gostaria
de saber por quê. Para compreender totalmente a situacão, ele devera conhecer as percep-
cões de Iuncionarios e clientes. Ele decidiu realizar uma survev dos clientes de ambos os
restaurantes, bem como uma outra de seus proprios Iuncionarios. As survevs dos clientes
Ioram Ieitas na saida dos restaurantes e a dos Iuncionarios consistiam de entrevistas com-
pletas com o maior numero possivel de empregados dentro do periodo de tempo estipu-
lado.
Phil Samouel concluiu que a realizacão de um censo com a coleta de inIormacões de
todos os elementos (individuos) da populacão alvo seria impossivel. No caso da survev
de clientes, isso exigiria tomar inIormacões de todos os clientes potenciais de restauran-
tes na cidade de Nova York. Mas, como Nova York tem uma populacão de mais de dez
milhões de pessoas, um censo não é algo realista. Um censo é exeqüivel se a populacão
é pequena e relativamente Iacil de contatar em um curto periodo de tempo. Por exem-
plo, muitas populacões business-to-business são pequenas (por exemplo, executivos de in-
dustrias quimicas ou compradores de Iabricantes de papel). Mas, com estudos do con-
sumidor, na maior parte dos casos, a populacão é grande, e alguma Iorma de amostra-
gem torna-se necessaria.
Uma amostra deve ser representativa da populacão da qual é extraida. Em outras pa-
lavras, a amostra deve reIletir as caracteristicas da populacão, assim minimizando os er-
ros associados com a amostragem. O planeiamento da amostragem adequada deve atin-
gir esse obietivo.
PROCESSO DE AMOSTRAGEM
Amostras representativas em geral são obtidas seguindo-se um coniunto de procedimen-
tos bem deIinidos. Estes incluem os seguintes passos:
1. DeIinicão da populacão alvo.
2. Selecão da estrutura de amostragem.
3. Selecão do método de amostragem.
4. Determinacão do tamanho da amostra.
5. Implementacão do plano de amostragem.
Discutiremos cada um desses passos nos paragraIos a seguir.
Os pesquisadores em administracão devem auxiliar seus clientes a tomar decisões
quanto a cada um desses passos. Mas muita aiuda pode ser conseguida em empresas es-
pecializadas no trabalho com pesquisadores para obtencão de uma amostra representati-
va. Uma das empresas de amostragem mais conhecidas nos Estados Unidos é descrita na
secão Pesquisa em acão .
CAPÍTULO 8 » ABORDAGENS E CONSÌDERAÇÕES SOBRE AMOSTRAGENS 2 3 9
PESQUISA EM AÇÃO
AMOSTRAGEM DE SURVEY ON-LINE
Por mais de 24 anos, a Survey Sampling Inc. (SSI) tem oIerecido amostras a pesquisadores, especia-
listas em marketing. pesquisadores de opinião publica e organizacões de pesquisa. Percebendo as
possibilidades de pesquisa através da Internet, a SSI (www.surveysampling.com) atualmente utili-
za survevs na Web, assim como os métodos mais tradicionais para contato com respondentes, como
teleIone, correio e entrevistas pessoais. Para realizar survevs na Web com sucesso, a SSI compreen-
deu que diversos Iatores, incluindo haraware. software. apresentacão do questionario e amostragem
adequada, devem ser levados em consideracão. Com isso em mente, a SSI atende a necessidade de
amostras por e-mail (eSamples) com dois tipos de servicos, o SurveySpot Panei‡ e o SSI-LIT eSam-
ples (Amostragem de Baixa Incidência).
O SurveySpot‡ Panei da SSI da aos pesquisadores acesso a um painel de varias Iontes na Internet
de pessoas interessadas em participar de pesquisa on-line. Como os participantes do SurveySpot‡
vêm de varias Iontes, incluindo anuncios embanners. métodos de recrutamento online e recrutamento
RDD (Discagem Digital Aleatoria), esse servico pode proporcionar maiores taxas de resposta do que
as obtidas por meio de outras Iontes. Os integrantes do SurveySpot‡ podem ser reunidos por escola-
ridade, grupo étnico, gênero, renda, ocupacão e raca - e os membros de uma Iamilia que moram na
mesma economia doméstica podem ser reunidos por idade e gênero.
As eSamples SSI-LIT são proietadas para permitir que os pesquisadores conduzam pesquisas di-
rigidas, especialmente quando segmentos de baixa incidência são obietivados pelos estudos. Os par-
ticipantes podem ser reunidos segundo centenas de categorias de estilo de vida, incluindo exposi-
cão a comerciais, escolaridade, Iamilia, saude, hobbies. Internet e viagens.
Os participantes do SurveySpot‡ e do SSI-LIT provêm de diversas Iontes e são recrutados por
meio de uma série de técnicas para consentimento. Os arquivos são criados a partir de inIormacões
especiIicas relatadas pelo proprio respondente, o que da aos pesquisadores a vantagem de atingir
os alvos exatos que procuram, ia que o respondente demonstra seu interesse especiIico. Além disso,
como os participantes concordam em ser procurados através de e-mail de acordo com areas de inte-
resse especiIicas, eles sempre cooperam quando recebem um convite de survev do eSample.
O processo para o eSampling da SSI é muito simples. Quando um pesquisador contrata os ser-
vicos da SSI, a empresa convida, através de e-mail. individuos selecionados de acordo com pré-re-
quisitos de qualiIicacão para participar de uma survev localizada no site do pesquisador. A SSI não
coleta os dados, uma vez que a empresa opera em uma posicão sem concorrência no processo de
pesquisa em marketing. Todos os dados são coletados no site do proprio pesquisador. A SSI pode ad-
ministrar a inIra-estrutura, os servidores, o haraware. o software e o cronograma do estudo. A empre-
sa também esta equipada para administrar a selecão aleatoria de ganhadores de prêmios e a organi-
zacão de gratiIicacões em dinheiro.
Com o acréscimo das survevs pela Web, a SSI continua sua missão de oIerecer amostras de qua-
lidade para proietos de pesquisa. Através das eSamples, a SSI garante um baixo custo aos pesquisa-
dores por entrevista com amostras nacionais e internacionais reunidas de acordo com demograIia,
estilo de vida e topicos de interesse.
Definição da população alvo
Os obietivos da pesquisa e o escopo do estudo são essenciais na deIinicão da populacão
alvo que sera estudada. A populacão alvo é o grupo complet o de obietos ou elementos re-
levantes para o proieto de pesquisa. São relevantes porque possuem as inIormacões que
o proieto de pesquisa se propõe a coletar. Outros Iatores praticos podem inIluenciar a de-
Iinicão da populacão alvo. Estes incluem o conhecimento do topico de interesse, acesso aos
elementos (individuos, empresas, et c) , disponibilidade dos elementos e de tempo. Os
elementos ou obietos disponiveis para selecão durant e o processo de amostragem são co-
nhecidos como unidades de amostragem. As uni dades de amostragem podem ser pes-
soas, economias domésticas, partes do censo, empresas ou qualquer uni dade logica relê-
240 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
vante para o obietivo do estudo. Quando o plano de amostragem é executado, as unida-
des de amostragem são retiradas da populacão alvo para serem usadas nas estimativas
das caracteristicas da populacão. A Figura 8-1 deIine uma populacão alvo para uma pes-
quisa de Iuncionarios de um banco regional que participam de um plano de incentivos.
Escolha da estrutura de amostragem
A estrutura de amostragem oIerece uma deIinicão operacional da populacão alvo. A es-
trutura de amostragem é uma lista abrangente dos elementos de onde a amostra é retira-
da. Exemplos de estruturas de amostragem são a lista de restaurantes das Paginas Ama-
relas, o catalogo teleIônico, lista interna de Iuncionarios e/ou clientes de uma empresa,
catalogos eletrônicos disponiveis em CD-ROM ou na Internet e até mesmo listas de ma-
tricula de universidades. Uma estrutura de amostragem é, portanto, uma lista o mais
completa possivel de todos os elementos da populacão de onde a amostra é retirada.
De modo ideal, a estrutura de amostragem é uma lista precisa e completa de todos os
elementos da populacão obietivada pela pesquisa. Na realidade, uma estrutura de amos-
tragem com Ireqüência apresenta diversas Ialhas:
‹ Pode não estar atualizada.
‹ Pode incluir elementos que não pertencem a populacão alvo.
‹ Pode não incluir elementos que realmente pertencem a populacão alvo.
‹ Pode ter sido compilada a partir de varias listas e conter elementos repetidos co-
mo resultado da maneira como Ioi elaborada.
Antes de extrair uma amostra de uma lista de estrutura de amostragem, o pesquisa-
dor deve, deste modo, conIirmar a precisão da lista, não importa sua origem. Isso sera
discutido na proxima secão, que lida com as questões de planeiamento.
Seleção do método de amostragem
A selecão do método de amostragem a ser empregado em um estudo depende de uma sé-
rie de questões teoricas e praticas relacionadas. Estas incluem a consideracão da nature-
za do estudo, seus obietivos e o tempo e o orcamento disponiveis.
Os métodos de amostragem tradicionais podem ser divididos em duas categorias
amplas: probabilisticos e não-probabilisticos. Os métodos probabilisticos são baseados na
premissa de que cada elemento da populacão alvo tem uma probabilidade conhecida,
mas não necessariamente igual, de ser selecionado para uma amostra. Na amostragem
probabilistica, os elementos são selecionados aleatoriamente e a probabilidade de ser se-
lecionado é determinada antecipadamente pelo pesquisador. Se Ieita de modo adequado,
a amostragem probabilistica garante a representatividade da amostra.
Com a amostragem não-probabilistica, a inclusão ou exclusão de elementos em uma
amostra Iica a critério do pesquisador. Em outras palavras, nem todo elemento da popu-
lacão alvo tem chance de ser selecionado para a amostra. Apesar disso, um processo de
FIGURA 8-1 POPULAÇÃO ALVO DE FUNCIONÁRIOS COM PAGAMENTO DE INCENTIVOS
EIemento Funcionários com pagamento de incentivos
Unidade de amostragem Representantes de atendimento aos clientes e gerentes de filiais
AIcance Todas as filiais no estado do Texas
Período Março de 2003
CAPÍTULO 8 ‹ ABORDAGENS E CONSÌDERAÇÕES SOBRE AMOSTRAGENS 241
selecão habilidoso pode resultar em uma amostra razoavelmente representativa. Com
representativa , queremos dizer que ela representa o iulgamento do pesquisador quan-
to ao que ele deseia, mas sem estar baseado no acaso. Os tipos mais comuns de métodos
de amostragem são mostrados na Figura 8-2.
Amostragem probabilística
Ao extrair-se uma amostra probabilistica, a selecão de elementos é baseada em algum
procedimento aleatorio que lhes da uma chance conhecida de serem selecionados, as-
sim minimizando a tendenciosidade de selecão. A amostragem probabilistica geral-
mente envolve a tomada de grandes amostras que seiam consideradas representativas
da populacão alvo de onde são retiradas. As descobertas baseadas em uma amostra
probabilistica podem ser generalizadas para a populacão alvo com um nivel especiIico
de seguranca. As técnicas de amostragem probabilistica mais empregadas são descritas
como segue:
Amostragem aleatória simples Esse é um método direto de amostragem que atribui a
cada elemento da populacão alvo uma igual probabilidade de ser selecionado. Tirar no-
mes de um chapéu ou sortear o numero ganhador de uma riIa são exemplos de amostra-
gem aleatoria simples. E Iacil retirar nomes ou numeros de um chapéu quando você tem
uma pequena amostra de uma populacão. Mas quando a populacão alvo é grande, outras
abordagens são necessarias.
Um método popular de amostragem aleatória simples é o das ligacões para nume-
ros aleatorios em survevs por teleIone. Essa técnica é usada porque supera a tendenciosi-
dade introduzida quando os catalogos teleIônicos não incluem listas recentes ou nume-
ros que não são revelados. InIelizmente, tem a desvantagem da digitacão de numeros ine-
xistentes bem como das recusas em atender o teleIone. De Iato, o telemarketing criou um
enorme problema na taxa de recusas em atender o teleIone nos Estados Unidos. Ha dez
anos atras, os pesquisadores em administracão conseguiam realizar entrevistas teleIôni-
cas usando uma amostra de 4 para 1 para a razão de realizacão (razão de realizacão ÷ ini-
cio com amostra total de 2.000 nomes para completar uma amostra de 500: isto é, 1.500
pessoas recusavam, não atendiam o teleIone, etc). Hoie, essa razão é muitas vezes de 10
para 1 (inicio com 5.000 nomes para completar 500 entrevistas). Parte do problema certa-
mente é o Iato de que os respondentes potenciais não estão em casa, não têm tempo ou
não estão interessados no topico. Mas a tecnologia, como os identiIicadores de chamadas,
e outras questões, como o simples deseio de não ser incomodado, estão tendo um impac-
to substancial sobre as taxas de realizacão de survevs.
O procedimento para extracão de grandes amostras envolve os seguintes passos:
1. Seqüencialmente atribuir um numero unico de identiIicacão para cada elemen-
to na amostragem.
TÌPOS DE MÉTODOS DE AMOSTRAGEM
Probabilísticos Não-probabilísticos
Aleatória simples Conveniência
Sistemática Julgamento
Estratificada Bola-de-neve / Referência
Conglomerado Quota
Vários estágios
FIGURA 8-2
242 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
2. Usar um gerador de numeros aleatorios para identiIicar os elementos adequa-
dos a serem selecionados para a amostra.
3. CertiIicar-se de que nenhum elemento seia selecionado mais de uma vez.
Pacotes de software como o SPSS executam os passos descritos acima para você. Se o
tamanho da amostra determinado é suIicientemente grande e o planeiamento da amos-
tragem é adequadamente executado, a amostra resultante é representativa da populacão
alvo. Na Figura 8-3, ilustramos a seqüência de cliques em SPSS para extracão de uma
amostra aleatoria de 50 casos dos 100 clientes do Samouel's que constam em nosso banco
de dados sobre restaurantes. Se você não esta Iamiliarizado com SPSS, va ao Apêndice 1-
C, onde Iornecemos uma explicacão mais detalhada de como utilizar esse softivare.
Amostragem sistematica A amostragem sistematica é um processo que envolve a sele-
cão aleatoria de um ponto de partida em uma lista, sendo que, depois, todo elemento cor-
respondente a um determinado numero ordinal na estrutura de amostragem é seleciona-
do. Por exemplo, suponha que você possui uma lista de 10.000 estudantes de uma deter-
minada universidade e deseia obter uma amostra de 500 estudantes. Seu obietivo de
amostragem é uma secão transversal representativa do corpo discente. Para extrair a
amostra, você deve determinar seu tamanho e então calcular o intervalo de amostragem
- o numero de elementos da populacão entre cada unidade selecionada para sua amos-
tra. Neste caso, o intervalo de amostragem é 20. (10.000 estudantes / amostra de 500 ÷
20). Para extrair a amostra, você aleatoriamente seleciona um numero entre 1 e 20 como
ponto de partida. Por exemplo, digamos que você aleatoriamente escolheu o numero 7:
assim, a amostra seria Iormada pelos elementos de amostragem de numeros 7,27,47,67,
etc. Na Figura 8-4, mostramos como desenvolver um procedimento de amostragem siste-
matica para a survev de clientes do restaurante Samouel's.
USO DE SPSS PARA SELEÇÃO DE AMOSTRA ALEATÓRIA
Nosso objetivo de amostragem é extrair uma amostra de 50 clientes do Samouel's Creek Cuisine en-
trevistados na survey. Cada uma das 100 entrevistas representa uma unidade de amostra. A estrutura
de amostragem é a lista de 100 clientes do Samouel's incluída no banco de dados do restaurante. A
seqüência de cliques em SPSS para selecionar a amostra aleatória é: DATA ‰> SELECT -> CASES ‰>
RANDOM -> SAMPLE -> OF -> CASES -» SAMPLE -> EXACTLY -> "50" CASES -> FROM THE FÌRST
"100" CASES ‰> CONTÌNUE ‰> OK. Nessa seqüência, você deve clicar em cada uma das opções e
colocar 50 na caixa "casos" e 100 na caixa "a partir dos primeiros casos". As entrevistas (casos)
não incluídas na amostra aleatória são indicadas por "/" através do número "ÌD" de caso na extremi-
dade esquerda da tela do computador.
Qualquer análise de dados realizada com a amostra aleatória será baseada apenas na amostra
aleatória de 50 clientes do Samouel's. Por exemplo, a tabela abaixo mostra o número e a porcenta-
gem de clientes ocasionais, pouco assíduos e muito assíduos do restaurante Samouel's que foram in-
cluídos na amostra. Os dados na coluna de freqüência indicam que selecionamos 27 clientes ocasio-
nais, 10 clientes pouco assíduos e 13 clientes muito assíduos para um total de 50 clientes. Essa tabe-
la é um exemplo do que você pode obter quando usa o software SPSS. Uma introdução ao uso des-
se software é apresentada no Apêndice 1 -C deste livro.
X
18
- Freqüência de cIientes
CAPÍTULO 8 « ABORDAGENS E CONSÌDERAÇÕES SOBRE AMOSTRAGENS 2 4 3
SELEÇÃO DE AMOSTRA ALEATÓRIA SISTEMÁTICA DE CLIENTES DO RESTAURANTE
SAMOUEL S GREEK CUI SI NE
Nos últimos quatro anos, Phil Samouel compi l ou uma lista de 1.030 clientes dispostos em ordem al-
fabética. Uma amostra sistemática da opi ni ão de 100 clientes é seu objetivo de pesquisa. Tendo op-
tado por um tamanho de amostra de 100 a ser selecionado a partir da estrutura de amostra de 1.030
clientes, Phil cal cula o tamanho do intervalo entre elementos sucessivos da amostra computando
1.030 / 100. O tamanho do intervalo é determinado dividindo-se o tamanho da popul ação alvo (es-
trutura de amostragem) pelo tamanho de amostra desejado (1.030 / 100 = 10,3). Em situações como
essa, temos um número decimal em vez de um inteiro, arredonda-se o decimal para seu inteiro mais
próxi mo. Assim, efetivamente di vi dimos a estrutura de amostragem em 100 intervalos de 10. Dos nú-
meros no intervalo de 1 a 10, devemos selecionar um número para identificar o primeiro elemento
da amostra sistemática. Se, por exempl o, esse número fosse 4, começaríamos com o quarto el emen-
to da estrutura de amostragem e seria selecionado cada elemento na décima posição a partir daí. O
ponto de partida seria o quarto elemento e os elementos restantes selecionados para a amostra seriam
o déci mo quarto, o vigésimo quarto, o trigésimo quarto e assim por diante até o número final esco-
l hi do, o 1.024°. Ìsso resultaria em uma amostra de 103 elementos a serem entrevistados.
A amostragem sistematica produz dados representativos se adequadamente executa-
da. Para trabalhar de Iorma apropriada, o intervalo de amostragem deve dividir a estru-
tura de amostragem em grupos relativamente homogêneos. Se houver uma seqüência ci-
clica para a estrutura de amostragem em vez de uma seqüência aleatoria, a amostragem
sistematica não Iuncionara. Por exemplo, as listas alIabéticas são consideradas aleatorias
e não ciclicas. Por outro lado, se quiséssemos realizar entrevistas semanais com os clien-
tes do Samouel's e nosso intervalo Iosse 7, a amostra produziria inIormacões tendencio-
sas, pois sempre entrevistariamos no mesmo dia da semana. Para serem verdadeiramen-
te aleatorias, as entrevistas devem ser conduzidas pelo menos em varios dias diIerentes
da semana. Também, se nossa lista de 1.030 clientes do Samouel's Ior organizada de acor-
do com a Ireqüência com que eles visitam o restaurante e as primeiras cem pessoas dessa
lista comerem no Samouel's pelo menos uma vez por semana e as 930 restantes Ireqüen-
tarem o restaurante numa média de quatro vezes por ano, teriamos um problema com o
uso da amostragem sistematica. Se o intervalo de amostragem é 10 e o tamanho de nossa
amostra é 103, então nossa amostra não representa adequadamente os clientes assiduos
(somente 10 clientes Ireqüentes) e representa para mais os clientes menos assiduos (93
clientes não-Irequentes). Assim, devemos saber antecipadamente se ha padrões sistema-
ticos subiacentes nos dados de modo que possamos explica-los em nosso plano de amos-
tragem.
Amostragem estratificada Essa abordagem de retirada de amostra da populacão alvo
exige que o pesquisador divida a populacão alvo em subgrupos relativamente homogê-
neos distintos e não-sobrepostos chamados estratos. O pesquisador geralmente Iaz a es-
tratiIicacão com base em alguns critérios predeterminados que podem resultar de sua ex-
periência prévia ou que podem até mesmo ser especiIicados pelos clientes. Por exemplo,
em sua survev. Phil Samouel poderia querer estratiIicar seus clientes com base em carac-
teristicas como idade, estado civil, tamanho da Iamilia, niveis de renda, assiduidade, ni-
veis de satisIacão ou alguma combinacão desses Iatores.
O pesquisador determina o tamanho total da amostra bem como os tamanhos de
amostra necessarios para cada um dos estratos individuais. Por exemplo, o tamanho to-
tal da amostra poderia ser 400, e os quatro estratos individuais poderiam ter cada uma
amostra de 100. A amostra estratificada é composta pelas amostras tomadas dos estratos.
Os elementos para a amostra estratiIicada geralmente são selecionados retirando-se
amostras sistematicas ou aleatorias simples do tamanho especiIicado a partir dos estratos
da populacão alvo. Com a amostragem estratiIicada, os elementos devem ser seleciona-
dos a partir de todos os subconiuntos (estratos) da populacão alvo. Quando adequada-
FI GURA 8-4
2 4 4 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
mente executada, a amostragem estratiIicada aumenta a precisão das inIormacões da
amostra, sem necessariamente elevar o custo. Na pratica, uma amostra estratiIicada é se-
lecionada de uma destas Iormas: amostragem estratiIicada proporcional ou amostragem
estratiIicada desproporcional. A seguir, apresentamos descricões de cada uma dessas
abordagens:
Na amostragem estratificada proporcional, o tamanho total da amostra sera o total
de todos os elementos de cada um dos estratos. O numero de elementos escolhidos de ca-
da estrato é proporcional ao tamanho de um determinado estrato em relacão ao tamanho
total da amostra. Assim, se tivermos um estrato que corresponde a 25° da populacão al-
vo, então o tamanho da amostra para esse estrato sera 25° da amostra total. Por exemplo,
se usarmos a amostragem estratiIicada proporcional para selecionar uma amostra de ho-
mens e mulheres em uma universidade com 10.000 alunos, sendo que 6.000 são mulheres
e 4.000 são homens, então a amostra incluira 60° de mulheres e 40° de homens.
Na amostragem estratificada desproporcional, ha duas maneiras para escolher os
elementos da amostra. Uma abordagem envolve a escolha de elementos de um estrato de
acordo com sua importância relativa. A importância relativa geralmente baseia-se em
consideracões praticas, tais como a importância econômica de diversos estratos. Por
exemplo, se o restaurante de Samouel estivesse localizado em uma area onde predomi-
nam individuos mais velhos que comem Iora com menos Ireqüência, a amostragem de
uma maior proporcão de clientes mais iovens que comem Iora com mais Ireqüência seria
vista como mais importante para ele. Isso aparece ilustrado na coluna da extremidade di-
reita da Figura 8-5.
Com uma amostragem estratiIicada desproporcional baseada em razões econômicas
ou em outros aspectos, o tamanho da amostra de cada estrato é determinado indepen-
dentemente, sem considerar o tamanho do estrato em relacão ao tamanho total da amos-
FI GURA 8-5
OU DESPROPORCIONAIS?
Phil Samouel, proprietári o do restaurante Samouel's Greek Cuisine, tem uma lista de 3.000 clientes
potenciais di vidi da por idade. Seu consultor administrativo determi nou, através do uso de uma fór-
mula estatística, que uma amostra estratificada proporcional de 200 produzirá informações suficien-
temente precisas para a tomada de decisão. O número de elementos a serem escolhidos de cada es-
trato utilizando-se uma amostra proporci onal é mostrado na quarta col una da tabela. Mas, se o con-
sultor acreditasse que seria necessário que o tamanho da amostra em cada estrato fosse relacionado
com a importância econômi ca, sendo que o grupo de freqüentadores mais assíduos e que mais gas-
tam comendo fora é composto pelos indivíduos com idades entre 18 e 49 anos, então o número de
elementos selecionados seria desproporcional ao tamanho do estrato, como está ilustrado na quinta
col una. Os números na col una desproporcional seriam determinados com base no j ul gament o do
pesquisador quanto à importância econômica de cada estrato.
Número de eIementos
seIecionados para a amostra
O QUE É MELHOR: AMOSTRAS ESTRATIFICADAS PROPORCI ONAI S
CAPÍTULO 8 * ABORDAGENS E CONSÌDERAÇÕES SOBRE AMOSTRAGENS 2 4 5
tra. Quanto mais importante um determinado estrato Ior considerado, maior sera a pro-
porcão dos elementos de amostra selecionados a partir dele.
Uma outra abordagem para selecão de uma amostra estratiIicada desproporcional
considera a variabilidade dos dados de cada estrato. Elementos de cada estrato são sele-
cionados com base em sua variabilidade relativa. Os estratos com alta variabilidade rela-
tiva contribuirão com uma maior proporcão de elementos para a amostra total (composi-
cão). De Iorma semelhante, quanto menor a variabilidade de um estrato, menor sua re-
presentacão proporcional na amostra composta. Por exemplo, suponhamos que a univer-
sidade com 10.000 alunos tem 50° de estudantes homens e 50° de estudantes mulheres.
Sabemos que quase todos os homens bebem cerveia e que ha uma grande variacão nos
habitos de consumo dessa bebida, com alguns bebendo cerveia todos os dias e um peque-
no numero que nunca bebe. Por outro lado, somente uma pequena proporcão das alunas
bebe cerveia e com pouca Ireqüência (as alunas preIerem vinho), de modo que não ha
muita variacão em seus padrões de consumo dessa bebida. Nesse exemplo, teriamos uma
amostra com um maior numero de alunos em nossa pesquisa para que pudéssemos re-
presentar com mais exatidão os padrões de consumo de cerveia entre individuos do sexo
masculino. Como as estudantes não variam muito em seus habitos de consumo de cerve-
ia, a menor amostra de mulheres ainda representaria seu comportamento com exatidão.
Amostragem por conglomerado Na amostragem por conglomerado, a populacão alvo
é vista como sendo Iormada por grupos chamados de conglomerados. Os conglomerados
são grupos relativamente homogêneos e naturalmente Iormados, podendo ser vistos co-
mo uma populacão ou subpopulacão por si proprios. Assim, dentro de cada conglomera-
do, os elementos de amostragem devem ser heterogêneos e podem ser considerados re-
presentativos da populacão alvo. Em contraste com a amostragem estratiIicada, em que
amostras de todos os estratos devem ser retiradas, na amostragem por conglomerado os
conglomerados individuais (subpopulacões) em que ocorre a amostragem são escolhidos
aleatoriamente: portanto, nem todos os conglomerados passam pela retirada de amostra.
Uma vez que os conglomerados são aleatoriamente selecionados, então, dependendo de
seu tamanho, as inIormacões são coletadas a partir de uma amostra aleatoria de elemen-
tos se o conglomerado Ior grande ou de todos os elementos se ele Ior pequeno. Exemplos
de conglomerados são os grupos étnicos, o coniunto de subsidiarias de uma empresa,
areas Iuncionais de uma empresa, unidades empresariais ou areas geograIicas.
O tipo de amostragem por conglomerado mais Ireqüentemente utilizado é o da area
geograIica. Por exemplo, suponhamos que você queira entrevistar gerentes de Iarmacias
da região sul de Houston, Texas. Não ha lista de Iarmacias nem de gerentes a disposicão.
O pesquisador poderia obter uma lista de areas de codigo postal ou de registros do cen-
so, sendo cada uma delas considerada um conglomerado. Os conglomerados de onde se
retirariam amostras seriam aleatoriamente selecionados e todos os gerentes ou uma
amostra aleatoria de gerentes de Iarmacia seriam entrevistados em cada conglomerado
selecionado. Esse processo em geral Iunciona bem e produz dados representativos, mas
os conglomerados devem ser relativamente homogêneos. Por exemplo, se as atitudes e
experiências em um determinado conglomerado são muito semelhantes, como muitas
vezes o são em areas geograIicas dentro de uma cidade, o pesquisador deve escolher um
numero maior de conglomerados de onde retirar amostras e tentar usar conglomerados
que têm caracteristicas diversas.
O procedimento para tomada de amostra de um conglomerado é o seguinte:
1. DeIinir as caracteristicas do conglomerado de modo a assegurar que os conglo-
merados seiam identiIicados sem ambigüidade na populacão alvo. Dessa ma-
neira, o numero total de conglomerados na populacão sera conhecido antecipa-
damente.
2 4 6 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
3. Escolher o(s) conglomerado(s) de maneira aleatoria.
4. Obter uma estrutura de amostragem para os conglomerados escolhidos.
la tomada de uma amostra probabilistica do(s) conglomerado(s).
amostra. Se mais de um conglomerado Ior usado, então o tamanho da amostra
devera ser distribuido adequadamente. Isso em geral é Ieito com base em uma
amostragem proporcional.
A Figura 8-6 explica como Phil Samouel poderia usar um processo de amostragem de
conglomerado para identiIicar os clientes relevantes para a entrevista.
Amostragem por conglomerado de vários estágios O que discutimos anteriormente Ioi
a amostragem por conglomerado de estagio unico. Envolvia a divisão da populacão em
conglomerados, selecionando aleatoriamente um numero pré-especiIicado de conglome-
rados e coletando inIormacões de todos os elementos de cada um dos conglomerados ou
de uma amostra aleatoria. A amostragem por conglomerado de vários estágios envolve
uma seqüência de estagios. O primeiro estagio exige a selecão aleatoria de conglomera-
dos (unidades de amostragem primaria). No segundo estagio, uma selecão aleatoria de
conglomerados é Ieita a partir de um segundo coniunto de conglomerados menores (uni-
dades de amostragem secundaria). Quando o processo é interrompido nesse ponto, é
chamado de amostragem por conglomerado de dois estagios. Mas proietos mais comple-
xos envolvendo três ou mais estagios também são possiveis.
Amostragem não-probabilística
Na amostragem não-probabilistica, a selecão de elementos para a amostra não é neces-
sariamente Ieita com o obietivo de ser estatisticamente representativa da populacão. Ao
contrario, o pesquisador usa métodos subietivos, tais como sua experiência pessoal, con-
veniência, conhecimento especializado, et c, para selecionar os elementos da amostra.
Como resultado, a probabilidade de um elemento da populacão ser escolhido não é co-
nhecida. Além disso, não ha métodos estatisticos para mensurar o erro de amostragem
para uma amostra não-probabilistica. Assim, o pesquisador não pode generalizar as des-
cobertas para a populacão alvo com um grau mensurado de seguranca, o que é possivel
corn amostras probabilisticas. Isso não signiIica que amostras não probabilisticas não de-
Phil Samouel gostaria de saber as percepções de seus clientes de fi m de semana, pois o valor médi o
gasto por essas pessoas em refeições (para todos os clientes em uma determinada conta) é de 124 dó-
lares, isso contrasta com o valor médio de somente 68 dólares durante a semana. Para esse projeto de
pesquisa, um conglomerado é definido com os clientes que freqüentam o restaurante nos finais de se-
mana. Ìsso resultará em 52 conglomerados (um para cada semana) dos quais uma amostra aleatória
de conglomerados (fins de semana) pode ser retirada. Há duas opções possíveis agora. Todos os cl ien-
tes dos conglomerados escolhidos para amostra podem ser entrevistados, tendo-se, então, a realiza-
ção de um censo. Por outro lado, podem-se retirar elementos (clientes) da amostra de conglomerados
através de um dos métodos de amostragem probabilística ou de amostragem não-probabilística dis-
cutidos no texto.
2. Decidir de quantos conglomerados retirar amostra.
5. Decidir pela realizacão de um censo no(s) conglomerado(s) escolhido(s) ou pe-
6. Se uma amostra probabilistica Ior deseiada, determinar o tamanho total da
AMOSTRAGEM POR CONGLOMERADO DE CLIENTES DE RESTAURANTE |
FIGURA 8-6
CAPÍTULO 8 » ABORDAGENS E CONSÌDERAÇÕES SOBRE AMOSTRAGENS 2 4 7
vem ser utilizadas. De Iato, em algumas situacões, elas podem ser a alternativa preIeri-
vel. Os métodos de amostragem não-probabilistica mais comumente usados serão des-
critos a seguir.
Amostragem por conveniência A amostra por conveniência envolve a selecão de ele-
mentos de amostra que esteiam mais disponiveis para tomar parte no estudo e que po-
dem oIerecer as inIormacões necessarias. Por exemplo, quando são Ieitas entrevistas com
clientes na saida dos restaurantes, os individuos são escolhidos tendo-se em vista o Iato
de recém terem Ieito uma reIeicão naqueles estabelecimentos. De maneira semelhante,
quando um proIessor universitario entrevista alunos de sua universidade, eles represen-
tam uma amostra por conveniência. As amostras por conveniência são usadas porque
possibilitam que o pesquisador realize um grande numero de entrevistas rapidamente e
a um baixo custo. Mas elas incorrem na tendenciosidade de selecão, pois os individuos
entrevistados muitas vezes são diIerentes da populacão alvo. Assim, é diIicil e perigoso
generalizar para a populacão alvo quando uma amostra por conveniência é utilizada.
Amostragem por julgamento A amostra por julgamento, as vezes chamada de amostra
intencional. envolve a selecão de elementos de amostra para um Iim especiIico. E uma Ior-
ma de amostra por conveniência em que o iulgamento do pesquisador é usado para sele-
cionar elementos de amostra. Os elementos de amostra são escolhidos porque o pesqui-
sador acredita que eles representam a populacão alvo, mas não são necessariamente re-
presentativos. Um exemplo de amostra por iulgamento poderia ser um grupo de especia-
listas com conhecimento sobre um problema ou questão especiIica, como médicos espe-
cializados no tratamento de diabetes, que poderiam ser entrevistados em uma pesquisa
com o obietivo de descobrir os modos mais eIicazes de convencer diabéticos a adotar die-
tas adequadas e a exercitar-se de maneira apropriada. As vantagens das amostras por iul-
gamento são sua conveniência, rapidez e baixo custo.
Amostragem por quota A amostragem por quota é semelhante a amostragem aleatoria
estratiIicada. O obietivo é conseguir que a amostra total tenha representacão proporcio-
nal dos estratos da populacão alvo. A amostragem por quota diIere da amostragem estra-
tiIicada no Iato de a selecão de elementos ser Ieita com base na conveniência.
Na amostragem por quota, o pesquisador deIine os estratos da populacão alvo, de-
termina o tamanho total da amostra e estabelece uma quota para os elementos da amos-
tra a partir de cada estrato. Além disso, o pesquisador também especiIica as caracteristi-
cas dos elementos a serem selecionados, mas deixa a verdadeira escolha de elementos a
critério da pessoa que coleta as inIormacões. Assim, enquanto a amostragem por quota
garante representacão proporcional de cada estrato na amostra total, as descobertas a par-
tir da amostra não podem ser generalizadas porque a escolha de elementos não é Ieita
com o método de amostragem probabilistica. Como com a amostragem por iulgamento,
as vantagens das amostras por quota são sua conveniência, rapidez e baixo custo.
Amostragem bola-de-neve A amostra bola-de-neve, também chamada de amostra por
referência. e aquela em que os respondentes iniciais comumente são escolhidos por meio
de métodos probabilisticos. O pesquisador utiliza os respondentes iniciais para identiIi-
car os outros respondentes na populacão alvo. Esse processo continua até que o tamanho
exigido para amostra seia alcancado. A amostragem bola-de-neve emprega reIerências
para Iacilitar a localizacão de populacões raras ou que não estão presentes em listas. Por
exemplo, um Ienômeno de inverno que ocorre nos Estados Unidos é o deslocamento de
pessoas da região norte do pais, que é mais Iria, para muitas areas litorâneas de estados
do sul, onde o clima é mais ameno. Como essas pessoas são residentes temporarios, não
ha muitas listas e numeros de teleIone disponiveis e as listas dos proprietarios de imoveis
da região não aiudam muito. Deste modo, uma abordagem eIetiva poderia ser a localiza-
248 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
cão de algumas dessas pessoas em uma comunidade, pedindo-lhes indicacão de outros
individuos ou grupos de individuos que também vêm para o sul durante o inverno. Essa
abordagem é particularmente proveitosa quando o alvo é restrito, como a populacão de
mulheres que vêm do norte e iogam golIe pelo menos uma vez por semana.
Definição do tamanho da amostra
Amostras de tamanho eIiciente podem ser retiradas de populacões grandes (inIinitas) ou
pequenas (Iinitas). A seguir, discutiremos a determinacão do tamanho da amostra em am-
bos os casos.
Amostragem de uma grande populacão Os pesquisadores muitas vezes precisam estimar
caracteristicas de grandes populacões. Para que isso seia realizado de maneira eIiciente, é
necessario determinar o tamanho adequado da amostra antes da coleta de dados.
A determinacão do tamanho da amostra é um procedimento complexo, pois muitos
Iatores precisam ser levados em consideracão simultaneamente. O desaIio é obter um
equilibrio aceitavel entre esses diversos Iatores. Estes incluem a variabilidade dos ele-
mentos na populacão alvo, o tipo de amostra exigido, o tempo disponivel, o orcamento,
o nivel de precisão deseiada e a intencão de se generalizar ou não as descobertas: em ca-
so positivo, também deve-se considerar o grau de seguranca de tal generalizacão.
Formulas baseadas na teoria estatistica podem ser utilizadas para computar o tamanho
da amostra. Por razões pragmaticas, como restricões de orcamento e de tempo, métodos al-
ternativos aa hoc* são Ireqüentemente empregados. Por exemplo: tamanhos de amostra ba-
seados em regras praticas, em estudos anteriores semelhantes e na propria experiência do
pesquisador ou simplesmente ditados pelo que se tem a disposicão. Não importando como
o tamanho da amostra é determinado, é essencial que ela seia de tamanho e qualidade su-
Iicientes para produzir resultados conIiaveis em termos de precisão e coerência.
Quando Iormulas estatisticas são usadas para determinar o tamanho da amostra, três
decisões devem ser tomadas: (1) o grau de seguranca (com Ireqüência, 95°), (2) o nivel
de precisão especiIicado (quantidade de erro aceitavel) e (3) variabilidade (homogeneida-
de da populacão). O grau de seguranca (nivel de seguranca) tradicionalmente é baseado
no iulgamento da administracão ou do pesquisador. Historicamente, um nivel de segu-
ranca de 95° (· 0,05 de chance de o parâmetro da populacão estimada estar incorreto)
tem sido usado, mas um nivel menor é aceitavel onde menos risco esta envolvido. O iul-
gamento da administracão e/ou do pesquisador também esta implicado na determina-
cão do nivel de precisão. O nivel de precisão é a maxima diIerenca aceitavel entre o valor
estimado da amostra e o valor verdadeiro da populacão.
A terceira decisão relaciona-se com a variabilidade, ou homogeneidade, da populacão. A
variabilidade da populacão é mensurada pelo desvio-padrão da populacão. Se a populacão é
homogênea, tem um pequeno desvio-padrão. Por exemplo, o desvio-padrão na idade dos es-
tudantes universitarios é pequeno e, portanto, exige uma amostra relativamente pequena. Mas
se a populacão é heterogênea, como a de individuos que estão em um estadio assistindo a um
iogo da National Football League. uma amostra relativamente grande Iaz-se necessaria, pois o
desvio-padrão na idade dessa populacão é maior. Na pratica, é improvavel que o verdadeiro
desvio-padrão seia conhecido. Assim, o pesquisador normalmente utiliza uma estimativa do
desvio-padrão com base em estudos anteriores semelhantes ou em um estudo piloto.
Se você tem inIormacões sobre esses três Iatores, o tamanho da amostra pode ser cal-
culado como segue:
Tamanho da amostra (TA) ÷ (GS X V / PD)
2
*N. de R.T.: Aa hoc. expressão oriunda do latim, mais empregada no meio iuridico e que pode ser traduzida como substi-
tuicão temporaria para Iins especiIicos .
CAPÍTULO 8 » ABORDAGENS E CONSÌDERAÇÕES SOBRE AMOSTRAGENS 2 4 9
Onde:
GS (grau de seguranca) ÷ o numero de erros padrão para o grau de segu-
ranca especiIicado para os resultados da pesquisa
V (variabilidade) ÷ o desvio-padrão da populacão
PD (precisão deseiada) ÷ a diIerenca aceitavel entre a estimativa da amos-
tra e o valor da populacão
A aplicacão da Iormula acima é apresentada na Figura 8-7. Observe que a Iormula
não inclui o tamanho da populacão. Isso acontece porque, exceto com populacões Iinitas,
ESTIMATIVA DO TAMANHO DE AMOSTRA DE UMA MÉDI A
Caso 1: Uso de uma escaIa de cIassificação
Phil Samouel pediu que seu consultor administrativo estimasse o tamanho adequado da amostra con-
siderando as questões que seriam feitas em sua survey com os clientes do restaurante. O pesquisador
deve determinar o tamanho da amostra que estimará o verdadeiro escore médi o percebido para as
características dos restaurantes (como a qualidade da comi da, os preços, etc.) no nível de precisão
desejado e no nível de segurança especificado. Para tanto, o pesquisador deve considerar todos os
três elementos na fórmula para tamanho de amostra - o grau de variabilidade na população medido
pelo desvio-padrão, o nível de precisão aceitável e o nível de segurança especificado. O pesquisador
provavelmente procederá da seguinte forma.
O pri mei ro elemento da fórmul a para tamanho de amostra que deve ser determinado é a variabi-
lidade presente nas respostas às perguntas, por exempl o, sobre a quali dade da comi da. Falando de
modo geral, a verdadeira variabilidade mensurada pelo desvio-padrão não é conheci da. Na maioria
dos casos, portanto, será necessário estimá-la através do uso de uma amostra de teste pi loto ou por
algum método subjetivo, como a estimativa feita pelo pesquisador com base em sua experiência com
tipos semelhantes de questões.
Também é necessário que se façam algumas suposições quanto às propriedades da distribuição
das respostas para a questão sobre qualidade da comi da. Em geral, supõe-se que a medida para a ca-
racterística a ser estimada segue uma distribuição normal . Em nosso estudo, a qualidade da comi da
percebida é mensurada com uma escala de classificação de 1 a 7. Ìsso dá uma variação de 6 unida-
des ( 7 - 1 =6) . Uma vez conhecida a variação, estima-se o desvio-padrão (variabilidade) da escala
de classificação dividi ndo-se a variação por 4 (6 / 4 = 1,5). A divisão por 4 é baseada na suposição de
que a distribuição das respostas sobre a qualidade da comi da é normal . Quando se tem uma distri -
buição normal , os pesquisadores em administração geralmente usam um intervalo de segurança de
mais ou menos 2 erros padrão (95 ) e divide-se a variação das respostas por 4 para que se obtenha
o desvio-padrão estimado.
Em uma consulta com o cliente, o pesquisador normalmente determina o nível aceitável de pre-
cisão e o nível desejado de segurança. Suponhamos que a precisão seja especificada como 1/3 de
uma unidade da escala de classificação. Ìsso significa que a estimativa da amostra deve ser precisa
dentro de 1/3 de uma unidade. Um nível de segurança de 95 é desejado.
Agora temos informações suficientes para calcular o tamanho de nossa amostra usando a fórmula:
Tamanho da amostra = [(grau de segurança exigido x variabilidade) / (precisão desejada)]
2
Tamanho da amostra = [ ( 2X1, 5) / (0,33)]
2
= 82,6
Assim, 83 é o tamanho míni mo de amostra que o pesquisador deve objetivar a f i m de atingir as
metas de precisão e segurança especificada.
Caso 2: Uso de uma escala de razão
Consideremos o caso em que desejamos estimar o gasto mensal médi o com refeições em restauran-
tes. Embora o verdadeiro desvio-padrão (variabilidade) seja desconhecido, um teste pi l oto de 30
clientes oferece uma estimativa desse desvio com sendo de 14 dólares. Queremos estar 95 seguros
de que nossa estimativa do gasto mensal médi o com refeições em restaurantes fica em 2 dólares da
verdadeira média da popul ação. Supondo-se que a distri buição de gastos é normal , o tamanho da
amostra é determinado como segue:
Tamanho da amostra = [(grau de segurança exigido x variabilidade) / (precisão desejada)]
2
Tamanho da amostra = [(2 x14) / ( 2) ]
2
= 196
Deveríamos ter por meta uma amostra de pelo menos 196 para atender nossos critérios preestabele-
cidos de tamanho de amostra eficiente.
FIGURA 8-7
250 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
o tamanho da populacão não tem impacto sobre a determinacão do tamanho da amostra.
EspeciIicamente, um tamanho de amostra de 500 é tão util na compreensão das opiniões
de uma populacão alvo de 15.000.000 quanto o é em uma populacão de 100.000. Isso sem-
pre é verdadeiro para grandes populacões. Quando se trabalha com pequenas popula-
cões (300 - 400 ou menores), as Iormulas para tamanho de amostra podem levar a uma
amostra desnecessariamente grande. Se, por exemplo, o tamanho da amostra, como Ioi
determinado pela Iormula anterior, é maior do que 5° da populacão, então o tamanho es-
timado da amostra deve ser aiustado pelo Iator de correcão de populacão Iinita.
Ìmplementação do plano de amostragem
O pesquisador implementa o plano de amostragem depois de haver um consenso quan-
to a todos os detalhes da amostragem. A populacão alvo Ioi deIinida, a estrutura de
amostragem Ioi escolhida, o método de amostragem Ioi selecionado e o tamanho adequa-
do da amostra Ioi determinado. Se a unidade de amostragem é empresas, os tipos de em-
presas devem ser especiIicados, bem como os cargos e talvez os nomes dos individuos
que serão entrevistados. Muitos detalhes devem ser decididos antes de o plano Iinal de
amostra ser aceito e implementado, pois, apos os dados terem sido coletados, é tarde de-
mais para modiIica-lo.
RESUMO
Compreensão dos princípios de amostragem mais importantes
As principais questões reIerentes a amostragem são a identiIicacão da populacão alvo, a
estrutura de amostragem e o método de amostragem. Geralmente, um pesquisador pro-
cura retirar uma amostra representativa de uma populacão alvo usando procedimentos
probabilisticos ou não-probabilisticos. O acesso e a participacão dos respondentes, seiam
eles empresas ou individuos, são, portanto, uma importante consideracão para garantir
que o tamanho da amostra seia conIiavel, eIiciente e representativo.
Avaliação da diferença entre população alvo e estrutura de amostragem
Antes de iniciar a amostragem, é necessario que se identiIiquem todos os elementos de
interesse para nosso estudo. Esses elementos podem ser individuos ou obietos, como em-
presas ou até mesmo eventos. Tais elementos são a populacão alvo. Na pratica, pode não
haver uma lista exaustiva desses elementos, de modo que temos que utilizar uma ou mais
listas que Iuncionem como um bom substituto para a populacão. E esse substituto que
Iorma a estrutura de amostragem da qual retiramos a amostra.
Reconhecimento da diferença entre amostragem probabilística e não-probabilística
A diIerenca entre as duas abordagens de amostragem é simples. Para os métodos de
amostragemprobabilistica, as chances de selecão de elementos para uma amostra são co-
nhecidas. Ao contrario, para métodos de amostragem não-probabilistica, as chances de
selecão não são conhecidas. Além disso, para que se inIiram generalizacões de uma po-
pulacão a partir de uma amostra, deve-se utilizar a amostragem probabilistica.
Descrição de diferentes métodos de amostragem
A amostragem probabilistica, geralmente empregada em survevs de grande escala, Iunda-
menta-se em um procedimento aleatorio para selecão de elementos da populacão alvo. Se
CAPÍTULO 8 « ABORDAGENS E CONSÌDERAÇÕES SOBRE AMOSTRAGENS 2 5 1
o tamanho da amostra é suIicientemente grande, a amostra selecionada deve ser repre-
sentativa. Abordagens de amostragem probabilistica incluem: amostragem aleatoria sim-
ples, amostragem sistematica, amostragem estratiIicada, amostragem por conglomerado
e amostragem de varios estagios. Cada um desses tipos de amostragem tem vantagens e
desvantagens que devem ser consideradas antes de se selecionar uma determinada abor-
dagem. Se executada adequadamente, a amostragem probabilistica possibilita as genera-
lizacões sobre a populacão com um grau especiIico de seguranca.
A amostragem não-probabilistica, geralmente usada em pesquisas exploratorias, en-
volve a selecão de elementos para uma amostra com base na conveniência, no iulgamento,
na reIerência ou em quotas, sem implicar probabilidade para os elementos na populacão al-
vo. E diIicil garantir que tais amostras seiam representativas, de Iorma que as descobertas
não podem ser generalizadas para a populacão com um grau especiIico de seguranca.
Determinação do tamanho adequado da amostra
Para determinar o tamanho da amostra, três tipos de inIormacões são necessarios. São
eles: o grau de seguranca necessario para estimar o valor verdadeiro, a precisão da esti-
mativa e a quantidade de variabilidade verdadeira presente nos dados. Na pratica, o pes-
quisador e o cliente discutem e chegam a um consenso quanto ao nivel de seguranca de-
seiado e a precisão da estimativa. Além disso, como é improvavel que se conheca a ver-
dadeira variabilidade, esta normalmente é estimada com base no iulgamento ou através
de um estudo piloto.
PALAVRAS-CHAVE
amostra
amostra representativa
amostragem
amostragem aleatoria simples
amostragem bola-de-neve
amostragem estratiIicada
amostragem estratiIicada
desproporcional
amostragem estratiIicada
proporcional
amostragem não-probabilistica
amostragem por conglomerado
amostragem por conglomerado
de varios estagios
amostragem por conveniência
amostragem por iulgamento
amostragem por quota
amostragemprobabilistica
amostragem sistematica
censo
elementos
estrutura de amostragem
populacão
populacão alvo
unidade de amostragem
DÌLEMA ÉTÌCO
Mark Stephenson é gerente de contas de uma empresa de pesquisa em administracão.
Sob a solicitacão da diretora de marketing de um hospital local, ele apresenta uma propos-
ta para realizacão de uma pesquisa da satisIacão dos pacientes. Em sua opinião, a amos-
tra deveria ser aleatoria e coletada por teleIone ou pela Internet. Depois da apresentacão
a diretora de marketing e ao presidente do hospital, a diretora pede que Mark Iaca entre-
vistas no momento da saida dos pacientes para a coleta de dados. Ela explica que seu che-
Ie acha que as entrevistas na saida têm a mesma validade e economizarão recursos do
hospital. O que Mark deve Iazer?
QUESTÕES DE REVÌSÃO
1. O que é amostragem e por que é usada?
2. Quais são os passos do processo de amostragem?
252 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
3. Qual é a diIerenca entre amostragem probabilistica e não-probabilistica?
4. Qual é a diIerenca entre amostragem estratiIicada proporcional e despropor-
cional?
5. Como se determina o tamanho adequado da amostra?
ATÌVÌDADES PARA DÌSCUSSÃO E APLÌCAÇÃO
1. Discuta as diIiculdades que você pode enIrentar na deIinicão da populacão al-
vo e sua estrutura de amostragem. Comente e exempliIique como você supera-
ria essas diIiculdades.
2. Em que situacões a amostragem não-probabilistica é preIerivel a amostragem
probabilistica? Comente com exemplos.
3. Ilustre com exemplos o uso de cada um dos tipos de amostragem probabilistica.
4. Que consideracões precisam ser Ieitas para a determinacão de uma amostra de
tamanho adequado e eIiciente?
5. Você preIere usar uma amostra de 20.000 ou de 2.000 eleitores para descrever o
comportamento dos votantes nas eleicões nacionais? Apresente as razões que
iustiIicam sua escolha.
EXERCÍCÌOS NA ÌNTERNET
1. Va ao Google e digite as palavras amostragem ae populacão. Prepare um breve re-
sumo do que você encontrou.
2. Va aos seguintes sites. www.surveysystem.com/sscalc.htm e www.svs.com.
Use as Iuncões dos szIes. Prepare um breve relatorio do que cada site Iaz e como
Iunciona. Inclua comentarios sobre sua utilidade para pesquisadores em admi-
nistracão.
3. Va ao seguinte site. http://random.mat.sbg.ac.at/links. Use as Iuncões do site.
Prepare um breve relatorio do que o site Iaz e como Iunciona. Inclua seus co-
mentarios sobre a utilidade do site para pesquisadores em administracão.
4. Va ao site www.surveysystem.com/sscale.htm. Nesse site. o Creative Research
System colocou um calculador de tamanho de amostra e algumas inIormacões
basicas sobre amostragem e tamanho de amostra. Prepare um breve relatorio
do que o site oIerece ao usuario. Inclua comentarios sobre sua utilidade para
pesquisadores em administracão.
Análise e Apresentação de Dados
CapítuIo 9: Compreensão e apresentação dos dados
CapítuIo 10: Métodos básicos de análise de dados
CapítuIo 11: Correlação e regressão
Apêndice 11-A: Tópicos especiais ern análise de
regressão múltipla
CapítuIo 12: Relato e apresentação da pesquisa
Apêndice 12-A: Relatório de pesquisa para Phil
Samouel
P A R T E
Compreensão e Apresentação
dos Dados
CAPÍTULO
256 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
Os pesquisadores em admini st racão nor mal ment e possuem mui t os dados para aiudar os
admi ni st radores a t omar mel hores decisões. Uma de suas principai s tareIas é converter
os dados em conhecimento. Ha algumas abordagens basicas que você pode utilizar para
melhor compreender seus dados e suas relacões subiacentes. Essas abordagens são uteis,
pois, atualmente, na maior part e das vezes, ha numeros demai s par a veriIicar e para, a
partir deles, identiIicar padrões que possam ser uteis. Quase todos os coniuntos de dados
precisam de um resumo de suas inIormacões, ou seia, algo que sintetize e descreva os nu-
meros que eles contêm. A estatistica basica e analise descritiva apresent adas neste capitu-
lo Ioram desenvolvidas para esse proposito. Nos capitulos posteriores, most raremos mé-
todos mai s soIisticados para utilizacão quando as abordagens simples não conseguem ex-
plicar as relacões existentes entre os dados.
A manei ra mais Iacil de aprender como a estatistica aiuda a compreender as relacões
entre dados é eIetivamente usar as técnicas. Isso signiIica que você deve possuir alguns
dados para analisar. Para aiuda-lo, preparamos dois bancos de dados que podem ser ana-
lisados com técnicas estatisticas abordadas neste livro. Uma vez que você estiver Iamilia-
rizado com os bancos de dados, poder a aplicar todas as técnicas estatisticas aos dados.
Damos instrucões, ao longo dos capitulos, sobre como utilizar o pacote de software SPSS.
Mas os mesmos tipos de analise podem ser empregados com SAS ou outros pacotes de
software semelhantes. As descricões das variaveis e de sua codificacão são apresentadas
no Apêndi ce 1-B do Capitulo 1. Uma copia eletrônica dos dados t ambém esta disponivel,
em inglês, no site www. wi ley. com/ coll ege/hai r. Saiba mais sobre SPSS na secão Pesqui-
sa em acão .
PESQUISA EM AÇÃO
SPSS ANALISA O MUNDO!
Em todo o mundo, as inIormacões estão aumentando exponencialmente. Organizacões com ou sem
Iins lucrativos estão coletando inIormacões em armazéns de dados* para analisar e melhorar suas
decisões. Para aiudar as pessoas e as organizacões a lidarem com a sobrecarga de inIormacões, uma
nova IilosoIia de administracão emergiu, chamada de administracão de conhecimento . Especia-
listas desse campo dizem que provavelmente 70° das inIormacões de que os responsaveis pelas de-
cisões precisam ia esta disponivel. O problema é que a maioria das organizacões não consegue loca-
lizar, recuperar e analisar as inIormacões rapidamente.
Os especialistas na tecnologia de inIormacão constroem a inIra-estrutura para localizar e recur`-
rar inIormacões. Mas elas ainda precisam ser analisadas para identiIicar as pérolas de sabedoria e
:
-
condidas nas montanhas de dados. E ai que a SPSS e outras empresas de software entram em cena. O ó
°¿½±¬»- ¼» -±º¬©¿ ®» °¿®¿ analise de dados estão disponiveis ha mais de 30 anos, mas so recentemer æ.
º±®¿³ ¿¼¿°¬¿¼±- °¿®¿ aplicacões Iaceis com base no Windows. Hoie, as organizacões têm acesso ÷
técnicas de analise de dados muito poderosas e uma das mais populares é comercializada pela SPi 5
A SPSS, Inc. (wwww.spss.com) aIirma que suas solucões e produtos permitem que as organ::: -
cões administrem o Iuturo a partir do conhecimento do passado, compreendendo o presente e prever -
do problemas e oportunidades potenciais . Seu principal ponto Iorte e diIerencial é o Iôlego e a pro-
Iundidade da tecnologia e do conhecimento em garimpagem de dados e analise estatistica - as tecr :-
logias que tornam possivel a analise prognostica . A SPSS oIerece instrumentos e solucões anali:::~
para organizacões do mundo todo. Para mais inIormacões sobre a SPSS, visite o site www.spss.com.
* N. de R.T.: Algumas empresas ou instituicões, publicas ou privadas, coletar` reunem e organizam (uma, todas ou (!
¼»--¿- ¿¬·ª·¼¿¼»-÷ inIormacões uteis para a pesquisa em diversas areas do conhecimento e as disponibilizam para = ó ó
¯«·-¿¼±®»- ¼» º±®³¿ ¹®¿¬«·¬¿ ±« ³»¼·¿²¬» ¬¿¨¿-ò Û--»- ¹®¿²¼»- ¾¿²½±- ¼» ¼¿¼±- são comumente conhecidos come .
mazéns de dados .
ÌNTRODUÇÂO
CAPÍTULO 9 « COMPREENSÃO E APRESENTAÇÃO DOS DADOS 257
O capitulo inicialmente oIerece uma explicacão sobre como proceder com a prepara-
cão dos dados antes de analisa-los. Mostramos como dispor os dados em graIicos de Ior-
ma que os responsaveis pelas decisões possam entendê-los melhor. Por exemplo, se você
realizasse uma survev dos clientes do McDonald's, poderia demonstrar de modo mais eIi-
ciente quais são os clientes mais assiduos em comparacão com os menos assiduos, talvez
explicando também por quê.
Para Iacilitar a aprendizagem, Ireqüentemente Iazemos reIerência ao caso e aos ban-
cos de dados dos restaurantes Samouel's e Gino's. Mas com o acesso a Internet, os pesqui-
sadores em administracão têm muitas inIormacões e bancos de dados disponiveis online.
Varios dos melhores sites da Web estão descritos na secão Pesquisa em acão .
PREPARAÇÃO DOS DADOS
Depois que os dados Ioram coletados e antes de serem analisados, o pesquisador deve
examina-los para certiIicar-se de sua validade. Respostas em branco, chamadas de da-
dos faltantes, devem ser tratadas de alguma Iorma. Se as questões Ioram pré-codiIica-
das, elas poderão simplesmente ser colocadas no banco de dados. Se não Ioram, então
um sistema deve ser desenvolvido para que possam ingressar no banco de dados. As ta-
reIas geralmente envolvidas nesse processo constituem a edicão de dados, que pode en-
globar a Ialta, a codiIicacão, a transIormacão e a entrada dos dados. Discutiremos cada
situacão a seguir.
REVISÃO DE DADOS
Antes que os dados do questionario possam ser usados, eles devem ser editados. Isso sig-
niIica que devem ser inspecionados para que se veriIiquem sua integridade e coerência.
Algumas incoerências podem ser corrigidas nesse momento. Por exemplo, um respon-
dente pode não ter respondido a questão sobre estado civil. Mas, em outras questões, res-
pondeu que estava casado ha dez anos e tinha três Iilhos, todos com menos de 18 anos.
Em casos como esse, o pesquisador podera optar por dar uma resposta para a questão so-
bre estado civil. Evidentemente, isso implica algum risco, ia que o individuo pode ter-se
divorciado recentemente ou, em alguns casos, os individuos optam por ter Iilhos sem se
casar. Se Iosse esse o caso, o pesquisador estaria introduzindo tendenciosidade nos dados
se optasse por marcar a categoria casado . Assim, se possivel, sempre é melhor entrar
em contato com os individuos para completar as questões sem resposta.
A edicão também envolve veriIicar se os respondentes compreenderam as questões e
se seguiram a seqüência especiIica que deveriam ter seguido em uma questão de ramiIica-
cão. Por exemplo, suponhamos que o pesquisador esteia usando um proieto experimental
com dois tipos de tratamento. Um deles deve ser um ambiente de trabalho cooperativo e
o outro deve ser um ambiente de trabalho muito menos cooperativo. Para veriIicar se um
respondente interpretou o tratamento adequadamente, o pesquisador pode Iazer o que é
chamado de verificacão de manipulacão. Isto é, depois que o respondente completou as
questões, pode-se pedir-lhe que Iaca comentarios sobre o quanto os ambientes de trabalho
Ioram cooperativos. Se o respondente indicar que ambos os ambientes Ioram igualmente
cooperativos, isso signiIicara que ele não respondeu adequadamente ao tratamento. Em
tais situacões, o pesquisador pode optar por remover aquele respondente da analise de da-
dos porque este não viu a diIerenca entre os dois ambientes de trabalho.
Finalmente, a edicão pode resultar na eliminacão de questionarios. Por exemplo, se
houver uma grande proporcão de dados Ialtantes, então todo o questionario podera ter
que ser removido do banco de dados. De Iorma parecida, uma questão de triagem pode
258 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
PESQUISA EM AÇÃO
INFORMAÇÕES E BANCOS DE DADOS ON-LINE
1. SERVICO DE INFORMACÔES
Banco de dados
ABI/INFORM
Public Opinion Online (POLL)
Marketsearch: International
Directory of Published Market
Research
Business Dateline
PTSP Prompt
2. SERVICO DE INFORMACÔES
Banco de dados
Business Newsstand
Company & Industry Center
Historical Market Data Center
The Wall Street 1ournal
Interactive Edition
Company/Industry Quick Search
3. SERVICO DE INFORMACÔES
Banco de dados
EBSCOMasterFILE Premier
DIALOG
Realizacão ae pesquisas e apresentacão ae listas ae titulos ae
resultaaos ae pesquisas são livres. 3.45 aolares por artigo.
Tipo de dados
Citacões e resumos de artigos de publicacões proIis-
sionais, periodicos acadêmicos e revistas comerciais
do mundo todo. InIormacões sobre a historia de em-
presas, conhecimento competitivo e desenvolvimen-
to de novos produtos.
Colecão completa de textos de survevs de opinião pu-
blica realizadas nos Estados Unidos.
Lista de mais de 20.000 estudos publicados de pes-
quisas de mercado mundiais.
Texto completo de artigos de 550 publicacões regio-
nais sobre administracão nos Estados Unidos e no
Canada.
Contém 1.100 publicacões empresariais e comerciais
internacionais ativas, mais Iontes de arquivos.
DOW 1ONES NEWS RETRIEVAL (DOW 1ONES
AND COMPANY)
69 aolares pela assinatura anual. mais 2.95 aolares por
artigo.
Tipo de dados
Artigos dos principais iornais e revistas de adminis-
tracão, incluindo The Wall Street Journal. The New
York Times. The Washington Post e Los Angeles Times.
Barron´s. Business Week. Fortune e Forbes.
PerIis Iinanceiros, relatorios de triagem de empresas,
relatorios comparativos, relatorios industriais e mais
de 50 relatorios de pesquisa de mercado com texto
integral.
Mais de 25 anos de cotacões de acões, titulos, Iundos
mutuos, indices de mercado e opcões.
Noticias sobre administracão de empresas, incluindo
cotas de Iundos e de acões atuais e relatorios deta-
lhados sobre mais de 10.000 empresas.
PerIis Iinanceiros de empresas, inIormacões para con-
tato, descricões empresariais, desempenho de corpo-
racões, desempenho de acões, press releases e artigos
comerciais.
EBSCO
Livre acesso atraves aa participacão em sistemas ae univer-
siaaaes e bibliotecas.
Tipo de dados
Texto completo de 1.880 periodicos abrangendo qua-
se todos os assuntos e incluindo reIerências em ge-
ral, administracão e saude.
{continua)
CAPÍTULO 9 » COMPREENSÃO E APRESENTAÇÃO DOS DADOS 2 5 9
PESQUISA EM AÇÃO
INFORMAÇÕES E BANCOS DE DADOS ON-LINE continuação)
Academic Search Elite
Business Source Premier
Business Wire News
Texto completo de mais de 1.530 periodicos cientiIi-
cos nas areas de ciências sociais, humanidades, ciên-
cia geral, estudos multiculturais e educacão.
Texto completo de 2.280 periodicos acadêmicos sobre
administracão, economia, Iinancas, contabilidade e
negocios internacionais.
Texto completo de bancos de noticias, incluindo noti-
cias de empresas de todo o mundo.
4. SERVICO DE INFORMACÔES GALE GROUP DATABASE
Livre acesso atraves aa participacão em sistemas ae universiaaaes e bibliotecas.
Banco de dados
Business and Company
Resource Center
General Reference Center Gold
National Newspaper Index
Tipo de dados
Noticias e inIormacões sobre empresas e industrias,
perIis, inIormacões sobre marcas, classiIicacões, rela-
torios de investimento, historico de empresas, cro-
nologias e periodicos.
Muitos artigos com texto integral de iornais, livros de
reIerência a partir de 1980 e periodicos sobre eventos
atuais, cultura popular, administracão e industria,
artes e ciências, esportes, hobbies. etc.
indices do The New York Times. The Wall Street Journal.
The Christian Science Monitor. Los Angeles Times e The
Washington Post.
5. SERVICO DE INFORMACÔES SIRS KNOWLEDGE SOURCE
Os precos variam ae acorao com os proautos e aa quantiaaae aaquiriaa.
Banco de dados
SIRS Researcher
SIRS Government Reporter
SIRS Renaissance
Tipo de dados
Texto integral de artigos de iornais, revistas, periodi-
cos e publicacões do governo dos Estados Unidos
explorando questões sociais, cientiIicas, de saude,
historicas, econômicas, administrativas, politicas e
de cunho geral.
Texto integral de documentos sobre saude, ciência,
economia, ambiente, politica, assuntos estrangeiros,
questões trabalhistas, administracão e industria. In-
clui documentos governamentais, decisões da Su-
prema Corte dos Estados Unidos e inIormacões so-
bre departamentos, agências e autoridades eleitas do
governo.
InIormacões atuais sobre musica, literatura, Iilmes,
artes cênicas, cultura, arquitetura, IilosoIia, religião e
artes visuais.
indicar que você quer entrevistar somente pessoas que t enham casa propria. Mas a res-
posta de um questionari o preenchido pode indicar que um determinado respondent e é
inquilino. Em tais casos, o questionario não deve ser incluido na analise de dados. Fala-
remos sobre como lidar com dados ausentes na proxima secão.
260 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
Os pesquisadores em administracão quase sempre constatam a ocorrência de dados Ialtan-
tes, seia nas survevs. seia nas Iontes internas como os depositos de dados. Os dados Ialtantes
podem ter impacto sobre a validade das descobertas e, portanto, devem ser identiIicados e o
problema, resolvido. Os dados Ialtantes normalmente surgem devido a Ialhas na coleta ou na
entrada de dados. O pesquisador em administracão deve avaliar a extensão do problema dos
dados Ialtantes e se a Ialha é sistematica ou aleatoria. Se o problema tem escopo limitado, a
solucão tipica é simplesmente eliminar respondentes e/ou questões que não apresentem os
dados. Quando os dados Ialtantes estão mais disseminados, o pesquisador deve trata-los de
Iorma diIerente, pois, com a remocão de respondentes com dados Ialtantes, a amostra pode
tornar-se muito pequena para oIerecer resultados signiIicativos. Na nossa survev dos restau-
rantes, coletamos um total de 71 questionarios com Iuncionarios. Mas sete deles apresenta-
vam dados Ialtantes em uma ou mais questões. Nesse caso, optamos por simplesmente remo-
ver as sete entrevistas com dados Ialtantes e trabalhar com as 63 restantes.
Abrangeremos duas abordagens para dados Ialtantes, embora outras alternativas se-
iam possiveis. A primeira é a da identiIicacão de respondentes e variaveis que apresen-
tam um grande numero de pontos de dados Ialtantes. Esses respondentes e/ ou variaveis
são eliminados da analise. A segunda abordagem é a da estimativa dos valores Ialtantes
substituindo-se a média. InIelizmente, essa alternativa so é adequada para variaveis me-
tricamente mensuradas. Quando variaveis não-métricas apresentam dados Ialtantes, o(a)
respondente/questão deve ser eliminado(a) da analise na maioria das situacões. Se você
esta usando o software SPSS, ha um procedimento para substituicão da média antes da
analise dos dados. Se você deseia eIetua-lo, va ao menu TransIorm, desca e clique em Re-
place Missing Values. Destaque e introduza as variaveis com dados Ialtantes na caixa. Va-
rios métodos de substituicão são possiveis, mas recomendamos o aefault média Series, cli-
cando OK. Para quem não deseia substituir os dados Ialtantes com antecedência, três téc-
nicas - regressão, discriminante e analise Iatorial - têm opcões para excluir observacões
de dados Ialtantes ou substituir valores pela média.
CODIFICAÇÃO E ENTRADA DE DADOS
Os respondentes devem ser codiIicados antes ou depois da coleta dos dados. Se possivel,
é melhor codiIica-los com antecedência. A codiIicacão consiste em atribuir um numero
para uma determinada resposta de modo que esta possa ingressar em um banco de da-
dos. Por exemplo, se você estiver usando uma escala de 5 pontos Concorda - Discorda,
então devera decidir se Concorda totalmente sera codiIicado com um 5 ou um 1. A maio-
ria dos pesquisadores atribui o maior numero para Concorda totalmente e o menor para
Discorda totalmente: por exemplo, 5 ÷ Concorda totalmente e 1 ÷ Discorda totalmente,
com os pontos intermediarios sendo 2, 3 e 4. Uma situacão especial surge quando o pes-
quisador tem uma variavel de duas categorias, como a de gênero. Alguns pesquisadores
usam uma abordagem de codiIicacão que considera 1 ÷ masculino e 2 ÷ Ieminino. Mas re-
comendamos que, em tais situacões, seia utilizada uma abordagem de codiIicacão que
atribua 1 para uma das categorias e 0 para a outra. Esse procedimento, conhecido como
codiIicacão de variavel muda, possibilita maior Ilexibilidade na analise de dados. Discu-
tiremos essa abordagem em um capitulo posterior.
Quando as entrevistas são realizadas utilizando-se uma abordagem assistida por
computador, as respostas têm entrada direta no banco de dados. Quando se usam ques-
tionarios auto-administrados, é bom empregar uma Iolha de scanner para que as repostas
possam ser diretamente escaneadas para o banco de dados. Em outras situacões, no en-
tanto, os dados brutos devem ser manualmente transpostos para um banco de dados uti-
DADOS FALTANTES
CAPÍTULO 9 « COMPREENSÃO E APRESENTAÇÃO DOS DADOS 2 6 1
lizando-se um computador pessoal. Os softwares mais populares, como o SPSS, incluem
um editor de dados que se assemelha a uma planilha (ver Apêndice 1-C), que pode ser
usada para dar entrada, editar e visualizar os conteudos do banco de dados. Valores Ial-
tantes são normalmente representados por um ponto (.) em uma célula, de modo que de-
vem ser codiIicados de maneira especial, como Ioi indicado anteriormente.
Erros humanos podem acontecer quando se completa o questionario, quando este é
codiIicado ou durante a entrada dos dados. Portanto, pelo menos 10° dos questionarios
codiIicados, bem como o banco de dados, são veriIicados em busca de possiveis erros de
codiIicacão ou de entrada de dados. Os questionarios a serem veriIicados geralmente são
selecionados por processo de amostragem aleatoria sistematica.
TRANSFORMAÇÃO DE DADOS
A transIormacão de dados é o processo de modiIicacão da Iorma original dos dados pa-
ra um novo Iormato. Isso tradicionalmente é Ieito para que se compreendam os dados
com maior Iacilidade ou para que se atinia algum outro obietivo da pesquisa. Por exem-
plo, com escalas de mensuracão, Ireqüentemente temos aIirmacões redigidas de modo
negativo e positivo. Em tais casos, o pesquisador revertera o codigo das questões redigi-
das como negacões de Iorma que uma escala somatoria possa ser calculada para interpre-
tar os resultados. Ou seia, se Ior usada uma escala de cinco pontos, o 5 sera transIormado
em 1 e o 4 em 2: o 3 não precisa ser alterado. Uma outra situacão que poderia exigir a
transIormacão é quando são coletados dados sobre a idade do respondente. Em geral, ha
menos tendenciosidade de resposta quando se pergunta aos respondentes seu ano de
nascimento em vez de sua idade. Nessas situacões, o pesquisador simplesmente transIor-
maria o ano de nascimento na idade do respondente.
Os pesquisadores também podem optar por desmembrar ou combinar categorias ad-
iacentes de uma variavel de uma Iorma que reduza o numero de categorias. Por exemplo,
uma escala de sete pontos Concorda - Discorda pode ser reduzida para uma escala de
três pontos combinando-se as respostas 5,6 e 7 e as respostas 1,2 e 3. As respostas 4 per-
maneceriam na categoria central ou neutra.
Uma outra importante transIormacão de dados envolve a criacão de novas variaveis
pela reespeciIicacão dos dados com transIormacões logicas. Por exemplo, podemos optar
por combinar escalas Likert com classiIicacão somatoria. Isso implicaria combinar os esco-
res (dados brutos) para varias aIirmacões de atitude em um unico escore somatorio. O es-
core somatorio para uma escala de atitude de três aIirmacões é calculado como segue:
Escore somatorio ÷ variavel 1 ¹ variavel 2 ¹ variavel 3
Uma outra abordagem que o pesquisador pode empregar é a de calculo do escore so-
matorio médio. Isso implica calcular o escore somatorio e dividi-lo pelo numero de varia-
veis. Quando essa abordagem é utilizada, a nova variavel transIormada composta é com-
paravel em escala a escala original. Por exemplo, se tivéssemos três aIirmacões de cinco
pontos, o escore somatorio poderia ser 4 ¹ 4 ¹ 5 ÷ 13. Mas, se usassemos o escore somato-
rio médio, o resultado seria 4 ¹ 4 ¹ 5 ÷ 1 3 / 3 ÷ 4,3.
USO DE TABELAS E GRÁFÌCOS PARA MELHOR COMPREENSÃO DOS DADOS
Os graIicos e as tabelas aiudam a compreender mais Iacilmente os dados. Eles também
comunicam de modo mais eIiciente os assuntos complexos e tornam seu relatorio de pes-
quisa visualmente mais atraente. Neste capitulo, ilustraremos o valor das distribuicões de
Ireqüência, graIicos de barras, graIicos de pizza e graIicos de linhas. Também revisare-
262 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
mos aspectos visuais que nos aiudam a avaliar a qual idade de nossos dados, tais como
graIicos caule-e-Iolha e de caixas.
DISTRIBUIÇÃO DE FREQÜÊNCIA
Os pesquisadores em administracão muit as vezes pesquisam questões com base em uma
unica variavel. Por exemplo, o pesquisador pode precisar responder questões como as se-
guintes:
1. Qual a probabilidade de os Iuncionarios de uma certa empresa procurarem ou-
tro emprego? Por exemplo, ha muit a probabilidade, pouca probabilidade ou
nenhuma probabilidade de procura por um novo emprego nos proximos seis
meses?
2. Qual a porcentagem de clientes de um restaurante que deveriam ser classiIica-
dos como muit o assiduos, pouco assiduos ou não assiduos? Por exemplo, se vo-
cê entrevistar uma amostra de individuos quando saem do Burger King, qual a
porcentagem deles que vai aquele estabelecimento com e sem Ireqüência?
3. Qual é a localizacão geograIica dos clientes? Por exemplo ha mai s proprietarios
de Mercedes na Alemanha do que nos Estados Unidos?
Perguntas como essas podem ser respondi das através do exame de uma tabela que
descreve os dados. A tabela é chamada de distribuicão de Ireqüência. As distribuicões de
Ireqüência exami nam os dados de uma variavel por vez e oIerecem contagens das diIe-
As aIirmacões sobre o ambiente de trabalho na survev dos Iuncionarios do Samouel's incluem três
medidas relacionadas ao supervisor. São as variaveis X
3
, X
6
e X
10
. Para calcular o escore somatorio,
carregue os dados da survev dos Iuncionarios (Survev de Funcionarios N ÷ 63.sav). A seqüência de
cliques é a seguinte: TRANSFORM-`COMPUTE. Primeiro, digite o nome de uma variavel na caixa
Target Variable. Nesse caso, estamos calculando um escore somatorio para aIirmacões sobre a su-
pervisão e usaremos a abreviacão SUMSUP para Somatorio Supervisor. A seguir, clique na caixa
Numeric Expression, movendo o cursor até la. Veia os botões abaixo e clique nos parênteses para co-
loca-los na caixa Numeric Expression. Agora, destaque a variavel X
3
e clique na caixa da seta para
coloca-la nos parênteses. Va aos botões abaixo e clique no sinal de (¹). Volte e destaque a variavel X,
e clique na caixa da seta para coloca-la nos parênteses. Novamente, clique no sinal de (¹). Finalmen-
te, volte e destaque a variavel X
10
e clique na caixa da seta para coloca-la nos parênteses.
A seguir, clique emOK e você obtera o escore somatorio para as três variaveis. Você pode encon-
tra-lo como uma nova variavel no lado direito da tela do editor de dados.
Para calcular o escore somatorio médio, siga o procedimento anterior. Desta vez, você deve digi-
tar um nome para Target Variable diIerente daquele utilizado antes. Usaremos a abreviacão ASUM-
SUP para indicar a classiIicacão do somatorio de supervisão médio. Depois de mover todas as três
variaveis para os parênteses e antes de clicar emOK, você posiciona o cursor depois dos parênteses.
A seguir, va até os botões abaixo da caixa Numeric Expression e clique no sinal de barra (/ ÷ sinal de
divisão) para coloca-lo depois dos parênteses. Agora, novamente, va até os botões abaixo da caixa
Numeric Expression e clique no 3. Você deve clicar no 3 porque esta calculando a média de três va-
riaveis. Em seguida, clique em OK e obtenha o escore somatorio médio para as três variaveis. Você
pode encontra-lo como uma nova variavel no lado direito da tela do editor de dados.
CAPÍTULO 9 « COMPREENSÃO E APRESENTAÇÃO DOS DADOS 2 6 3
rentes respostas para os diversos valores da variavel. O obietivo de uma distribuicão de
Ireqüência é demonstrar o numero de respostas associadas com cada valor de uma varia-
vel. Normalmente, a distribuicão de Ireqüência mostra o nome e a descricão da variavel,
as contagens de Ireqüência para cada valor da variavel e as porcentagens acumuladas de
cada valor associado com uma variavel.
Utilizemos nosso banco de dados da survev de Iuncionarios do Samouel's para ilus-
trar uma distribuicão de Ireqüência. A Figura 9-1 apresenta as três questões que usamos
a partir da survev dos Iuncionarios em muitos dos exemplos deste capitulo. Observe que
Ioi pedido que os Iuncionarios indicassem suas percepcões sobre o trabalho no restauran-
te Samouel's respondendo a uma escala de sete pontos do tipo Concordo/Discordo. Nos
exemplos, a questão 13 é denominada Lealdade , a 14 é chamada de Empenho e a 15,
de Orgulho .
A distribuicão de Ireqüência para a variavel X
15
- Orgulho é mostrada na Figura 9-2.
Na tabela de distribuicão de Ireqüência, a primeira coluna com numeros mostra as varias
respostas (classiIicacões) para a questão. Por exemplo, as respostas para essa questão es-
tavam em uma escala de sete pontos, mas a menor classiIicacão Ioi 4, e a maior Ioi 7. A se-
gunda coluna, rotulada de Freqüência, é a contagem do numero de vezes que uma deter-
minada classiIicacão Ioi dada pelos respondentes. Nesse exemplo, uma classiIicacão de 5
Ioi dada por 28 respondentes. A terceira coluna, a de porcentagem, mostra a porcentagem
de todos os respondentes (N ÷ 71) selecionando o valor para essa variavel. Por exemplo,
39,4° dos respondentes deram uma classiIicacão de 5 nessa questão (28/71 ÷ 39,4°). A
quarta coluna, Porcentagem Valida, demonstra o percentual de respostas validas (N ÷
69). Em outras palavras, a porcentagem de respostas , não a porcentagem de respon-
dentes . Para a survev. houve oito respondentes que tiveram dados Ialtantes em uma ou
mais questões. Mas, para essa questão (X
15
), houve apenas dois respondentes (2,8°) com
dados Ialtantes. Se não ha dados Ialtantes, as porcentagens nas colunas Porcentagem e
Porcentagem Valida serão as mesmas. A Porcentagem Acumulada, na ultima coluna, é a
porcentagem acumulada do topo até a base, a partir da coluna de respostas validas. A
porcentagem acumulada simplesmente é a soma dos Percentuais Validos. Nessa survev.
55,1° dos respondentes deram uma classiIicacão de 5 ou menos.
As distribuicões de Ireqüência têm muitos usos na pesquisa em administracão. As
distribuicões de Ireqüência são utilizadas para descrever as respostas a uma determina-
da variavel, mostrando as contagens e porcentagens antes e depois do aiuste para ausên-
cia de respostas (dados Ialtantes). Uma distribuicão de Ireqüência pode ser empregada
para desempenhar uma veriIicacão visual dos dados e Iacilmente determinar a quanti-
dade de ausência de respostas, se houver. Se uma classiIicacão aparecer na distribuicão
de Ireqüência que não é resposta valida, o pesquisador também pode determinar quando
ha imprecisão de dados. Por exemplo, ver um zero na distribuicão de Ireqüência na Figu-
ra 9-2 (onde uma escala de 1 a 7 Ioi usada) indicaria um problema com os dados, uma vez
Discorda Concorda
totaImente totaImente
Por favor, indique sua opinião sobre cada uma das seguintes questões:
264 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
que a classiIicacão não era possivel, dada a codiIicacão dessa variavel. Casos em que as
classiIicacões estivessem Iora do alcance seriam investigados e medi das corretivas seriam
tomadas. O pesquisador também pode examinar os dados para cada variavel para ver se
ha pont os extremos - casos com valores extremos que podem distorcer o quadro geral.
Por exemplo, um individuo que come no McDonald' s mais de dez vezes por semana pro-
vavelment e seria tão incomum que poderi a ser considerado um pont o extremo.
Histogramas
Uma distribuicão de Ireqüência também oIerece evidências da Iorma da distribuicão pa-
ra a variavel. A maioria das respostas esta na extremidade alta ou baixa dos valores de
resposta? Um graIico de barras verticais, ou histograma, pode ser construido a parti r das
inIormacões na distribuicão de Ireqüência, e a Iorma dos verdadeiros dados como são
apresentados no histograma pode ser comparada com a Iorma esperada. A Figura 9-3 é
um histograma para a variavel ' ' Orgulho' ' (X
15
). Mostra que a maioria dos Iuncionarios
do restaurant e Samouel' s esta moder adament e orgulhosa de trabalhar la. Ou seia, a
maior parte dos Iuncionarios deu uma classiIicacão de 5, 6 ou 7 para Orgulho . Uma
curva normal (Iormato de sino) é sobreposta ao histograma para Iacilitar a comparacão
da distribuicão real com a curva normal . A distribuicão, nesse exemplo, conIorma-se ra-
zoavelment e bem a uma curva normal . No canto inIerior direito do graIico, a média, o
desvio-padrão e o t amanho da amostra são indicados. Observe que o t amanho da amos-
tra é 69. Isso indica que ha dados Ialtantes nessa variavel para dois respondentes.
PESQUISA EM AÇÃO
USO DE SPSS PARA PREPARAR UMA TABELA E UM HISTOGRAMA DE
DISTRIBUIÇÃO DE FREQÜÊNCIA
E Iacil usar o SPSS para calcular a tabela de distribuicão de Ireqüência na Figura 9-2. Inicie seu soft-
ware SPSS e carregue o banco de dados da survev dos Iuncionarios com dados Ialtantes (Survev de
FuncionariosN ÷ 71 com Dados Faltantes.sav). A seqüência de cliques é: ANALYZE -~ DESCRIP-
TIVE STATISTICS -FREQUENCIES. Desca e destaque X
15
- Orgulho e clique na caixa da seta para
coloca-la na caixa Variables. Clique em Charts e, sob Chart Type, clique Histograms e, abaixo a di-
reita, With Normal Curve e, Iinalmente, Continue. A seguir, clique em OK para executar o progra-
ma. O resultado sera a tabela e o graIico de Ireqüência mostrados nas Figuras 9-2 e 9-3.
CAPÍTULO 9 « COMPREENSÃO E APRESENTAÇÃO DOS DADOS 265
HISTOGRAMA PARA A VARIÁVEL "ORGULHO" DOS FUNCIONÁRIOS COM DADOS
FALTANTES
0
Os resultados mostrados anteriormente seriam de interesse para Phil Samouel, pro-
prietario do Samouel's Greek Cuisine. Mas uma comparacão da satisIacão de seus clien-
tes com a dos clientes do Gino's também seria interessante. Fazendo essa comparacão, ele
poderia determinar se ha diIerencas nos niveis de satisIacão dos clientes dos dois restau-
rantes. A questão usada para mensurar a satisIacão nas survevs dos clientes do Samouel's
e do Gino's é apresentada na Figura 9-4.
As tabelas de Ireqüência na Figura 9-5 mostram as classiIicacões para satisIacão dos
clientes nos dois restaurantes. Observe que você pode comparar as classiIicacões de satis-
Iacão para ambos cs restaurantes. Primeiro, va até a coluna de Freqüência e veriIique o
Total para o Samouel's e o Gino's. Você vera que cada total é 100 - o numero de clientes
entrevistados em cada restaurante que não apresentaram dados Ialtantes em seus ques-
tionarios. Na extremidade direita, ha uma coluna chamada de Porcentagem Acumulada.
Se você olhar o terceiro numero a partir de cima nessa coluna, vera o numero 68° para o
Samouel's. Essa é a porcentagem de classiIicacões de satisIacão de 5,0 ou menos. Mas
quando você olha o Gino's, vê que somente 35° de seus clientes deram uma classiIicacão
de 5 ou menos. Esses numeros dizem-nos que os clientes do Gino's estão mais satisIeitos
do que os do Samouel's. Como sabemos disso? Com base no Iato de que os clientes do Gi-
no's dão classiIicacões mais altas para a variavel de satisIacão (X
17
) do que os do
Samouel's. Por exemplo, como Ioi observado antes, 68° dos clientes do Samouel's classi-
Iicam o restaurante com um 5 ou menos, enquanto que somente 35° dos clientes do Gi-
no's o classiIicam com 5 ou menos. InIormacões como essas podem ser muito uteis para
pesquisadores em administracão, proprietarios e administradores.
As comparacões visuais com um histograma das classiIicacões de satisIacão dos dois
restaurantes tornam ainda mais Iacil a comparacão dessas classiIicacões. Um histograma
simplesmente toma as inIormacões de uma tabela de Ireqüência e as distribui em um gra-
Iico. Rapidamente vemos, a partir da Figura 9-6, que o Samouel's tem muito poucas clas-
siIicacões 7 (Altamente SatisIeito) e que o Gino's tem muitas. Além disso, o Samouel's
tem muitas classiIicacões 4, ao passo que o Gino's tem muito poucas. Assim, é Iacil ver
que os clientes do Gino's estão muito mais satisIeitos do que os do Samouel's.
FIGURA 9-3
266 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
PESQUISA EM AÇÃO
USO DE SPSS PARA COMPARAR OS RESTAURANTES SAMOUEL S E GiNO S
QUANTO À SATISFAÇÃO DOS CLIENTES
Para comparar os dois restaurantes quanto a satisIacão dos clientes, primeiro carregue o banco de
dados no software SPSS - Survev de clientesœN ÷ 200.sav. Entre no software SPSS e clique no menu
Data. Desca e clique em Split File e depois em Compare Groups. Agora desca e destaque a variavel
X
25
- Concorrência e posicione-a na caixa chamada Groups based on e clique em OK.
Agora, você pode comparar os dois restaurantes. A seqüência de cliques é: ANALYZE ‰» DES-
CRIPTIVE STATISTICS -~ FREQUENCIES. Destaque X
17
- SatisIacão e clique na caixa da seta para
coloca-la na caixa Variables. Clique em Charts e, abaixo de Chart Type, clique em Histograms e, lo-
go abaixo, em With Normal Curve e, Iinalmente, Continue. A seguir, clique em OKpara rodar o pro-
grama. Os resultados serão os mesmos das Figuras 9-5 e 9-6.
Gráficos de barras
Os graIicos de barras mostram os dados na Iorma de barras que podem ser distribuidas
horizontal ou verticalmente (a unica diIerenca entre um graIico de barras e um histogra-
ma é que não ha espaco entre as barras no histograma). Os graIicos de barras são muito
uteis para demonstrar magnitudes absolutas e relativas e para comparar diIerencas. A Fi-
gura 9-7 é um exemplo de um graIico de barras vertical para a distribuicão de respostas
para uma questão na survev de Iuncionarios do SamoueFs (X
15
- Orgulho). A questão per-
guntava qual o grau de orgulho de trabalhar no SamoueFs. Os respondentes classiIicaram
a questão usando uma escala de sete pontos em que 7 ÷ Concordo totalmente e 1 ÷ Discor-
do totalmente. Por exemplo, a Ireqüência (10) para o valor de Concordo totalment e ÷ 7 é a
barra vertical do lado direito do graIico. Esse graIico mostra que uma proporcão modera-
ZOMPREENSÃO E APRESENTAÇÃO DOS DADOS 2 6 7
FIGURA 9-6 HÌSTOGRAMAS COMPARANDO SAMOUEL/S E GÌNO'S
dament e alta dos Iuncionarios do Y @.28;]9 esta orgulhosa de trabalhar la (uma alta pro-
porcão de Iuncionarios respondeu com 5, 6 ou 7 na escala de sete pontos). Observe que ne-
nhuma das respostas Ioi inIerior a 4 na escala de sete pontos.
Gráficos de pizza
Os graIicos de pizza apresent am proporcões relativas das respostas. Cada secão da pi zza
é a proporcão relativa. Isto é, as secões da pizza são most radas como porcentagem da area
total da pizza. Na Figura 9-8, ha um graIico de pizza para a variavel X
15
- Orgulho na sur-
vev dos Iuncionarios do SamoueFs. Geralmente, seis ou sete secões em um graIico de piz-
za são consideradas o maxi mo possivel, e três ou quatr o seriam o ideal.
PESQUÌSA EM AÇÃO
FLORENCE NÌGHTÌNGALE E O GRAFÌCO DE PÌZZA
Florence Nightingale é mais lembrada como a mãe da enIermagem moderna. Poucos sabem, porém,
que ela também ocupa um lugar na historia pelo uso de métodos graIicos para transmitir inIorma-
cões estatisticas complexas.
Depois de testemunhar as condicões sanitarias deploraveis na Criméia, ela escreveu Notes on
Matters Affecting the Health. Efficiencv ana Hospital Aaministration of the British Armv (1858), que in-
cluia diagramas coloridos onde as estatisticas representadas eram proporcionais a area de uma cu-
nha em um diagrama circular. Esses graIicos ilustravam visualmente que muito mais mortes de-
viam-se a causas não relacionadas com as batalhas, tais como condicões insalubres.
Com essas inIormacões, Nightingale aiudou a promover a idéia de que os Ienômenos sociais po-
deriam ser obietivamente mensurados e submetidos a analise matematica. E, através dessa aborda-
gem estatistica, Nightingale convenceu as autoridades militares, o Parlamento e a Rainha Vitoria, a
realizarem reIormas hospitalares - o que resultou em um declinio na taxa de mortalidade dos solda-
dos.
Como Nightingale demonstrou, a estatistica oIereceu um modo organizado de conhecimento e
levou a melhorias nas praticas médicas e cirurgicas. Nightingale também desenvolveu um Formu-
lario Estatistico Modelo para Hospitais que poderia ser usado para coletar e gerar dados e estatisti-
cas sistematicas. Ela tornou-se membro da Royal Statistical Society em 1858 e membro honorario da
American Statistical Association em 1874 e Ioi reconhecida como uma proIetisa no desenvolvi-
mento da estatistica aplicada.
FONTE: www.math.yorku.ca/SCS Gallery/Ilo.html
268 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
PESQUISA EM AÇÃO
USO DE SPSS PARA CRIAÇÃO DE GRÁFICOS DE BARRAS E DE PIZZA
Você pode usar o software SPSS para criar o graIico de barras exibido na Figura 9-7. Carregue o ban-
co de dados sobre Iuncionarios. A seqüência de cliques para preparar um graIico de barras para a
variavel X
15
- Orgulho é: ANALYZE -* DESCRIPTIVE STATISTICS -~ FREQUENCIES. Destaque X
15
e clique na caixa da seta para coloca-la na caixa Variables. Clique em Charts e Bar Charts e, depois,
em Continue. Em seguida, clique em OK para executar o programa. Você devera ver o mesmo gra-
Iico de barras mostrado na Figura 9-7.
Você também pode usar o software SPSS para criar graIicos de pizza. A seqüência de cliques:
ANALYZE -~ DESCRIPTIVE STATISTICS -» FREQUENCIES. Destaque X
15
- Orgulho e clique na
caixa da seta para coloca-la na caixa Variables. Clique em Charts e Pie Charts, depois, em Continue.
A seguir, clique em OK para rodar o programa. O graIico de pizza é apresentado na Figura 9-8.
O graIico de pizza é uma outra maneira de apresentar dados visualmente. A propor-
cão dos Iuncionarios do Samouel' s que indicaram estar orgulhosos de trabalhar la (res-
ponder am com 5, 6 ou 7) Ioi mui t o alta - mai s de 80°. Veia a secão Pesquisa em acão
para apreciar uma interessante perspectiva historica do graIico de pizza.
Os numeros e porcentagens em nossos exemplos dos restaurantes mostram como os
clientes e os Iuncionarios classiIicam varios aspectos das operacões dos restaurantes. Co-
mo ha o envolviment o de numeros, as distribuicões de Ireqüência, os graIico de barra e
os de pizza podem ser utilizados para calcular estatisticas descritivas. A seguir, discutire-
mos a curva normal e as medi das de tendência central e dispersão.
A DÌSTRÌBUÌÇÃO NORMAL
Uma das distribuicões mais uteis para os pesquisadores em administracão é a distribui-
cão normal . A distribuicão normal descreve a distribuicão esperada de médias de amos-
tras, bem como muitas outras ocorrências casuais. A curva normal é simétrica, com Iorma
de sino, e quase todos (99°) os seus valores estão dentro de mai s/ menos três desvios-pa-
drão de sua média. Um exemplo de curva normal é mostrado na Figura 9-9. Observe que,
quando você tem uma distribuicão normal, 68° dos valores estão dentro de mais ou me-
nos um desvio-padrão e 95° estão dentro de mais ou menos dois desvios-padrão. A dis-
tribuicão normal é especialmente import ant e porque oIerece uma base subiacente para
muitas das inIerências Ieitas pelos pesquisadores em administracão.
MEDÌDAS DE TENDÊNCÌA CENTRAL
As tabelas distribuicão de Ireqüência são Iaceis de ler e Iornecem uma grande quantida-
de de inIormacão basica sobre os dados. Muitas vezes, no entanto, os pesquisadores pre-
cisam sintetizar e condensar as inIormacões para melhor compreendê-las. As medi das de
tendência central podem ser utilizadas para tal. A média, a mediana e a moda são medi -
das de tendência central. As medidas de tendência central localizam o centro da distribui-
cão, bem como outras inIormacões uteis.
Média
A média é a média aritmética e uma das medi das mai s utilizadas de tendência central.
Por exemplo, se você esta interessado em saber qual o consumo diari o de reIrigerantes,
CAPÍTULO 9 ‹ COMPREENSÃO E APRESENTAÇÃO DOS DADOS 269
FIGURA 9-7
GRÁFICO DE BARRAS E TABELA DE FREQÜÊNCIA PARA A VARIÁVEL X
15
- ORGULHO
DE TRABALHAR NO SAMOUEL S
Porcentagem Porcentagem
Resposta Freqüência Porcentagem váIida acumuIada
FIGURA 9-8 GRÁFICO DE PIZZA DA VARIÁVEL X
15
- ORGULHO
Concorda
totalmente = 7
FIGURA 9-9 A CURVA NORMA!
270 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
você pode calcular o numero médio de reIrigerantes que um individuo bebe por dia. A
média pode ser usada quando seus dados são medidos com uma escala intervalar ou de
razão (também chamada métrica). Os dados comumente mostram algum grau de tendên-
cia central, com a maioria das respostas distribuidas proximas da média ou valor médio.
Na maioria dos casos, a média não é sensivel a valores de dados que estão sendo adi-
cionados ou apagados. Por essa razão, os estatisticos dizem que ela é uma medida ro-
busta de tendência central. Se valores extremos (pontos extremos) ocorrerem na distri-
buicão, no entanto, a média podera representar mal as verdadeiras caracteristicas dos da-
dos. Por exemplo, suponhamos que você pergunte a quatro individuos quantas Coca-Co-
las eles bebem em um dia. Eles respondem o que segue: Respondente A ÷ 1: Responden-
te ^ ã ïðå λ-°±²¼»²¬» O ã ëå » λ-°±²¼»²¬» Ü ã êò Além disso, você observou que os res-
pondentes A e ^ são do sexo Ieminino e os respondentes O » Ü são do sexo masculino.
Com esse conhecimento, você agora pode comparar o consumo de Coca-Colas entre ho-
mens e mulheres. Analisando primeiro os respondentes do sexo Ieminino (Respondentes
A e B), calculamos que o numero médio de Coca-Colas é 5,5 (1 ¹ 10 ÷ 11 / 2 ÷ 5,5). Do
mesmo modo, ao considerarmos os respondentes do sexo masculino (Respondentes O ;
Ü÷ô ½¿´½«´¿³±- ¯«» ± numero médio de Coca-Colas é 5,5 (5 ¹ 6 ÷ 11 / 2 ÷ 5,5). Poderiamos
concluir que não ha diIerencas nos padrões de consumo de homens e mulheres se consi-
derassemos somente o numero médio de Coca-Colas consumidas por dia. Mas, se consi-
derassemos a distribuicão subiacente, é obvio que ha diIerencas. As duas mulheres estão
nos extremos, enquanto que os homens estão no centro da distribuicão. A retirada de con-
clusões Iundamentadas apenas na média pode distorcer nossa compreensão dos padrões
de consumo de Coca-Cola de homens e mulheres em situacões como a do exemplo ante-
rior. Naturalmente, devemos também considerar que, nesse exemplo, estamos nos reIe-
rindo a uma pequena amostra e que, a medida que aumenta o tamanho da amostra, au-
menta a habilidade de Iazer inIerências quanto a uma populacão maior. Dessa Iorma, o
tamanho da amostra também deve ser considerado ao se tirarem conclusões sobre distri-
buicões e suas caracteristicas, como as médias.
A média é mais utilizada com dados intervalares ou de razão (métricos). Mas, como
observado acima, quando valores extremos ocorrem nos dados, a média pode distorcer
os resultados. Nessas situacões, a mediana e a moda devem ser consideradas.
Mediana
A proxima medida de tendência central, a mediana, é o valor que esta no centro da distri-
buicão. Em outras palavras, a mediana é o valor abaixo (e acima) do qual recai metade dos
valores na distribuicão da amostra. Por essa razão, as vezes é chamada de 50° percentil. Por
exemplo, suponhamos que você entrevistasse uma amostra de individuos a respeito do nu-
mero de reIrigerantes que eles bebem em uma semana. Você poderia descobrir que o nume-
ro mediano de reIrigerantes consumidos é 10, com o numero de reIrigerantes consumidos
acima e abaixo desse numero sendo o mesmo (o numero mediano é o centro exato da dis-
tribuicão). Se você tem um numero par de observacões de dados, a mediana é a média de
dois valores centrais. Se você tem um numero impar de observacões, a mediana é o valor
central. A mediana é a medida adequada de tendência central para dados comuns.
Moda
A moda é a medida de tendência central que identiIica o valor que ocorre com mais Ire-
qüência na distribuicão da amostra. Por exemplo, o individuo tipico pode beber uma mé-
dia de três Coca-Colas por dia, mas o numero de Coca-Colas que a maioria das pessoas
bebe é somente dois (a moda). A moda é o valor que representa o pico mais alto no graIi-
co de distribuicão. A moda é a medida apropriada de tendência central para dados nomi-
nais (categoricos).
CAPÍTULO 9 » COMPREENSÃO E APRESENTAÇÃO DOS DADOS 271
Exemplos de medidas de tendência central
A tabela estatistica da Figura 9-10 contém as medi das de tendência central para os 63
questionarios de Iuncionarios sem dados Ialtantes. Observe que a média é 5,49, a media-
na é 5,0, a moda é 5 e não ha dados Ialtantes. Como essa variavel é mensurada em uma
escala de sete pontos, com 1 ÷ Discordo totalmente e 7 ÷ Concordo totalmente, isso mos-
tra que os Iuncionarios sentem-se orgulhosos de trabalhar no Samouel' s (centro da esca-
la de sete pontos ÷ 4).
A seguir, veriIique o histograma na Figura 9-11. Impusemos uma curva normal sobre
o graIico para que você possa comparar as respostas com ela. O graIico visualmente mos-
tra que o pont o mais baixo na escala de sete pontos para X
15
- Orgulho é 4 e que o mais al-
to é 7. Também mostra que a distribuicão é bastant e normal e não apresenta problema.
Você pode usar o Excel para computar as medidas de tendência central. Primeiro, destaque os nu-
meros incluidos no calculo (por exemplo, coluna ou Iileira de numeros). Para Iazer isso, clique na
coluna deseiada e ela destacara todos os dados na coluna. A seguir, va até a parte inIerior da coluna
e clique na primeira célula aberta. Apos, siga a seqüência abaixo.
A seqüência de cliques no Excel é: Insert ‰~ Function - Or select a category ‰~ All. Depois dessa
seqüência, desca na lista de Iuncões na caixa grande de texto e destaque MEAN (Média), MEDIAN
ou MODE, conIorme deseiar. Selecione OK, e a caixa Function Arguments aparecera. Essa caixa per-
mite ao usuario certiIicar-se de que a coluna correta Ioi selecionada. Selecione OK novamente, e o
computador iniciara os calculos. A resposta aparecera na célula selecionada na parte inIerior da co-
luna.
Para calcular a média da variavel X
15
na survev dos Iuncionarios, destaque a coluna P (a que con-
tém os dados para X
15
), va até a parte inIerior da coluna e clique na primeira célula aberta. Siga a se-
qüência acima e selecione a média, clicando em OK duas vezes. Os resultados serão os mesmos da
Figura 9-10. Um processo semelhante é seguido para calcular a mediana e a moda.
MEDÌDAS DE DÌSPERSÃO
As medidas de tendência central raramente oIerecem um panorama completo da distribui-
cão de uma amostra. Por exemplo, se o McDonald' s coletasse dados sobre as atitudes dos
clientes em relacão a um novo sanduiche a base de carne, você poderi a calcular a média, a
mediana e a moda da distribuicão das respostas. Mas também poderia deseiar saber se ha
muita variabilidade nas opiniões dos respondentes quant o ao sanduiche de carne. Por
exemplo, lembre-se de nossa discussão da média e o consumo de Coca-Cola, em que os in-
dividuos do sexo Ierninino e do masculino tinham a mesma média de consumo, mas as mu-
lheres estavam bem no alto e bem embaixo da distribuicão, e os homens estavam no centro.
Se a survev do McDonald' s sobre as atitudes em relacão ao novo sanduiche Iosse bastante
coerente (pouca variacão) e se situasse na extremidade positiva da escala, provavelmente a
empresa Iicaria satisIeita. Por outro lado, se as respostas variassem da extremidade inIerior
(negativa) para a superior (positiva), a empresa iria querer investigar mais o novo produt o
antes de acrescenta-lo ao seu cardapio. EspeciIicamente, iria querer saber por que havia res-
postas negativas (extremo inIerior) e o que poderi a ser Ieito para elimina-las ou minimiza-
las. Você pode saber mai s sobre esse problema examinando as medidas de dispersão asso-
ciadas com a distribuicão de respostas da amostra na pesquisa de clientes.
As medi das de dispersão descrevem a tendência de as respostas da amostra partirem
da tendência central. O calculo da dispersão dos dados, ou como as respostas vari am a
272 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
PESQUISA EM AÇÃO
USO DE SPSS PARA CALCULAR MEDIDAS DE TENDÊNCIA CENTRAL
Você pode calcular as medidas de tendência central com o software SPSS. A seqüência de cliques é:
ANALYZE -~ DESCRIPTIVE STATISTICS -» FREQUENCIES. Examinaremos outra vez a variavel
X
15
- Orgulho da pesquisa com Iuncionarios (Survev de Funcionarios N ÷ 63.sav). Clique em X
15
para
destaca-la e na seta para a caixa Variables para usa-la em sua analise. Depois, abra a caixa Statistics,
clique emMean, Median e Mode e, apos, em Continue. A seguir, clique emCharts, Histograms e, lo-
' go abaixo, emWith Normal Curve e Continue. Usando os aefaults para a caixa Format, clique emOK
para rodar o programa. Os resultados serão os mesmos apresentados nas Figuras 9-10 e 9-11.
partir da média, é outro meio de sintetizar os dados. As medi das tipicas de dispersão usa-
das para descrever a variabilidade em uma distribuicão de numeros incluem o intervalo,
a variância, o desvio-padrão, a assimetria e a curtose.
Intervalo
O intervalo é a mais simples medi da de dispersão. Ele deIine a dispersão dos dados e a
distância entre ao maiores e os menores valores da distribuicão de Ireqüência de uma
amostra. Também podemos deIinir o intervalo di zendo que ele identiIica os pontos Iinais
da distribuicão da amostra. Por exemplo, se nossa survev de opiniões sobre um novo san-
duiche do McDonald' s veriIicasse a probabilidade de compra desse item utilizando uma
escala de dez pontos e a maior classiIicacão de probabilidade Iosse 8 e a menor Iosse 1, o
intervalo seria sete ( 8 - 1 ÷ 7).
Variância
Para det ermi nar a distância da qual um respondent e se encontra em relacão a médi a,
calculamos os escores de desvi o i ndi viduai s para cada respondent e. Se os escores de
desvi o são grandes, descobrimos que a distribuicão tem uma grande dispersão ou va-
riabilidade. O problema com os escores de desvio é que, quando tentamos calcular um
desvi o médi o para t odos os respondentes, os escores de desvio positivo sempre cance-
lam os negativos, assim deixando um valor de desvio médi o igual a zero. Para eliminar
esse problema, podemos colocar os escores de desvi o ao quadr ado e então calcular a
médi a. O resultado é uma medi da chamada de variância. Ela é util par a descrever a va-
riabilidade da distribuicão e é um indice mui t o bom do grau de dispersão. A variância
sera igual a zero se cada um do total de respondent es na distribuicão Ior igual a média.
A variânci a torna-se maior a medi da que as observacões t endem a diIerir cada vez mais
umas das out ras e da média.
CAPÍTULO 9 ‹ COMPREENSÃO E APRESENTAÇÃO DOS DADOS 2 7 3
| HISTOGRAMA COM CURVA NORMAL PARA X
15
- ORGULHO
Desvio-padrão
A variância Ireqüentemente é usada em estatistica. Mas apresenta uma desvantagem. A
variância é uma unidade de mensuracão levada ao quadrado. Por exemplo, se medimos
o numero de Coca-Colas consumidos em um dia e deseiamos calcular uma média para a
amostra de respondentes, a média sera o numero médio de Coca-Colas, e a variância se-
ra em numeros ao quadrado. Para superar o problema de ter a medida de dispersão em
unidades ao quadrado em vez das unidades de mensuracão originais, usamos a raiz qua-
drada da variância, que é chamada de desvio-padrão. O desvio-padrão descreve a disper-
são da variabilidade dos valores de distribuicão da amostra a partir da média e é talvez o
indice mais valioso da dispersão.
Para obter o desvio ao quadrado, elevamos ao quadrado os escores de desvio indivi-
dual antes de adiciona-los (o quadrado de um numero negativo produz um resultado po-
sitivo). Assim que a soma dos desvios ao quadrado é determinada, ela é dividida pelo nu-
mero de respondentes menos 1. O numero 1 é subtraido do numero de respondentes pa-
ra aiudar a produzir uma estimativa do desvio-padrão sem tendenciosidade. Se o desvio-
padrão estimado é grande, as respostas na distribuicão de numeros de uma amostra não
Iicam muito proximas da média da distribuicão. Se o desvio-padrão é pequeno, você sa-
be que os valores de distribuicão estão proximos da média.
Uma outra maneira de pensar sobre o desvio-padrão estimado é a de que seu tama-
nho indica algo sobre o nivel de concordância entre os respondentes quando eles respon-
dem uma determinada questão. Por exemplo, na survev dos Iuncionarios do Samouel's,
solicitou-se aos respondentes que indicassem sua lealdade e orgulho de trabalhar no
Samouel's (X
13
e X
15
) utilizando-se uma escala de sete pontos. Se o desvio-padrão estima-
do dessas duas variaveis é pequeno (· 1,0), signiIica que os respondentes Ioram muito
coerentes em suas opiniões sobre o trabalho no Samouel's. Por outro lado, se o desvio-pa-
drão calculado dessas duas variaveis é grande (~ 3,0), então vemos que ha muita variabi-
lidade nas opiniões.
Um ultimo conceito a ser esclarecido é o erro padrão da média. O desvio-padrão da
distribuicão da média da amostragem é chamado de erro padrão da média. Quando te-
mos inIormacões da populacão, podemos determinar o desvio-padrão. Como raramente
temos inIormacões de uma populacão, normalmente retiramos uma amostra e estimamos
o desvio-padrão. Quando retiramos somente uma amostra, reIerimo-nos a isso como des-
vio-padrão estimado. Quando extraimos muitas amostras da mesma populacão, temos
uma distribuicão de amostragem de todos os valores possiveis das médias da amostra. O
desvio-padrão dessa distribuicão de médias é o erro padrão da média.
274 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
Assimetria e curtose
Muitas vezes, estamos interessados na Iorma de nossa distribuicão. Duas medidas que nor-
malmente veriIicamos são a assimetria e a curtose. A assimetria mensura a partida de uma
distribuicão simétrica (ou equilibrada). Em uma distribuicão simétrica, a média, a mediana
e a moda estão na mesma localizacão. Uma distribuicão com respondentes que se posicio-
nam ao longo de uma extremidade ou de outra é chamada de assimétrica. Quando a extre-
midade se alonga para a esquerda (valores menores), é negativamente assimétrica. Quan-
do se alonga para a direita (valores maiores), é positivamente assimétrica. Quando uma dis-
tribuicão é simétrica, a assimetria é zero, e, quant o maior o numero, maior a assimetria.
Com uma assimetria positiva, obtemos um numero positivo, e, com uma assimetria nega-
tiva, obtemos um numero negativo. Quando os valores de assimetria são maiores do que ¹1
ou menores do que - 1 , isso indica uma distribuicão substancialmente assimétrica.
A curtose é uma medida do pico (ou do achatamento) de uma distribuicão. As distri-
buicões em que as respostas se aglomeram no centro são ditas agudas. As distribuicões
com escores mais amplament e distribuidos e extremidades mais separadas são conside-
radas achatadas. Para uma curva normal , o valor da curtose é zero. Um valor positivo al-
to signiIica que a distribuicão é muit o aguda, enquant o que um valor negativo alto signi-
Iica que a distribuicão é muit o achatada. Uma curva é muit o aguda quando a curtose ex-
cede ¹3 e é muit o achatada quando ela Iica abaixo de - 3 .
As medidas de tendência central e de dispersão podem revelar muito sobre a distribui-
cão de um coniunto de numeros a partir de uma survev. Os pesquisadores em administracão
Ireqüentemente estão interessados, porém, em resolver problemas de pesquisa que envolvem
mais de uma variavel por vez. Explicaremos como Iazer isso em capitulos posteriores.
Exemplos de medida de dispersão
As medidas de dispersão para X
15
- Orgul ho na survev dos Iuncionarios do Samouel' s são
mostradas na Figura 9-12. A resposta mais alta na escala de sete pontos é um 7 (maximo),
e a mais baixa é um 4 (minimo). Nenhum respondent e deu 1,2 ou 3 para essa questão. O
intervalo, calculado como a distância entre o menor e o maior valor no coniunto de res-
postas, é 3 (7 - 4 ÷ 3). O desvio-padrão é 0,931, e a variância é 0,867. Um desvio-padrão de
0,931 em uma escala de sete pontos é relativamente pequeno e indica que as respostas es-
tão razoavelmente proximas da médi a de 5,49 da amostra.
USO DE EXCEL PARA COMPUTAÇÃO DO DESVIO-PADRÃO
Você pode utilizar o Excel para computar o desvio-padrão. Primeiro, destaque todos os numeros in-
cluidos no calculo (uma coluna ou Iileira de dados). Para isso, clique na coluna (ou Iileira) deseiada.
A seguir, va até a parte inIerior da coluna (ou outro lugar da planilha Excel) e clique na primeira cé-
lula aberta. Siga a seqüência abaixo.
A seqüência de cliques no Excel é: Insert ‰~ Function ‰~ Or select a category ‰~ All. Depois de
completar a seqüência, desca na lista de Iuncões na caixa grande de texto e destaque STDEV, que re-
presenta desvio-padrão. Selecione OK, e a caixa Function Argument aparecera. Essa caixa permite
ao usuario certiIicar-se de que a coluna ou Iileira correta Ioi selecionada. Selecione OK novamente,
e o computador iniciara os calculos. A resposta aparecera na célula selecionada.
Para calcular o desvio-padrão da variavel X
15
na survev dos Iuncionarios, destaque a coluna P (a
que contém os dados para X
15
), va a parte inIerior da coluna e clique na primeira célula aberta. Siga
a seqüência anterior, selecione STDEV e clique em OK duas vezes. Os resultados serão os mesmos
da Figura 9-12. Lembre-se de que, se você ia calculou a média para a variavel X
15
da survev dos Iun-
cionarios, você deve apagar a média calculada na célula antes de computar o desvio-padrão.

CAPÍTULO 9 » COMPREENSÃO E APRESENTAÇÃO DOS DADOS 275
FIGURA 9-12 MEDIDAS DE DISPERSÃO
PONTOS EXTREMOS
Um pont o extremo é um respondent e (observacão) que tem ou um mais valores distin-
t ament e diIerentes dos valores dos outros respondent es. Como os dados Ialtantes, os
pont os extremos podem ter impact o sobre a vali dade das descobertas do pesqui sador
e, port ant o, devem ser identiIicados e tratados. Os pont os extremos podem resultar de
erros na coleta ou na ent rada dos dados. Esse tipo de pont o extremo é nor mal ment e
identiIicado e corrigido na Iase de limpeza dos dados do proieto de pesquisa. Um se-
gundo tipo pode ser uma observacão precisa que represent a as verdadeiras caracteris-
ticas da popul acão, mas ainda distorce as descobertas. Por exemplo, se calculassemos o
valor liquido das economias domésticas na area onde vive Bill Gates, da MicrosoIt, a
médi a resultant e seria muit o maior com Gates incluido do que el iminado, ia que o va-
lor liquido de sua economia doméstica torna-o um pont o extremo. Certamente, os vizi-
nhos de Gates são ricos, mas suas economias domésticas t êm um valor liqui do mui t o
menor do que a dele. Nessa situacão, a questão seria O valor médi o das economias do-
mésticas na vizinhanca de Bill Gates é mai s representativo com ele incluido ou exclui-
do? A resposta, aqui , seria depende dos obietivos da pesquisa . A verdadeira médi a
incluiria Bill Gates. Mas sua exclusão seria muit o mai s representativa do valor liquido
de uma economi a doméstica na area.
O terceiro tipo de pont o extremo é o respondente que tem um ou mais valores unicos,
mas sem razão aparente (no exemplo de Bill Gates, sabiamos a razão: agora, não sabe-
mos). Em casos como esse, se o pesquisador não consegue determinar se o pont o extremo
PESQUISA EM AÇÃO
USO DE SPSS PARA CALCULAR MEDIDAS DE DISPERSÃO
Ilustraremos as medidas de dispersão utilizando a variavel X
15
- Orgulho da survev de Iuncionarios
do Samouel's com o software SPSS. Aseqüência de cliques é: ANALYZE -~ DESCRIPTIVE STATIS-
TICS ‰`FREQUENCIES. Destaque X
15
e clique na seta para coloca-la na caixa Variables. A seguir, cli-
que em Statistics e va até a caixa Dispersion. Clique em Standard deviation, Variance, Range, Mini-
mum and Maximum, Skewness and Kurtosis e Continue. Se você deseiar criar graIicos, clique na
caixa Charts e escolha entre as opcões Bar, Pie e Histogram. Usando os aefaults da caixa Format, cli-
que OK para rodar o programa. Os resultados serão os da Figura 9-12.
276 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
representa um segmento valido da populacão, este devera ser removido. Para mais inIor-
macões sobre a natureza dos pontos extremos e como trata-los, ver Hair, et ai. 2003, Mul-
tivariate Data Analvsis. With Reaaings. Prentice-Hall, 6
a
edicão.
Discutiremos outros dois instrumentos diagnosticos para melhor compreensão dos da-
dos. O primeiro é o graIico de caixa, e o segundo é o graIico caule-e-Iolha.
ÙÎ_Ú×ÝÑÍ ÜÛ Ýß×Èß
Um instrumento valioso para exame de dados é o graIico de caixa. Ele apresenta visual-
mente a localizacão, a dispersão, a extensão das extremidades e os pontos extremos da
distribuicão. São representacões visuais da mediana, quartis superior e inIerior e maior e
menor valores de respondentes. Uma caixa retangular Iica no centro e inclui 50° dos va-
lores dos dados (dois quartis internos). Uma linha central na caixa demarca o valor da
mediana. Os marcadores superior e inIerior estendem-se como linhas retas até o menor e
maior valores a partir da caixa e incluem os dados restantes, com excecão dos pontos ex-
tremos (valores extremos). Em posicão perpendicular ao Iinal das linhas, ha um eixo. Es-
te localiza-se de Iorma a abranger todos os valores dentro de 1,5 vezes o intervalo do in-
terquartil de cada borda da caixa. Qualquer valor Iora, para mais ou para menos de 1,5
vezes o interquartil, é considerado um ponto extremo. Os graIicos de caixa são um exce-
lente instrumento diagnostico para pesquisadores em administracão. Eles visualmente
representam a Iorma (simetria) dos dados, a assimetria e a dispersão e mostram os pon-
tos extremos, se houver. A Figura 9-13 apresenta um graIico de caixa para a variavel X
13
-
Lealdade da survev dos Iuncionarios do Samouel's. Os eixos mostram que a mais alta clas-
siIicacão para essa variavel é 7 e que a mais baixa é 4, enquanto que o valor da mediana é
6. Os dois quartis internos não são do mesmo tamanho. O inIerior é maior, indicando que
mais respondentes nesse quartil do que no superior. Não ha pontos extremos para essa
questão, ia que não ha observacões Iora dos eixos.
A Figura 9-14 mostra um graIico de caixa para a variavel X - Empenho da survev
dos Iuncionarios do Samouers. A mediana é 5, e todo o quartil interno esta na média ou
acima dela. Isso signiIica que 25° das respostas são 3 ou 4. Observe que a caixa identiIi-
ca um ponto extremo de 3 na parte inIerior da escala. Isso mostra que o respondente 58
esta mais de 1,5 vezes o intervalo do interquartil da caixa, que o eixo esta localizado 1,5
GRÁFICO DE CAIXA PARA A VARIAVEL DA SURJEY DE FUNCIONARIOS
êôð
ëôð
ìôë
ìôð
Òã êí
È
ïí
ó Ô»¿´¼¿¼»
OUTRAS MEDIDAS DIAGNÓSTICAS
7,5
éôð
êôë
ë ôë
í ôë
CAPÍTULO 9 ‹ COMPREENSÃO E APRESENTAÇÃO DOS DADOS 177
PESQUÌSA EM AÇÃO
USO DE SPSS PARA CONSTRUÇÃO DE UM GRÁFÌCO DE CAÌXA
Você pode construir um graIico de caixa com SPSS. A seqüência de cliques é a seguinte: ANALYZE
-~ DESCRIPTIVE STATISTICS -~ EXPLORE. Destaque a variavel X
14
- Empenho e clique na caixa da
seta para a caixa Dependent List para usa-la na analise. Mantenha o DeIault na caixa Display, abra a
caixa Statistics e clique em Outliers e Continue, indo então para Plots e desativando Stem and LeaI,
pois discutiremos esse topico na proxima secão, e clique em Continue. Para a caixa Options, usamos
os aefaults e clicamos emOKpara executar o programa. O graIico de caixa para a variavel X
14
é mos-
trado na Figura 9-14. O SPSS identiIica pontos extremos mostrando o numero do respondente.
vezes a largura da caixa em relacão a sua parte inIerior e que o respondent e 58 esta ainda
mais aIastado. A distribuicão não é simétrica, mas um pouco assimétrica para a part e de
cima, que é a extremidade superior da escala. A dispersão, que inclui 99° dos valores
(mai s/ menos três desvios-padrão) vai de 4 a 7.
GRÁFICOS CAULE-E-FOLHA
Os graIicos caule-e-Iolha são instrument os diagnosticos relacionados aos histogramas.
Mas, diIerentemente destes, os graIicos caule-e-Iolha não agrupam valores de dados em
intervalos e, portanto, perdem inIormacões. Os graIicos caule-e-Iolha most ram valores de
dados reais que podem ser inspecionados diretament e sem o uso de barras incluidas. Es-
sa caracteristica demonstra a distribuicão de valores dentro do intervalo e preserva sua
ordem de classiIicacão para descoberta da mediana, da moda e de outras estatisticas pa-
ra sintese. O intervalo de valores é Iacilmente visualizado, e as impressões de Iorma e de
dispersão são imediatas. Os padrões nos dados são Iaceis de observar, tais como Ialhas
onde não ha valores, areas onde os valores estão aglomerados e pontos extremos que di-
Ierem dos dados principais.
A Figura 9-15 mostra o graIico caule-e-Iolha para a variavel X
14
- Empenho. A coluna
bem a esquerda é a da Ireqüência de uma determinada resposta. O valor de uma respos-
ta é listado sob a coluna Caule e os respondentes são apresentados sob a Folha com zeros.
Por exemplo, para o valor 4 (Caule), a Ireqüência a esquerda indica 12 e, a direita, abaixo
da coluna Folha, ha doze zeros para indicar 12 respostas. Com amostras pequenas, cada
zero representa uma resposta naquela categoria especiIica de uma Iolha. Mas, com amos-
FÌGURA 9-14 GRÁFÌCO DE CAÌXA E HÌSTOGRAMA PARA A SURVEY DE FUNCÌONÁRÌOS
278 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
FIGURA 9-15
FUNCIONÁRIOS
Gráfico cauIe-e-foiha para X,
4
- Empenho
Freqüência CauIe-e-foIha
1,00 Extremos (=<3,0)
12,00 4. 000000000000
0,00 4 .
24,00 5 . 000000000000000000000000
0,00 5 .
15,00 6. 000000000000000
0,00 6.
11,00 7 . 00000000000
Ampli tude de caule: 1
Cada folha: 1 caso(s)
PESQUISA EM AÇÃO
USO DE SPSS PARA CONSTRUÇÃO DE UM GRAFICO CAULE-E-FOLHA
Você pode construir um graIico caule-e-Iolha com SPSS. A seqüência de cliques é: ANALYZE ‰~DES-
CRIPTIVE STATISTICS ‰~ EXPLORE. Destaque a variavel X
14
- Empenho e clique na seta para a cai-
xa Dependent List para utiliza-la na analise. Mantenha o DeIault na caixa Display, abra a caixa Statis-
tics e clique emOutliers e Continue. Usando os aefaults para as caixas Plots e Options, clique emOK
para executar o programa. O resultado sera o mesmo do graIico caule-e-Iolha da Figura 9-15.
tras maiores, cada Iolha (0) pode representar doi s ou mai s respondent es (casos). Resu-
mi ndo, essa é uma Iorma de graIico de barras horizontal criado com zeros. No topo do
graIico, ha a observacão de que um valor extremo (ponto extremo) é igual ou inIerior a 3.
RESUMO
Compreensão da importância e das abordagens da preparação de dados
Depoi s de os dados terem sido coletados e antes de serem analisados, o pesquisador de-
ve examina-los para certiIicar-se de sua validade. Respostas em branco, chamadas de da-
dos Ialtantes, devem ser tratadas de algum modo. Se as questões Ioram pré-codiIicadas,
então elas podem simplesmente ser colocadas em um banco de dados. Se não Ioram pré-
codiIicadas, um sistema deve ser desenvolvido para que possam ser colocadas em um
banco de dados. As tareIas comuns envolvidas no processo de preparacão são a edicão, o
tratamento de dados Ialtantes, a codiIicacão, a transIormacão e a entrada dos dados.
Explicação dos benefícios de tabelas e gráficos para a compreensão dos dados
Os graIicos e tabelas aiudam a entender mais Iacilmente os dados. Eles não so acrescen-
t am clareza, como t ambém têm impacto sobre os relatorios de pesquisa. As tabelas e gra-
Iicos mais usados incluem as distribuicões de Ireqüência, os graIicos de barras, os graIi-
cos de pizza e os graIicos de linhas. Também utilizamos recursos visuais que nos auxiliam
a determinar se temos dados Ialtantes ou pont os extremos, tais como os graIicos caule-e-
Iolha e os graIicos de caixa.
GRÁFICO CAULE-E-FOLHA PARA A VARIÁVEL X
14
- EMPENHO DA SURVEY DE
CAPÍTULO 9 » COMPREENSÃO E APRESENTAÇÃO DOS DADOS 279
Explicação sobre as medidas de tendência central
As medidas de tendência central possibilitam aos pesquisadores sintetizar e condensar
inIormacões para melhor compreendê-las. A média, a mediana e a moda são medidas de
tendência central. As medidas de tendência central localizam o centro da distribuicão e
outras inIormacões uteis.
Diferenças entre as medidas de dispersão e as medidas de tendência central
As medidas de dispersão descrevem a tendência de as respostas partirem da tendência
central (média, mediana e moda). O calculo da dispersão dos dados, ou como as respos-
tas variam em relacão a média, é um outro meio de sintetizar os dados. Medidas comuns
de dispersão usadas para descrever a variabilidade em uma distribuicão de numeros in-
cluem o intervalo, a variância, o desvio-padrão, a assimetria e a curtose.
Explicação sobre como identificar e tratar pontos extremos
Quando você encontra pontos extremos, bem como observacões de dados Ialtantes, deve
decidir se vai conserva-los ou elimina-los. A abordagem mais conservadora é a da elimi-
nacão para evitar distorcão ou ma representacão das descobertas. Se você os preserva, de-
ve ter uma razão valida para assim proceder. Isso também é verdadeiro no caso de você
decidir substituir os dados Ialtantes por uma estimativa do valor e assim preserva-los em
sua analise. A preservacão das observacões com dados Ialtantes ou substituidos é arrisca-
da e deve ser Ieita com cautela.
Discussão sobre instrumentos diagnósticos usados para melhor compreender os dados
Dois instrumentos diagnosticos que nos aiudam a melhor compreender nossos dados são
os graIicos de caixa e os graIicos caule-e-Iolha. Os graIicos de caixa são representacões vi-
suais do intervalo e da variacão da distribuicão. Também são uteis para a identiIicacão de
pontos extremos. Os graIicos caule-e-Iolha mostram valores de dados reais e rapidamen-
te ilustram os pontos extremos que diIerem da distribuicão de dados principal ou as Ia-
lhas de dados em que não ha valores ou os valores estão aglomerados.
PALAVRAS-CHAVE
assimetria
codiIicacão
curtose
dados Ialtantes
desvio-padrão
dispersão
distribuicão de Ireqüência
distribuicão normal
edicão de dados
entrada de dados
graIico de barras
graIico de caixa
graIico de pizza
graIico caule-e-Iolha
histograma
intervalo
média
mediana
moda
pontos extremos
preparacão de dados
tendência central
transIormacão de dados
variância
DÌLEMA ÉTÌCO
Ann Webster é uma analista de vendas de uma grande rede de supermercados. A empre-
sa esta planeiando sua reunião anual, e o cheIe de Ann pede-lhe que prepare recursos vi-
suais para a apresentacão na reunião. O presidente da empresa esta planeiando relevar o
Iato de as vendas globais da empresa estarem declinando, concentrando-se no desempe-
nho das cinco loias mais importantes da rede. Portanto, pede-se a Ann que prepare graIi-
280 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
cos de barras separados para cada uma das principais loias, listando os periodos de ven-
das em ordem ascendente, e um graIico de barras dos dados de vendas totais, com perio-
do em ordem descendente. Embora os dados seiam Iatuais, Ann percebe que os graIicos
vão dar uma idéia Ialsa aos membros da diretoria. O que ela deve Iazer?
QUESTÕES DE REVÌSÃO
1. Quais são alguns dos bancos de dados uteis online? Diga por que cada um de-
les é importante.
2. Por que é necessario preparar os dados antes de analisa-los?
3. Como as distribuicões de Ireqüência podem aiudar a compreender melhor os
dados?
4. Como as medidas de tendência central diIerem das medidas de dispersão?
5. O que são pontos extremos?
6. Para que são usados os graIicos de caixa e caule-e-Iolha?
ATÌVÌDADES PARA DÌSCUSSÃO E APLÌCAÇÃO
1. Por que o pesquisador em administracão deseiaria usar tabelas e graIicos?
2. Qual é o valor das medidas de tendência central e de dispersão?
3. Por que os dados Ialtantes e os pontos extremos são problematicos?
4. Aplicacão SPSS: Examine todas as variaveis no banco de dados de Iuncionarios
usando histogramas, assimetria, intervalo e graIico de caixa para determinar se
ha algum problema com os dados.
ATÌVÌDADES NA ÌNTERNET
1. O pacote de software estatistico SPSS tem uma home page emwww.spss.com. Va
até esse site e identiIique e sintetize as técnicas estatisticas que podem ser usa-
das com as atividades deste capitulo.
2. A home page para a American Statistical Association é www.amstat.org. Va até o
site e identiIique e sintetize as opcões de carreira para quem esta interessado
em estatistica.
3. Va até www.yankelovich.com. Prepare um relatorio sintetizando o MONITOR.
Como os pesquisadores em administracão usam dados dessa pesquisa?
4. Va a www.acop.com. Prepare um relatorio sintetizando o site e os tipos de sur-
vevs que estão sendo realizadas.
5. Va a www.raosoIt.com. Prepare um relatorio sintetizando as Iuncões e o valor
desse site para os pesquisadores em administracão.
NOTAS
1. Hair, Joseph E, William Oò Þ´¿½µô α´°¸ ß²¼»®-±² ¿²¼ α²¿´¼ Ì¿¬¸¿³ò îððíò Ó«´¬·ª¿®·¿¬» Ü¿¬¿
ß ²¿´§-·-ò É·¬¸ λ¿¼·²¹-ò Ю»²¬·½»óØ¿´´ô ꬸ »¼·¬·±²ò
Métodos Básicos de
Análise de Dados
CAPÍTULO
282 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
ÌNTRODUÇÃO
Os dados tornam-se conhecimento somente depois de a analise ter identiIicado um con-
iunt o de descricões, relacões e diIerencas uteis na tomada de decisão. Os dados são cole-
tados na pesquisa em administracão para dois propositos amplos - descoberta e teste de
hipotese. Quando o proposito é a descoberta, o pesquisador utiliza a estatistica descriti-
va, como as técnicas discutidas no capitulo anterior. Quando o obietivo é o teste de hipo-
tese, o pesquisador emprega a estatistica inIerencial. As estatisticas descritivas são usadas
para descrever e caracterizar a amostra que esta sendo examinada. Ja as estatisticas inIe-
renciais possibilitam ao pesquisador tirar conclusões sobre uma popul acão a partir de
uma amostra.
Neste capitulo, primeiro descreveremos o teste de hipoteses. A seguir, revisaremos e
explicaremos a relacão entre estatísticas de amostra e parâmetros de populacão. Final-
mente, abrangeremos varias estatisticas univariadas e bivariadas que podem ser usadas
para testar hipoteses. Ao longo deste livro, utilizamos o pacote de software SPSS. A secão
Pesquisa em acão descreve um pacote de software menos dispendioso, mas razoavel-
ment e abrangente, chamado XLSTAT.
PESQUISA EM AÇÃO
XLSTAT OFERECE ANALISE ESTATÍSTICA ACESSÍVEL
Ha muitos pacotes de software para analises estatisticas de qualidade disponiveis para pesquisado-
res em administracão, todos com amplas capacidades de analise e investigacão. Mas esses pacotes,
como SPSS, STATTSTICAe SAS, são um tanto soIisticados e quase sempre muito caros para estudan-
tes, analistas ocasionais e pequenas empresas. Felizmente, existe uma alternativa Iacil e de baixo
custo - o XLSTAT.
Em 1993, o estatistico Irancês Thierry Fahmy desenvolveu um acréscimo ao Excel simples para
analise estatistica e de dados. O XLSTAT Ioi criado para aiudar os usuarios a ganhar tempo, elimi-
nando complicadas e arriscadas transIerências de dados entre aplicacões para analise de dados.
Desde sua criacão, o XLSTAT expandiu-se para incorporar os seguintes procedimentos: administra-
cão de dados, analise de dados, modelos, servicos Excel e teste e seguranca.
O XLSTAT oIerece mais de 40 Iuncões diIerentes para melhorar o Excel, o que o torna um paco-
te de solucões estatisticas cotidianas para pequenas empresas. O pacote não so pode executar técni-
cas simples, como graIicos de caixa, Ireqüências e outras estatisticas descritivas, como também pro-
porciona procedimentos para uma extensa analise de dados, incluindo: aglomeracão 1 e 2: correla-
cões/analise de componentes principais (ACP): analise de correspondência (AC): estatistica descri-
tiva: analise discriminante: analise Iatorial: histogramas: escalonamento multidimensional (EM):
analise de correspondência multipla: e razão de chances.
Como o XLSTAT é rapido, Iacil de usar, conIiavel e, o que é melhor, tem preco acessivel, o soft-
ware é usado por muitas empresas e universidades em mais de 70 paises. Uma demonstracão de XL-
STAT pode ser baixada do site da Web (www.xlstat.com), podendo ser usada 20 vezes. As versões
eletrônica e em CD-ROM do pacote XLSTAT também podem ser adquiridas online. Além disso, a
empresa oIerece uma versão de baixo custo do XLSTAT (aproximadamente 50 dolares) para estu-
dantes e ONGs, paises do Terceiro Mundo e pessoas deIicientes , de Iorma que todos possam aces-
sar as Ierramentas necessarias para uma analise estatistica eIiciente.
FONTES: www.xlstat.com: Ken Deal. 2001. Statistical Analysis When You Don't Need the Big Guns. Marketing Research.
A Magazine of Management ana Applications (Summer): 48.
CAPÍTULO 10 ‹ MÉTODOS BÁSÌCOS DE ANÁLÌSE DE DADOS 283
O QUE É UMA HÌPÓTESE?
As medidas de tendência central e de dispersão são Ierramentas uteis para os pesquisa-
dores em administracão. Muitas vezes, os pesquisadores têm algumas idéias prelimina-
res quanto as relacões dos dados com base nos obietivos de pesquisa. Essas idéias origi-
nam-se de pesquisas anteriores, da teoria e/ou da atual situacão administrativa e normal-
mente são chamadas de hipoteses. Em estatistica, uma hipotese é uma suposicão ou pro-
posicão sem comprovacão que Iunciona como tentativa de explicacão de certos Iatos ou
Ienômenos. Uma hipotese também pode ser pensada como uma suposicão sobre a natu-
reza de uma situacão especiIica. As técnicas estatisticas possibilitam determinar se as hi-
poteses propostas podem ser conIirmadas por evidência empirica. Um exemplo de hipo-
tese seria O numero de Coca-Colas consumidas por um individuo em um dia quente se-
ra maior do que a quantidade consumida em um dia Irio . Comecamos este capitulo com
uma discussão sobre o desenvolvimento de hipoteses e, em seguida, sobre como testa-las.
COMO DESENVOLVER HIPÓTESES
As hipoteses são desenvolvidas antes da coleta dos dados, geralmente como parte do pla-
no de pesquisa. As hipoteses possibilitam que os pesquisadores expliquem e testem Iatos
ou Ienômenos propostos. Por exemplo, Phil Samouel pode deseiar testar a proposicão de
que 70° de seus Iuncionarios sentem-se orgulhosos de trabalhar em seu restaurante.
De maneira semelhante, ele pode querer comparar dois ou mais grupos de individuos e
determinar se ha diIerencas entre os grupos. Por exemplo, ele poderia querer usar os re-
sultados da pesquisa com seus Iuncionarios para testar a proposicão de que os Iunciona-
rios que trabalham em regime de meio turno têm maior probabilidade de procurar um
novo emprego do que os Iuncionarios que trabalham em tempo integral.
Ha muitas hipoteses que podem ser desenvolvidas a partir das survevs dos restauran-
tes. Por exemplo, digamos que descobrimos que, dos 200 clientes entrevistados, 15° di-
zem visitar esses restaurantes pelo menos duas vezes por mês. Mas em uma pesquisa rea-
lizada no ano anterior, 12° disseram ter visitado os restaurantes pelo menos duas vezes
por mês. A questão é ver se a diIerenca nas porcentagens é ou não é inIormacão util para
Phil no desenvolvimento de seu plano administrativo. Em outras palavras: ha um nume-
ro signiIicativamente maior de pessoas visitando os restaurantes duas vezes por mês es-
te ano em comparacão com o ano passado ou essa descoberta resulta de um erro de amos-
tragem?
Existe uma diIerenca nas porcentagens das pessoas que visitam os restaurantes pelo
menos duas vezes por mês. Observamos anteriormente, porém, que o erro de amostra-
gem poderia distorcer os resultados o bastante para não poder haver nenhuma diIerenca
estatistica entre as porcentagens deste ano e as do anterior. Se a diIerenca entre as porcen-
tagens são muito grandes, o analista estaria mais seguro, de Iato, de haver uma verdadei-
ra diIerenca entre os grupos. Algum grau de incerteza ainda persiste, no entanto, em re-
lacão a relevância da diIerenca observada. Nessa situacão, intuitivamente consideramos
a quantidade de diIerenca entre as médias. Mas não consideramos o tamanho da amostra
usada para calcular as médias, nem as variâncias da amostra.
Hipóteses nulas e alternadas
A hipótese nula é aquela em que não ha diIerenca nas médias dos grupos. Baseia-se na
nocão de que qualquer mudanca de uma situacão passada deve-se inteiramente ao erro
aleatorio. Nesse caso, a hipotese nula seria aquela em que não ha diIerenca entre os 12°
de visitantes dos restaurantes numa média de duas vezes por mês no ano anterior e os
284 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
15° deste ano. Os estatisticos e os pesquisadores em administracão sempre testam a hi-
potese nula. Uma outra hipotese, chamada de hipótese alternativa, estabelece o oposto
da hipotese nula. A hipotese alternativa é a de que ha diIerenca entre médias de grupos.
Se a hipotese nula é aceita, não temos mudanca de status quo. Mas, se a hipotese nula é re-
ieitada e a hipotese alternativa é aceita, a conclusão é que houve uma mudanca de com-
portamento, de atitude ou de alguma medida semelhante.
Hipóteses direcionais e não-direcionais
As hipoteses podem ser estabelecidas como direcionais ou não-direcionais. Se você usa
termos como mais do que , menos do que , positivo ou negativo ao estabelecer re-
lacões entre dois grupos ou duas variaveis, essas hipoteses são direcionais. Um exemplo
de hipotese direcional seria: quanto maior o estresse vivenciado no trabalho, maior a
probabilidade de um Iuncionario procurar outro emprego . Um outro modo de colocar
uma hipotese direcional é utilizando se - então : se os Iuncionarios têm mais treina-
mento em seguranca, então eles terão menos acidentes .
As hipoteses não-direcionais postulam uma diIerenca ou relacão, mas não indicam
uma direcão para essas diIerencas ou relacões. Ou seia, podemos postular uma relacão
signiIicativa entre dois grupos ou duas variaveis, mas não conseguimos dizer se a relacão
é positiva ou negativa. Um exemplo de hipotese não-direcional seria: ha uma relacão en-
tre o estresse vivenciado no trabalho e a probabilidade de um Iuncionario procurar outro
emprego . Um outro exemplo de hipotese não-direcional é: ha uma relacão entre o com-
prometimento com o trabalho e a probabilidade de procura de outro emprego .
ESTATÍSTICAS DE AMOSTRAVERSUSPARÂMETROS DE POPULAÇÃO
A estatistica inIerencial aiuda-nos a Iazer iulgamentos sobre a populacão a partir de uma
amostra. Uma amostra é um pequeno subconiunto do numero total de respondentes em
uma populacão. Usamos diIerentes terminologias para nos reIerirmos as caracteristicas
da amostra e da populacão. As estatisticas de amostra são valores sumarios da amostra e
são computados utilizando-se todas as observacões na amostra. Os parâmetros de popu-
lacão são valores sumarios da populacão, mas raramente são conhecidos. Essa é a razão
pela qual utilizamos estatisticas de amostra para inIerir os parâmetros de populacão.
Uma hipotese nula reIere-se a um parâmetro de populacão, não a uma estatistica de
amostra. Com base nos dados da amostra, o pesquisador em administracão pode reieitar
a hipotese nula ou aceitar a hipotese alternativa - por exemplo, ha uma diIerenca signiIi-
cativa entre os grupos ou não ha nenhuma diIerenca signiIicativa. No ultimo caso, o pes-
quisador não conseguiria detectar qualquer diIerenca signiIicativa entre os grupos. E im-
portante compreender que, embora a hipotese nula possa não ser reieitada, ela não neces-
sariamente é aceita como verdade.
Na pesquisa em administracão, a hipotese nula normalmente é desenvolvida de mo-
do que sua reieicão leve a uma aceitacão da situacão deseiada. Isto é, a hipotese alterna-
tiva representa o que pensamos que pode estar correto. Com o exemplo do consumo de
reIrigerantes, a hipotese nula é de que não ha diIerenca entre o consumo de reIrigeran-
tes entre homens e mulheres. A hipotese alternativa é de que o consumo de reIrigerantes
diIere entre homens e mulheres. Em terminologia estatistica, a hipotese nula é notada
como H
0
, e a hipotese alternativa é notada como H,. Se a hipotese nula H
0
é reieitada, en-
tão a hipotese alternativa H, é aceita. A hipotese alternativa é sempre a que deve ser
comprovada.
CAPÍTULO 10 ‹ MÉTODOS BÁSÌCOS DE ANÁLÌSE DE DADOS 285
PESQUISA EM AÇÃO
PASSOS PARA DESENVOLVIMENTO E TESTE DE HIPÓTESES
1. Estabelecer as hipoteses nula e alternativa.
2. Examinar a distribuicão da amostragem da populacão e selecionar o teste estatistico apro-
priado considerando se os dados são paramétricos ou não-paramétricos.
3. Decidir o nivel de signiIicância deseiado (p ÷ 0,05: 0,01 ou outro).
4. Coletar dados de uma amostra e computar o teste estatistico para veriIicar se o nivel de sig-
niIicância Ioi atingido.
5. Aceitar ou reieitar a hipotese nula. Ou seia, determinar se o desvio do valor da amostra em re-
lacão com o valor esperado teria ocorrido por acaso (por exemplo, cinco vezes em cem).
ERROS DE TIPO I E DE TIPO II
Sempre existe o risco de a inIerência Ieita pelo pesquisador sobre uma populacão estar in-
correta. Assim, na pesquisa em administracão, o erro nunca pode ser completamente evi-
tado, e os testes estatisticos que o pesquisador realiza para aceitar ou reieitar a hipotese nu-
la podem não estar corretos. Os pesquisadores, portanto, precisam estar cientes de dois ti-
pos de erros associados com o teste de hipoteses. O primeiro tipo de erro é chamado de er-
ro tipo I. O erro tipo I, chamado de alIa (a), ocorre quando os resultados da amostra levam
a reieicão da hipotese nula quando ela é verdadeira. No banco de dados dos restaurantes,
um erro tipo I ocorreria se concluissemos, com base nos dados da amostra, que a satisIa-
cão com o Samouel's e o Gino's é diIerente quando na verdade é a mesma. A probabilida-
de desse tipo de erro (a), também chamado de nivel de signiIicância, é a quantidade de ris-
co com relacão a exatidão do teste que o pesquisador esta disposto a aceitar. Assim, o ni-
vel de signiIicância é a probabilidade de incorrer em erro reieitando-se a hipotese nula.
Dependendo dos obietivos de pesquisa e da situacão, os pesquisadores em adminis-
tracão geralmente consideram · 0,05 ou · 0,01 como nivel aceitavel de signiIicância. O
pesquisador esta disposto, portanto, a aceitar algum risco de incorretamente reieitar a hi-
potese nula, mas esse nivel de risco é especiIicado antes de o proieto de pesquisa ser exe-
cutado. Se a situacão de pesquisa envolve testes de relacões em que o risco de cometer um
erro é alto, o pesquisador especiIica um maior nivel de signiIicância, por exemplo, · 0,01.
Ao examinar, por exemplo, a relacão entre duas substâncias quimicas que podem explodir
ou a taxa de mau Iuncionamento de uma onerosa peca de um equipamento, o pesquisador
não estaria disposto a assumir muito risco. Por outro lado, ao examinar relacões compor-
tamentais ou quando o risco é menos oneroso, o pesquisador pode arriscar-se mais. Em al-
gumas situacões, o pesquisador pode até mesmo aceitar um nivel de signiIicância de 0,10.
O segundo tipo de erro é chamado de erro tipo II. O erro tipo II ocorre quando, com
base nos resultados da amostra, a hipotese nula não é reieitada quando, na verdade, é Ial-
sa. O erro tipo II geralmente é chamado de beta ((3). Normalmente, o pesquisador especi-
Iica o erro alIa com antecedência, mas o erro beta Iundamenta-se no parâmetro de popu-
lacão (média ou proporcão) e/ ou no tamanho da amostra.
Um terceiro conceito importante na testagem de hipoteses para signiIicância estatistica
é o poder estatistico do teste. O poder de um teste é a habilidade de reieitar a hipotese nula
quando na verdade ela é Ialsa. O poder estatistico de um teste pode ser descrito como (1 -
P), a probabilidade de corretamente reieitar a hipotese nula. A probabilidade de um erro ti-
po II é desconhecida, mas esta relacionada com a probabilidade de um erro tipo I. Niveis
extremamente baixos de a resultarão em um alto nivel de erro (3, de Iorma que é necessario
que se atinia um comprometimento aceitavel entre os dois tipos de erro. O tamanho da
amostra pode aiudar a controlar os erros de tipo I e II. Geralmente, o pesquisador selecio-
nara o a e o tamanho da amostra para aumentar o poder do teste e minimizar a e |3.
286 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
TESTE E ANÁLÌSE DE RELAÇÕES
Depois que o pesquisador desenvolveu as hipoteses e selecionou um nivel aceitavel de
risco (signiIicância estatistica), o proximo passo é testar as hipoteses. Nesta secão, discu-
tiremos as estatisticas usadas para realmente testar as hipoteses. Primeiro, diremos como
selecionar a técnica estatistica adequada para testar as hipoteses. Depois, discutiremos o
uso do teste i, do qui-quadrado e de ANO VA para testar as hipoteses.
ESCOLHA DA TÉCNICA ESTATÍSTICA ADEQUADA
Quando testamos hipoteses, convertemos dados em conhecimento. Uma série de técnicas
estatisticas podem ser usadas para testar hipoteses. A escolha de uma determinada técni-
ca considera (1) o numero de variaveis e (2) a escala de mensuracão. Outras considera-
cões poderiam ser o tamanho da amostra e as propriedades de distribuicão das variaveis.
Número de variáveis
O numero de variaveis examinadas em coniunto é uma importante consideracão na sele-
cão da técnica estatistica adequada. A estatistica univariada utiliza apenas uma variavel
por vez para Iazer generalizacão sobre uma populacão a partir de uma amostra. Por
exemplo, se o pesquisador quiser examinar o numero médio de xicaras de caIé Starbucks
que os estudantes universitarios bebem durante as provas Iinais, uma unica variavel se-
ra usada, e a estatistica univariada sera adequada. Se o pesquisador em administracão es-
tiver interessado na relacão entre o numero médio de xicaras de caIé Starbucks que os es-
tudantes universitarios bebem durante as provas Iinais e o numero de horas que passam
estudando para essa provas, duas variaveis estarão envolvidas, e uma técnica estatistica
bivariada sera necessaria. Freqüentemente, os pesquisadores precisam examinar muitas
variaveis ao mesmo tempo para representar o mundo real e explicar inteiramente as rela-
cões existentes nos dados. Em tais casos, serão necessarias as técnicas estatisticas multi-
variadas. As estatisticas univariadas e bivariadas serão examinadas neste capitulo, e as
técnicas estatisticas multivariadas serão vistas nos capitulos posteriores. Ha muito site
da Web que podem aiuda-lo a saber mais sobre estatistica e dados. A secão Pesquisa em
acão descreve alguns dos melhores site que utilizamos.
Escala de mensuração
A mensuracão e as escalas Ioram discutidas no Capitulo 6. Usamos essas inIormacões
aqui para mostrar que técnicas estatisticas são utilizadas com um determinado tipo de es-
cala. A Figura 10-1 oIerece um panorama dos tipos de escalas usadas em diIerentes situa-
cões. Suponhamos que o pesquisador tenha uma escala nominal como individuos que be-
bem caIé Starbucks® versus individuos que bebem caIé Maxwell House . A moda seria a
unica medida apropriada de tendência central. Um teste qui-quadrado poderia ser usadc
FIGURA 10-1 TIPO DE ESCALA E ESTATÍSTICA APROPRIADA
Medida de Medida de
Tipo de escaIa tendência centraI dispersão Estatística
CAPÍTULO 10 ‹ MÉTODOS BÁSÌCOS DE ANÁLÌSE DE DADOS 287
PESQUISA EM AÇÃO
ESTATÍSTICA NA WORLD WIDE WEB
Você gostaria de saber mais sobre estatistica? E so ligar seu computador. Os sites listados a seguir oIe-
recem Iontes de dados, materiais, exemplos reais e licões de estatistica interativas para estudantes.
Chance
O obietivo do site Chance é inIormar os estudantes para que se tornem leitores criticos das noticias
atuais que Iazem uso da probabilidade e da estatistica. Uma secão do site aborda itens do noticiario
atual para uma aula de estatistica tradicional. Uma outra secão utiliza estudos de caso, concentran-
do-se em certas questões importantes que ocorrem regularmente no noticiario, tais como o censo
dos Estados Unidos, questões estatisticas na iustica, experimentos médicos e estatistica nos espor-
tes. Uma terceira secão acompanha o noticiario. Em todas elas, o Chance usa atividades, simulacões
em computador, coniuntos de dados e videos para auxiliar os estudantes na compreensão de ques-
tões que podem não ser encontradas em textos de estatistica comuns.
http: / /www.dartmouth.edu / -chance / teachingaids /data .html
Data and Story Library
O Data and Story Library (DASL) é uma biblioteca online comhistorias e arquivos de dados que usa
exemplos da vida real para ilustrar os métodos estatisticos basicos. Cada historia aplica um deter-
minado método estatistico a um coniunto de dados. Cada arquivo de dados tem uma ou mais his-
torias associadas. Os dados podem ser baixados como uma tabela delimitada por tabulacão ou es-
pacos no texto, sendo Iacilmente lidos pela maioria dos programas estatisticos. As historias são clas-
siIicadas de acordo com os métodos estatisticos e os principais topicos de interesse.
http://lib.stat.cmu.edu/DASL/
Documents Center na UM
O Documents Center, criado pela Universidade de Michigan, oIerece um coniunto abrangente de
links para bancos de dados de todos os tipos, desde agricultura até clima. Por exemplo, os estudan-
tes podem acessar estatisticas demograIicas do Censo 2000 em um relatorio pdI para cada estado,
com uma tabela por estado, distrito, cidade e municipio. Os dados incluem gênero, idade em Iaixas
etarias de cinco anos, numero de individuos acima de 65 anos por gênero, 17 racas e relacões e tipos
de economias domésticas.
http://www.lib.umich.edu/govdocs/stats.html
EIectronic EncycIopedia of StatisticaI Exercises and ExampIes
Um link relacionado no site DASL é o Electronic Encyclopedia oI Statistical Exercises and Examples
(EESEE). Esse site é destinado a estudantes de estatistica e contém arquivos de dados iuntamente
com questões e respostas relacionadas que orientam os alunos no exame de técnicas estatisticas ba-
sicas. O EESEE esta sendo usado como um suplemento para aulas de introducão a estatistica mi-
nistradas na Ohio State University. Além de conter arquivos de dados com questões e respostas, o
EESEE também inclui tareIas com problemas e solucões, sugestões para trabalhos mais longos e
exemplos de dados reais em uma interIace de Iacil utilizacão.
http://lib/stat.cmu.edu/DASL/ReIerence/eesee.html
FEDSTATS
O FEDSTATS oIerece uma gama completa de inIormacões estatisticas oIiciais disponibilizadas ao
publico pelo Governo Federal sobre agências que relatam gastos de, no minimo, 500.000 dolares por
ano em uma ou mais atividades estatisticas, tais como survevs. analise de dados, coleta e processa-
mento de dados. Pode-se utilizar a capacidade de links e de busca do site para mapear tendências
econômicas e populacionais, custos com assistência médica, seguranca na aviacão, comércio exte-
rior, consumo de energia, producão agricola e muito mais. Os estudantes podem acessar estatisticas
oIiciais coletadas e publicadas por mais de 70 agências Iederais sem precisar saber com antecedên-
cia qual a agência que as produziu.
http://www.Iedstats.gov/
(continua)
288 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
PESQUÌSA EM AÇÃO
ESTATISTICA NA WORLDWIDEWEB (continuacão)
1ournal of Statistics Education
O Journal of Statistics Eaucation destina-se a Iornecer educacão em estatistica para todos os niveis,
incluindo o elementar, o secundario, o pos-secundario e o de pos-graduacão, e conhecimentos pa-
ra proIissionais. O site apresenta artigos sobre pesquisa estatistica e probabilistica. Também inclui
os departamentos Dicas de ensino: recursos para proIessores de estatistica e Coniuntos de da-
dos e historias . O Dicas de ensino sintetiza eventos e pesquisas atuais interessantes que podem
ser usados como exemplos nas aulas de estatistica, bem como itens relevantes dos textos sobre
educacão. O departamento Coniuntos de dados e historias identiIica coniuntos de dados inte-
ressantes e descreve suas caracteristicas educacionais uteis, podendo ser baixado para analise
posterior.
http://www.amstat.org/publications/ise
Statistics.com
Lista abrangente de links para Iontes estatisticas online por assunto para reIerência rapida. Por exem-
plo, quando um estudante procura no indice do site o topico Publicidade, acessa os dados de marke-
ting da Aavertising Age sobre publicitarios nacionais, despesas com iornais e os 100 melhores merca-
dos dos Estados Unidos.
http://www.berinsteinresearch.com/stats.htm
StatLib
O StatLib oIerece um sistema de distribuicão de software estatistico, coniuntos de dados e inIorma-
cões por correio eletrônico, FTP e World Wide Web. Por exemplo, os estudantes que estivessem pro-
curando um arquivo de dados sobre gordura corporal poderiam acessar listas de estimativas da
porcentagem de gordura corporal determinadas por pesagem submersa e diversas medidas de cir-
cunIerência corporal de 252 homens. O site também mantém o StatLib Forum, uma colecão de bole-
tins para os estudantes colocarem, responderem e discutirem questões de outras pessoas sobre soft-
ware e bancos de dados no StatLib.
http://lib.stat.cmu.edu/
StatWeb
O Statistical Science Web destina-se a oIerecer um guia abrangente sobre recursos da ciência estatis-
tica, com especial atencão aos recursos australianos. O site Iornece uma lista abrangente de links pa-
ra Iontes estatisticas online. incluindo associacões de estatistica, recursos educacionais e coniuntos
de dados, computacão estatistica e computacão em geral.
http://www.statsci.org/
WebStat
Criado pela University oI South Carolina, o WebStat oIerece aos estudantes acesso a procedimen-
tos basicos de analise de dados. O software WebStat com sua completa gama de procedimentos ba-
sicos em analise de dados é executado através de um browser. de Iorma que os estudantes não pre-
cisam carrega-lo e instala-lo no computador. O software inclui: Ierramentas de analise de dados
para introducão a estatistica: orientacão Iacil, passo a passo, para procedimentos de analise de da-
dos: ampla gama de métodos de importacão de dados, incluindo a World Wide Web: graIicos, in-
cluindo os graIicos de pizza, histogramas, graIicos de caixa e diagramas de dispersão: numeros,
incluindo testes t. regressão e ANOVA. Os resultados podem ser gravados e impressos a partir do
browser da Web.
http://www.stat.sc.edu/webstat/
CAPÍTULO 10 ‹ MÉTODOS BÁSÌCOS DE ANÁLÌSE DE DADOS 289
para testar se o numero observado de pessoas que bebem caIé Starbucks é o numero es-
perado. Por exemplo, se a survev de uma amostra demonstrasse que 24° dos estudantes
de sua universidade bebem caIé Starbucks e você esperasse 30°, com base em uma sur-
vev nacional, você poderia usar o qui-quadrado para determinar se as diIerencas são es-
tatisticamente relevantes.
Com dados comuns, pode-se utilizar a mediana, o percentil e o qui-quadrado mais
qualquer outro procedimento que se possa usar com dados nominais. Por exemplo, se ti-
vermos dados de ranqueamento para dois Iatores considerados importantes na selecão
de um caIé, usaremos a mediana, o percentil e o qui-quadrado. Se os dois Iatores de ran-
queamento Iorem o sabor da bebida e o ambiente do local, poderemos usar a estatistica
qui-quadrado para determinar se o clientes do Starbucks e os clientes do CCs classiIica-
ram esses Iatores de modo diIerente. Finalmente, se tivermos o verdadeiro numero de xi-
caras de caIé que os cliente tradicionais do Starbucks e do CCs beberam toda vez que Io-
ram la, teremos os dados de razão e poderemos calcular o desvio-padrão e determinar se
ha diIerencas no numero médio de xicaras consumidas utilizando o teste t ou ANOVA.
TESTES DE HÌPÓTESES PARAMÉTRÌCOS VERSUSTESTES NÃO-PARAMÉTRÌCOS
Ha dois grupos principais de procedimentos estatisticos. Os grupos são chamados de pa-
ramétricos e não-paramétricos. A principal diIerenca entre eles reside nas suposicões
subiacentes a respeito dos dados. Em geral, quando os dados são mensurados utilizando-
se uma escala de intervalo ou de razão e a amostra é grande, as estatisticas paramétricas
são adequadas. Também supõe-se que os dados da amostra são coletados de populacões
com distribuicões normais (Iormato de sino). Quando a suposicão de uma distribuicão
normal não é possivel, o pesquisador deve usar estatisticas não-paramétricas. Quando os
dados são mensurados utilizando-se uma escala ordinal ou nominal, geralmente não é
apropriado Iazer a suposicão de que a distribuicão é normal: portanto, a estatistica não-
paramétrica ou sem distribuicão deve ser empregada. Neste capitulo, discutiremos a es-
tatistica não-paramétrica qui-quadrado e as estatisticas paramétricas teste t e ANOVA.
ESTATÍSTICAS DE AMOSTRAVERSUSPARÂMETROS DE POPULAÇÃO
Anteriormente, deIinimos populacão como o total de elementos que compartilham um
coniunto de caracteristicas. Por exemplo, a populacão poderia ser todos os alunos de uma
universidade, todas as pessoas que vivem em um determinado estado ou distrito ou to-
dos os clientes dos restaurantes Samouel's e Gino's. Ja a amostra é um pequeno subcon-
iunto ou parte de todos os elementos da populacão. Por exemplo, se quiséssemos deter-
minar o numero médio de copos de vinho consumidos com o iantar no Samouel's, não
entrevistariamos todos os clientes. Isso seria muito caro, levaria muito tempo e provavel-
mente seria impossivel devido a diIiculdade de encontrar todos os clientes. Em vez dis-
so, uma amostra de cem clientes (de um total de mil clientes) poderia ser considerada
grande o suIiciente por Phil para oIerecer inIormacões precisas sobre o numero médio de
copos de vinho consumidos.
Usamos a estatistica de amostra para estimar parâmetros de populacão. O parâmetro
de populacão é uma caracteristica de toda a populacão. As estatisticas de amostra são ba-
seadas nos dados da amostra. Um exemplo de estatistica de amostra seria o numero de
copos de vinho que os clientes do Samouel's dizem consumir obtido a partir da amostra
de cem pessoas. De maneira semelhante, poderia ser o numero de xicaras de caIé consu-
midas por uma amostra de estudantes em uma survev em uma determinada universida-
de ou a porcentagem de individuos em uma amostra que dizem preIerir a Coca-Cola a
290 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
Pepsi-Cola . A estatistica de amostra Iundamenta-se nos dados da amostra, mas é usada
para calcular o parâmetro da populacão. Os verdadeiros parâmetros da populacão rara-
mente são conhecidos, uma vez que o custo de um censo da populacão é proibitivamen-
te alto. Uma excecão a isso seria o censo nacional, realizado a cada dez anos.
Ha três abordagens para analisar estatisticamente os dados de uma amostra. Pode-
mos usar estatistica univariada, bivariada ou multivariada. A estatistica univariada indi-
ca que analisamos estatisticamente apenas uma variavel por vez. A bivariada analisa
duas variaveis, e a multivariada examina muitas variaveis simultaneamente. Comecare-
mos com a estatistica univariada, mas discutiremos todas as três abordagens neste livro.
Testes de significância univariados
Atestagem de hipoteses com o uso de testes estatisticos envolve muito mais do que as ta-
bulacões incluidas em uma distribuicão de Ireqüência ou o calculo de medidas de ten-
dência central ou de dispersão. Os pesquisadores não so descrevem os dados usando mé-
dias ou porcentagens. Eles indicam testes de probabilidade de os numeros da amostra es-
timarem correta ou incorretamente as caracteristicas da populacão. Os tipos mais simples
de testes são os testes univariados de signiIicância. Os testes univariados de signiIicân-
cia são usados para testar hipoteses quando o pesquisador deseia testar uma proposicão
sobre uma caracteristica da amostra em relacão a um padrão dado ou conhecido. A se-
guir, temos exemplos de proposicões:
‹ A satisIacão dos Iuncionarios da MicrosoIt é de pelo menos 5,5 em uma escala de
sete pontos.
‹ O novo produto sera preIerido por 90° de nossos clientes atuais.
‹ A média de gasto com luz elétrica emAtlanta, Georgia, ultrapassa 300 dolares.
‹ A participacão da Community CoIIee no mercado do sul da Louisiana é de pelo
menos 70°.
‹ Mais de 50° dos atuais consumidores de Coca Diet preIerirão a nova Coca Diet
com sabor de limão.
Podemos traduzir essas proposicões em hipoteses nulas e testa-las. Nos paragraIos
seguintes, oIerecemos um exemplo de nosso banco de dados de restaurantes para um tes-
te de hipotese univariado.
Teste de hipótese univariado
Phil Samouel gostaria de saber se seus clientes acham que seus precos são razoaveis. Ele
também gostaria de saber como os clientes do Gino's percebem os precos deste restauran-
te (ver Pesquisa em acão ). Os respondentes indicaram suas percepcões de preco usan-
do uma escala de sete pontos em que 1 ÷ Discordo totalmente de que o restaurante tem
precos razoaveis e 7 ÷ Concordo totalmente . O consultor administrativo de Phil disse-
lhe que a questão é uma escala intervalar, e pesquisas anteriores mostraram que as res-
postas têm distribuicão aproximadamente normal.
Para examinar a questão de Phil sobre o preco, primeiro devemos desenvolver a hipo-
tese e chegar a um consenso quanto ao nivel de signiIicância para reieicão ou aceitacão des-
sa hipotese. Phil acha que os clientes consideram os precos dos itens do cardapio um tantc
razoaveis. Depois de conversar com seu consultor, ambos concordaram que uma classiIica-
cão 5 em uma escala de sete pontos representaria precos razoaveis. Portanto, eles esperam
que as respostas para a questão sobre precos razoaveis tenha uma média de 5,0. A hipotese
nula é de que a média da populacão não sera diIerente de 5,0. A hipotese alternativa é de
que a média de amostra das respostas para X
7
- Precos razoaveis sera diIerente de 5,0.
CAPÍTULO 10 ‹ MÉTODOS BÁSÌCOS DE ANÁLÌSE DE DADOS 291
Como Phil gostaria de saber a opinião dos clientes quanto aos precos de seu restaurante e do Gino's,
antes de testar as hipoteses, devemos dividir a amostra em clientes do Samouel's e clientes do Gi-
no's. Lembre-se de que isso envolve ir até o menu Data e proceder da seguinte Iorma: Data ‰~ Split
File, e clicar em Compare groups. A seguir, destaque X
25
- Concorrente e clique na seta para coloca-
la na caixa Groups Based on. Agora clique em OK e você voltara para a tela do editor de dados SPSS.
Todas as analises de dados estarão agora comparando os clientes dos dois restaurantes.
A seqüência de cliques para executar o teste i é: ANALYZE -~ COMPARE MEANS -» ONE-
SAMPLE T-TEST. Clique em X
|0
- Precos Razoaveis para destaca-la e, apos, na seta para colocar X
10
na caixa Test Variables. Na caixa chamada Test Value, dê entrada no numero 5,0. Esse é o numero
com o qual você quer comparar as respostas dos entrevistados. Quando você clicar na caixa Op-
tions, observe que 95 é o aefault na caixa de intervalo de seguranca. Isso é o mesmo que estabelecer
o nivel de signiIicância em 0,05. Como Phil decidiu aceitar um risco maior, devemos mudar esse nu-
mero. O nivel de risco que Phil aceitara é 10° (0,10), de maneira que deveremos trocar o 95 por 90
na caixa ConIidence Interval. Apos, clique no botão Continue e OK para executar o programa. Os
resultados são mostrados na Figura 10-2.
Lembre-se de que os pesquisadores com Ireqüência consideram · 0,05 (5°) o maxi-
mo de risco que estão dispostos a correr ao reieitar a hipotese nula. Nesse caso, no entan-
to, Phil constatou que precisa ter apenas 90° de certeza de que a médi a não é 5,0. Isto é,
ele esta disposto a assumir um risco de 10° no exame da questão do preco. Usar esse ni-
vel de signiIicância indica que, se a survev dos clientes Iosse realizada muitas vezes, a pro-
babilidade de incorretamente reieitar a hipotese nul a quando ela realmente Iosse verda-
deira ocorreria 10 vezes ou menos em 100 (0,10).
A hipotese nul a de que a médi a da percepcão de precos não é diIerente de 5,0 pode
ser testada utilizando-se um teste i de amostra. Os resultados do uso desse teste são apre-
sentados na Figura 10-2. A primeira tabela, chamada de Estatistica de uma amostra, apre-
senta a médi a e o desvio-padrão para X
10
- Precos razoaveis. Os clientes de Samouel dão-
lhe uma médi a de 4,14, e os do Gino, 3,97. Os respectivos desvios-padrão são 0,932 e
0,937. A tabela do Teste de uma amostra indica os resultados do teste I para a hipotese nu-
TESTE T DE UMA AMOSTRA RELATÌVO AOS PREÇOS DO SAMOUEL'S E DO GÌNO'S FIGURA 10-2
292 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
la de que a resposta média para X
10
- Precos razoaveis é 5,0. A estatistica do teste i para o
Samouel's é -9,225, e o nivel de signiIicância é 0,000. De modo semelhante, a estatistica do
teste I para o Gino's é -10,993, e o nivel de signiIicância é 0,000. Isso signiIica que a hipo-
tese nula para ambos os restaurantes pode ser reieitada e que a hipotese alternativa pode
ser aceita com um alto nivel de seguranca. O nivel de signiIicância de 0,000 signiIica que
não ha nenhuma chance em 10.000 de a reieicão da hipotese nula estar incorreta.
De um ponto de vista pratico, os resultados do teste de hipotese univariado indicam
que os clientes de ambos os restaurantes acharam que os precos dos itens do cardapio não
eram muito razoaveis, em vez de moderadamente razoaveis, como Phil havia pensado.
Do ponto de vista de Phil, isso signiIica que seus clientes acreditam que os precos não são
tão razoaveis quanto ele imaginava. Naturalmente, os clientes do Gino's também pensam
que os precos deste restaurante não são muito razoaveis, de modo que Phil não tem ai
uma vantagem competitiva, apesar de as percepcões sobre seu restaurante serem ligeira-
mente mais Iavoraveis. Phil precisa determinar se o problema é real, isto é, se seus precos
são realmente muito altos. Ou ainda, se o problema deve-se a percepcões errôneas dos
clientes, ou seia, se os precos são percebidos como sendo muito altos quando na verdade
não o são. Assim que isso estiver determinado, Phil devera desenvolver um plano para
melhorar as percepcões dos clientes quanto ao preco dos itens do cardapio. Isso pode en-
volver uma verdadeira mudanca nos precos ou requerer mudanca no tamanho das por-
cões ou ainda alguma outra abordagem. Mas a melhoria nas percepcões dos precos pode-
riam tornar-se uma vantagem competitiva relevante para o restaurante Samouel's.
Teste de hipóteses bivariado
Os pesquisadores normalmente testam as hipoteses de que um grupo diIere de outro em
termos de atitudes, comportamento ou outra caracteristica. Por exemplo, Phil Samouel
poderia deseiar saber se ha diIerencas nas percepcões de Iregueses mais iovens e mais ve-
lhos de seu restaurante. Se houvesse diIerencas, ele poderia desenvolver estratégias de
marketing separadas para atrair cada um daqueles segmentos. Quando mais de um gru-
po esta envolvido, os testes estatisticos bivariados devem ser empregados. Em termino-
logia estatistica, a hipotese nula é de que não ha diIerencas signiIicativas entre os dois
grupos. Na secão seguinte, descreveremos três testes de hipotese bivariados: qui-quadra-
do, que testa diIerencas entre grupos usando dados nominais e ordinais, o teste t e ANO-
VA, que testam diIerencas entre as médias dos grupos com base nos dados intervalares e
de razão.
Tabulacão cruzada com uso da análise qui-quadrado Um dos métodos mais simples pa-
ra descrever coniuntos de relacões é a tabulacão cruzada. A tabulacão cruzada é a distri-
buicão de Ireqüência de respostas de dois ou mais coniuntos de variaveis. Isso signiIica
que tabulamos as respostas para cada grupo e as comparamos. A analise qui-quadrado
permite-nos testar se ha diIerencas estatisticas entre grupos. A seguir, apresentamos
exemplos de questões que poderiam ser respondidas utilizando-se tabulacões cruzadas e
analise qui-quadrado:
‹ Existe relacão entre gênero e regime de horario de trabalho (meio turno ou tempo
integral) no restaurante Samouel's?
‹ As classiIicacões do Iator de selecão do restaurante (mais importante, segundo
mais importante, terceiro mais importante, etc.) diIerem entre homens e mulheres?
‹ A assiduidade dos clientes (muito Ireqüente, um pouco Ireqüente e ocasional) di-
Iere entre os restaurantes Samouel's e Gino's?
CAPÍTULO 10 ‹ MÉTODOS BÁSÌCOS DE ANÁLÌSE DE DADOS 293
‹ O uso da Internet (intenso, moderado e baixo) esta relacionado com os niveis
educacionais (Iundamental, médio, superior incompleto, superior completo, pos-
graduacão)?
‹ A consciência de marca (inconsciente, consciente) esta relacionada com a area geo-
graIica onde vivem os individuos (América do Norte, Europa, Asia, AIrica, etc)?
Os pesquisadores em administracão podem usar o teste qui-quadrado para determi-
nar se as respostas observadas em uma survev seguem o padrão esperado. Por exemplo,
Phil Samouel poderia acreditar que não ha diIerenca nas porcentagens de clientes do se-
xo masculino e do sexo Ieminino com relacão as suas classiIicacões do ambiente como Ia-
tor de selecão de um restaurante. De maneira parecida, ele pode pensar que não ha diIe-
renca na porcentagem de seus clientes que classiIicam a qualidade da comida como o
mais importante Iator de selecão de um restaurante e a porcentagem dos clientes do Gi-
no's que dão a mesma classiIicacão. Deste modo, as hipoteses nulas seriam: (1) as classi-
Iicacões do ambiente como Iator de selecão de um restaurante são as mesmas para ho-
mens e mulheres e (2) a proporcão dos clientes do Gino's que classiIicam a qualidade da
comida como o Iator mais importante na selecão de um restaurante é a mesma dos clien-
tes do Samouel's. Hipoteses como essas podem ser testadas com o uso da estatistica qui-
quadrado. Phil gostaria de saber a resposta dessas perguntas porque, se houver diIeren-
cas, ele podera usar essas inIormacões para desenvolver seu plano administrativo.
A estatística qui-quadrado é utilizada para testar a signiIicância estatistica entre as
distribuicões de Ireqüência de dois ou mais grupos. Dados categoricos das questões so-
bre gênero, escolaridade ou outras variaveis nominais podem ser examinados. A estatis-
tica qui-quadrado compara as Ireqüências observadas (as vezes chamadas de reais) das
repostas com as Ireqüências esperadas. As Ireqüências observadas são os dados da sur-
vev. e as Ireqüências esperadas são o que pensamos que a distribuicão da populacão de-
veria ser. Nosso pensamento (Ireqüências esperadas) deriva de pesquisas anteriores ou
da teoria. A estatistica testa se os dados observados estão ou não distribuidos de acordo
com a distribuicão esperada. Por exemplo, Phil acha que os Iuncionarios do sexo Iemini-
no e do sexo masculino de seu restaurante diIerem quanto ao tipo de trabalho (tempo in-
tegral ou meio turno). A Figura 10-3 mostra as contagens observadas para homens e mu-
lheres que trabalham no Samouel's em tabulacão cruzada com o tipo de trabalho. Exami-
nando-se a contagem observada na coluna do sexo Ieminino, vemos que a survev desco-
briu que havia 30 Iuncionarios que trabalhavam em tempo integral. Se compararmos is-
so com a contagem esperada de 13,5, veremos que ha pouca diIerenca entre o que Ioi ob-
servado e o que era esperado. De Iato, ha pouca diIerenca para homens e mulheres e,
quando veriIicamos o teste qui-quadrado Pearson na parte inIerior da Iigura, constata-
mos que realmente não ha diIerencas estatisticamente signiIicativas no tipo de trabalho
de homens e mulheres. Portanto, a coniectura de Phil não é sustentada.
Quando realizamos uma analise qui-quadrado, estabelecemos uma tabela de contin-
gência com um numero de células como esta apresentado na Figura 10-3. Uma célula re-
Iere-se a intersecão de uma linha e uma coluna que representa uma combinacão especiIi-
ca de duas variaveis. Por exemplo, uma célula no exemplo da Figura 10-3 seria o numero
de mulheres que trabalham em turno integral (N ÷ 13). Uma outra célula seria o numero
de homens que trabalham em regime de meio turno (N ÷ 16). Uma tabela de contingên-
cia 2 X 2 teria quatro células. O uso adequado do qui-quadrado requer que cada Ireqüên-
cia de célula esperada tenha um tamanho de amostra de pelo menos 5. Se esse tamanho
minimo não puder ser atingido, o pesquisador pode tomar uma amostra maior ou com-
binar categorias de resposta individuais de modo a atingir o tamanho minimo.
A estatistica qui-quadrado deve ser estimada somente em contagens de dados.
Quando os dados estão na Iorma de porcentagem, devemos primeiro convertê-los para
contagens ou numeros absolutos. Além disso, supomos que as observacões tenham sido
294 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
FIGURA 10-3
CONTAGENS ESPERADAS E OBSERVADAS PARA FUNCIONÁRIOS E FUNCIONARIAS
DO SAMOUEL S E HORÁRIO DE TRABALHO
X
18
- Horário de trabaIho * X
19
-TabuIação cruzada de gênero
adqui ri das i ndependent ement e. Isso signiIica que um grupo de respondentes não in-
Iluencia de maneira alguma as respostas do outro grupo. Ou seia, no exempl o da Figura
10-3, as respostas das mulheres para a questão Você trabalha em meio turno ou em tur-
no integral no restaurant e Samoeul' s? não inIluenciam as respostas dos homens para a
mesma pergunta.
Teste de diferencas em freqüências com uso de qui-quadrado Como em todo teste de hi-
poteses, comecamos Iormulando a hipotese nula e selecionando o nivel adequado de signi-
Iicância estatistica para nosso problema de pesquisa. No exemplo anterior, a hipotese nula
é de que Iuncionarios e Iuncionarias não diIerem em seu regime de trabalho (turno integral
e mei o turno). Desta vez, testaremos a hipotese para a survev de clientes. Phil desenvolve
suas Ireqüências esperadas com base em comentarios que ouve de seus clientes no restau-
rante. Ele não conversou com os clientes do Gino' s, de Iorma que não pode Iormular Ire-
qüências esperadas em relacão a eles (a menos que tivesse essas inIormacões em um estu-
do publicado, mas ele não as tem). A hipotese nula é de que não ha diIerenca entre clientes
do sexo Ieminino e do sexo masculino quanto as suas classiIicacões do ambiente como Ia-
tor importante na selecão de um restaurante. Suporemos que o nivel aceitavel de signiIicân-
cia estatistica é 0,5. Os resultados do teste dessa hipotese são mostrados na Figura 10-4.
PESQUISA EM AÇÃO
USO DE SPSS PARA CALCULO DO QUI -QUADRADO
Phil deseia usar o software SPSS qui-quadrado para comparar Iuncionarios e Iuncionarias e regime
de trabalho (tempo integral e meio turno). Para executar a analise do qui-quadrado, a seqüência de
cliques é: ANALYZE -~ DESCRIPTIVE STATISTICS -* CROSSTABS. Clique em X
1 8
` Horario de
trabalho para a linha de variaveis e em X
19
- Gênero para a coluna de variaveis. Clique em Statistics
e na caixa de qui-quadrado, no canto superior esquerdo da caixa de dialogo, e depois em Continue.
A seguir, clique emCell, emObserved (esse pode ser o aefault) e emExpected Frequencies. Apos, cli-
que em Continue e em OK para rodar o programa. O resultado sera o apresentado na Figura 10-3.
CAPÍTULO 10 ‹ MÉTODOS BÁSÌCOS DE ANÁLÌSE DE DADOS 295
X
14
- Ambiente Ligeiramente importante Contagem (observada)
Contagem esperada
Um pouco importante Contagem
Contagem esperada
Muito importante Contagem
Contagem esperada
Total Contagem
Contagem esperada
* 0 células (0,0 ) com contagem esperada menor do que 5. A contagem mínima esperada é 10,12.
A primeira tabela na Figura 10-4 mostra o numero de respostas de homens e mulhe-
res para cada uma das categorias de X
14
- Ambiente. Esses numeros são chamados de con-
tagens observadas a partir dos dados da amostra. Também são mostradas na tabela as Ire-
qüências (contagens) esperadas sob a hipotese nul a de que não ha diIerenca. Por exem-
plo, se olharmos sob a coluna de Contagem (observada) para Homens, veremos que na
survev da amostra 16 homens classiIicaram o ambient e como ligeirament e importante.
Por outro lado, esperavamos ter 11,9 homens nessas células. Como obtemos as contagens
esperadas? As contagens (numeros) esperadas em uma célula são calculadas utilizando-
se as porcentagens totais da amostra e os tamanhos da amostra. Por exemplo ol hando a
coluna bem da direita, veremos que 22° da amostra total classiIicou o ambiente como li-
geirament e importante. Agora, olhando os tamanhos da amostra (parte inIerior da tabe-
PESQUISA EM AÇÃO
USO DE SPSS PARA TESTAR UMA HÌPÓTESE BÌVARÌADA COM QUÌ - QUADRADO
BASEADA NOS CLÌENTES DO SAMOUEL'S
Phil so pode Iormular as Ireqüências esperadas de seus clientes, por isso deve separa-los dos clien-
tes do Gino's para uma analise de gênero e importância do ambiente. Para isso, vamos ao menu Da-
ta e clicamos em Select Cases, em II Condition SatisIied e depois em II. Em seguida, destacamos a
variavel X
25
e clicamos na seta para coloca-la na caixa. Clicamos no sinal de igual (÷) no gabarito
abaixo e em zero (0 ÷ clientes do Samouel's). Finalmente, clicamos em Continue e em OKpara sele-
cionar somente os clientes do Samouel's.
Para executar a analise de qui-quadrado, a seqüência de cliques é: ANALYZE ‰~ DESCRIPTIVE
STATISTICS ‰~ CROSSTABS. Clique em X
14
- Ambiente para a linha de variaveis e em X
22
- Gênero
para a coluna de variaveis. Clique em Statistics, na caixa Chi-square e em Continue. Emseguida, cli-
que em Cells, em Observed e em Expected Frequencies. Apos, clique em Continue e em OK para ro-
dar o programa. O resultado sera o mesmo da Figura 10-4.
296 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
la), vemos 54 homens e 46 mulheres. Quando calculamos 22° de 54 (numero de homens),
obtemos 11,9 (numero de homens esperado). Da mesma maneira, quando calculamos
22° de 46 (numero de mulheres), obtemos 10,1 (numero de mulheres esperado). Todas as
contagens esperadas são calculadas de modo semelhante.
A segunda tabela na Figura 10-4 demonstra o valor qui-quadrado (16,270), que é signi-
Iicativo no nivel 0,000. Portanto, podemos reieitar a hipotese nula de que não ha diIerenca
entre as classiIicacões de homens e mulheres para o Iator de selecão de restaurante Ambien-
te. Por exemplo, esperavamos que houvesse aproximadamente 15 mulheres e 17 homens
que classiIicariam o ambiente como muito importante. Mas, na verdade, houve 8 homens
(esperados ÷ 17,3) e 24 mulheres (esperadas ÷ 14,7) que classiIicaram o ambiente como mui-
to importante. Assim, Iacilmente concluimos que as mulheres, mais do que os homens, clas-
siIicam o ambiente como sendo muito importante na selecão de um restaurante.
TESTE DE DÌFERENÇAS EM MÉDÌAS DE GRUPOS
Uma das questões mais Ireqüentemente examinadas na pesquisa em administracão é se
as médias de dois grupos de respondentes quanto a alguma atitude ou comportamento
são signiIicativamente diIerentes. Por exemplo, em uma amostra, poderiamos examinar
uma das seguintes questões:
‹ Os padrões de consumo de caIé (mensurados utilizando-se o numero médio de
xicaras consumidas por dia) diIerem entre homens e mulheres?
‹ O numero de horas que um individuo passa na Internet por semana diIere se-
gundo o nivel de renda?... de gênero?... de escolaridade?
‹ Os Iuncionarios mais iovens demonstram mais satisIacão com o emprego do que
os Iuncionarios mais velhos?
‹ As cinco maiores empresas de contabilidade têm uma imagem mais Iavoravel do
que as empresas de contabilidade regionais?
Quando examinamos questões como essas, primeiro desenvolvemos as hipoteses nu-
la e alternativa. Depois, selecionamos o nivel de signiIicância para testar a hipotese nula.
Finalmente, selecionamos o teste estatistico adequado e o aplicamos aos dados da amos-
tra. Nesta secão, abrangeremos dois testes estatisticos que podem ser usados para exami-
nar questões que comparam as médias de dois grupos.
AMOSTRAS INDEPENDENTES E RELACIONADAS
Os pesquisadores em administracão muitas vezes acham util comparar as médias de dois
grupos. Ao compararem-se médias de grupos, duas situacões são possiveis. A primeira
situacão da-se quando as médias são de amostras independentes. A segunda situacão
ocorre quando as amostras são relacionadas. Um exemplo da primeira situacão, a de
amostras independentes, poderia ser quando o pesquisador entrevista uma amostra de
homens e mulheres. Se o pesquisador estivesse comparando o numero médio de Coca-
Colas consumidas por dia por mulheres com o numero de Coca-Colas consumidas por
homens, isso caracterizaria uma situacão de amostras independentes. Um exemplo da se-
gunda situacão, a de amostras relacionadas, seria o caso em que o pesquisador coleta da-
dos de uma amostra de mulheres somente e compara o numero médio de vezes por se-
mana que elas comem no Burger King com o numero médio de vezes por semana que
elas comem no McDonald's. O paragraIo seguinte apresenta um breve panorama da tes-
tagem de amostras relacionadas.
CAPÍTULO 10 ‹ MÉTODOS BÁSÌCOS DE ANÁLÌSE DE DADOS 297
O pesquisador deve examinar as inIormacões com cautela quando conIrontado com
um problema de amostras relacionadas. Embora as questões seiam independentes, os
respondentes são os mesmos, de modo que o pesquisador não tem amostras indepen-
dentes. Ao contrario, ele estara lidando com o que é chamado de amostras em pares e
devera usar um teste i em pares. O software SPSS tem opcões para testes i de amostras in-
dependentes e relacionadas. Escolha o teste apropriado para cada situacão.
COMPARAÇÃO DE DUAS MÉDIAS COM O TESTE T
O teste i pode ser usado para testar uma hipotese que estabelece que as médias para as va-
riaveis associadas com duas amostras ou grupos independentes serão iguais. Os testes i
univariados e bivariados exigem dados intervalares ou de razão. Mas, com um teste t bi-
variado, supomos que as populacões de amostras têm distribuicões normais e que as va-
riâncias são iguais. O teste t avalia se as diIerencas observadas entre as médias de duas
amostras ocorreram por acaso ou se houve uma diIerenca verdadeira. Embora uma distri-
buicão normal seia suposta com o teste i, é bem possivel a discordância da normalidade.
O teste t é adequado em situacões em que o tamanho da amostra é pequeno (n ÷ 30
ou menos) e o desvio-padrão da populacão é desconhecido. O teste i usa a distribuicão I,
também chamada de distribuicão i do estudante, para testar hipoteses. A distribuicão t e
uma distribuicão simétrica em Iorma de sino com uma média de zero e um desvio-pa-
drão igual a 1. A distribuicão Z é apropriada em situacões em que o tamanho da amostra
(n) é maior do que 30. Mas a distribuicão t normalmente é empregada para amostras
maiores do que 30 porque as duas distribuicões são quase idênticas com tamanhos maio-
res de amostra.
EXEMPLO DE TESTE T DE DIFERENÇA ENTRE DUAS MÉDIAS
Phil Samouel deseia descobrir se ha diIerencas no nivel de satisIacão entre os seus clien-
tes e os clientes do Gino's. A hipotese nula é de que não ha diIerencas no nivel médio de
satisIacão dos clientes dos dois restaurantes. Essa hipotese Ioi testada por meio do teste i,
e os resultados são mostrados na Figura 10-5. O teste das amostras independentes Ioi uti-
lizado porque estamos comparando os clientes do Samouel's com os clientes do Gino's.
A tabela superior na Figura 10-5 contém a Estatistica de Grupo. O nivel médio de sa-
tisIacão para os clientes do Samouel's Ioi consideravelmente inIerior, em 4,78, compara-
do com 5,96 para os clientes do Gino's. O desvio-padrão para o Samouel's Ioi um pouco
maior (1,16) do que para o Gino's (0,974). Para determinar se os niveis médios de satisIa-
cão são signiIicativamente diIerentes, veriIicamos as inIormacões na tabela de Teste de
Amostras Independentes. As inIormacões na coluna chamada Sig. (bi-caudal) mostra que
as médias são signiIicativamente diIerentes (· 0,05) para suposicões de variâncias iguais
ou desiguais. Assim, os clientes do Samouel's estão signiIicativamente menos satisIeitos
dos que os clientes do Gino's, de Iorma que Phil Samouel decididamente precisa desen-
volver estratégias para melhorar o nivel de satisIacão de seus clientes.
ANÁLISE DE VARIÂNCIA ANOVA)
A ANOVA é usada para avaliar as diIerencas estatisticas entre as médias de dois ou mais
grupos. Por exemplo, suponhamos que a pesquisa dos clientes do Samouel's revele que a
satisIacão de Ireqüentadores muito assiduos é 5,97, a dos clientes um pouco assiduos é
4,62 e a dos clientes ocasionais é 4,04. Phil Samouel gostaria de saber se essa diIerenca ob-
servada é estatisticamente signiIicativa. Saber a resposta de perguntas como essa seria
îçè
TESTE DE DÌFEREÇAS ENTRE DUAS MEDÌAS COM USO DE SPSS
Para responder a questão da satisIacão dos clientes, podemos usar o programa Compare Means
SPSS. Primeiro, certiIique-se de estar analisando todos os 200 casos. Para isso, va ao menu Data e cli-
que emSplit File. Se aparecer Analyze All Cases, clique OKe volte ao Data Editor. Se aparecer Com-
pare Groups, clique emAnalyze All Cases e em OK para voltar ao Data Editor.
A seqüência de cliques em SPSS é: ANALYZE -~ COMPARE MEANS -» INDEPENDENTE -~
SAMPLES ‰~ TTESTQuando chegar na caixa de dialogo, coloque a Variavel X
17
- SatisIacão na cai-
xa Test Variables e a variavel X
25
- Concorrência na caixa Grouping Variables. Agora, clique em De-
Iine Groups e coloque 0 para o grupo 1 (Samouel's) e 1 para o grupo 2 (Gino's) e, a seguir, clique em
Continue. Para Options, usaremos os aefaults. por isso, clique em OKpara executar o programa. Os
resultados serão os mostrados na Figura 10-5.
muit o util para administradores e pesquisadores em administracão e, em especial, para
Phil Samouel. A ANO VA pode testar as diIerencas estatisticas entre as três médias de sa-
tisIacão, enquant o que o teste t so poderi a comparar duas. A hipotese nul a é de que os ni-
veis médios de satisIacão de clientes mui t o assiduos, um pouco assiduos e ocasionais são
os mesmos. Os resultados do teste dessa hipotese são mostrados na Figura 10-6. Observe
que o teste ANO VA indica uma diIerenca altamente signiIicativa (0,000) entre as médias
dos grupos, de modo que devemos reieitar a hipotese nula.
O termo ANO VA quer dizer Analise de Variância. E um teste de médias para duas
populacões ou mais. A hipotese nula é de que as médias são iguais. Discutiremos a ANO-
VA de um Iator nest a secão. A expressão um Iator é usada porque ha soment e uma va-
riavel independente. A ANO VA t ambém pode examinar problemas de pesquisa que en-
volvem diversas variaveis independentes. Quando muitas variaveis independentes estãc
incluidas, é chamada de ANOVA de N Iatores. As variaveis i ndependentes em uma
ANO VA devem ser categoricas (não-métricas). Na ANOVA, chamamos as variaveis inde-
pendentes categoricas de Iatores. Cada Iator tem dois ou mai s niveis. Cada nivel é chama-
do de tratamento. Por exemplo, se estivermos examinando a preIerência de urna amostra
FIGURA 10-5
FUNDAMENTOS DE MÉTODOS DE PESQUISA EM ADMINISTRAÇÃO
CAPITULO 10 o METODOS BASICOS DE ANALISE DE PADOS 2 9 !
ANÁLISE DEVARIÂNCIA EM TESTE DE DIFERENCAS MÉDIAS NOS NIVEIS DE
SATISFACÃO DOS CLIENTES DO SAMOUEL'S COM BASE NA ASSIDUIDADE
Tabela ANOVA
Soma de Média ao
X
25
- Concorrência : quadrados dí quadrado F
Samouel's X
17
- Satisfacão Entre (Combinados)
X
20
-Assiduidade os grupos 71,324 2 35,662 55,942 0,000
Dentro dos
grupos 61,836 97 0,637
133,160 99
de individuos pela Coca Diet, a variavel dependente poderia ser uma medida de preIe-
rência em uma escala de sete pontos em que 7 ÷ PreIerência muito acentuada e 1 ÷ Ne-
nhuma preIerência. Do mesmo modo, a variavel (Iator) independente poderia ser o con-
sumo, medido como intenso, moderado e leve. Como temos apenas uma variavel inde-
pendente, esse é um caso de ANOVA de um Iator. Se adicionassemos uma segunda varia-
vel independente, como a lealdade a marca (medida com altamente leal e não-leal ),
teriamos uma ANOVA de N Iatores.
Em nosso exemplo anterior, no qual queriamos comparar a satisIacão de três grupos
de Ireqüentadores do restaurante Samouel's, um teste t não poderia ser usado. A ANOVA,
porém, pode ser empregada com três grupos ou mais, desde que a variavel dependente se-
ia medida como intervalo ou razão. Por outro lado, a variavel independente, nesse caso, os
três grupos de Ireqüentadores do Samouel's com base na assiduidade, deve ser categori-
ca. Se ambas as condicões são atendidas, a ANOVA pode ser utilizada. Como com outros
testes bivariados, a hipotese nula seria de que todas as médias dos grupos são iguais. A hi-
potese nula, portanto, é de que todos os três grupos de Ireqüentadores do Samouel's (gru-
pos baseados na assiduidade) expressarão o mesmo nivel de satisIacão com o restaurante.
O teste F avalia as diIerencas entre as médias dos grupos quando empregamos a
ANOVA. Para tanto, a variância total é dividida em duas Iormas de variacão, que são
comparadas. A primeira é a variacão dentro dos grupos, e a segunda é a variacão entre
grupos. A distribuicão F é a razão dessas duas Iormas de variância e pode ser calculada
como segue:
F ÷ Variância entre grupos (VE) / Variância dentro dos grupos (VD)
Quando a variância entre grupos, em relacão a variância dentro dos grupos, é maior,
então a razão F é maior. Razões F maiores indicam diIerencas signiIicativas entre os gru-
pos e uma alta probabilidade de a hipotese nula ser reieitada.
InIelizmente, a ANOVA so permite que o pesquisador conclua que ha diIerencas es-
tatisticas em algum ponto entre as médias dos grupos. Ela não identiIica onde estão as di-
Ierencas. Em nosso exemplo dos niveis de satisIacão dos clientes do Samouel's, poderia-
FIGURA 10-6
300 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
mos concluir que as diIerencas nos niveis de satisIacão com base na assiduidade são esta-
tisticamente signiIicativas, mas não saberiamos se as diIerencas estão entre os clientes
muit o assiduos e os pouco assiduos, entre os pouco assiduos e os ocasionais ou entre os
clientes ocasionais e os mui t o assiduos. Apenas poderiamos dizer que ha diIerencas sig-
niIicativas em al gum pont o entre os grupos. Por essa razão, os pesquisadores em admi-
nistracão devem utilizar testes de acompanhamento para determinar onde estão as diIe-
rencas.
ANOVA COM TESTES DE ACOMPANHAMENTO
Varios testes de acompanhament o Ioram desenvolvidos para identiIicar a localizacão das
diIerencas signiIicativas. Muitos estão disponiveis em pacotes de software estatistico, tais
como SPSS ou SAS. Todos os testes de acompanhament o envolvem avaliacão simultânea
de estimativas intervalares de seguranca das diIerencas entre diversas médias. A discus-
são dessas técnicas situa-se além do escopp deste livro, mas elas diIerem em sua capaci-
dade de controle da taxa de erro. O software SPSS possui 14 testes que supõem variâncias
iguais e 4 em que não se supõe a variância idêntica. Em nosso exemplo, utilizaremos o
procediment o ScheIIe, poi s este é o mét odo mais conservador para avaliacão de diIeren-
cas signiIicativas entre médias de grupos. Mas os testes Tukey e Duncan são amplamen-
te usados na literatura sobre pesquisa em administracão.
Nossa questão de pesquisa tem duas partes. Primeiro, devemos determinar se as diIe-
rencas signiIicativas na satisIacão existem entre os três grupos de clientes deIinidos por sua
assiduidade. Segundo, se as diIerencas são identiIicadas, devemos determinar entre quais
grupos elas são estatisticamente signiIicativas. Faremos isso utilizando a ANOVA univaria-
da e o teste de acompanhament o ScheIIe. A hipotese nula é de que as médias de satisIacão
dos três grupos de clientes deIinidos pela assiduidade serão as mesmas. Os resultados pa-
ra o calculo do teste ScheIIe para essas hipoteses são apresentados na Figura 10-7.
A tabela Estatistica descritiva da Figura 10-7 mostra o numero de Ireqüentadores
em cada um dos grupos de Ireqüência e o nivel médi o de satisIacão por assiduidade. Ob-
serve que em todos os casos a maior assiduidade esta associada com maior satisIacão. Na
coluna N a direita da tabela, vemos que o Gino' s tem três ou mai s clientes muit o assiduos
ou pouco assiduos do que o Samouel' s. Além disso, a satisIacão geral com o restaurante
Samouel' s (4,78) não é tão alta quant o com o Gino' s (5,96). A tareIa para Phil Samouel,
portanto, é analisar os dados da survev e desenvolver uma estratégia para melhorar os ni-
veis de satisIacão dos clientes, atrair novos clientes e aumentar o grau de Ireqüência em
seu restaurante.
PESQUISA EM AÇÃO
USO DE SPSS PARA REALIZAR TESTES DE ACOMPANHAMENTO EM ANOVA
Ao usar o teste ScheIIe para comparar o Samouel's com o Gino's, va primeiro ao menu Data, clique
em Split Sample, mova X
25
para a caixa e clique em Compare Groups e em OK. Isso possibilita que
veriIiquemos os clientes de cada restaurante separadamente.
A seqüência de cliques em SPSS é: ANALYZE -» GENERAL LINEAR MODEL -» UNIVARIA-
TE. Destaque a variavel dependente X
17
- SatisIacão clicando nela e colocando-a na caixa Dependent
Variable. A seguir, destaque X
20
- Assiduidade e coloque-a na caixa Fixed Factors. Clique na caixa
Post Hoc, destaque X
20
na caixa Factor(s) e clique na caixa da seta para colocar essa variavel na cai-
xa Post Hoc Tests. VeriIique o lado inIerior esquerdo da tela e clique em ScheIIe Test e em Continue.
Em seguida, clique na caixa de opcões, em Descriptive Statistics no lado esquerdo e em Continue.
Agora, clique OKpara executar o programa. Os resultados são mostrados na Figura 10-7.
CAPÍTULO 10 ‹ MÉTODOS BÁSÌCOS DE ANÁLÌSE DE DADOS 301
* R Quadrado = 0,536 (R Quadrado ajustado = 0,526) (Samouei's)
f
R Quadrado = 0,215 (R Quadrado ajustado = 0,199) (Gino's)
As inIormacões na tabela denominada 'Testes de eIeitos entre suieitos (Figura 10-7)
revela que os niveis de satisIacão realmente diIerem de Iorma signiIicativa entre os gru-
pos identiIicados por sua assiduidade, isso é determinado veriIicando-se a coluna Sig. pa-
ra a variavel X
20
(localizada na coluna Fonte). Observe que o nivel de signiIicância para o
Samouei's é 0,000 e o do Gino's é 0,000, de modo que os niveis de satisIacão dos clientes
de ambos os restaurantes variam signiIicativamente com base na assiduidade. A hipote-
se nula de que não ha diIerencas é, assim, reieitada.
Para determinar quais médias de grupo que são signiIicativamente diIerentes,- va até
a tabela Comparacões multiplas , mostrada na Figura 10-8. A coluna bem a direita, cha-
mada Sig.. mostra o nivel de signiIicância. Para o Samouei's e o Gino's, ha diIerencas es-
tatisticamente signiIicativas entre todos os grupos. Isso signiIica que os clientes Muito
assiduos , Pouco assiduos e Ocasionais diIerem signiIicativamente em seus niveis de
satisIacão. Se houvesse comparacões em que as médias dos grupos não Iossem signiIica-
tivamente diIerentes, isso apareceria na coluna Sig. de numeros.
Para detectar a natureza da diIerenca, podemos examinar as médias mostradas ante-
riormente na tabela Estatistica descritiva da Figura 10-7. Para o Samouei's, o nivel mé-
dio de satisIacão dos clientes Muito assiduos é 5,97: para os Pouco assiduos , a média
é 4,62: e, para os Ocasionais , é 4,04. Assim, como seria esperado, os clientes mais assi-
6
ß diIerenca média é signiIicativa no nivei 0,05.
duos estão signiIicativamente mais satisIeitos. Uma descoberta semelhante é verdade em
relacão ao Gino's. O nivel médio de satisIacão dos clientes Muito assiduos é 6,26: para
os clientes Pouco assiduos , a média é 5,69: e, para os clientes Ocasionais , é 4,78. Co-
mo ia Ioi observado, Phil deve estar interessado em ver os clientes do Gino's Ireqüenta-
rem mais seu restaurante. Um plano administrativo deve ser criado para aumentar a Ire-
qüência dos clientes bem como outros indicadores de desempenho.
ÐÎÑÖÛÌÑ ÚßÌÑÎ×ßÔæ ßÒÑÊß Þ×ÊßÎ×ßÜß
Os proietos de ANOVAbivariada envolvem uma unica variavel independente não-métri-
ca e uma unica variavel dependente métrica. Um proieto Iatorial examina o eIeito (se
houver) de duas ou mais variaveis independentes não-métricas sobre uma variavel de-
pendente métrica. Com a ANOVA univariada, a variância total é dividida em variância
entre grupos e variância dentro dos grupos. Mas, em proietos Iatoriais, a propria variân-
cia entre grupos é dividida em (1) variacão devido a cada uma das variaveis (Iatores) in-
dependentes e (2) variacão devido a interacão das duas variaveis - isto é, seus eIeitos
combinados sobre a variavel dependente além da inIluência separada de cada uma. Por-
tanto, três hipoteses nulas são testadas simultaneamente por um proieto Iatorial de ANO-
VA bivariada: (1) o eIeito da variavel 1 sobre a variavel dependente: (2) o eIeito da varia-
vel 2 sobre a variavel dependente: e (3) o eIeito combinado (coniunto) das variaveis 1 e 2
sobre a variavel dependente. Os eIeitos das duas variaveis independentes são chamados
de eIeitos principais, e seu eIeito combinado é denominado de eIeito de interacão.
EXEMPLO
Phil Samouel observou que a Ireqüência de clientes do sexo Ieminino parece ser diIeren-
te da de clientes do sexo masculino. Se, de Iato, a Ireqüência Iosse estatisticamente diIe-
rente, ele gostaria de entender melhor por que e determinar como poderia utilizar essa in-
íð î ÚËÒÜßÓÛÒÌÑÍ ÜÛ MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
FIGURA 10-8
COMPARAÇÕES DE MÉDIAS DE GRUPO INDIVIDUAIS PARA DIFERENÇAS
SIGNIFICATIVAS
ÜÛ ßÒÑÊß Þ×ÊßÎ×ßÜß
CAPÍTULO 10 ‹ MÉTODOS BÁSÌCOS DE ANÁLÌSE DE DADOS 303
Iormacão para melhorar seu empreendimento. Ele também gostaria de saber como o gê-
nero e a Ireqüência se relacionam com a satisIacão. As hipoteses nulas são: (1) não ha di-
Ierencas nos niveis médios de satisIacão com base na assiduidade: (2) não ha diIerencas
nos niveis médios de satisIacão com base no gênero: e (3) não ha diIerencas nos niveis
médios de satisIacão com base nos eIeitos combinados de assiduidade e de gênero. Phil
não esta Iamiliarizado com os padrões de Ireqüência do Gino's, portanto, ele não tem ba-
se para examinar hipoteses que não esteiam relacionadas com seus clientes. A variavel de-
pendente métrica para essas hipoteses é X
17
- SatisIacão, e as variaveis independentes
não-métricas são X
20
- Assiduidade e X
22
- Gênero. Os resultados do teste das hipoteses
são relatados nas Figuras 10-9,10-10 e 10-11.
A primeira tabela na Figura 10-9, chamada 'Testes de eIeitos entre suieitos , mostra
os resultados do programa ANO VA. As hipoteses nulas eram de que não haveria diIeren-
ca entre os escores médios para X
17
- SatisIacão para clientes com diIerentes taxas de as-
siduidade (X
20
), nenhuma diIerenca nos escores médios em X
17
- SatisIacão entre mulhe-
res e homens (X
22
) e nenhum eIeito de interacão. O proposito da analise ANO VA de N Ia-
tores é, primeiramente, ver se existem diIerencas estatisticamente signiIicativas e, se exis-
tirem, veriIicar entre quais grupos elas ocorrem.
Para avaliar as diIerencas médias para cada comparacão de variaveis independentes,
uma razão F e utilizada. Como discutimos anteriormente, a abordagem usada na ANO-
VA compara a variância de média entre grupos e a variância aentro de grupos. Nesse caso,
os grupos são os três grupos de clientes que exibem diIerentes taxas de Ireqüência e os
dois grupos de gênero. Quando a razão F é alta, ha maior probabilidade de haver maio-
res diIerencas entre as médias dos diversos grupos examinados.
O primeiro eIeito principal que examinamos é o impacto da variavel X
20
- Assiduida-
de sobre a variavel X
17
- SatisIacão. A razão F para X
20
- Assiduidade dos clientes do
SamoueFs é 39,639, a qual é estatisticamente signiIicativa no nivel 0,000 (ver Figura 10-9).
A partir da tabela Estatistica descritiva na Figura 10-10, podemos ver isso, pois a satis-
Iacão no restaurante SamoueFs é maior entre clientes um pouco assiduos (média ÷ 4,62)
e muito assiduos (5,97) do que para os clientes ocasionais (4,04). Desta Iorma, reieitamos
a hipotese nula e concluimos que a satisIacão realmente varia corn a assiduidade dos
clientes do SamoueFs. Além disso, como seria de se esperar, os clientes mais Ireqüentes
são signiIicativamente mais satisIeitos do que os menos assiduos.
O segundo eIeito principal é se ha uma diIerenca na satisIacão com base em X
22
-
Gênero. A razão F para gênero é 25,604 e estatisticamente signiIicativa (0,000) (ver Figura
FIGURA 10-9 TESTES DE EFEITOS ENTRE SUJEITOS
VariáveI dependente: X
17
- Satisfação
Tipo HI Quadrado
Fonte Soma de quadrados cif de média F Sig.
* R Quadrado = 0,652 (R Quadrado ajustado = 0,634)
PESQUISA EM AÇÃO
Phil observou um padrão somente entre seus clientes, de modo que devemos separa-los dos clien-
tes do Gino's para essa analise. Para tanto, va até o menu Data e clique em II Condition SatisIied e
depois em II, destacando então a variavel X
25
e clicando na seta para coloca-la na caixa. A seguir, cli-
que no sinal de igual (÷) abaixo e em zero (0). Finalmente, clique em Continue e em OK: selecione
somente os clientes do Samouel's para a analise.
A seqüência de cliques é: ANALYZE -~ GENERAL LINEAR MODEL -~ UNIVARIATE. Desta-
que a variavel dependente X
17
- SatisIacão, clicando nela para coloca-la na caixa Dependent Varia-
ble. A seguir, destaque X
20
- Assiduidade e X
22
- Gênero e mova-as para a caixa Fixed Factors. Ago-
ra, clique na caixa Post Hoc e destaque X
20
na caixa Factor(s), depois clicando na seta para colocar
essa variavel na caixa Post Hoc Tests. Não movemos X
22
porque ela tem apenas dois grupos, e não
três. VeriIique o canto inIerior esquerdo da tela e clique no teste ScheIIe e em Continue. Agora, va
até a caixa Options e clique em Descriptive Statistics e em Continue. Finalmente, clique em OK, ia
que não precisamos especiIicar nada mais para esse teste. Os resultados aparecem na Figura 10-9.
10-9). Portanto, reieitamos a hipotese nula de que não ha diIerencas e concluimos que a sa-
tisIacão dos clientes do Samouel's diIere de acordo com o gênero. EspeciIicamente, as mu-
lheres estão signiIicativamente menos satisIeitas do que os homens (os niveis médios de sa-
tisIacão das mulheres são sistematicamente inIeriores aos dos homens).
A terceira hipotese era a de que não havia diIerencas com base no eIeito combinado
de assiduidade e gênero. A interacão entre a assiduidade e o gênero não é signiIicativa
(0,095), o que reIlete que a diIerenca na satisIacão quando ambas as variaveis indepen-
dentes são consideradas iuntas é muito pequena. A hipotese nula de nenhuma diIerenca
não é, portanto, reieitada para o eIeito de interacão.
Para melhor entender isso, vamos veriIicar primeiro as inIormacões na tabela Mul-
tiplas comparacões na Figura 10-11. Ha diIerencas signiIicativas entre todos os grupos
de clientes - Ocasionais , Pouco assiduos e Muito assiduos . Deste modo, a maior
assiduidade indica um maior nivel de satisIacão, e existem diIerencas signiIicativas para
todas as comparacões de grupos.
304 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
USO DE SPSS PARA EXECUTAR ANOVA BÌVARÌADA
Baseado nas médias observadas.
*A diferença média é significativa no nível 0,05.
MANOVA
A MANOVA (Analise de Variância Multivariada) é semelhante a ANOVA, A diIerenca é
que, em vez de uma variavel dependente métrica, a técnica pode examinar duas ou mais.
O obietivo é o mesmo, ia que ambas as técnicas avaliam as diIerencas em grupos (varia-
veis categoricas) quanto ao seu impacto sobre variaveis dependentes métricas. Enquanto
a ANOVA examina a diIerenca em uma unica variavel dependente métrica, a MANOVA
examina diIerencas de grupos com diversas variaveis dependentes métricas ao mesmo
tempo. Com a ANOVA, a hipotese nula é de que as médias da unica variavel dependen-
te são as mesmas entre grupos. Na MANOVA, a hipotese nula é de que as médias das di-
versas variaveis dependentes são as mesmas entre grupos.
Como exemplo, nossa survev de clientes tem três variaveis de producão de relacões -
satisIacão, recomendacão a amigo e probabilidade de retorno no Iuturo. Todas essas va-
riaveis são mensuradas metricamente. Uma MANOVA adequada seria examinar a rela-
cão entre gênero (não-métrica) e as três variaveis de producão (métricas). De maneira se-
melhante, uma outra aplicacão adequada da MANOVA em nossa survev de clientes seria
o exame da relacão entre assiduidade (não-métrica) e as três variaveis de producão. A
MANOVA não esta incluida na versão para estudantes do pacote de software SPSS, por is-
so, não a abordaremos neste texto.
Discussão sobre os testes de hipóteses e por que os utilizamos
Os pesquisadores em administracão muitas vezes têm algumas idéias preliminares so-
bre as relacões entre dados com base em seus obietivos de pesquisa. Essas idéias origi-
nam-se de pesquisas anteriores ou da teoria e são normalmente chamadas de hipoteses.
Em estatistica, uma hipotese é uma suposicão ou proposicão não comprovada que tenta
explicar certos Iatos ou Ienômenos. Uma hipotese também pode ser considerada como
uma suposicão sobre a natureza de uma determinada situacão. As técnicas estatisticas
permitem-nos determinar se nossas hipoteses teoricas são conIirmadas pela evidência
empirica.
CAPÍTULO 10 * MÉTODOS BÁSÌCOS DE ANÁLÌSE DE DADOS 305
RESUMO
306 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
Explicação sobre o conceito de significância estatística
Sempre ha o risco de a inIerência do pesquisador sobre uma populacão estar incorreta.
Assim, na pesquisa em administracão, o erro nunca pode ser completamente evitado, e o
pesquisador realiza testes estatisticos para aceitar ou reieitar a hipotese nula. A probabi-
lidade de cometer um erro é chamada de nivel de signiIicância. O nivel de signiIicância é
equivalente a quantidade de risco que o pesquisador esta disposto a aceitar em relacão a
precisão do teste. Os pesquisadores geralmente aceitam um nivel de signiIicância de 0,05
ou 0,01, dependendo dos obietivos de pesquisa.
Compreensão de como escolher a técnica estatística adequada
A escolha de uma técnica especiIica depende (1) do numero de variaveis e (2) da escala de
mensuracão. A estatistica univariada pode avaliar somente uma unica variavel. A estatis-
tica bivariada pode avaliar duas variaveis. A estatistica multivariada pode examinar mui-
tas variaveis simultaneamente e pode lidar com diversas variaveis dependentes e inde-
pendentes. A estatistica adequada também varia dependendo do modo como os dados
são mensurados, ou seia, nominalmente, ordinalmente, em intervalo ou razão.
Explicação sobre a diferença entre estatística de amostra e parâmetros de população
O proposito da estatistica inIerencial é desenvolver estimativas sobre uma populacão uti-
lizando uma amostra dessa populacão. Uma amostra é um pequeno subconiunto de to-
dos os elementos de uma populacão. A estatistica de amostra diz respeito as medidas ob-
tidas diretamente da amostra ou calculadas a partir dos dados da amostra. Uma popula-
cão é uma caracteristica sumaria de toda a populacão. Geralmente, os verdadeiros parâ-
metros da populacão não são conhecidos, ia que o custo de realizacão de um censo da po-
pulacão é proibitivamente alto. As estatisticas de amostra são uteis para se Iazerem inIe-
rências sobre os parâmetros da populacão.
Explicação sobre a diferença entre teste t, ANOVA e qui-quadrado
Os pesquisadores em administracão Ireqüentemente deseiam testar a hipotese de que um
grupo diIere de outro em termos de atitudes, comportamento ou alguma outra caracteris-
tica. Quando mais de um grupo esta envolvido, os testes bivariados devem ser usados.
Em terminologia estatistica, a hipotese nula é de que não ha diIerencas signiIicativas en-
tre os dois grupos. Três testes de hipotese bivariados Ioram discutidos neste capitulo. O
primeiro, o qui-quadrado, testa as diIerencas entre grupos usando dados mensurados em
uma escala nominal ou ordinal. O teste i e a ANOVA são usados para testar diIerencas
nas médias de grupos quando os dados são mensurados em escala intervalar ou de razão.
Além disso, o teste I é apropriado para testar a diIerenca em somente dois grupos, en-
quanto que a ANOVA pode testar diIerencas em três grupos ou mais.
PALAVRAS-CHAVE
amostras independentes escala parâmetros de populacão
amostras relacionadas estatistica de amostra tabulacão cruzada
ANOVA hipotese alternativa qui-quadrado
ANOVA bivariada hipotese nula teste bivariado
ANOVA univariada MANO VA teste de acompanhamento
erro tipo I não-paramétrico teste I
erro tipo Q paramétrico teste univariado
CAPÍTULO 10» MÉTODOS BÁSÌCOS DE ANÁLÌSE DE DADOS 307
DÌLEMA ÉTÌCO
Dan Henderson, presidente executivo de uma cadeia de loias de departamentos, acredi-
ta que a empresa precisa criar um programa de lealdade de clientes destinado a recom-
pensar os consumidores que gastam mais de 200 dolares em cada sessão de compras. Por-
tanto, ele pede que seu analista de marketing crie um programa que possa aiudar a empre-
sa a identiIicar e caracterizar o perIil de seus clientes mais lucrativos. Quando o relatorio
esta completo, os dados indicam que os compradores com maior poder aquisitivo que
gastam mais de 200 dolares em cada sessão de compras representam somente uma pe-
quena parcela das vendas totais da empresa, pois Iazem compras apenas três ou quatro
vezes por ano e tendem a comprar somente vestuario comum de menor margem de lu-
cro. Ja o analista relata que os clientes mais lucrativos da loia tendem a ter mais de 40
anos, pertencem a economias domésticas de renda média e compram pelo menos duas
vezes por mês, gastando uma média de 100 dolares de cada vez em todos os tipos de pro-
dutos, de cosméticos a utensilios domésticos e vestuario de griIe com alta margem de lu-
cro. Apos revisar o relatorio, Dan continua a querer que o programa de lealdade de clien-
tes Iavoreca os compradores que gastam mais de cada vez, iustiIicando sua decisão com
a aIirmacão de que eles são os responsaveis pela imagem da loia, atraindo o cliente regu-
lar. O que você acha da decisão de Dan?
QUESTÕES DE REVÌSÃO
1. O que é testagem de hipotese e por que a utilizamos?
2. Qual é a diIerenca entre estatistica de amostra e parâmetros de populacão?
3. Compare e diIerencie as analises univariadas, bivariadas e multivariadas.
Quando e por que usariamos cada um desses tipos de analise estatistica?
4. Quais são as diIerencas entre o teste t. a ANO VA e o qui-quadrado?
5. Por que utilizamos testes de acompanhamento em ANO VA?
6. Qual é a diIerenca entre ANO VA univariada e bivariada?
ATÌVÌDADES PARA DÌSCUSSÃO E APLÌCAÇÃO
1. Dê um exemplo de situacão em que as técnicas estatisticas multivariadas se-
riam necessarias.
2. Por que os pacotes de software de computador aumentaram o uso de técnicas
estatisticas multivariadas?
3. Um pesquisador em administracão usa ANO VA bivariada em um relatorio pa-
ra um cliente. O pesquisador não veriIica as pressuposicões de uso da técnica.
Isso é um problema?
4. Aplicacão SPSS: Use o banco de dados da survev de clientes e compare a satis-
Iacão, a probabilidade de recomendacão e a probabilidade de retorno para o
Samouel's e o Gino's utilizando o teste t. Eles são estatisticamente diIerentes?
Se são, como você interpretaria essa descoberta?
308 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
EXERCÍCÌOS NA ÌNTERNET
1. Va a um dos sites listados abaixo. Participe de uma survev em um dos sites* e
prepare um relatorio sobre o que você aprendeu.
a. www.prudential.com
b. www.dssresearch.com/mainsite/surveys.htm
/ ©©©ò «¬²»ò ½±³ñ°±´´-
¼ò ©©©ò ½½ò ¹¿¬»½¸ò »¼«ñ¹ª«ñ«-»®Á-«®ª»§-
»ò ©©©ò -«®ª»§ò ²»¬
îò Ñ Ú»¼»®¿´ λ-»®ª» Þ¿²µ ¼» ͬò Ô±«·- ¬»³ «³ ¾¿²½± ¼» ¼¿¼±- ½¸¿³¿¼± ÚÎÛÜ
øÚ»¼»®¿´ λ-»®ª» Û½±²±³·½ Ü¿¬¿÷ò Va até o site http://research.stlouis-
Ied.org/Ired/abotIred.html e relate o que você encontrou. IdentiIique algumas
questões de pesquisa que podem ser examinadas com as técnicas estatisticas
tratadas neste capitulo.
3. Você deseia obter mais inIormacões sobre os Iundamentos de analise estatistica
e deIinicões de conceitos e termos? Va a Platonic Realms Interactive Mathema-
tics Encyclopedia em www.mathacademy.com/pr/index.asp. Clique no logoti-
po Platonic Realms e em Encyclopedia. Prepare um relatorio sintetizando o va-
lor desse site da Web.
I
N. de R.T.: Não é possivel garantir que as survevs esteiam no ar quando da publicacão desta obra, uma vez que a disponi-
bilizacão de conteudo e os proprios enderecos de acesso mudam com Ireqüência na Web.
Correlacão e Regressão
CAPITULO
310 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
ÌNTRODUÇÃO
Muitas questões administrativas concentram-se na relacão entre duas ou mais variaveis.
Questões como As vendas estão relacionadas com a publicidade? , A qualidade do
produto esta relacionada com a lealdade do cliente? , O nivel educacional esta relacio-
nado com a aquisicão de um determinado item? ou Quanto tempo de treinamento em
seguranca é necessario para reduzir acidentes? podem ser respondidas utilizando a es-
tatistica para examinar as relacões entre variaveis. Este capitulo explica como você pode
usar a estatistica para investigar questões como essas.
TÌPOS DE RELAÇÕES ENTRE VARÌÁVEÌS
Quando ha uma ligacão coerente e sistematica entre as variaveis, dizemos que existe
uma relacão. A estatistica é usada para determinar se ha uma ligacão ou associacão esta-
tistica entre as variaveis. Se ha uma associacão estatistica, é importante compreender
que a relacão não é necessariamente causal. Isto é, não se pode dizer que uma variavel
causa a outra. A correlacão e a regressão são técnicas associativas que nos aiudam a de-
terminar se ha uma relacão coerente e sistematica entre duas ou mais variaveis. Ha qua-
tro conceitos basicos que precisamos entender a respeito das relacões entre variaveis:
presenca, natureza das relacões, direcão e forca de associacão. Descreveremos cada um
desses conceitos.
PRESENÇA
A presenca de relacão avalia se existe uma relacão sistematica entre duas ou mais varia-
veis. Baseamo-nos no conceito de significância estatística para determinar se uma rela-
cão esta presente. Se é encontrada uma signiIicância estatistica entre as variaveis, dize-
mos que uma relacão esta presente. Ou seia, dizemos que o conhecimento do comporta-
mento de uma ou mais variaveis possibilita prever o comportamento de uma outra varia-
vel. Por exemplo, se encontrassemos uma relacão estatisticamente signiIicativa entre as
percepcões dos clientes em relacão aos Iuncionarios do Gino's Ristorante e sua satisIacão
com aquele estabelecimento, diriamos que uma relacão esta presente e que as percepcões
sobre os Iuncionarios nos indicara como provavelmente serão as percepcões de satisIa-
cão. Anteriormente, introduzimos o conceito de hipotese nula. Com a analise associativa,
a hipotese nula é a de que não ha nenhuma associacão presente entre as variaveis.
NATUREZA DAS RELAÇÕES
Um segundo conceito importante reIere-se ao modo como as variaveis se relacionam
umas com as outras. Normalmente, dizemos que a relacão entre variaveis é linear ou não-
linear. Uma relacão linear é uma associacão em linha reta entre duas ou mais variaveis.
Uma relacão não-linear, muitas vezes chamada de curvilinea, é aquela em que a relacão
é melhor descrita por uma curva em vez de uma linha reta. Com uma relacão linear, a Ior-
ca e a natureza da relacão entre as variaveis permanece a mesma em todo o coniunto de
variaveis. Mas, com uma relacão não-linear, a Iorca e a natureza modiIicam-se em ambas
as variaveis (por exemplo, a relacão de Y comXprimeiro enIraquece a medida que X au-
menta, mas depois se Iortalece a medida que o valor de X continua a aumentar).
CAPÍTULO 11 « CORRELAÇÃO E REGRESSÃO 31 1
E muito mais Iacil trabalhar com as relacões lineares entre variaveis do que com as
curvilineas. Se sabemos o valor da variavel X, podemos usar a Iormula para linha reta (Y
÷ a ¹ bX) para determinar o valor de Y. Mas, quando as variaveis apresentam uma rela-
cão curvilinea, a Iormula que melhor descreve essa associacão sera muito mais complexa.
As relacões curvilineas estão além do escopo deste livro, e a maioria dos pesquisadores
em administracão trabalha com relacões que acreditam ser lineares. Na verdade, a maior
parte da estatistica abordada nesta obra baseia-se na suposicão de que uma relacão linear
é uma maneira eIiciente de descrever a associacão entre as variaveis que estão sendo exa-
minadas.
DIREÇÃO
Se existe uma relacão entre as variaveis, também precisamos conhecer a direcão. A dire-
cão de uma relacão pode ser positiva ou negativa. No exemplo do restaurante, existira
uma relacão positiva se os clientes que classiIicam os Iuncionarios de modo Iavoravel
também estiverem muito satisIeitos. Da mesma Iorma, existira uma relacão negativa se os
clientes que acham que os precos são mais altos também demonstrarem menor satisIacão.
Uma relacão negativa entre duas variaveis é denotada com um sinal de menos (-), e uma
relacão positiva é apresentada com um sinal de mais (¹).
FORÇA DE ASSOCIAÇÃO
Dependendo do tipo de relacão que esta sendo examinada, geralmente categorizamos a
Iorca de associacão como: leve: pequena, mas deIinida: moderada: alta: ou muito Iorte.
Uma situacão de Iorca de associacão leve, quase imperceptivel, é aquela em que uma as-
sociacão coerente e sistematica não esta presente entre as variaveis. Quando uma relacão
esta presente, o pesquisador em administracão deve determinar a Iorca de associacão.
Uma associacão muito Iorte indica que ha uma probabilidade muito alta de haver uma
relacão entre as variaveis. Uma associacão moderada indica que é provavel que haia uma
relacão coerente e sistematica entre as variaveis.
COVARÌAÇÃO E RELAÇÕES ENTRE VARÌÁVEÌS
Os pesquisadores em administracão muitas vezes deseiam saber se duas ou mais varia-
veis estão associadas. As variaveis estão associadas quando exibem covariacão. A cova-
riacão existe quando uma variavel coerente e sistematicamente muda em relacão a outra
variavel. O coeficiente de correlacão é usado para avaliar essa associacão. Grandes coe-
Iicientes indicam uma alta covariacão e uma Iorte relacão. Pequenos coeIicientes indicam
pouca covariacão e uma Iraca relacão. Assim, um coeIiciente de correlacão mede o grau
de covariacão entre duas variaveis. Por exemplo, se sabemos que as compras pela Inter-
net são relacionadas por idade, queremos saber até que ponto os iovens compram mais
pela Internet e, essencialmente, que tipos de produtos eles compram com mais Ireqüên-
cia e por quê. Deste modo, quando duas variaveis modiIicam-se iuntas em uma base con-
Iiavel ou coerente (isto é, covariam), essa inIormacão aiuda-nos a Iazer previsões para uso
no desenvolvimento de estratégias administrativas solidas.
Uma das primeiras questões que precisamos determinar é se o coeIiciente de correla-
cão é estatisticamente signiIicativo. Sem levar em conta seu tamanho absoluto, um coeIi-
ciente de correlacão não tem signiIicado a menos que seia estatisticamente signiIicativo.
A maioria dos programas de software diz se uma correlacão é estatisticamente signiIicati-
312 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
va. O programa SPSS representa a signiIicância como a probabilidade de reieitar a hipo-
tese nula quando ela é verdadeira. As orientacões comuns dizem que, para ser considera-
da estatisticamente signiIicativa, a probabilidade deve ser pelo menos · 0,05. Isso signiIi-
ca que, para reieitar a hipotese nula, deve haver menos de cinco chances em cem de você
estar errado ao reieita-la. Em algumas situacões administrativas, um nivel · 0,10 é consi-
derado aceitavel. Mas aceitar esse nivel de probabilidade acarreta mais risco, e a analise
deve decidir se a situacão garante um maior nivel de risco.
Uma vez determinado que a relacão é estatisticamente signiIicativa, devemos decidir
que Iorca de associacão é aceitavel. O tamanho do coeIiciente de correlacão é usado para
descrever quantitativamente a Iorca de associacão entre duas ou mais variaveis. Regras
praticas têm sido propostas para caracterizar a Iorca de associacão entre variaveis, com
base no tamanho absoluto-do coeIiciente de correlacão. Como sugere a Figura 11-1, os
coeIicientes de correlacão entre +0,91 e +1,00 são considerados muito Iortes . Ou seia, a
covariância decididamente é compartilhada entre as duas variaveis que estão sendo exa-
minadas. Por outro lado, se o coeIiciente de correlacão estiver entre +0,00 e +0,20, mesmo
se o coeIiciente Ior maior do que zero na amostra, ha uma boa chance de a hipotese nula
não ser reieitada (a menos que se esteia trabalhando com uma grande amostra). Esses ni-
veis são apenas sugestões, e outras orientacões quanto a Iorca da relacão são possiveis.
Os diagramas de dispersão são uma maneira Iacil de demonstrar visualmente a co-
variacão entre duas variaveis. Um diagrama de dispersão é um graIico dos valores de
duas variaveis para todas as observacões na amostra. E costume dispor a variavel depen-
dente no eixo vertical e a independente no eixo horizontal. As Figuras ll-2a-c são exem-
plos de possiveis relacões entre duas variaveis que poderiam ser dispostas em um diagra-
ma de dispersão. Na Figura 11-2a, não ha nenhuma relacão ou associacão aparente entre
as variaveis. Isto é, não ha nenhum padrão previsivel ou identiIicavel para os pontos. Sa-
ber os valores de Y ou de X não nos diria muita coisa (provavelmente nada) sobre os pos-
siveis valores da outra variavel. A Figura 11-2a sugere que não ha uma relacão coerente e
sistematica entre Y e X e que, deste modo, muito pouca ou nenhuma covariacão é com-
partilhada entre as duas variaveis. Se a quantidade de covariacão compartilhada por es-
sas duas variaveis Iosse medida, estaria proxima de zero.
Na Figura ll-2b, o padrão das duas variaveis mostra um quadro bastante diIerente.
Ha um padrão distinto para os pontos no diagrama de dispersão, que é Iacilmente descri-
to como uma linha reta. ReIerimo-nos a essa relacão como positiva, pois os aumentos no
valor de X estão associados com aumentos no valor de Y. De maneira semelhante, se os
valores de X diminuem, os valores de Y também decrescem. Se mensurassemos a covaria-
cão entre os valores de Y e X, ela seria relativamente alta. Assim, mudancas no valor de X
estão coerente e sistematicamente relacionadas com mudancas no valor de Y.
A Figura ll-2c mostra um tipo semelhante de padrão entre os valores de Y e X, mas a
direcão da relacão é oposta aquela apresentada na Figura ll-2b. Existe um padrão linear,
REGRAS PRÁTICAS SOBRE O VALOR DO COEFICIENTE DE CORRELAÇÃO* FIGURA11-1
CAPÍTULO 11 ‹ CORRELAÇÃO E REGRESSÃO 313
FIGURA 11-2 DIAGRAMAS DE DISPERSÃO ILUSTRANDO DIFERENTES RELAÇÕES
a. Nenhuma associação b. Associação positiva c. Associação negativa
mas agora, quando o valor de X aumenta, os valores de Y diminuem. Ou seia, os valores
de X e de Y mudam na direcão oposta. Essa relacão é descrita como negativa. Ha uma
grande covariacão entre as duas variaveis porque Y e X sistematicamente modiIicam-se
iuntas. A diIerenca é que se movem na direcão oposta a da Figura ll-2b. A covariacão diz
respeito a quantidade de movimento compartilhado entre duas variaveis, não a direcão
da relacão.
Os diagramas de dispersão possibilitam que se demonstre visualmente a relacão entre
duas variaveis e até onde elas covariam. Por exemplo, um diagrama de dispersão pode
dizer que, a medida que a idade aumenta, o consumo médio de aspirina também aumen-
ta ou que, em um dia quente, consumimos mais agua. Mas, embora uma demonstracão
visual dos dados seia muito util, como vimos no Capitulo 6, algumas situacões podem
precisar de uma medida quantitativa da covariacão entre duas variaveis para que se en-
tenda completamente a relacão.
A correlacão de Pearson mensura a associacão linear entre duas variaveis métricas. O
numero que representa a correlacão de Pearson é chamado de coeIiciente de correlacão.
Ele varia de -1,00 a ¹1,00, com o zero não representando absolutamente nenhuma asso-
ciacão entre as duas variaveis métricas. Embora -1,00 ou ¹1,00 seia possivel e represente
uma associacão perIeita entre duas variaveis, essa Iorma raramente acontece. Quanto
maior o coeIiciente de correlacão, mais Iorte a ligacão ou o nivel de associacão. Os coeIi-
cientes de correlacão podem ser positivos ou negativos, dependendo da direcão da rela-
cão entre as variaveis. Se ha um coeIiciente de correlacão positivo entre X e Y, então os au-
mentos no valor de X estão associados com aumentos no valor de Y e vice-versa.
O coeIiciente de correlacão avalia a associacão entre duas variaveis. A hipotese nula
estabelece que não ha nenhuma associacão entre duas variaveis e que o coeIiciente de cor-
relacão é zero (ou muito pequeno). Por exemplo, podemos colocar a hipotese de que não
ha relacão entre a preIerência por batatas Iritas do McDonald's
R
e niveis de renda. Se vo-
cê mensurar as duas variaveis (consumo de batatas Iritas do McDonald's
R
e renda) em
uma amostra da populacão e calcular o coeIiciente de correlacão para essa amostra como
sendo de 0,36, a questão é Qual a probabilidade de você obter um coeIiciente de correla-
cão de 0,36 em sua amostra se o coeIiciente de correlacão na populacão é na verdade ze-
ro? Ou seia, se você calcula um grande coeIiciente de correlacão entre duas variaveis em
sua amostra - consumo de batatas Iritas do McDonald's® e renda - (e sua amostra Ioi ade-
quadamente selecionada da populacão de interesse), as chances de o coeIiciente de corre-
ANÁLISE DE CORRELAÇÃO
314 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
lacão da populacão ser realmente zero são pequenas. Se o coeIiciente de correlacão é es-
tatisticamente signiIicativo, você pode reieitar a hipotese nula e concluir, com uma cer-
ta seguranca, que as duas variaveis que você esta examinando compartilham alguma
associacão na populacão. Em outras palavras, o consumo de batatas Iritas do McDon-
ald's* esta relacionado com a renda.
Além de examinar o coeIiciente de correlacão, muitas vezes o elevamos ao quadrado
para obter o coeIiciente de determinacão ou r
2
. 0 coeIiciente de determinacão varia de 0,00
a 1,0 e representa a quantidade de variacão explicada em uma variavel por uma ou mais
das outras variaveis. Se um coeIiciente de correlacão é 0,543, isso signiIica que R é 0,294,
indicando que aproximadamente 29,4° da variacão em uma variavel esta associada com a
outra variavel. Como acontece com o coeIiciente de correlacão, quanto maior o coeIiciente
de determinacão, mais Iorte a relacão entre as variaveis que estão sendo examinadas.
Quando utilizamos o coeIiciente de correlacão de Pearson, devemos Iazer varias su-
posicões sobre a natureza dos dados. Primeiro, supõe-se que as duas variaveis Ioram
mensuradas usando-se medidas intervalares ou de classiIicacão (isto é, métricas). Outros
tipos de coeIicientes de correlacão podem ser usados com medidas nominais ou ordinais.
Mais adiante, neste capitulo, discutiremos o coeIiciente de correlacão de Spearman para
uso com dados ordinais. Uma outra suposicão do coeIiciente de correlacão de Pearson é
a de que a relacão que estamos examinando é linear. Isto é, uma linha reta é a descricão
precisa da relacão entre as duas variaveis métricas.
Uma terceira suposicão do coeIiciente de correlacão de Pearson é a de que as varia-
veis que estão sendo examinadas são de uma populacão normalmente distribuida. Uma
distribuicão normal é uma suposicão comum para muitas técnicas estatisticas usadas por
pesquisadores em administracão. Mas muitas vezes é diIicil determinar se os dados da
amostra estão normalmente distribuidos. Como a correlacão é considerada uma estatisti-
ca razoavelmente Iorte quando a distribuicão diIere do normal, essa suposicão Ireqüen-
temente é tida como certa. Em uma secão posterior deste capitulo, mostraremos como de-
terminar se os dados de uma amostra têm distribuicão normal.
EXEMPLO DE CORRELAÇÃO BIVARIADA DEPEARSON
Phil Samouel coletou inIormacões, em sua survev com os Iuncionarios, sobre a coopera-
cão entre eles, o trabalho em equipe e a probabilidade de procurarem um novo emprego.
Como uma mão-de-obra estavel seria algo bom para seu restaurante, ele quer usar suas
descobertas para compreender melhor o que pode ser Ieito para reter os Iuncionarios.
Uma das cosias que ele esta pensando em implementar é um novo programa de treina-
mento para seus Iuncionarios. Portanto, ele gostaria de saber se a relacão entre a coope-
racão percebida entre os Iuncionarios e a probabilidade de procura de novo emprego é
signiIicativa e positiva. Se houver uma relacão, ele podera usar essa inIormacão para de-
senvolver um programa de treinamento que assegure que seus Iuncionarios cooperem
mais no preparo das reIeicões e no atendimento aos' clientes.
A hipotese nula é a de que não ha relacão entre a cooperacão percebida dos Iunciona-
rios do Samouel's e a probabilidade de busca por um novo emprego. Lembre-se de que,
na descricão da survev dos Iuncionarios no Apêndice 1-B, Ioram coletadas inIormacões
sobre a intencão de procurar um novo emprego (X
16
) e a cooperacão percebida entre os
membros de um grupo de trabalho (X
4
). Para testar essa hipotese, devemos calcular a cor-
relacão entre essas duas variaveis. Isso esta apresentado na Figura 11-3.
A tabela de correlacões na Figura 11-3 mostra como as duas variaveis estão relaciona-
das. Dito de outro modo, ela nos mostra se as duas variaveis covariam. Para interpretar a
tabela, olhe para a coluna e a linha onde as variaveis se cruzam. Por exemplo, a coluna
CAPÌ TULOU ‹ CORRELAÇÃO E REGRESSÃO . 315
CORRELAÇÃO BÌVARÌADA ENTRE COOPERAÇÃO NO GRUPO DE TRABALHO E
ÌNTENÇÃO DE PROCURAR OUTRO EMPREGO
Estatística descritiva
Correlações
X
4
- Cooperação X
16
- Ìntenção de
no grupo de trabalho procurar outro emprego
X
4
- Cooperação no grupo de trabalho
X
16
- Ìntenção de procurar outro emprego
A correlação é significativa no nível 0,01 (bicaudal).
bem da direita na tabela é a variavel X
16
- Intencão de procurar novo emprego, e o nume-
ro no topo da coluna é -0,585. Isso indica que a correlacão entre a variavel X
4
- Coopera-
cão no grupo de trabalho e a X
16
~ Intencão de procurar novo emprego é -0,585 e que o ni-
vel de signiIicância é 0,01 (esse numero esta logo abaixo de -0,585 na linha denominada
de Sig. |bicaudal|, em que o teste t mostra que a correlacão é signiIicativa). Os numeros
na linha denominada de N representam o numero de respondentes usados para compu-
tar a correlacão: isto é, o tamanho da amostra - 63 Iuncionarios do Samouel's.
Os resultados relatados na Figura 11-3 conIirmam que a cooperacão percebida no
grupo de trabalho esta signiIicativamente correlacionada com a intencão de procurar
um novo emprego. Isso signiIica que podemos reieitar a hipotese nula de que não ha re-
lacão entre as duas variaveis. Além disso, a correlacão é negativa e moderadamente Ior-
te, de modo que podemos concluir que os Iuncionarios que acreditam haver uma menor
cooperacão no grupo de trabalho demonstram mais intencão de procurar um novo em-
prego. Para garantir uma mão-de-obra mais estavel, Phil precisa implementar o treina-
mento que ele esta considerando de Iorma a poder melhorar a cooperacão nos grupos de
trabalho.
PESQUÌSA EM AÇÃO
USO DE SPSS PARA CALCULAR UMA CORRELAÇÃO DE PEARSON BÌVARÌADA
A seqüência de cliques em SPSS para executar a correlacão bivariada de Pearson é: ANALYZE ‰.~
CORRELATE -» BIVARIATE, o que leva a uma caixa de dialogo onde você seleciona as variaveis.
Destaque X
16
e X
4
e coloque-as na caixa Variables. Usaremos as três opcões de aefault. correlacão de
Pearson, teste bi-caudal de signiIicância e variaveis signiIicativas Ilag. A seguir, va até a caixa Op-
tions e clique em Means, Standard deviation e Continue. Finalmente, clique em OKno alto, a direi-
ta da caixa de dialogo para rodar o programa. Os resultados serão os mesmos da Figura 11-3.
Medis Desvio-padrão N
X
4
- Cooperação no grupo de trabalho 3,89 1,345 63
X
16
- Ìntenção de procurar outro emprego 4,27 1,807 63
FÌGURA ïïó Y
316 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
SIGNIFICÂNCIA PRÁTICA DO COEFICIENTE DE CORRELAÇÃO
Se o coeIiciente de correlacão é Iorte e estatisticamente signiIicativo, pode-se concluir que
existe uma relacão entre as variaveis. Em nosso exemplo, Phil Samouel pode Iicar razoa-
velment e seguro de que as variaveis para cooperacão no grupo de trabalho e intencão de
procurar novo emprego estão relacionadas, pois a correlacão é -0,585 e altamente signiIi-
cativa (0,000). Mas, se o coeIiciente de correlacão é pequeno, ha duas possibilidades. Uma
é a de que não existe uma relacão coerente e sistematica entre as variaveis: a outra é a de
que existe a associacão, mas ela não é linear, de modo que outros tipos de relacões devem
ser considerados.
Mesmo se o coeIiciente de correlacão Ior estatisticamente signiIicativo, isso não quer
dizer que seia signiIicativo na pratica. Também devemos veriIicar se os numeros que cal-
culamos t êm signiIicado. Ao calcularmos a signiIicância estatistica de um coeIiciente de
correlacão, o t amanho da amostra é um Iator de grande inIluência. Com grandes amos-
tras, é possivel obter um coeIiciente de correlacão estatisticamente signiIicativo que, na
realidade, é muit o pequeno para ter algum uso pratico. Por exemplo, se o coeIiciente de
correlacão entre cooperacão no grupo de trabalho e intencão de procurar um novo em-
prego Iosse 0,20 (signiIicativo em nivel 0,05), o coeIiciente de determinacão seria 0,04. Es-
se coeIiciente de determinacão tem alguma significância prática? Saber que você conse-
guiu explicar 4° da variacão compensa o custo de coleta e analise dos dados? Depende
dos obietivos da pesquisa. Assim, sempre devemos considerar ambos os tipos de signiIi-
cância (estatistica e pratica) antes de desenvolver conclusões, especialmente quando exa-
minamos questões mais complexas.
PESQUISA EM AÇÃO
USO DE EXCEL PARA CALCULAR CORRELAÇÃO
Podemos usar o Excel para calcular correlacão. Primeiro, clique em um campo em branco da plani-
lha. A seqüência de cliques em Excel para a correlacão é: Insert -» Function‰~ Or select a category -~
All. Depois de completar a seqüência, percorra a lista de Iuncões na grande caixa de texto e desta-
que CORREL, que representa a palavra correlacão. Selecione OK, a caixa Function Arguments
aparecera. Havera duas caixas de texto, chamada Array 1 e Array 2 . EspeciIique as duas colu-
nas que você deseia comparar nessas duas caixas de texto. Para comparar a coluna D com a colu-
na E , por exemplo, você digita D1:D63 (tamanho da amostra) na caixa de texto Array 1 e E1:E63
na caixa de texto Array 2 . O Dl signiIica comecar com a primeira observacão, e o D63 signiIica ter-
minar com a observacão 63 (tamanho da amostra). A seguir, selecione OK, e o computador calcula-
ra a correlacão. A resposta aparecera no campo em branco selecionado.
Para calcular a correlacão entre as variaveis X
15
- Orgulho e X
16
- Intencão de procurar outro em-
prego, a partir da survev de Iuncionarios do Samouel's, clique em qualquer campo aberto na plani-
lha. Siga a seqüência acima e selecione CORREL. Quando você vir as duas caixas Array, digite
P1:P63 emArray 1 e Q1:Q63 emArray 2. O P é usado porque essa é a coluna que tem os dados para
X
15
- Orgulho. O Q é usado porque essa é a coluna que contém os dados para X
16
- Intencão de pro-
curar outro emprego. O 1 signiIica comecar com a primeira observacão, e 63 signiIica parar na ulti-
ma observacão (isto é, incluir o total da amostra). Clique, então, em OK, e o resultado aparecera no
campo em branco que você selecionou. O resultado é uma correlacão negativa de -0,598.
CAPÍTULO 11 » CORRELAÇÃO E REGRESSÃO 3 1 7
CORRELAÇÃO E ESCALAS DE MENSURAÇÃO
Os pesquisadores em administracão Ireqüentemente descobrem que as respostas para
suas perguntas so podem ser mensuradas com escalas ordinais ou nominais. Por exem-
plo, se quisermos veriIicar se o gênero esta relacionado ao consumo de reIrigerantes, te-
remos um problema, pois o gênero é uma variavel nominal. Se usassemos o coeIiciente de
correlacão de Pearson para examinar o consumo de reIrigerantes por homens e mulheres
e supuséssemos que a medida tem propriedades intervalares ou de classiIicacão, nossos
resultados seriam enganosos. Por exemplo, o uso de uma escala de dois pontos (não-mé-
trica) em vez de uma escala de cinco pontos (métrica) reduz substancialmente a quanti-
dade de inIormacões disponiveis e pode resultar em uma atenuacão do verdadeiro coeIi-
ciente de correlacão na populacão.
Quando as escalas para coletar dados são nominais ou ordinais (não-métricas), o que
o analista pode Iazer? Uma opcão é utilizar o coeIiciente de correlacão de ordem de ran-
queamento de Spearman em vez da correlacão produto-momento de Pearson. O coeIi-
ciente de correlacão de Spearman tipicamente resulta em um coeIiciente mais baixo, mas
é considerado uma estatistica mais conservadora.
EXEMPLO DE CORRELAÇÃO DE ORDEM DE RANQUEAMENTO
DESPEARMAN
A pesquisa sobre os clientes dos restaurantes coletou dados sobre quatro Iatores de esco-
lha de restaurantes. Pediu-se aos clientes que classiIicassem os quatro Iatores seguintes
em termos de sua importância na selecão de um restaurante - qualidade da comida, am-
biente, precos e Iuncionarios. As variaveis da survev iam de X
13
a X
16
e eram mensuradas
ordinalmente. Phil Samouel gostaria de saber se as classiIicacões para qualidade da co-
mida estavam relacionadas com as classiIicacões para ambiente . Uma resposta para
essa questão aiudara Phil a saber se deve enIatizar a qualidade da comida ou o ambiente
em seus comerciais. Esses dados são ordinais (ranqueamento): portanto, a correlacão de
Pearson não pode ser usada. A correlacão de ordem de ranqueamento de Spearman, ou
rho de Spearman, é a correlacão adequada para o calculo. A hipotese nula é a de que não
existe diIerenca nos ranqueamentos dos dois Iatores de selecão de restaurantes.
As inIormacões na tabela de correlacão da Figura 11-4 mostram que a correlacão en-
tre as variaveis X
13
- Qualidade da comida e X
14
- Ambiente é de -0,801 e que o nivel de
signiIicância é 0,000. Isso demonstra que ha uma relacão negativa signiIicativa entre os
dois Iatores de selecão de restaurantes. A correlacão negativa signiIica que os clientes que
colocam uma grande importância na qualidade da comida como Iator de selecão classiIi-
carão o ambiente como um Iator signiIicativamente menos importante. Os clientes de res-
taurantes classiIicam a qualidade da comida como algo muito importante com muito
mais Ireqüência do que consideram o ambiente, como podemos ver no graIico de barras
da Figura 11-5.
Phil sabe agora que os clientes classiIicam a qualidade da comida como sendo relati-
vamente mais importante do que o ambiente. Mas ele não conhece as classiIicacões dos
Iatores de selecão em geral. As variaveis X
13
e X
16
são dados ordinais. Portanto, não pode-
mos compara-las pelo calculo da média. Em vez disso, devemos utilizar a mediana para
comparar os ranqueamentos dos quatro Iatores de selecão de restaurantes. Isso possibili-
tara uma melhor compreensão das relacões.
Os ranqueamentos são mostrados na Figura 11-6. Lembre-se de que os quatro Iatores
de selecão Ioram classiIicados de 1 a 4, com 4 ÷ mais importante. Assim, a variavel com
maior mediana é classiIicada como a mais alta e mais importante, e a variavel com menor
mediana é a menos importante. A qualidade da comida (X
13
) é classiIicada como a mais
318 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
* A correlação é significativa no níve! 0,01 (bicaudal).
PESQUISA EM AÇÃO
USO DE SPSS PARA CALCULAR CORRELAÇÃO RHO DE SPEARMAN
A seqüência em SPSS é: ANALYZE -~ CORRELATE -~ BIVARIATE. Destaque as variaveis X
13
e X
14
e coloque-as na caixa Variables. A correlacão de Pearson esta no aefault iuntamente com o teste bi-
caudal de signiIicância e correlacões signiIicativa Ilag. Desative a correlacão de Pearson e clique
em Spearman. Em seguida, clique em OKno alto, a direita da caixa de dialogo para rodar o progra-
ma. Os resultados serão os mesmos mostrados na Figura 11-4,
important e (mediana ÷ 4), enquant o que X
15
- Precos é a menos import ant e (mediana ÷
1). Além disso, observe que o minimo para as variaveis X
13
e X
14
é 2 e que, para X
15
e X
16
, é
1. Desta Iorma, com base nas classiIicacões da mediana, os clientes desses dois restauran-
tes estão interessados, em primeiro lugar, na qualidade da comida e, em segundo, no am-
biente. Mais ainda, comparando-se as medi anas, pode-se ver que os Iuncionarios e os
precos são os Iatores de selecão menos importantes, isso não quer dizer que não seiam
importantes e que possam ser ignorados por Phil, mas sim que, relativamente Ialando, a
qual idade da comida e o ambient e são mai s importantes. No desenvolviment o de um
pl ano de acão para competir com o Gino' s, Phil precisa concentrar-se inicialmente na
FIGURA 11-5
GRÁFICOS DE BARRAS DE RANQUEAMENTO PARA QUALIDADE DA COMIDA
E AMBIENTE
CAPÍTULO 11 ‹ CORRELAÇÃO E REGRESSÃO 319
qualidade da comida, depois no ambiente e, até certo ponto, nos Iuncionarios (alguns
clientes classiIicaram os Iuncionarios como mais importantes, como é demonstrado pelo
valor maximo de 4),
TÉCNÌCAS ESTATÍSTÌCAS E ANÁLÌSE DE DADOS
A maioria dos problemas em administracão envolvem muitas variaveis. Os administra-
dores consideram diversas dimensões de desempenho quando avaliam seus Iunciona-
rios. Os consumidores avaliam muitas caracteristicas dos produtos ao decidirem quais
vão comprar. Muitos Iatores inIluenciam as acões que um corretor recomenda. Os clien-
tes de restaurantes consideram varios Iatores ao decidirem onde comer. A medida que o
mundo se torna mais complexo, mais Iatores inIluenciam as decisões tomadas pelos ad-
ministradores. Assim, os pesquisadores em administracão devem, cada vez mais, basear-
se em métodos mais soIisticados de analise de dados.
Nossa discussão, até este ponto, tratou das analises univariada e bivariada. A analise
univariada envolve a testagem estatistica de uma unica variavel, e a analise bivariada en-
volve duas variaveis. Quando os problemas em administracão envolvem três ou mais va-
riaveis, são inerentemente multidimensionais e requerem o uso de analise multivariada.
Por exemplo, administradores que tentam entender melhor seus Iuncionarios podem
examinar a satisIacão no emprego, o comprometimento com a Iuncão, a iornada de traba-
lho (meio turno ou turno integral), turno de trabalho (dia ou noite), idade, etc. De manei-
ra semelhante, os consumidores que estiverem comparando supermercados, poderão
considerar a variedade e o Irescor dos produtos, a localizacão do estabelecimento, o ho-
rario de atendimento, a limpeza, a cortesia e a atencão dos Iuncionarios, etc. Os pesquisa-
dores em administracão precisam de técnicas estatisticas multivariadas para compreen-
der totalmente esses problemas complexos.
A Figura 11-7 apresenta uma classiIicacão util de técnicas estatisticas. Como podemos
ver na parte superior do esquema, dividimos as técnicas em dependência e interdepen-
dência, de acordo com o numero de variaveis dependentes. Se ha apenas uma variavel
dependente, a técnica é chamada de método de dependência. Isto é, temos variaveis de-
pendentes e independentes em nossa analise. Por outro lado, quando não temos uma va-
riavel dependente, chamamos a técnica de método de interdependência. Ou seia, todas as
variaveis são analisadas iuntas e nosso obietivo é Iormar grupos ou dar sentido a um con-
iunto de variaveis ou de respondentes.
Com essa classiIicacão, podemos selecionar a técnica estatistica adequada. Se tiver-
mos um problema de pesquisa que envolva a associacão ou a previsão usando variaveis
dependentes e independentes, deveremos veriIicar as técnicas de dependência no lado
esquerdo do esquema. A escolha de uma técnica estatistica especiIica depende de termos
320 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
CLASSIFICACÃO DE TÉCNICAS ESTATISTICAS
uma variavel dependente métrica ou não-métrica. Com uma variavel dependente não-
métrica ordinalmente mensurada, devemos usar a correlacão de Spearman, que ia discu-
timos. Com uma variavel dependente nominal não-métrica, usamos a analise discrimi-
nante, a análise conjunta ou regressão logística. Por outro lado, se nossa variavel depen-
dente é métrica, podemos usar a correlacão, a regressão, a ANOVA ou MANO VA e a con-
iunta (a técnica estatistica de analise coniunta pode ser Iormulada para tratar tanto de va-
riaveis métricas quanto de não-métricas). As diversas técnicas estatisticas são deIinidas
na Figura 11-8.
ANALISE DE REGRESSÃO
A analise de regressão é talvez a técnica de analise de dados mais amplamente aplicada
para mensurar relacões lineares entre duas ou mais variaveis. A correlacão nos diz se
existe uma relacão entre duas variaveis, bem como a Iorca dessa relacão. As vezes, no en-
tanto, essas respostas não oIerecem inIormacões suIicientes para que a administracão to-
me a decisão apropriada. Por exemplo, Phil Samouel pode deseiar examinar a relacão en-
tre varias medidas de ambiente de trabalho e o comprometimento de seus Iuncionarios.
A Figura 11-9 mostra as três variaveis de supervisão-(X
3
, X
6
e X
10
) da survev com Iunciona-
rios e uma das variaveis de comprometimento (X
14
- Empenho). Se Phil usasse a regres-
são bivariada, ele teria que realizar três modelos de regressão, um para cada uma das três
variaveis de supervisão. Mas, com a regressão múltipla, ele poderia aplicar somente um
modelo de regressão. Isto é, a variavel dependente métrica seria X
14
- Empenho, e as três
variaveis independentes métricas seriam X
3
, X
6
e X
10
(todas essas variaveis mensuram as
percepcões dos Iuncionarios quanto a supervisão no restaurante Samouel's).
Os administradores Ireqüentemente deseiam prever, por exemplo, qual o impacto
que uma campanha publicitaria tera sobre as vendas. Os três métodos tradicionais para
Iazer essas previsões são: (1) iulgamento inIormado: (2) extrapolacão a partir de compor-
tamento passado: e (3) regressão. O iulgamento inIormado e a extrapolacão supõem que
CAPÍTULO 11 ‹ CORRELAÇÃO E REGRESSÃO 3 2 1
FÌ GURA 11- 8 DEFINICÔES DE TÉCNICAS ESTATISTICAS
regressão bivariada
analise de conglomerado
correlacão
analise conjunta
análise di scrimi nant e
analise Iatoriai
regressão logistica
regressão multipla
MANOVA
mapeamento perceptual
ANOVA quer dizer análise de variância. É usada para examinar diferenças estatísticas entre
as médias de dois ou mais grupos. A variável dependente é métrica, e a(s) variável(is) inde-
pendente^) é/são não-métrica(s). A ANOVA de um fator tem uma única variável indepen-
dente, e a ANOVA de N fatores pode ter duas ou mais variáveis independentes não-métricas.
É um t i po de regressão com uma única variável dependente e uma única variável indepen-
dente métrica.
Esse ti po de análise possibilita aos pesquisadores colocar objetos (por exemplo, clientes, mar-
cas, produtos) em grupos de modo que os objetos dos grupos sejam semelhantes uns aos
outros. Ao mesmo tempo, os objetos de um determinado grupo são diferentes dos objetos
de todos os outros grupos.
A correlação examina a associação entre duas variáveis métricas. A força da associação é
medida pelo coeficiente de correlação.
Essa técnica possibilita aos pesquisadores determinar as preferências que os indivíduos têm
por diversos produtos e serviços e quais as características dos produtos que são mais valo-
rizadas.
Possibilita ao pesquisador prever os componentes de um grupo usando duas ou mais variá-
veis independentes métricas. A variável para composição do grupo é uma variável depen-
dente não-rnétrica.
Essa técnica é usada para sintetizar as informações de um grande número de variáveis em
um número bem menor de variáveis e fatores. A técnica é usada para combinar variáveis,
enquanto que a análise de conglomerado é usada para identificar grupos com característi-
cas semelhantes.
A regressão logística é um t i po especial de regressão que pode ter uma variável dependente
não-métrica.
Esse ti po de regressão tem uma única variável dependente métrica e diversas variáveis inde-
pendentes métricas.
É o mesmo que a ANOVA, mas pode examinar diferenças de grupo em duas ou mais variá-
veis dependentes métricas ao mesmo tempo.
Essa abordagem usa informações de outras técnicas estatísticas para mapear as percepções
dos clientes em relação a produtos, marcas, empresas, etc.
FIGURA 11-9 VARIAVEIS SELECIONADAS A PARTIR DA SURJEY DE FUNCIONARIOS DO SAMOUEL'S
eventos e comport ament os do passado conti nuarão no Iuturo, Quando esses eventos pas-
sados mudam, a extrapol acão e o i ul gament o não conseguem aiudar o pesqui sador em
admi ni st racão a prever o Iuturo com um nivel aceitavel de exatidão. Em tais casos, o pes-
qui sador em admini st racão precisa de uma técnica como a analise de regressão.
Nossa discussão inicial sera concent rada na regressão linear bi vari ada. A analise de
regressão bivari ada é uma técnica estatistica que examina inIormacões sobre a relacão en-
tre uma vari avel i ndependent e (indicador) e uma variavel dependent e (critério), dai Ia-
zendo previsões. Valores da variavel i ndependent e são exami nados e o comport ament o
ANOVA
322 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
da variavel dependente é observado e comparado utilizando-se a Iormula para uma linha
reta. A Iormula para regressão linear é:
Y ÷ a · bX
Onde:
M ã variavel prevista
X ÷ variavel usada para prever Y
! ã intercepcão, ou ponto onde a linha atravessa o eixo Y quando X ÷ 0
b ÷ inclinacão, ou mudanca em Y para qualquer mudanca correspondente em uma
unidade de X
Isso assemelha-se a relacão de linha reta que descrevemos como subiacente ao coeIi-
ciente de correlacão. Quando o diagrama de dispersão é uma linha reta, ha uma alta cor-
relacão entre as duas variaveis. A regressão esta diretamente relacionada com a correla-
cão e, na verdade, a regressão bivariada e a analise de correlacão são a mesma coisa.
A tareIa do pesquisador em administracão é encontrar o melhor método para estabe-
lecer uma linha reta para os dados. O método de mínimos quadrados é um método ma-
tematico relativamente simples de garantir que a linha reta que passa pelos pontos no
diagrama de dispersão seia posicionada da melhor maneira possivel. Para isso, minimi-
zam-se as distâncias a partir da linha reta para todos os pontos no diagrama de dispersão.
O método mede essas distâncias veriIicando os erros na previsão de M¿ °¿®¬·® ¼» Èò Ñ ½®·s
tério dos minimos quadrados minimiza a soma dos desvios quadrados entre os valores
reais de Y e os previstos pela estimativa da linha de regressão.
Devemos avaliar certas suposicões quando usamos a analise de regressão, assim co-
mo com a correlacão. Primeiro, a analise de regressão pressupõe que a relacão entre duas
variaveis é linear. Se o diagrama de dispersão dos valores de ambas as variaveis Ior pare-
cido com os das Figuras 11-2b ou ll-2c, essa suposicão parecera boa. Se Ior parecido com
o da Figura ll-2a, a analise de regressão não sera a escolha adequada.
Segundo, reIerimo-nos as duas variaveis como independente e dependente, mas isso
não signiIica que possamos dizer que uma variavel causa o comportamento da outra. A
analise de regressão avalia a magnitude e o tipo de associacão entre duas variaveis e Iaz
previsões, mas não passa de uma Ierramenta estatistica. Muitas vezes, é uma tentacão apli-
car a causalidade aos resultados de uma analise de regressão. Mas a causalidade deve vir
da teoria, que esta além do campo da estatistica. Conseqüentemente, embora duas varia-
veis, como vendas e propaganda, esteiam logicamente relacionadas, a analise de regressão
não permite que o pesquisador em administracão tire conclusões de causa e eIeito.
As outras suposicões da regressão simples são: (1) as variaveis são medidas utilizan-
do-se escalas intervalares ou de razão e provêm de uma populacão normal: e (2) os ter-
mos de erro são independentes e distribuidos normalmente. Abordaremos essas suposi-
cões com mais detalhes quando discutirmos a regressão multipla. No entanto, queremos
esclarecer que as escalas nominais e ordinais podem ser incluidas em uma regressão se
Iorem convertidas a uma codiIicacão de variavel muda (discutida no apêndice deste ca-
pitulo).
Com a analise de regressão bivariada, temos uma variavel independente e uma va-
riavel dependente. Mas os pesquisadores em administracão com Ireqüência interessam-
se pelo exame da inIluência combinada de diversas variaveis independentes sobre uma
variavel dependente. Por exemplo, os padrões de compra pela Internet estão relaciona-
dos não so a idade, mas também a renda, etnia, gênero, localizacão geograIica, instrucão,
etc? De modo semelhante, Phil Samouel poderia querer saber se a satisIacão dos clientes
com seu restaurante esta relacionada somente com as percepcões quanto a qualidade da
comida (Xi) ou também com a percepcão da variedade do cardapio (X
9
), do lugar (X
8
), dos
precos razoaveis (X
10
) e/ou com qualquer outra variavel de percepcão. A regressão mul-
CAPÍTULO 11 ‹ CORRELAÇÃO E REGRESSÃO 323
tipla possibilita mensurar essas relacões sem executar diversas regressões bivariadas in-
dividuais. Primeiramente, vamos examinar um exemplo de analise de regressão simples
ou bivariada e depois continuaremos com a regressão multipla,
EXEMPLO DE REGRESSÃO BIVARIADA
Phil Samouel regularmente lê as publicacões comerciais da American Restaurant Associa-
tion para melhor compreender essa area de negocios e suas tendências. Ele sistematica-
mente vê estudos que indicam a qualidade da comida como a variavel mais importante
usada pelos clientes na selecão de um restaurante e na decisão de la retornar. Ele deseia
saber se a alta qualidade da comida o aiudara a manter os clientes e a ampliar seu nego-
cio. A analise de regressão bivariada pode oIerecer inIormacões para auxilia-lo a encon-
trar a resposta para essa questão.
A survev dos clientes de Phil coletou inIormacões sobre satisIacão (X
17
). Essa variavel
Ioi mensurada como 1 ÷ Não muito satisIeito e 7 ÷ Totalmente satisIeito. A variavel K
=
»®¿
«³¿ ³»¼·¼¿ ¼¿- percepcões dos respondentes quanto a qualidade da comida (1 ÷ Discor-
da totalmente, 7 ÷ Concorda totalmente). A hipotese nula, nesse caso, é a de que não ha
relacão entre X
17
- SatisIacão e X
r
Excelente qualidade da comida. A hipotese alternati-
va é a de que X
17
e X-, são signiIicativamente relacionadas. Essa hipotese pode ser testada
corn a regressão bivariada, pois temos uma unica variavel métrica dependente e uma uni-
ca variavel métrica independente.
Os resultados do teste de nossa hipotese com a analise de regressão bivariada são
mostrados na Figura 11-10. Observe que separamos as survevs de clientes em dois gru-
pos - clientes do SamoueFs e clientes do Gino's. Isso possibilita que Iacamos compara-
cões entre os resultados dos dois restaurantes. A tabela de estatistica descritiva apresen-
ta a média do SamoueFs e do Gino's para a variavel dependente X
17
(SamoueFs ÷ 4,78:
Gino's ÷ 5,96) e para a variavel independente K
=
øÍ¿³±«»Ú- ã ëôîìå Ù·²±ù- ã ëôèï÷ ò Ò¿ ¬¿s
¾»´¿ ½¸¿³¿¼¿ ¼» λ-«³± ¼» ³±¼»´±ô ª»³±- ¯«» Î
î
°¿®¿ ± ³±¼»´± ¼» regressão do
SamoueFs é 0,263 e para o Gino's é 0,110. Como podemos lembrar a partir da discussão
anterior, R
2
indica a quantidade de variacão em uma variavel que é explicada por uma
outra variavel. Nesse caso, as percepcões dos clientes quanto a qualidade da comida do
SamoueFs explicam 26,3° da variacão total na satisIacão dos clientes com o restauran-
te, enquanto que, para o Gino's, equivalem a somente 11°.
REGRESSÃO BIVARIADA DE ESTATÍSTICA DESCRITIVA PARA SATISFAÇÃO E
QUALÌDADE DA COMÌDA
FIGURA 11-10
324 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
Ha varios outros aspectos da regressão bivariada que você precisa conhecer. Entre
eles, incluem-se a compreensão do índice F, a regressão e as somas residuais de quadra-
dos e o coeficiente de regressão. A Figura 11-11 contém essas inIormacões para a regres-
são bivariada da satisIacão do cliente e da qualidade da comida. A tabela ANO VA mostra
o indice F para os modelos de regressão. Essa estatistica avalia a signiIicância estatistica
do model o global de regressão. Sob a coluna Soma de Quadrados, a variância em Aiy ‰ sa-
tisIacão do cliente que esta associada com Xi - Excelente qualidade da comida é chama-
da de variância explicada (soma de quadrados de regressão). O restant e da variância to-
tal em X
17
que não esta associado com X
1
é chamado de variância não-explicada (denomi-
nada de soma de quadrados residual). O indice F é o resultado da comparacão da quan-
tidade de variância explicada com a variância não-explicada. EspeciIicamente, se você di-
vide o quadrado da médi a para a regressão (35,001) pelo quadrado da médi a para o resi-
duo (1,002), você obtém o indice F de 34,945 para o Samouel' s. Quant o maior o indice F,
mais variância na variavel dependent e é explicada pel a variavel independente. Em nos-
so exemplo de regressão bivariada, o indice F para o Samouel' s (34,945) indica que o mo-
delo é altamente signiIicativo no nivel 0,000. A relacão para o Gino' s é relativamente me-
nos signiIicativa (indice F ÷ 12,095), mas ainda mui t o Iorte (0,001).
A soma de quadrados t ambém Iornece inIormacões proveitosas na compreensão da
regressão. Para o Samouel' s, a soma de quadrados da regressão é 35,001 e a soma de qua-
drados residual é 98,159. Para o Gino' s, a soma de quadrados de regressão é 10,310 e a so-
ma de quadrados residual é 83,530. O exame da regressão, do residuo e das somas totais
de quadrados indica que, para ambos os modelos de regressão, ha muita variância não-ex-
plicada (residual) na variavel dependente. EspeciIicamente, para determinar a porcenta-
gem de variância não-explicada para um modelo de regressão, você simplesment e divide
a variância residual pela variância total. Para o Samouel' s, você divide 98,159 (soma de
quadrados residual) por 133,160 (soma total de quadrados) e descobre que 73,7° da va-
riância total não são explicados por esse model o de regressão bivariada (98,159/133,160 ÷
73,7°). Além disso, se você dividir 35,001 (soma de quadrados de regressão) por 133,160
(soma total de quadrados), descobrira que 26,3° da variância total são explicados por es-
se modelo de regressão bivariada (35,001/133,160 ÷ 26,3°). Observe que a divisão da so-
ma de quadrados de regressão pela soma total de quadrados Iornece R para esse modelo
de regressão (26,3°), como aparece na Figura 11-10.
PESQUISA EM AÇÃO
USO DE SPSS PARA CALCULAR UMA REGRESSÃO BIVARIADA (OS CLIENTES DO
SAMOUEL S E DO GINO S SÃO CONSIDERADOS SEPARADAMENTE)
O software SPSS pode aiudar a testar a hipotese nula de nenhuma relacão entre a satisIacão do clien-
te e a qualidade da comida. Como deseiamos veriIicar os clientes dos dois restaurantes separada-
mente, devemos primeiro utilizar o menu Data para separar a amostra em clientes do Samouel's e
do Gino's. Para isso, va ao menu Data, clique em Compare groups e destaque a variavel X
25
- Con-
corrência, movendo-a para a caixa chamada de Groups based on . Clique em OK. Como Ioi obser-
vado anteriormente, Iazemos isso porque Phil deseia comparar seu restaurante com o Gino's.
Para executar a regressão bivariada, a seqüência em SPSS é: ANALYZE ‰~ REGRESSION -~ LI-
NEAR. Clique em X
17
- SatisIacão e coloque-a na caixa Dependent Variable. Clique em X, - Excelen-
te qualidade da comida e coloque-a na caixa Independent Variables. Use o aefault Enter na caixa cha-
mada Method . Clique em Statistics e utilize os aefaults para Estimates e Model e então clique em
Descriptives. Finalmente, clique em Continue e em OK para rodar o programa. Os resultados serão
os mesmos das Figuras 11-10 e 11-11.
CAPÍTULO 11 ‹ CORRELAÇÃO E REGRESSÃO 3 2 5
Os coeIicientes de regressão dizem o quanto de variância na variavel dependente é ex-
plicado peia variavel independente. Veiamos o coeIiciente de regressão para X
x
do restau-
rante Samouel's mostrado na tabela de coeIicientes na Figura 11-11, A coluna denominada
CoeIicientes não-padronizados revela que o coeIiciente de regressão não-padronizado pa-
ra Xi é 0,459, A coluna chamada Sig. indica a signiIicância estatistica do coeIiciente de re-
gressão para X
r
O teste i indica se o coeIiciente de regressão é diIerente de zero o suIicien-
te para ser estatisticamente signiIicativo. A estatistica t é calculada pela divisão do coeIicien-
te de regressão por seu erro padrão (assim chamado na tabela de coeIicientes). Se você di-
vidir 0,459 por 0,78, obtera um valor t de 5,911, que é signiIicativo no nivel 0,000 (observa-
cão: quaisquer diIerencas no calculo de numeros devem-se a erros de arredondamento),
A relacão entre satisIacão do cliente e qualidade da comida para o Samoeul's é posi-
tiva, mas so um pouco Iorte, O coeIiciente de regressão (b) para K
=
é interpretado como:
para cada unidade de aumento em X
b
. X
17
aumentara 0,459 unidade) . Lembre-se de que
Phil Samouel queria saber: A excelente qualidade da comida aumentara a satisIacão dos
clientes e, portanto, a habilidade de atrair e manter a clientela?
,/
A resposta é Um pou-
co , O modelo Ioi signiIicativo no nivel 0,000, e R
2
Ioi 0,263, mas isso é signiIicativo na
pratica? Um R
2
de 0,263 sugere que Phil deveria concentrar-se na melhora da qualidade
da comida, mas que continue a observar outras areas que ainda devem ser melhoradas,
também relacionadas com a satisIacão dos clientes. Ele também deve preocupar-se por-
que a comida servida no Gino's é classiIicada como de melhor qualidade com um valor
médio de 5,81 versus 5,24 (ver Figura 11-10). Finalmente, embora a relacão entre a quali-
dade da comida e a satisIacão dos clientes para o Gino's não seia tão grande quanto para
o Samoeul's, ainda ha uma relacão signiIicativa,
A tabela de coeIicientes contém os CoeIicientes não-padronizados (b) e os CoeIi-
cientes padronizados (betas). Não precisamos nos preocupar com os coeIicientes padro-
nizados na regressão bivariada, Mas, na regressão multipla, quando diversas variaveis
* Ìndicadores: (Constante), X1 - Excelente qualidade da comida
Coeficientes*
* Variável dependente: X17- Satisfação
FIGURA 11-11 OUTROS ASPECTOS DA REGRESSÃO BÌVARÌADA
3 2 6 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
independentes são usadas, as escalas que mensuram essas variaveis podem nem sempre
ser as mesmas (por exemplo, uso do numero de vendedores e dos gastos com publicida-
de para prever as vendas). A padronizacão é um método de aiuste para diIerentes unida-
des de medida entre variaveis. O termo Beta reIere-se aos coeIicientes de regressão que
Ioram padronizados.
ANÁLISE DE REGRESSÃO MÚLTIPLA
Na regressão bivariada, usamos uma unica variavel independente para prever uma uni-
ca variavel dependente. Com a analise de regressão multipla, são inseridas muitas varia-
veis independentes no mesmo tipo de equacão de regressão e prevemos uma unica varia-
vel dependente. Um coeIiciente de regressão separado é então calculado para cada varia-
vel independente, descrevendo sua relacão individual com a variavel dependente. Esses
coeIicientes permitem que o pesquisador avalie a inIluência relativa de diversas variaveis
independentes sobre a variavel dependente. A regressão multipla é um modelo mais rea-
lista porque, no mundo em que vivemos, a previsão quase sempre depende de varios Ia-
tores, não de um so.
Supõe-se que a relacão entre cada variavel independente e a medida dependente se-
ia linear, como no caso da regressão bivariada. A tareIa do pesquisador é encontrar a me-
lhor maneira de adequar uma linha reta aos dados. O método dos minimos quadrados é
uma técnica matematica relativamente simples que assegura que uma linha reta repre-
sentara melhor a relacão entre as diversas variaveis independentes e a unica variavel de-
pendente. A logica dos minimos quadrados é a de que nenhuma linha reta pode comple-
tamente representar cada ponto em um diagrama de dispersão de regressão. Mesmo se
houvesse uma perIeita correlacão entre as variaveis (e nunca ha), sempre haveria algu-
mas diIerencas entre os escores reais (cada ponto) e os escores previstos com o uso da
equacão de regressão calculada. Resumindo, qualquer equacão de regressão calculada
produzira alguns erros. O método dos minimos quadrados minimiza os erros na previ-
são da variavel dependente a partir das variaveis independentes. Um teste F é então uti-
lizado para comparar a variância explicada pela regressão para a variância não-explica-
da (residual), e o resultado nos diz se a relacão global é estatisticamente signiIicativa.
Para entender a relacão entre as diversas variaveis independentes e a unica variavel
dependente, examinamos os coeIicientes de regressão para cada variavel independente.
Esses coeIicientes descrevem a quantidade média de mudanca em Y (variavel dependen-
te), dada a mudanca de uma unidade na variavel independente (X) que estamos exami-
nando. Além disso, um coeIiciente de regressão descreve a relacão de cada variavel inde-
pendente com a variavel dependente. Por exemplo, suponhamos que a variavel depen-
dente é o numero de garraIas de agua consumidas em uma tarde. As duas variaveis inde-
pendentes são a temperatura e a distância a ser percorrida para obter a agua. Os coeIi-
cientes de regressão para as variaveis independentes provavelmente serão altos, ia que
ambas estão logicamente relacionadas com o numero de garraIas de agua consumidas.
A regressão multipla é essencialmente o mesmo que a regressão bivariada, exceto
por estarmos trabalhando com mais de uma variavel independente. Com mais de uma
variavel independente, algumas novas questões devem ser consideradas. Uma é se as
variaveis independentes são medidas com uma mesma escala ou com uma escala diIe-
rente. Se uma escala diIerente Ior utilizada, não poderemos Iazer comparacões diretas
entre os coeIicientes de regressão para determinar a importância relativa de cada varia-
vel independente na previsão da variavel dependente. Por exemplo, suponhamos que
queremos prever as vendas anuais da concessionaria Ford local usando o numero de
vendedores e os gastos com publicidade. Essas duas variaveis são mensuradas por diIe-
rentes unidades de escala. Os vendedores são mensurados utilizando-se o numero real,
CAPÍTULO 11 « CORRELAÇÃO E REGRESSÃO 3 2 7
e os gastos com publicidade são mensurados em dolares. Quando diversas variaveis in-
dependentes são mensuradas com diIerentes escalas, não é adequado comparar direta-
mente os coeIicientes de regressão para ver qual variavel independente inIluencia mais
a variavel dependente.
Como as variaveis independentes geralmente são mensuradas com diIerentes unida-
des de escala e os pesquisadores em administracão normalmente deseiam identiIicar
quais as variaveis que são relativamente mais importantes, devemos encontrar um modo
de superar esse problema. Para isso, empregamos o coeIiciente de regressão padroniza-
do, chamado de coeIiciente beta. Esse processo de padronizacão aiusta os coeIicientes de
regressão para explicar as diIerentes escalas de mensuracão. Os coeIicientes beta variam
de -1,00 a ¹1,00. Quando usamos os coeIicientes beta na regressão multipla, podemos Ia-
zer comparacões diretas entre as variaveis independentes para determinar qual delas tem
mais inIluência sobre a variavel dependente. Quanto maior o valor absoluto de um coe-
Iiciente beta padronizado, mais importância relativa ele assume na previsão da variavel
dependente.
Uma outra questão que devemos considerar é que as diversas variaveis independen-
tes são estatisticamente independentes e não se relacionam umas com as outras. Se exis-
tem altas correlacões entre as variaveis independentes, a multicolinearidade é certamen-
te um problema. Como pesquisador, você deve testar e remover a multicolinearidade se
ela estiver presente. Um modo é examinar a matriz de correlacão para as variaveis inde-
pendentes e usar somente as que apresentam baixa correlacão. Uma outra abordagem é
usar veriIicacões internas presentes na maioria dos programas de software. as quais assi-
nalam a multicolinearidade como um problema e identiIicam onde ele se localiza. No
apêndice deste capitulo, mostramos como utilizar as veriIicacões internas em SPSS.
SIGNIFICÂNCIA ESTATÍSTICA VERSUS SIGNIFICÂNCIA PRÁTICA
Quando discutimos a regressão bivariada, usamos o coeIiciente de determinacão para ver
se a variância na variavel dependente estava coerente e sistematicamente relacionada
com a variavel independente. O mesmo conceito aplica-se a regressão multipla. O termo
coeIiciente multiplo de determinacão indica que estamos mensurando a habilidade das
diversas variaveis independentes de prever a unica variavel dependente. Como na re-
gressão bivariada, o coeIiciente multiplo de determinacão pode ser interpretado como a
proporcão da variabilidade na variavel dependente que pode ser explicada por diversas
variaveis independentes no modelo.
O primeiro passo no exame do modelo de regressão é veriIicar se ele é estatisticamen-
te signiIicativo. Fazemos isso utilizando a estatistica F. Para haver signiIicância estatisti-
ca, uma regra pratica é a de que deve haver probabilidade · 0,05 de os resultados serem
obra do acaso. Algumas situacões administrativas aceitam um nivel de probabilidade
menor de cerca de · 0,10, mas a maioria exige um nivel · 0,05 e, para algumas, espera-se
·0,01.
Se R é estatisticamente signiIicativo, avaliamos então a Iorca da associacão linear en-
tre a variavel dependente e as diversas variaveis independentes. O R multiplo, também
chamado de coeIiciente multiplo de determinacão, é uma medida pratica da Iorca da re-
lacão global. Se você se lembra de nossa discussão de R na secão de analise de correlacão,
sabe que o coeIiciente de determinacão é a medida da quantidade de variacão na varia-
vel dependente associada com a variacão na variavel independente. No caso da analise
de regressão multipla, o R
2
mostra a quantidade de variacão na variavel dependente as-
sociada com todas as variaveis independentes consideradas iuntas (também é chamado
de medida de adequacão). O R multiplo varia de 0 a ¹1 e representa a quantidade de va-
riacão na variavel dependente explicada pelas variaveis independentes combinadas. Um
328 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
alto R multiplo indica que o modelo de regressão estimada Iunciona bem enquanto que
um baixo R indica que o modelo não esta adequado.
Quanto maior o R , mais a variavel dependente esta associada com as variaveis inde-
pendentes que estamos usando para prevê-la. Por exemplo, se o R multiplo entre o nu-
mero de garraIas de agua consumidas em uma tarde (variavel dependente) e as variaveis
independentes temperatura e distância a ser percorrida Iossem 0,69, isso signiIicaria que
podemos iustiIicar, ou explicar , 69° da variacão no consumo de agua engarraIa usan-
do a variacão na temperatura e na distância. Um R maior indica uma relacão mais Iorte
entre as variaveis independentes e a medida dependente. Como antes, a medida da Iorca
da relacão entre uma variavel independente individual e a medida dependente de inte-
resse é demonstrada pelo coeIiciente de regressão padronizado (beta) para essa variavel.
Assim, usariamos o coeIiciente beta para nos inIormar se a temperatura ou a distância é
um melhor indicador do consumo de agua engarraIada.
Assim como Iizemos com a regressão bivariada, é necessario, na regressão multipla,
testar a signiIicância estatistica dos coeIicientes de regressão padronizados (betas) para
cada variavel independente. Novamente, devemos determinar se o erro de amostragem
esta inIluenciando os resultados da regressão. A questão basica ainda é a mesma: Qual a
probabilidade de obtermos um coeIiciente como esse para nossa amostra se o verdadeiro
coeIiciente de regressão na populacão Iosse zero? O SPSS e a maioria dos outros softwa-
res estatisticos calculam a estatistica do teste t para cada coeIiciente de regressão, de mo-
do que podemos Iacilmente responder essa pergunta. Se algum dos coeIicientes de re-
gressão padronizados não Ior estatisticamente signiIicativo, essa variavel independente
especiIica não é um bom indicador da variavel dependente. Em outras palavras, um be-
ta não-signiIicativo indica que a relacão deve-se a erro de amostragem e não a uma ver-
dadeira relacão na populacão. Em resumo, o uso de uma variavel independente com um
beta não-signiIicativo não tem sentido e deve ser eliminado do modelo de regressão. Re-
movendo-se as variaveis independentes não-signiIicativas e executando-se novamente o
modelo de regressão, pouca inIormacão é perdida e o modelo Iica mais parcimonioso.
Resumindo, para avaliar os resultados de uma analise de regressão, Iaca o seguinte:
(1) avalie a signiIicância estatistica do modelo de regressão global usando a estatistica F:
(2) se F Ior signiIicativo, avalie o R para ver se é grande o suIiciente (ver Figura 11-1): (3)
examine cada um dos coeIicientes de regressão e suas estatisticas i para identiIicar que
variaveis independentes têm coeIicientes estatisticamente signiIicativos: e (4) execute no-
vamente a regressão com as variaveis independentes signiIicativas e veriIique os coeIi-
cientes beta para determinar a inIluência relativa de cada variavel independente. Se você
seguir esses passos, tera respostas para as quatro questões basicas sobre as relacões entre
sua unica variavel dependente e suas diversas variaveis independentes: Existe uma re-
lacão? , Se existe, qual sua Iorca? , A relacão é positiva ou negativa? e Se ha relacão,
qual a melhor maneira de descrevê-la?
EXEMPLO DE REGRESSÃO MÚLTIPLA
Phil Samouel gostaria de prever a satisIacão de seus clientes com base na experiência que
eles têm ao Ireqüentar seu restaurante. Como parte de sua survev de clientes, Phil coletou
inIormacões sobre as percepcões dos clientes com relacão a varias caracteristicas de seu
restaurante. As doze primeiras variaveis no banco de dados são as caracteristicas de per-
cepcão. São variaveis métricas e poderiam ser usadas como variaveis independentes em
um modelo de regressão. As percepcões são mensuradas utilizando-se uma escala de
classiIicacão Likert de sete pontos com 7 ÷ Concorda totalmente (Iavoravel) e 1 ÷ Discor-
da totalmente (desIavoravel). As variaveis, de X
13
a X
16
, são não-métricas, pois são dados
de ranqueamento, e não é adequado utiliza-las em uma equacão de regressão. X
17
, X
18
e
CAPÍTULO 11 ‹ CORRELAÇÃO E REGRESSÃO 329
X
19
são variaveis métricas dependentes mensuradas em uma escala de classiIicacão Likert
de sete pontos. Essas variaveis mensuram as reacões dos clientes quanto a sua experiên-
cia de Iazer uma reIeicão, tais como satisIacão e probabilidade de retorno. A variavel X
20
- Assiduidade é não-métrica, assim como X
21
- Tempo como cliente, X
22
- Gênero e X
25
-
Concorrência ÷ Gino's versus Samouel's. Desta Iorma, a survev de Phil coletou inIorma-
cões que poderiam ser usadas para desenvolver um modelo de previsão de regressão
multipla que podera ser um elemento de previsão muito melhor do que seu proprio iul-
gamento ou do que a extrapolacão a partir de inIormacões passadas.
Varios estudos empiricos mostram que a qualidade da comida é o Iator mais impor-
tante para selecão de um restaurante. Esses mesmos estudos demonstram que, quando os
clientes mencionam a qualidade da comida, estão pensando no sabor, temperatura ade-
quada, tempero, variedade, etc. Assim, Phil Samouel evidentemente deseiara saber se,
nessa situacão, as percepcões quanto a comida de seu restaurante estão relacionadas com
a satisIacão, bem como as outras variaveis, tais como a possibilidade de recomendacão a
um amigo e de Iuturo retorno. Um modelo de regressão multipla pode responder essas
questões. Para o modelo de regressão inicial, examinaremos a unica variavel métrica de-
pendente X
18
- Probabilidade de retorno e as variaveis independentes K
=
ó Ï«¿´·¼¿¼» ¼¿
½±³·¼¿ô È
ì
ó Í¿¾±® »È
ç
ó Ê¿®·»¼¿¼» ¼± cardapio. Essas variaveis são mostradas na Figu-
ra 11-12 como Ioram usadas na survev. Para testar o modelo como um todo, a hipotese nu-
la seria a de que não ha relacão entre X
18
eX
1:
X
4
e X
9
. A hipotese alternativa seria a de que
X
l7
X
4
e X
9
estão signiIicativamente relacionadas com X
18
- Probabilidade de retorno. A se-
cão Pesquisa em acão da pagina 330 Iornece a seqüência de cliques para a regressão
multipla.
Os resultados desse modelo de regressão multipla inicial são mostrados na Figura 11-
13. Para esse exemplo, dividimos a amostra em dois grupos - clientes do Samouel's e
clientes do Gino's - de modo que possamos compara-los. Apresentamos inIormacões pa-
ra cada modelo de regressão multipla. A tabela de estatistica descritiva mostra as médias
das variaveis na analise de regressão. Observe que as médias para as variaveis indepen-
dentes K
=
ó Ï«¿´·¼¿¼» ¼¿ ½±³·¼¿ øëô îì÷ô È
ì
ó Í¿¾±® øëô ïê÷ » È
ç
ó Ê¿®·»¼¿¼» ¼± cardapio
(5,45) para o Samouel's estão acima do ponto intermediario da escala de sete pontos (4,0)
e, portanto, representam percepcões positivas desses atributos. A variavel dependente X
18
- Probabilidade de retorno (Samouel's ÷ 4,37) é mais baixa, mas ainda esta ligeiramente
acima do, ponto intermediario. O que interessa a Phil, no entanto, é que os clientes do Gi-
no's têm mais probabilidade de retornar aquele restaurante (média ÷ 5
f
55) e que, em to-
das as variaveis relacionadas com a comida, suas percepcões são relativamente mais po-
sitivas. Essas são as inIormacões que Phil deve utilizar para desenvolver um plano de
acão para melhorar seu restaurante.
VARÌÁVEÌS SELECÌONADAS DA SURVEY DE CLÌENTES DO SAMOUEL'S
Discorda Concorda
totalmente totalmente
330 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
FIGURA 11-13
REGRESSÃO MÚLTIPLA DAS VARIÁVEIS INDEPENDENTES RETORNO E QUALIDADE
DA COMIDA
As inIormacões na tabela de resumo do model o nas Figuras 11-13 e 11-14 indicam
que o R
2
para a regressão no restaurant e SamoueFs é 0,262. Isso signiIica que 26,2° da va-
riacão no retorno (variavel dependente) podem ser explicados a parti r das três variaveis
i ndependent es. Em geral, o R sempre aument a a medi da que variaveis independentes
são acrescentadas a um model o de regressão multipla. Para não superestimar o impacto
PESQUISA EM AÇÃO
USO DE SPSS PARA CALCULAR UM MODELO DE REGRESSÃO MÚLTIPLA
Para este exemplo, queremos comparar as percepcões dos clientes do Samouers com as dos clientes
do Gino's. Va ao menu Data para separar a amostra. Clique em Split File e em Comapare Groups.
Destaque a variavel X
25
e coloque-a na caixa Groups based on : clique em OK. Agora você pode
realizar a regressão.
A seqüência de cliques em SPSS é: ANALYZE -4 REGRESSION -~ LINEAR. Destaque X
18
e co-
loque-a na caixa de variaveis dependentes. Destaque X
v
X
14
e X
9
e coloque-as na caixa de variaveis
independentes. Use o aefault Enter na caixa Methods. Clique em Statistics e use os aefaults para Es-
timates e Model Fit. A seguir, clique em Descriptives e em Continue. Ha varias outras opcões que
você pode selecionar na parte inIerior dessa caixa de dialogo, mas, por enquanto, usaremos os ae-
faults do programa. Clique em OK no canto superior direito da caixa de dialogo para executar a re-
gressão. Os resultados serão os mesmos que aparecem na Figura 11-13.
As demais inIormacões diagnosticas para os modelos de regressão multipla são mostradas na
Figura 11-14. O modelo de regressão para o SamoueFs é estatisticamente signiIicativo (razão F ÷
11,382: nivel de probabilidade ÷ 0,000). O nivel de probabilidade de 0,000 signiIica que as chances
são 0,000 de que os resultados do modelo de regressão devam-se a eventos aleatorios em vez de
uma relacão verdadeira. O modelo de regressão multipla para o Gino's também é signiIicativo em
um nivel muito alto (0,000). Deste modo, as variaveis independentes relativas a comida realmente
prevêem a probabilidade de um cliente retornar a ambos os restaurantes. Podemos, portanto, reiei-
tar a hipotese nula de que não ha relacão entre as variaveis.
CAPÍTULO 11 ‹ CORRELAÇÃO E REGRESSÃO 331
do acréscimo de uma variavel independente ao modelo, alguns analistas preIerem usar o
R
2
aiustado (recalcula-se o R
2
com base no numero de variaveis preditivas no modelo e no
tamanho da amostra). Isso torna Iacil a comparacão do poder explicativo dos modelos de
regressão com diIerentes numeros de variaveis independentes e diIerentes tamanhos de
amostra. O R
2
aiustado para o modelo é 0,239, o que indica somente uma leve superesti-
mativa com esse modelo.
As inIormacões apresentadas na tabela de coeIicientes da Figura 11-14 apontam quais
das variaveis independentes são Iatores signiIicativos de previsão da probabilidade de re-
torno. Na coluna de signiIicância, observamos que o coeIiciente beta para a qualidade da
comida do Samouel's é signiIicativo (0,028). De maneira parecida, para o Gino's, a quali-
dade da comida é o unico Iator de previsão signiIicativo (0,024). Examinando a coluna de
coeIicientes beta padronizados para o SamoueFs, vemos que X
a
- Qualidade da comida es-
ta mais estreitamente associada com o retorno (beta ÷ 0,324) e que a mesma situacão é ver-
dadeira para o Gino's (beta ÷ 0,316). Para ambos os modelos de regressão, a qualidade da
comida aproxima-se da signiIicância, mas não atinge nosso critério de · 0,05.
Devemos ter cautela ao examinar os coeIicientes beta padronizados e sua signiIicân-
cia. Concluimos que somente uma variavel independente em cada modelo de regressão
é estatisticamente signiIicativa com base nos niveis de signiIicância relatados. Mas os ni-
FIGURA 11-14 OUTRAS INFORMAÇÕES PARA MODELOS DE REGRESSÃO MÚLTÌPLA
* Variáve! dependente: X18 - Probabilidade de retorno
332 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
veis de signiIicância podem variar se ha multicolinearidade entre as variaveis indepen-
dentes. Do mesmo modo, os sinais indicando uma relacão negativa ou positiva entre as
variaveis independentes e dependentes podem ser revertidos se ha multicolinearidade
entre as variaveis independentes. Por essa razão, ao desenvolver um modelo de regres-
são multipla, sempre recomendamos que as correlacões simples entre as variaveis inde-
pendentes e dependentes seiam examinadas detidamente para assegurar a interpretacão
apropriada das descobertas. Retornaremos a esse topico posteriormente neste capitulo
devido a sua importância.
Interpretamos os coeIicientes de regressão no caso da regressão multipla de uma Ior-
ma um pouco diIerente daquela como são interpretados na regressão bivariada. Na re-
gressão bivariada, interpretamos o coeIiciente de regressão não-padronizado como a
quantidade de mudanca na variavel dependente para cada mudanca de uma unidade na
variavel independente. Mas, na regressão multipla, essa interpretacão deve ser um pou-
co modiIicada. Em nosso exemplo anterior, se usassemos o coeIiciente beta para X-, - Qua-
lidade da comida no Samouel's, diriamos que a variavel dependente mudaria 0,324 para
cada mudanca de uma unidade na qualidade dos pratos, isso quando todas as outras va-
riaveis independentes são mantidas constantes. Assim, 0,324 é o aumento estimado na
probabilidade de retorno associado com um aumento de uma unidade na qualidade da
comida quando o sabor e a variedade são mantidos constantes. Observe que os sinais dos
coeIicientes são interpretados da mesma Iorma como com um coeIiciente de correlacão.
Deste modo, com percepcões mais positivas quanto a qualidade da comida, ha uma au-
mento na probabilidade de retorno. Isso é coerente com o valor médio de 5,24 para a qua-
lidade da comida, o que indica que os clientes do Samouel's estão relativamente satisIei-
tos com os pratos servidos nesse restaurante. Descobertas semelhantes Ioram Ieitas tam-
bém para o Gino's, mas deve-se observar que a qualidade da comida no Gino's é percebi-
da como um pouco superior (5,81) a do Samouel's.
Isso signiIica que podemos reieitar ambas as hipoteses nulas de que as três variaveis
independentes reIerentes a comida não estão associadas com X
18
- Probabilidade de re-
torno para os restaurantes Samouel's e Gino's. Usando o coeIiciente beta para a qualida-
de da comida, por exemplo, podemos concluir que toda vez que X
a
aumenta em uma uni-
dade, X
18
aumenta em média 0,324 unidades para o Samouel's e 0,316 unidades para o Gi-
no's, supondo-se que as outras variaveis seiam mantidas constantes. Assim, podemos
concluir que as percepcões quanto a qualidade da comida decididamente são um Iator de
previsão da probabilidade de retorno.
Porém, ainda permanecem dois outros problemas. O primeiro é que o modelo de re-
gressão inicial para o Samouel's explica somente cerca de 26,2° da variacão em X
18
(para
o Gino's, explica 23,2°), de modo que precisamos considerar outras variaveis indepen-
dentes que poderiam nos aiudar a aumentar a capacidade de previsão de nosso modelo
de regressão, tais como as outras variaveis de percepcão. Aumentar a capacidade de pre-
visão de nossa regressão acrescentando outras variaveis independentes aiudara Phil Sa-
mouel a desenvolver um plano administrativo mais eIiciente para competir com o Gino's.
O segundo problema é que os clientes do Gino's têm mais probabilidade de retorno (5,55
versus 4,37), de Iorma que o plano administrativo de Phil deve abordar também essa
questão. A secão Pesquisa em acão sugere outras questões de pesquisa que Phil pode-
ria examinar usando SPSS.
MULTICOLINEARIDADE E REGRESSÃO MÚLTIPLA
Em nossa discussão sobre a regressão multipla, usamos o termo variavel independente
para nos reIerirmos a qualquer variavel que estivesse sendo empregada para prever ou
explicar o valor da variavel dependente. Isso não signiIica que as variaveis independen-
CAPÌTULOU » CORRELAÇÃO E REGRESSÃO 333
PESQUÌSA EM AÇÃO
APRENDENDO A USAR SPSS
Um dos nossos propositos neste capitulo é apresentar os conceitos basicos de correlacão e regressão
e aiuda-lo a interpretar os resultados de um programa de analise estatistica. Ha muitas inIormacões
incluidas nas tabelas SPSS que não Ioram discutidas. Os administradores geralmente não usam
muito essas inIormacões, mas os estatisticos podem utiliza-las. Com o SPSS e outros softwares esta-
tisticos, você precisara determinar que inIormacões são uteis para sua analise. Isso Iica mais diIicil
se considerarmos tipos adicionais de analise. Recomendamos que você comece com tipos simples
de analise e depois passe para os tipos mais soIisticados. Por exemplo, o proximo problema que vo-
cê poderia querer examinar é a mudanca da variavel dependente de X
18
- Probabilidade de retorno
para X
19
- Recomendacão a um amigo ou para X
17
- SatisIacão, procedendo a mesma técnica de re-
gressão com as três variaveis independentes relativas a comida. Você também pode querer usar no-
vamente a probabilidade de retorno como variavel dependente e incluir todas as 12 variaveis de
percepcão como Iatores de previsão. Lembre-se de que o Apêndice 1-C apresenta um panorama de
como usar o SPSS.
tes seiam i ndependentes no sentido estatistico. Na verdade, a maiori a das variaveis inde-
pendent es na regressão multipla esta correlacionada. A multicolinearidade na analise de
regressão multipla reIere-se, portanto, a correlacão entre as variaveis independentes.
A multicolinearidade pode causar uma série de probl emas com a regressão. Por
exemplo, o teste F do model o de regressão multipla global pode indicar uma relacão es-
tatisticamente signiIicativa. Mas, quando examinamos os testes i para os coeIicientes in-
dividuais, podemos descobrir que nenhum deles é signiIicativo. Se isso acontece, não é
possivel determinar o eIeito individual de qualquer variavel independent e especiIica so-
bre a variavel dependente. Além disso, em alguns casos de multicolinearidade, as estima-
tivas de minimos quadrados podem ter um sinal oposto ao do coeIiciente que esta sendo
calculado. Assim, com um alto grau de colinearidade, não podemos conIiar nos coeIicien-
tes indivi duai s para interpretar os resultados. Os probl emas de multicolinearidade não
têm impacto sobre o valor de R nem na nossa habilidade de prever valores da variavel
dependente. Mas certamente podem aIetar a signiIicância estatistica dos coeIicientes de
regressão individuai s e, portanto, a precisão das previsões.
Então, como sabemos quando a multicolinearidade é muit o alta? Uma regra pratica
adotada pelos estatisticos é a de que um coeIiciente de correlacão de uma amostra entre
duas variaveis independentes maior do que ¹0,70 ou menor do que -0,70 é evidência de
problemas potenciais com multicolinearidade. De Iato, quando ha muitas variaveis inde-
pendentes, todas inter-relacionadas, as vezes podem surgir problemas quando a multico-
linearidade é menor do que 0,70. Quando essa situacão existe, deve-se remover uma ou
mai s variaveis independentes do modelo de regressão e executa-lo novamente.
Os estatisticos desenvolveram testes mai s precisos do que a regra pratica acima para
determinar se a multicolinearidade é alta o suIiciente para causar problemas. Examinare-
mos esses testes nos paragraIos a seguir. Eles são chamados de testes de tolerância e FIV.
EXEMPLO DE MULTICOLINEARIDADE
Phil Samouel certamente precisa saber se a multicolinearidade é um problema em seus
modelos de regressão. Uma avaliacão de multicolinearidade é necessaria para assegurar
que ele possa interpretar a importânci a relativa das variaveis i ndependent es individuai s
nos modelos de regressão. Com base nas conversas com seu consultor, Phil deseia exami-
nar se as questões de compensacão estão relacionadas com o empenho de seus Iunciona-
rios. Ele coletou inIormacões relativas a esses topicos em sua survev com os Iuncionarios,
334 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
e nos as utilizaremos para responder essa pergunta. Para tanto, empregaremos a unica
variavel métrica dependente X
14
- Empenho e as três variaveis métricas independentes X
1
- Salario iusto, X
9
- Salario compensa o esIorco e X
12
- BeneIicios razoaveis. Essas varia-
veis são exibidas na Figura 11-15 na Iorma que aparecem no questionario dos Iunciona-
rios. A hipotese nula é a de que não ha relacão entre X
14
- Empenho e as três variaveis in-
dependentes. Testaremos essa hipotese usando a analise de regressão multipla.
Os resultados do modelo de regressão multipla são mostrados nas Figuras 11-16 e 11-
17. As inIormacões a partir da tabela de Resumo do modelo na Figura 11-16 indicam que
R para o modelo é 0,256. Examinando a tabela ANO VA, vemos que o modelo é altamen-
te signiIicativo (0,001). A questão agora é identiIicar qual das três variaveis independen-
tes que esta contribuindo para esse modelo de regressão e como. Para isso, olhamos a ta-
bela de coeIicientes na Figura 11-17. Lembre-se de que os coeIicientes beta padronizados
nos indicam qual variavel independente mais contribui para explicar o relacionamento
entre as variaveis dependentes e independentes. A variavel X
9
- Salario compensa o es-
Iorco é altamente signiIicativa (0,001) e tem um beta de -0,203. Nenhum dos betas das ou-
tras variaveis independentes é signiIicativo. Portanto, nesse modelo de regressão, a uni-
ca variavel independente signiIicativa é X
9
. Mas isso signiIica que as outras variaveis não
estão relacionadas com a variavel dependente? Precisamos veriIicar melhor a resposta
para essa pergunta.
‹ Ìndicadores: (Constante), X12 - Benefícios razoáveis, X9 - Salário refiete o empenho, X^ - Salário justo
* indicadores: (Constante), X12 - Benefícios razoáveis, Xg - Salário reflete o empenho, X, - Salário justo
Variável dependente: X14 - Empenho
ANOVA
f
CAPÍTULOU ‹ CORRELAÇÃO E REGRESSÃO 335
Na extremidade direita da Figura 11-17, ha uma coluna de numeros chamada de es-
tatistica de colinearidade. Abaixo desse cabecalho, esta uma coluna denominada FIV, que
representa Fator de InIlacão de Variância. O FIV mede o quanto a variância dos coeIi-
cientes de regressão esta aIetada por problemas de multicolinearidade. Se o FIV é igual a
zero, não ha correlacão entre as medidas independentes. Um valor FIV igual a l e uma in-
dicacão de alguma associacão entre as variaveis de previsão, mas geralmente não o suIi-
ciente para causar problemas. Um valor maximo aceitavel para FIV seria 5,0: qualquer
valor acima desse indicaria um problema com multicolinearidade. VeriIicando as inIor-
macões para a regressão de X
14
- Empenho e as variaveis independentes de compensacão,
o FIV para a variavel K
=
é 4,894, para X
9
é 1,701 e para X
12
é 4,456. Isso indica que as va-
riâncias dos coeIicientes de regressão para as duas variaveis independentes (X
1
e X
12
) es-
tão um pouco aumentados e que a colinearidade pode ser um problema,
Você também pode examinar o valor de tolerância para avaliar a multicolinearidade
na regressão (é o oposto do FIV). A tolerância é a quantidade de variância em uma varia-
vel independente que não é explicada pelas outras variaveis independentes. Se as outras
variaveis independentes explicam boa parte da variância de uma determinada variavel
independente, temos um problema com a colinearidade. Assim, pequenos valores para a
tolerância indicam problemas de multicolinearidade. O valor minimo para a tolerância é
normalmente 0,10. Isso é, o valor de tolerância deve ser menor do que 0,10 para indicar
um problema de multicolinearidade. Como o valor de tolerância para X
9
é 0,588 e o do
FIV é 1,701, vê-se claramente que não ha problema. Mas, para as outras duas variaveis, os
numeros de tolerância são 0,204 e 0,224, de onde concluimos novamente que a multicoli-
nearidade pode ser um problema corn as variaveis independentes nesse modelo de re-
gressão.
Para melhor entender a questão da multicolinearidade, vamos veriIicar as correla-
cões bivariadas entre as variaveis mostradas na Figura 11-18÷ O alto da tabela apresenta
as correlacões, e a parte inIerior representa o nivel de signiIicância. Todas as três variaveis
de compensacão estão signiIicativamente correlacionadas com a variavel dependente
(empenho). Com relacão a multicolinearidade entre as variaveis independentes, os pro-
blemas identiIicados anteriormente pelo FIV e pelos testes de tolerância tornam-se evi-
dentes. As variaveis X
a
e X
12
estão 0,88 correlacionadas, X
9
e K
=
estão 0,639 correlaciona-
das, e X
9
e X
12
estão 0,592 correlacionadas. Enquanto duas das correlacões estão abaixo do
valor 0,7 recomendado, a terceira (X
a
e X
12
) demonstra correlacão bem acima desse nivel.
Deste modo, vemos que a multicolinearidade claramente inIluenciou esse modelo de re-
gressão. Como resultado, o modelo indica que as variaveis X-, e X
12
não estão relacionadas
com a variavel independente quando na verdade estão,
FIGURÀ-11-17 COEFICIENTES PARA O MODELO DE REGRESSÃO DE FUNCIONÁRIOS
Coeficientes*
* Variável dependente: X1 4 - Empenho
336 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
FIGURA 11-18 CORRELAÇÕES BIVARIADAS DAS VARIÁVEIS EMPENHO E COMPENSAÇÃO
Para compreender inteiramente o problema da multicolinearidade na regressão, vo-
cê deve examinar as correlacões entre as variaveis independentes com antecedência. Se
gurria Ior muito alta (~0,70), você devera considerar a remocão de uma das variaveis al-
tamente correlacionadas. Como decidir qual variavel independente que sera removida?
Uma abordagem é identiIicar as variaveis independentes que estão mais estreitamente re-
lacionadas uma com a outra (maior correlacão). Mantém-se então a variavel independen-
te, no seu modelo de regressão, que estiver mais altamente correlacionada com a variavel
dependente. Uma outra abordagem é executar os modelos de regressão com todas as
combinacões de variaveis e ver qual modelo tem o maior R . Finalmente, o bom senso po-
de determinar quais as variaveis que serão incluidas.
REGRESSÃO MÚLTIPLA PASSO A PASSO
Até este ponto, utilizamos o aefault de entrada do software de regressão SPSS. Quando se
usa essa opcão, todas as variaveis independentes que você coloca na regressão são simul-
taneamente utilizadas para prever a unica variavel dependente. Ha uma outra opcão, no
entanto, chamada de passo a passo. Trata-se de uma abordagem seqüencial em que a
equacão de regressão é calculada com um coniunto de variaveis independentes que são
seletivamente adicionadas ou eliminadas do modelo. Com a regressão passo a passo pa-
ra tras, todas as variaveis independentes inicialmente são incluidas na analise de regres-
são, e as variaveis independentes são então removidas uma de cada vez. A primeira va-
riavel removida é a menos signiIicativa, e o modelo de regressão é reIeito. O processo é
repetido e a cada vez com a variavel menos signiIicativa e a mais altamente correlaciona-
da com a outra variavel independente. O modelo de regressão é então recalculado.
A abordagem passo a passo para Irente é a mais utilizada, de modo que nos concen-
traremos nela. Com essa abordagem, cada uma das variaveis independentes é considera-
da para inclusão na regressão antes do desenvolvimento da equacão. A primeira variavel
a ser selecionada para inclusão na regressão é aquela que mais contribui para a previsão
da variavel dependente. Se nenhuma das independentes estiver signiIicativamente rela-
cionada com a dependente, nenhuma regressão sera calculada. Seguindo a inclusão da
CAPÍTULO 11 » CORRELAÇÃO E REGRESSÃO 3 3 7
primeira variavel independente signiIicativa na regressão, todas as outras variaveis inde-
pendentes são examinadas novamente, e a variavel que agora mais contribui para a pre-
visão da variância ainda não explicada na variavel dependente é incluida (supondo-se
que a nova variavel não esta altamente correlacionada com as ia incluidas). Esse proces-
so continua até que permanecam somente as variaveis que não são correlacionadas e têm
coeIiciente beta padronizado signiIicativo. Os critérios para inclusão de uma variavel in-
dependente estão além do escopo deste livro. Para mais inIormacões sobre os critérios de
inclusão de variaveis independentes, ver Hair, Jr., et ai, 2003. Multivariate Data analvsis.
With Reaaings. Prentice-Hall, 6
th
edition. Se você optar por utilizar um pacote de software
para calcular a regressão passo a passo, recomendamos que empregue o aefault do pro-
grama.
Como observado anteriormente, é comum haver multicolinearidade entre variaveis
independentes. Para minimizar ou evitar problemas causados pela multicolinearidade,
você pode usar os testes diagnosticos de tolerância ou FIV para remover do modelo de
regressão as variaveis independentes problematicas. Ambos os testes normalmente es-
tão incluidos nos pacotes de software comuns, bem como a opcão de regressão passo a
passo. A secão Pesquisa em acão Iornece a seqüência de cliques para a regressão pas-
so a passo.
EXEMPLO DE REGRESSÃO MÚLTIPLA PASSO A PASSO
Phil Samouel gostaria de saber se seus Iuncionarios ou os atributos da comida servida em
seu restaurante são mais importantes na determinacão da satisIacão dos clientes (X
17
).
Quando examinamos as variaveis de percepcão, observamos que a variavel X
x
mensura
a qualidade da comida, X
4
avalia o sabor e X
9
, a variedade de pratos do cardapio. De ma-
neira semelhante, as variaveis X
6
, X
u
e X
12
mensuram as caracteristicas dos Iuncionarios.
Podemos usar a regressão multipla passo a passo para determinar qual dessas variaveis
é mais importante na previsão da satisIacão dos clientes. Os resultados para uma regres-
são passo a passo dessas seis variaveis métricas independentes e a unica variavel métri-
ca dependente (satisIacão) são exibidos nas Figuras 11-19 a 11-22. Lembre-se de que, nes-
PESQUÌSA EM AÇÃO
USO DE SPSS PARA EXECUTAR UM MODELO DE REGRESSÃO PASSO A PASSO
COM OS CLÌENTES DO SAMOUEL'S
O software SPSS apresenta uma opcão de regressão passo a passo. Antes de executar a regressão, vo-
cê deve selecionar os clientes do Samouel' s para analise. Para isso, va ao menu Data e clique em Se-
lect Cases. A seguir, clique em II conditions satisIied e depois em II. Agora, saliente a variavel X
25
-
Concorrência e coloque-a na caixa. Clique no sinal de igual abaixo e coloque um zero depois dele
(usamos o zero porque o Samouel' s esta codiIicado como 0 e o Gi no' s esta codiIicado como 1 ).
Agora, clique em Continue e em OK para executar a selecão dos clientes do Samouel' s.
Para executar um model o de regressão passo a passo, a seqüência de cliques é: ANALYZE -»
REGRESSION ‰~ LINEAR. Destaque X
17
e coloque-a na caixa de variavel dependent e. A seguir, des-
taque as variaveis X,, X
4
, X
6
, X
9
, X
n
e X
12
e coloque-as na caixa de variaveis independent es. Enter
é o aefault na caixa Methods. Clique nessa caixa e mude-a para Stepwise . Clique em Statistics e em
Estimate na caixa Regression CoeIIicients. Agora, clique em Model Fit, Descriptives, Collinearity
Diagnostics e em Conti nue (se algumas dessa caixas ia estiverem veriIicadas, deixe-as assim. Para
algumas versões de SPSS, elas são o aefault). Não utilizaremos nenhuma das opcões nas caixas Plots,
Save ou Options, por isso, clique em OK para rodar o programa. Os resultados serão os mesmos que
aparecem nas Figura 11-19 a 11-22.
338 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
* Ìndicadores: (Constante), X, - Qualidade da comida
+
Ìndicadores: (Constante), X1 - Qualidade da comida, X6 - Funcionários simpáticos
* Ìndicadores: (Constante), X1 - Qualidade da comida
+
Ìndicadores: (Constante), X, - Qualidade da comida, X6 - Funcionários simpáticos
Variável dependente: X17 - Satisfação
se modelo de regressão, estamos considerando somente os dados da survev para o restau-
rante SamoueFs,
As inIormacões Iornecidas nas tabelas Resumo do modelo e ANO VA na Figura 11-19
mostram que os dois modelos de regressão estatisticamente signiIicativos (0,000) Ioram
calculados. A primeira variavel a entrar na regressão Ioi X
2
- Qualidade da comida e pro-
duziu um R de 0,263. A segunda variavel a ingressar no modelo de regressão Ioi X
6
-
Funcionarios simpaticos, eoR
2
subiu para 0,356. As outras quatro variaveis não pode-
riam ser acrescentadas de maneira signiIicativa ao poder de previsão da equacão de re-
gressão passo a passo, de modo que não Ioram introduzidas no modelo (os critérios em
aefault no SPSS Ioram usados para excluir variaveis).
As inIormacões na tabela de coeIicientes para as medidas de tolerância e de FIV (ver
Figura 11-22) indicam que a multicolinearidade não é um problema. Para examinar a im-
portância relativa das duas variaveis independentes na previsão da variavel dependente,
examinamos as inIormacões para o segundo modelo quando ambas as variaveis entra-
ram na regressão. Os betas padronizados são 0,449 e 0,312, de Iorma que a qualidade da
comida, que entrou na equacão primeiro, é a variavel de previsão mais Iorte. Ambas as
variaveis são Iatores razoavelmente Iortes para previsão e deveriam ser consideradas na
tentativa de entender o que inIluencia a satisIacão no restaurante Samouel's.
RESUMO
Descricão da natureza das relacões entre variaveis
Ha quatro conceitos basicos que precisamos entender quanto as relacões entre variaveis:
presenca, tipo de relacão, direcão e Iorca de associacão. Descreveremos cada um desses
conceitos. A presenca avalia se existe uma relacão sistematica entre duas ou mais varia-
veis. Fundamentamo-nos no conceito de signiIicância estatistica para veriIicar se uma re-
CAPÍTULO 11 ‹ CORRELAÇÃO E REGRESSÃO 3 3 9
FÌGURA 11-20
MÉDIAS E CORRELACÔES PARA VARIÁVEIS SELECIONADAS DA ÍËÎÊÛÇ DE CLIENTES
DO SAMOUEL'S
Estatística descritiva
Correlacões de Pearson
Média
X
17
-SatisIacão 4,78
X.,- Qualidade da comida 5,24
X
4
-Sabor 5,16
X
9
-Variedade do cardapio 5,45
X
6
- Funcionarios simpaticos 2,89
X
n
- Funcionarios gentis 1,96
X
12
- Funcionarios competentes 1,62
340 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
FIGURA 11-21 VARIÁVEIS INDEPENDENTES NO MODELO DE REGRESSÃO PASSO A PASSO
Variaveis inseridas/removidas*
Modelo Variaveis inseridas Variaveis removidas Método
X
}
- Qualidade
da comida
X
6
- Funcionários
simpáticos
Passo a passo (Critérios: Probabilidade de F inserir
<=0
/
050
/
Probabilidade de F remover >=0,100).
Passo a passo (Critérios: Probabilidade de F inserir
<=0
/
050
/
Probabilidade de F remover >= 0,100).
* Variável dependente: X17 - Satisfação
* Variável dependente: X17 - Satisfação
lacão esta presente. Um segundo conceito importante é o tipo de relacão. Normalmente,
dizemos que ha dois tipos de relacão - linear e não-linear. Uma relacão linear é uma as-
sociacão em linha reta entre duas ou mais variaveis. Uma relacão não-linear, Ireqüente-
mente chamada de curvilinea, é aquela em que a relacão é melhor descrita por uma cur-
va em vez de uma linha reta. Se uma relacão estiver presente entre as variaveis, também
precisamos conhecer sua direcão. A direcão de uma relacão pode ser tanto positiva quan-
to negativa. Finalmente, quando uma relacão esta presente, o pesquisador em adminis-
tracão deve determinar a Iorca da associacão. Dependendo do tipo de relacão que estiver
sendo examinada, geralmente categorizamos a Iorca de associacão como leve, pequena
mas deIinida, moderada, alta ou muito Iorte.
Explicacão sobre os conceitos de correlacão e análise de regressão
A analise de correlacão calcula a associacão entre duas variaveis, A correlacão de Pearson
mensura a associacão linear entre duas variaveis métricas. O numero que representa a
correlacão de Pearson é chamado de coeIiciente de correlacão. Varia de -1,00 a ¹1,00, com
o zero representando a ausência absoluta de associacão entre duas variaveis métricas.
Embora -1,00 ou ¹1,00 seiam possiveis e representem uma associacão perIeita entre duas
variaveis, eles raramente ocorrem. Quanto maior o coeIiciente de correlacão, mais Iorte a
ligacão ou nivel de associacão. Os coeIicientes de correlacão podem ser positivos ou ne-
gativos, dependendo da direcão da relacão entre as variaveis. Se ha um coeIiciente de cor-
relacão positivo entre X e Y, então, os aumentos no valor de X estão associados com au-
mentos no valor de Y e vice-versa.
CAPÍTULO Q u CORRELAÇÃO E REGRESSÃO 341
Os administradores muitas vezes deseiam prever, por exemplo, quanto impacto uma
campanha publicitaria pode ter sobre as vendas. Os três métodos tipicos para Iazer essas
previsões são: (1) iulgamento inIormado: (2) extrapolacão a partir de comportamento pas-
sado: e (3) regressão. O iulgamento inIormado e a extrapolacão não conseguem aiudar o
pesquisador em administracão a prever o Iuturo com um nivel aceitavel de exatidão. Em
tais casos, o pesquisador em administracão precisa de uma técnica como a analise de re-
gressão.
A analise de regressão é talvez a técnica de analise de dados mais amplamente apli-
cada para mensurar relacões lineares entre duas ou mais variaveis. A correlacão mostra
se existe uma relacão entre duas variaveis, bem como a Iorca global dessa relacão. As ve-
zes, porém, essas respostas não oIerecem inIormacões suIicientes para que a administra-
cão tome a decisão adequada. Por exemplo, Phil Samouel pode deseiar examinar como as
variaveis de ambiente e qualidade da comida estão relacionadas com a satisIacão, em vez
de veriIicar essa relacão com uma de cada vez. Em tais situacões, usamos a analise de re-
gressão, pois ela nos possibilita empregar diversas variaveis independentes para prever
uma unica variavel dependente.
Diferença entre análise de regressão múltipla e de regressão bivariada
A regressão bivariada tem somente duas variaveis - uma variavel métrica dependente e
uma variavel métrica independente. Tanto para a regressão bivariada quanto para a re-
gressão multipla, o analista de dados normalmente reIere-se ao coeIiciente de determina-
cão como R .
Compreensão de como a multicolinearidade pode influenciar modelos de regressão
A multicolinearidade pode causar uma série de problemas com a regressão. Por exemplo,
o teste F do modelo de regressão multipla global pode indicar uma relacão estatistica-
mente signiIicativa. Mas, quando examinamos os testes t para os coeIicientes individuais,
podemos descobrir que nenhum deles é signiIicativo. Se isso acontece, não é possivel de-
terminar o eIeito individual de nenhuma variavel independente especiIica sobre a varia-
vel dependente. Problemas de multicolinearidade não têm impacto sobre o valor de R
2
,
nem sobre a habilidade de prever valores da variavel dependente. Mas eles certamente
podem aIetar a signiIicância estatistica dos coeIicientes de regressão individuais.
E como sabemos quando a multicolinearidade é muito alta? Uma regra pratica geral
adotada pelos estatisticos é a de que um coeIiciente de correlacão de amostra entre duas
variaveis independentes maior de ¹0,70 ou menor de -0,70 evidencia problemas poten-
ciais com a multicolinearidade. Mas os estatisticos desenvolveram testes mais precisos do
que a regra acima para determinar se a multicolinearidade é alta o suIiciente para causar
problemas. Os testes são chamados de tolerância e FIV. Eles podem ser realizados através
do SPSS e outros pacotes de software para estatistica.
Compreensão de quando e como usar a regressão múltipla passo a passo
A regressão multipla passo a passo é uma abordagem seqüencial em que a equacão de re-
gressão é estimada com um coniunto de variaveis independentes que são seletivamente
adicionadas ou eliminadas no modelo. Com a regressão passo a passo, todas as variaveis
independentes inicialmente são examinadas para inclusão na analise de regressão e então
variaveis independentes são acrescentadas uma de cada vez. A primeira variavel inclui-
da é a mais signiIicativa. O processo é repetido, adicionando-se, cada vez, a variavel mais
signiIicativa até que todas as variaveis não-correlacionadas com coeIiciente beta signiIi-
cativo seiam incluidas. Ou seia, somente as variaveis independentes que aiudam a prever
342 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
a variavel dependent e e aument am o R é que são incluidas no model o de regressão Iinal.
Al gumas das outras variaveis i ndependent es podem estar relacionadas com a variavel
dependente, mas não são incluidas no model o de regressão Iinal devido a multicolinea-
ri dade com as outras variaveis independentes no model o de regressão.
PALAVRAS-CHAVE
analise coniunta
coeIiciente de correlacão
coeIiciente de determinacão
coeIiciente de regressão
coeIicientes não-padronizados
coeIicientes padronizados
correlacão
correlacão de ordem de
ranqueamento de Spearman
correlacão de Pearson
covariacão
diagramas de dispersão
Iorca de associacão
minimos quadrados
multicolinearidade
presenca de relacão
razão F
regressão bivariada
regressão logistica
regressão multipla
regressão multipla
passo a passo
relacão
relacão linear
relacão não-linear
signiIicância
estatistica
signiIicância pratica
soma de quadrados
de regressão
soma de quadrados
total
tolerância
DÌLEMA ÉTÌCO
Uma companhi a teleIônica que oIerece uma variedade de servicos contrata uma empre-
sa de pesquisa em administracão para determinar o nivel de satisIacão dos clientes com
seus servicos de teleIonia local, teleIonia celular e Internet no publico alvo. Terry Brown,
principal pesquisadora da empresa, usa o r de Pearson para calcular as relacões nos da-
dos da survev. Quando esta veriIicando os resultados antes de preparar o primeiro esbo-
co do resumo executivo para o clientes, o assistente de Terry observa que ela inclui os
pontos extremos em alguns calculos, mas não em outros (ver Apêndice 11-A). A incoerên-
cia aIeta a validade da pesquisa? O que o assistente de Terry deveria Iazer?
QUESTÕES DE REVÌSÃO
1. Qual é o valor de um coeIiciente de correlacão na mensuracão de relacões entre
variaveis?
2. Qual é a diIerenca entre as técnicas estatisticas ANOVA e MANO VA?
3. Que testes diagnosticos podem ser usados para determinar se a multicolineari-
dade é um problema na regressão multipla?
4. Explique a relacão entre variância explicada e não-explicada na regressão mul-
tipla.
ATÌVÌDADES PARA DÌSCUSSÃO E APLÌCAÇÃO
1. Por que o pesquisador em administracão usaria a regressão multipla em vez de
regressão bivariada?
2. Por que um pesquisador em administracão poderi a usar a regressão multipla
passo a passo em vez da regressão regular?
CAPÍTULO Q e CORRELAÇÃO E RECRESSÃO 343
3. Por que é importante entender a multicolinearidade quando se executa uma re-
gressão multipla passo a passo?
4. Aplicacão SPSS: Use X
17
- SatisIacão como variavel dependente e K
=
ó È
ï î
½±³±
variaveis independentes. Divida sua amostra por X
25
- Concorrência e execute
uma regressão multipla para determinar a capacidade de previsão para todas
as 12 variaveis métricas independentes.
5. Aplicacão SPSS: Calcule a mediana e as respostas modais para os Iatores de se-
lecão de restaurante (X
13
- X
16
). Compare as respostas de homens e mulheres.
Os ranqueamentos são iguais? Se não o são, como diIerem e como Phil usaria
essas inIormacões na preparacão de seu plano administrativo?
EXERCÍCÌOS NA ÌNTERNET
1. Use o mecanismo de busca Google. Digite a palavra-chave regressão multipla.
Prepare um breve relatorio do que você encontrou.
2. O Federal Reserve Bank de St. Louis tem um banco de dados chamado FRED (Fe-
deral Reserve Economic Data). Va ao site http://research.stlouisIed.org/Ired/-
abotIred.html e relate o que você encontrou. Revise as variaveis sobre as quais ha
inIormacões e selecione uma variavel para ser usada como variavel dependente
em um modelo de regressão multipla. Agora veriIique as variaveis novamente e
selecione as diversas variaveis a serem usadas como variaveis independentes
multiplas para previsão da variavel dependente que você escolheu. Prepare um
breve relatorio sintetizando sua logica para selecão de variaveis.
4. Va ao seguinte site. http://calculators.start.ucla.edu. Trata-se de um dispositi-
vo para calculo de correlacão e regressão. Na primeira coluna, coloque os se-
guintes numeros: 2, 2, 2, 1, 1, 2, 3 e 2. CertiIique-se de pressionar a tecla Enter
para cada numero. Na segunda coluna, coloque os seguintes numeros: 2, 1, 2, 2,
1,3,3 e 2. Clique na caixa de dialogo Submit para usar os dados em um mode-
lo de correlacão. Prepare um breve relatorio sobre o site e os resultados de cor-
relacão e regressão encontrados.
5. Va ao seguinte site www.surveysystem.com/correlation.htm. Prepare um bre-
ve relatorio sobre a discussão de correlacão.
NOTAS
1. Tecnicamente, o simbolo r
2
reIere-se ao coeIiciente de determinacão na regressão bivariada e o
simbolo R
2
reIere-se ao coeIiciente multiplo de determinacão na regressão multipla. Na pratica, os
analistas geralmente reIerem-se a ambos como coeIicientes de determinacão e usam o simbolo R .
Apêndice 11 -A: Tópicos especiais em
análise de regressão múltipla
ÌNTRODUÇÃO
Varios topicos mais avancados sobre analise de regressão multipla são tratados neste
apêndice. Entre eles, incluem-se as variáveis mudas, o exame de suposicões de regressão
e a identiIicacão e tratamento de pontos extremos.
O PAPEL DAS VARÌÁVEÌS MUDAS NA REGRESSÃO
Uma variavel independente muda é uma variavel que possui dois (ou mais) niveis distin-
tos, codiIicados como 0 e 1. As variaveis mudas codiIicadas possibilitam-nos usar variaveis
independentes não mensuradas utilizando escalas intervalares ou de razão para prever a
variavel dependente. Por exemplo, se você quisesse incluir o gênero dos clientes dos dois
restaurantes para entender a satisIacão, é obvio que sua medida inclui somente duas cate-
gorias possiveis - masculino e Ieminino. Nesse caso, poderiamos usar o gênero em um mo-
delo de regressão codiIicando o gênero masculino como 0 e o Ieminino como 1. De manei-
ra semelhante, poderiamos ter compradores versus não-compradores e inclui-los como uma
variavel independente usando a codiIicacão 1-0. Isso representa uma ligeira (mas aceitavel)
violacão da suposicão de escala métrica para variaveis independentes.
Para usar variaveis mudas, devemos escolher uma categoria da variavel para servir
como categoria de reIerência e então adicionar tantas variaveis mudas quantos Iorem
possiveis os valores da variavel, menos a categoria de reIerência. Cada categoria é codiIi-
cada como 0 ou 1. No exemplo acima, se você escolher a categoria masculina como cate-
goria de reIerência, você devera ter uma variavel muda para a categoria Ieminina. A essa
variavel muda sera atribuido o valor de 1 para o sexo Ieminino e 0 para o sexo masculi-
no. No banco de dados sobre os Iuncionarios do restaurante, X
19
- Gênero ia esta codiIica-
da como variavel muda para gênero, usando o sexo masculino como categoria de reIerên-
cia (os homens estão codiIicados como 0).
Também podemos utilizar a codiIicacão muda com variaveis independentes catego-
ricas com mais de duas categorias. Digamos que você deseia usar uma variavel indepen-
dente como a ocupacão e você tem médicos, advogados e proIessores na sua amostra. Pa-
APÊNDICE 11-A ‹ TÓPÌCOS ESPECÌAÌS EM ANÁLÌSE DE REGRESSÃO MÚLTÌPLA 345
ra usar as variaveis mudas em sua regressão, você escolhe uma categoria como grupo de
reIerência (médicos) e acrescenta variaveis mudas para as demais categorias. As variaveis
seriam codiIicadas como segue, usando 0 e 1:
Categoria X
1
X
Médico 0 0
Advogado 1 0
ProIessor 0 1
Como você pode ver pela lista acima, quando o respondente é médico, K
=
» È
î
são ze-
ro (a categoria de reIerência sempre é codiIicada como 0). Para advogados, o coeIiciente
de regressão para X
a
representa a diIerenca na variavel dependente comparada com mé-
dicos. O coeIiciente de regressão associado com X
2
representa a diIerenca na variavel de-
pendente para proIessores comparados com médicos.
EXEMPLO DE VARIÁVEIS MUDAS
Para preparar um plano administrativo melhor, Phil deseia saber mais sobre seus Iuncio-
narios e o que ele pode Iazer para aumentar a produtividade e o comprometimento com
o trabalho em seu restaurante. Na survev dos Iuncionarios, ele reuniu dados sobre o com-
prometimento, a satisIacão no trabalho e o gênero dos Iuncionarios. As variaveis sobre as
quais ele coletou dados são mostradas na Figura A-l como Ioram usadas na survev.
Para investigar a relacão entre a satisIacão e o comprometimento com o emprego, me-
didos através do orgulho de trabalhar no restaurante SamoueTs, podemos usar X
15
- Or-
gulho como variavel dependente em um modelo de regressão e as três variaveis de satis-
Iacão no emprego X
2
- Trabalho no que quero, X
5
- Aprendizagem de novas habilidades
eX
7
- Sensacão de realizacão como variaveis independentes métricas. Além das variaveis
de satisIacão no emprego, contudo, Phil quer determinar se o gênero de seus Iuncionarios
inIluencia seu orgulho de trabalhar no restaurante. Portanto, também incluimos X
19
- Gê-
nero (codiIicado como masculino ÷ 0 e Ieminino ÷ 1) em nosso modelo de regressão.
Os resultados da analise de regressão multipla são mostrados nas Figuras A-2 e A-3.
O r para o modelo é 0,393, como mostra a tabela Resumo do Modelo. Assim, aproxima-
damente 39,3° da variacão total em X
15
podem ser previstos por X
2
- Trabalho no que
FIGURA A-1 VARIÁVEIS SELECIONADAS DA SURVEY DE FUNCIONÁRIOS DO SAMOUEL/S
346 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
FIGURA A-2 A SATISFACÃO E O COMPROMETIMENTO COM O EMPREGO COMO VARIAVEIS
INDEPENDENTES
* Indicadores: (Constante), X19 - Gênero, X7 - Realizacão, X5 -Aprendizagem de novas habilidade, X2 -Trabalho
no que quero
quero, X
5
- Aprendizagem de novas habilidades, X
7
- Realizacão e X
19
- Gênero. O mode-
lo de regressão é altamente signiIicativo, com um nivel de probabilidade de 0,000, como
é apresentado na tabela ANO VA.
A tabela de coeIicientes na Figura A÷3 revela que X
19
- Gênero é um indicador de X
15
- Orgulho com um coeIiciente beta de 0,445 (probabilidade de 0,000). Trabalho no que
quero (X
2
) também é signiIicativa (0,023) e tem uma coeIiciente beta de 0,325. Aprendiza-
gem de novas habilidades (X
5
) e Senso de realizacão (X
7
) não estão signiIicativamente re-
lacionadas com o comprometimento com o emprego (X
15
- Orgulho). Deste modo,
Gênero e Trabalho no que quero são variaveis independentes que explicam signiIicativa-
mente o Orgulho de trabalhar no SamoueFs.
Para melhor entender esses resultados, vamos comparar as respostas de Iuncionarios
e Iuncionarias para as variaveis satisIacão e comprometimento com o emprego. Os resul-
tados dessa comparacão estão na Figura A-4. Como você pode ver, as Iuncionarias são re-
lativamente mais Iavoraveis (maior média) em X
2
, X
7
e X
15
, mas menos Iavoraveis quanto
* Variavel dependente: X15 - Orgulho
MODELO DE REGRESSÃO PARA OS FUNCIONARIOS DO SAMOUEL/S USANDO
APÊNDICE 11-A ‹ TÓPÌCOS ESPECÌAÌS EM ANÁLÌSE DE REGRESSÃO MÚLTÌPLA 3 4 7
a X
5
. Entretanto, as diIerencas são signiIicativas somente para as variaveis X
5
- Aprendi -
zagem de novas habili dades e X
19
- Gênero (ver tabela ANO VA). Assim, vê-se que as Iun-
cionarias são signiIicativamente mai s Iavoraveis do que os Iuncionarios com relacão ao
orgul ho de trabal har no Samouel ' s. Essa descoberta sugere que Phil precisa saber mai s
sobre Iuncionarios e Iuncionarias e por que diIerem em seus sentimentos quant o ao tra-
bal ho que desempenham em seu rest aurante. De Iato, ele precisa ir além dessas quatro
variaveis e veriIicar todos os aspectos do trabalho no restaurant e.
PESQUISA EM AÇÃO
USO DE SPSS PARA EXAME DE VARIÁVEIS MUDAS
A seqüência de cliques em SPSS para examinar variaveis mudas é: ANALYZE‰~ REGRESSION ‰~ LI-
NEAR. Clique em X
15
- Orgulho e coloque-a na caixa Dependent Variables. Clique em A
?
, 5Âô ߧ » 5ò2 »
½±´±¯«»ó¿- ²¿ ½¿·¨¿ ײ¼°»²¼»²¬ Ê¿®·¿¾´»-ò ß ½¿·¨¿ ½¸¿³¿¼¿ þ Ó»¬¸±¼þ ¬»³ Û²¬»® ½±³± ¼»º¿«´¬ô ¯«» -»s
ra utilizado. Clique em Statistics e use os aefaults Estimates e Model Iit. Clique em Descriptives, Con-
tinue e OKpara executar a regressão. Os resultados serão os mesmos mostrados nas Figura A-2 e A-3.
X2 -TrabaIho no que quero*
X,œ - Gênero
X5 - Aprendizagem de novas
habiIidades*
X10 - Gênero
X7 - ReaIização*
X,œ - Gênero
X1 5 - OrguIho*
X. œ-Gênero
348 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
PESQUISA EM AÇÃO
Com o SPSS, é simples comparar as respostas de Iuncionarios e Iuncionarias. A seqüência de cliques
em SPSS é: ANALYZE-» COMPAREMEANS -» MEANS. Clique em X
15
- Orgulho e em X
2
, X
5
e X
7
e coloque-as na caixa Dependent List. Clique em X
|9
- Gênero e coloque-a na caixa Independent List.
Clique na caixa Options e, no canto esquerdo da tela, clique em ANO VA. Agora clique em Continue
e emOKpara rodar o programa. Os resultados são os mesmos apresentados na Figura A-4.
ANALÌSE DE RESÍDUOS - SUPOSÌÇÕES E PONTOS EXTREMOS
Quando executamos um modelo de regressão, desenvolvemos uma estimativa da variân-
cia explicada (R ) e do erro não-explicado (residuos). Uma analise dos residuos aiuda a
determinar se as suposicões que Ioram Ieitas sobre o modelo de regressão são adequadas.
Nossas suposicões são (1) a variância de erro esta acima de todos os valores das variaveis
independentes: (2) os erros não são correlacionados com nenhuma das variaveis indepen-
dentes: e (3) os erros são normalmente distribuidos. Se nossas suposicões sobre os erros
não estiverem corretas, então nossos resultados podem não ser validos.
Os residuos oIerecem as melhores inIormacões sobre nossos erros. Assim, uma anali-
se dos residuos é um passo importante para determinar se nossas suposicões estão corre-
tas. A maior parte da analise de residuos baseia-se no exame de graIicos. Esses graIicos
normalmente envolvem a colocacão dos residuos em relacão aos valores da variavel in-
dependente (com mais Ireqüência utilizada na regressão bivariada). Colocacão dos resi-
duos em relacão aos valores previstos da variavel dependente (mais usada na regressão
multipla), um graIico residual padronizado e um graIico de probabilidade normal. Para
a regressão linear bivariada, tanto a colocacão do residuo em relacão a variavel indepen-
dente (X) e contra a variavel dependente (Y) oIerecem as mesmas inIormacões. Para a re-
gressão multipla, a colocacão do residuo em relacão a variavel dependente é mais ampla-
mente utilizada porque ha mais de uma variavel independente. A maioria dos pacotes de
software estatistico oIerece graIico dos residuos de regressão, tais como residuos de regres-
são padronizada em relacão a variavel dependente prevista, um graIico da probabilida-
de normal dos residuos de regressão e umhistograma da variavel dependente e dos resi-
duos padronizados de regressão. Vamos discuti-los a seguir.
O graIico dos residuos padronizados oIerece inIormacões sobre a suposicão de que
os erros estão normalmente distribuidos. Para avaliar isso, você veriIica um graIico de re-
siduos padronizados e determina se 95° dos residuos padronizados estão entre -2 e ¹2.
Se eles parecerem estar, e isso requer discernimento, então concluimos que os erros estão
normalmente distribuidos.
O graIico de probabilidade normal é uma outra abordagem para determinar se os er-
ros estão normalmente distribuidos. Os escores normais são colocados no eixo horizon-
tal, e os residuos padronizados correspondentes, no eixo vertical. Se os residuos padroni-
zados estiverem aproximadamente distribuidos de maneira normal, os pontos do graIico
deverão se aglomerar em torno de uma linha em 45 graus passando através da origem.
Esse tipo de graIico é chamado de graIico de probabilidade normal. O discernimento é
usado para determinar se o padrão de valores observados desvia-se da linha o suIiciente
para concluir que os residuos padronizados não são de uma distribuicão de probabilida-
de normal padrão. Se os pontos estiverem agrupados relativamente proximos em torno
da linha, concluimos que nossa suposicão de normalidade dos residuos é razoavel. De
modo geral, podemos dizer que quanto mais proximos os pontos estiverem agrupados
em torno da linha em 45 graus, mais Iorte a evidência que sustenta a suposicão de norma-
USO DE SPSS PARA COMPARAÇÃO DE MÉDIAS DE GRUPOS
APÊNDÌCE 11-A ‹ TÓPÌCOS ESPECÌAÌS EM ANÁLÌSE DE REGRESSÃO MÚLTÌPLA 3 4 9
lidade. Quaisquer desvios substanciais da linha sugerem que os residuos não estão nor-
malmente distribuidos. A analise de residuos também pode ser usada para identiIicar res-
pondentes com pontos de dados que são extremos na determinacão do modelo de regres-
são estimada. Lembre-se de que, a partir de nossa discussão anterior, um ponto extremo
é um ponto de dados (respondente) que é distintamente diIerente dos valores dos outros
respondentes. Um ponto extremo é suspeito porque desvia-se do padrão dos outros res-
pondentes e, portanto, de nossas expectativas. Os pontos extremos devem ser detidamen-
te examinados porque podem representar dados errôneos que precisam ser corrigidos.
Os pontos extremos também podem indicar que uma das suposicões do modelo de re-
gressão não Ioi atingida. Mas, em algumas situacões, eles são simplesmente valores inco-
muns que ocorrem por acaso, como no exemplo de Bill Gates dado no Capitulo 9. Ao de-
cidir como lidar com um ponto extremo, primeiro devemos veriIicar se ele é um valor va-
lido para aquele respondente. Se um erro Ioi cometido na coleta ou na entrada dos dados
no arquivo, devera ser corrigido. Mas, em geral, os pontos extremos não devem ser remo-
vidos do banco de dados a menos que uma clara evidência demonstre que são verdadei-
ramente diIerentes da populacão que esta sendo estudada e que não devem ser incluidos
no coniunto de dados original.
Os residuos padronizados podem ser usados para identiIicar pontos extremos. Se
uma observacão (respondente) desvia-se substancialmente do padrão do resto dos dados,
o residuo padronizado para aquela observacão sera grande em valor absoluto. A maioria
dos pacotes de software estatistico, incluindo o SPSS, identiIica respondentes com resi-
duos padronizados com grandes valores absolutos. Geralmente, os respondentes com um
residuo padronizado menor do que -2 ou maior do que ¹2 são considerados pontos ex-
tremos. Com erros normalmente distribuidos, os residuos padronizados devem estar Io-
ra desses limites não mais do 5° das vezes.
EXEMPLOS DE RESÍDUOS E PONTOS EXTREMOS
Examinando-se os termos de erro (residuos), podemos diagnosticar problemas causados
por observacões que não atendem as suposicões de regressão. Os residuos representam a
diIerenca entre os valores observados (amostra) da variavel dependente e os valores previs-
tos da variavel dependente por meio do modelo de regressão. Isto é, eles representam o ter-
mo de erro para o modelo de regressão (também chamado de variacão não-explicada).
Lembre-se de que Phil Samouel esta muito interessado na relacão entre a satisIacão
de seus Iuncionarios com o emprego e seu comprometimento com o trabalho. O analista
contratado para conduzir essa survev apontou, no entanto, que, mesmo se os resultados
de regressão Iorem estatisticamente signiIicativos, eles devem ser interpretados com cau-
tela até que as suposicões do modelo de regressão seiam examinadas para veriIicar se ha
algum problema. Podemos conduzir uma analise de residuos para determinar se alguma
das suposicões do modelo de regressão Ioram violadas (ou seia, pontos extremos, erros
normalmente distribuidos, linearidade, etc).
O graIico na Figura A-5 chamado Histograma mostra a Ireqüência de distribuicão
dos residuos padronizados comparados com uma curva de distribuicão normal. Ha al-
guns residuos (por exemplo, aqueles que ocorrem a 2,25) que estão além da extremidade
direita da curva, mas muitos dos residuos estão bem proximos. Também, algumas das co-
lunas de residuos estão acima da curva, e outras estão abaixo. Poderiamos concluir, a par-
tir do exame desse graIico somente, que ha um problema. Mas você precisa veriIicar to-
dos os três graIicos, bem como as inIormacões nas tabelas de colinearidade e de diagnos-
tico para Iazer um iulgamento Iinal. O que podemos concluir nesse ponto, entretanto, é
que existe a possibilidade de que as observacões da extremidade direita seiam pontos ex-
tremos.
350 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
FIGURA A-5
HISTOGRAMA DA VARIÁVEL DEPENDENTE X
15
- ORGULHO NA SURVEY DE
FUNCIONÁRIOS
A Figura A-6 mostra o segundo graIico, chamado de GraIico de Probabilidade Nor-
mal de Residuos de Regressão Padronizados . Ele compara os residuos padronizados ob-
servados com os residuos padronizados esperados a partir de uma distribuicão normal
Se os residuos observados estiverem normalmente distribuidos, eles estarão situados per-
to da linha em 45 graus mostrada no graIico. Os residuos para nosso modelo de regressão
estão razoavelmente proximos da linha, indicando que os erros estão normalmente dis-
tribuidos.
Finalmente, o terceiro graIico (ver Figura A-7), chamado de Diagrama de Disper-
são , compara os valores previstos padronizados da variavel dependente em relacão aos
residuos padronizados a partir da equacão de regressão. Na extremidade direita do gra-
Iico, vemos alguns residuos isolados (além de 2), o que sugere a possibilidade de pontos
extremos. De Iorma semelhante, ha alguns pontos de dados no alto do graIico além de
FIGURA A-6
GRAFICO DE PROBABILIDADE NORMAL DE RESÍDUOS DE REGRESSÃO
PADRONIZADOS
APÊNDÌCE 11-A ‹ TÓPÌCOS ESPECÌAÌS EM ANÁLÌSE DE REGRESSÃO MÚLTÌPLA 351
FIGURA A-7
DIAGRAMA DE DISPERSÃO DA VARIÁVEL DEPENDENTE X
15
- ORGULHO NA SURVEY
DE FUNCIONÁRIOS
doi s desvios-padrão. Mas, no todo, o diagrama de dispersão dos residuos não apresent a
grandes diIerencas na dispersão dos residuos quando olhamos o graIico da esquerda pa-
ra a direita, e maiori a dos pontos esta na Iaixa de -2 a ¹2. Esses achados novament e suge-
rem uma relacão linear com termos de erro normalment e distribuidos.
Examinando-se as inIormacões mostradas em todos os três graIicos, concluimos que
não ha problemas signiIicativos que possam indicar que as suposicões de regressão mul -
tipla Ioram seriamente violadas. Essa conclusão é reIorcada pelo Iato de que a regressão
PESQUISA EM AÇÃO
O SPSS inclui varias Ierramentas de diagnostico para examinar residuos. Para executar a regressão
que examina os residuos, primeiro carregue o banco de dados dos Iuncionarios. A seqüência de cli-
ques é: ANALYZE -~ REGRESSION -~ LINEAR. Destaque X
15
- Orgulho e coloque-as na caixa de
variavel dependente. A seguir, destaque as variaveis X
2
, X
5
, X
7
e X
19
e coloque-as na caixa de varia-
veis independentes. O Enter é aefault na caixa Methods e sera utilizado. Clique em Statistics, e Esti-
mates e Model Fit serão os aefaults (se eles não Iorem os aefaults em sua versão de SPSS, clique ne-
les). Agora, clique em Collinearity Diagnostics e va até o canto inIerior esquerdo da tela e clique na
caixa Residuais e emCasewise Diagnostics. O aefault e identiIicar pontos extremos Iora dos três des-
vios-padrão, mas, nesse caso, seremos conservadores e usaremos dois desvios-padrão. Clique em
Outliers e coloque um 2 na caixa para numero de desvios-padrão. A seguir, clique em Continue.
Essa é a mesma seqüência das aplicacões de regressão anteriores, mas agora também devemos
usar a alternativa Plots para solicitar novas inIormacões. Para produzir graIicos dos residuos para
veriIicar potenciais violacões das suposicões de regressão, clique em ZPRED em coloque-o na caixa
Y. Clique em ZRESID e coloque-a na caixa X. Esses dois graIicos são para variavel dependente pre-
vista padronizada e residuos padronizados. A seguir, clique em Histogram e em Normal Probabi-
lity abaixo da caixa Standardized Residual Plots no lado inIerior esquerdo da tela. O exame desses
graIicos e tabelas nos possibilita determinar se a relacão suposta entre a variavel dependente X
15
e
as variaveis independentes X
2
, X
5
, X
7
e X
19
é linear e também se os termos de erro no modelo de re-
gressão estão normalmente distribuidos. Finalmente, clique em Continue e emOKpara rodar o pro-
grama. Os resultados serão os apresentados nas Figuras A-5 a A-7.
USO DE SPSS PARA EXAME DE RESÍDUOS E PONTOS EXTREMOS
352 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
é considerada uma técnica estatistica Iorte . em que as vioiacões das suposicões devem
ser substanciais antes que encontremos problemas.
Ai nda temos out ras inIormacões para examinar com relacão aos pont os extremos. Pa-
ra t anto, vamos veriIicar a tabela Estatistica residual most rada na Figura A-8. Ao longo
da part e superior, estão colunas chamadas de mi nimo, maxi mo, média, desvio-padrão e
N. No lado esquerdo, estão linhas chamadas de valor previsto (a variavel dependent e ÷
X
15
), resi duo, valor previsto padroni zado e residuo padr oni zado. O processo de padroni -
zacão pr oduz valores com uma médi a ÷ 0 e um desvio-padrão ÷ 1,00. As ent radas nas co-
l unas Mi ni mo e Maximo para o residuo padr oni zado represent am o numer o de desvios-
padr ão a partir da médi a de 0. Por exemplo, o mai or valor do resi duo padroni zado é
2,263 desvios-padrão acima de sua médi a de 0. Lembre-se de que anteriormente dissemos
que, quando t emos um resi duo padr oni zado de menos do que -2 ou mai s do que ¹2, é
possivel encontrar um ou mai s pont os extremos. Isso porque, com erros nor mal ment e
distri buidos, os residuos padroni zados devem estar Iora desses limites em não mais do
que 5° das vezes. Um teste ainda mais rigoroso é veriIicar os valores mi ni mos e maxi mo
maiores de 3,0 em que os residuos devem estar Iora desses limites não mai s do que 1°
das vezes. Isso signiIicaria que alguns dos valores e resi duos previstos estão mai s de três
desvios-padrão de distância de suas médi as e que provavelment e ha pont os extremos nos
dados. Como temos um residuo padroni zado maior do que ¹2, podemos concluir que tal-
vez haia varios pont os extremos e que devemos examina-los i ndi vi dual ment e. Como
pont o de esclarecimento das inIormacões relatadas na tabela, sob a coluna da Média pa-
ra Residuo, ha um numer o apresent ado como óè\è[óïêò ×--± -·¹²·º·½¿ ¯«» ¼»ª»³±-
¿½®»-½»²¬¿® ïë ¦»®±- ¿± numer o (a casa decimal esta a 16 espacos para a esquerda) e que,
na ver dade, ele é -0,000000000000000818, um numer o obviament e mui t o longo para ser
apresent ado na tabela.
A Figura A-8 t ambém inclui uma tabela chamada de Diagnosticos por Caso . A ta-
bela identiIica os numer os de caso (respondentes) e suas classiIicacões para a variavel X
15
.
FIGURA A-8
Estatistica de residuos*
Minimo Maximo = Desvio-padrão N
* Variavel dependente: X1S- Orgulho
Diagnosticos por caso`
* Variavel dependente: X15 - Orgulho
DE FUNCIONARIOS J
ESTATISTICA DE RESIDUOS E DIAGNÓSTICOS POR CASO NA ÍËÎÊÛÇ
APÊNDICE 11-A ‹ TÓPÌCOS ESPECÌAÌS EM ANÁLÌSE DE REGRESSÃO MÚLTÌPLA 3 5 3
Observe que os respondentes 14,51 e 53 deram uma classiIicacão de 7 em uma escala de
sete pontos (acima do valor previsto de 6,95). A média para todos os Iuncionarios do
Samouel's Ioi de 5,49, e o desvio-padrão do valor previsto Ioi de 0,58 (ver tabela de Resi-
duos Estatisticos na Figura A-8). Além disso, o valor maximo previsto de X
15
é mais do
que os dois desvios-padrão da média (5,49 comparado com 6,65 / Observe que 2 X 0,58
÷ 6,65). Assim, esses três respondentes Iicaram mais de dois desvios-padrão acima da mé-
dia e podem representar pontos extremos. Para lidar com isso, podemos optar por elimi-
nar esses respondentes por eles serem tão diIerentes ou podemos conserva-los, embora
eles obviamente tenham demonstrado muita satisIacão. Para tomar essa decisão, pode-
riamos examinar suas outras respostas na survev e, se eles Iossem muito positivos, prova-
velmente nos os conservariamos, uma vez que suas respostas são coerentes e temos pou-
cas iustiIicativas para removê-los.
RESUMO
Explicacão sobre o uso de variáveis mudas na análise de regressão
Uma variavel independente muda é uma variavel que tem dois (ou mais) niveis distintos,
codiIicados como 0 e 1. As variaveis mudas codiIicadas nos possibilitam usar variaveis
independentes qualitativas não mensuradas usando escalas intervalares ou de razão pa-
ra prever a variavel dependente. Por exemplo, se você quisesse incluir o gênero dos clien-
tes dos dois restaurantes para compreender sua satisIacão, é claro que sua mensuracão
para gênero incluiria apenas duas categorias possiveis - masculino e Ieminino. Nesse ca-
so, poderiamos usar o gênero em um modelo de regressão codiIicando os homens com 0
e as mulheres com 1. De maneira semelhante, poderiamos usar compradores versus não-
compradores e inclui-los como variavel independente utilizando uma codiIicacão 1-0.
Isso representa uma ligeira (mas aceitavel) violacão da suposicão da escala métrica para
variaveis independentes.
Para usar variaveis mudas, devemos escolher uma categoria da variavel para servir
como categoria de reIerência e adicionar tantas variaveis mudas quantos Iorem possiveis
os valores da variavel, menos a categoria de reIerência. Cada categoria é codiIicada como
0 ou 1. No exemplo acima, se você escolher a categoria masculina como categoria de reIe-
rência, você tera uma variavel muda para a categoria Ieminina. A essa variavel muda se-
ria atribuido o valor de 1 para o sexo Ieminino e 0 para o sexo masculino. Também pode-
mos usar a codiIicacão muda com variaveis independentes categoricas com mais de duas
categorias.
Exame dos resíduos e pontos extremos na análise de regressão multipla
Quando executamos um modelo de regressão, desenvolvemos uma estimativa da variân-
cia explicada (R ) e da não-explicada (residuos). Uma analise dos residuos aiuda-nos a de-
terminar se as suposicões que Ioram Ieitas sobre o modelo de regressão são adequadas. A
maior parte da analise dos residuos baseia-se no exame de graIicos dos residuos. Esses
graIicos normalmente envolvem a colocacão dos residuos em relacão aos valores da va-
riavel independente (geralmente usada na regressão bivariada), colocacão dos residuos
em relacão aos valores previstos da variavel dependente (geralmente usada na regressão
multipla), um graIico de residuos padronizados e um graIico de probabilidade normal.
Para a regressão linear bivariada, tanto a colocacão dos residuos em relacão a variavel in-
dependente (X) quanto a colocacão dos residuos em relacão a variavel dependente (Y)
Iornecem as mesmas inIormacões. Para a regressão multipla, a colocacão dos residuos em
relacão a variavel dependente é mais amplamente utilizada porque ha mais de uma va-
riavel independente. O software SPSS oIerece um graIico dos residuos de regressão padro-
354 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
nizados em relacão a variavel dependente prevista, um graIico de probabilidade normal
dos residuos de regressão e um histograma da variavel dependente e dos residuos de re-
gressão padronizados.
Em nossa discussão sobre a regressão multipla, usamos o termo variavel indepen-
dente para nos reIerirmos a qualquer variavel que estiver sendo usada para prever ou ex-
plicar o valor da variavel dependente. Isso não signiIica que as variaveis independentes
seiam independentes no sentido estatistico. Na verdade, a maioria das variaveis indepen-
dentes na regressão multipla são correlacionadas. A multicolinearidade na analise de re-
gressão multipla reIere-se, portanto, a correlacão entre as variaveis independentes.
PALAVRAS-CHAVE
residuo variavel muda
CAPÍTULO
Relato e Apresentação da Pesquisa
356 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
ÌNTRODUÇÃO
Uma boa pesquisa torna-se util quando seu obietivo, metodologia, resultados e implica-
cões são comunicados de maneira eIiciente. O obietivo da pesquisa é responder suas
questões e assim possibilitar uma melhor decisão. A metodologia é uma explicacão deta-
lhada do proieto de pesquisa e o modo como o proieto Ioi implementado. Os resultados e
implicacões sintetizam as principais descobertas e as conclusões a partir de sua relacão
com os obietivos do estudo.
Os pesquisadores usam três abordagens Iormais de comunicacão. Estas incluem a
proposta da pesquisa, o relatorio de pesquisa por escrito e a apresentacão oral. Ocasional-
mente, um proieto pode passar por cima de um dos passos acima: por exemplo, a apre-
sentacão oral. Em outras situacões, no entanto, mais de uma apresentacão do relatorio po-
dera ser necessaria. Em qualquer caso, esses três mecanismos oIerecem oportunidades de
tornar clara a utilidade do proieto. Certamente, ha ocasiões em que a pesquisa Ioi corre-
tamente executada, mas os resultados Ioram ignorados por serem mal apresentados. Se é
para a pesquisa ser util abordando a questão de decisão que lhe deu inicio, uma atencão
cuidadosa deve ser dada a essas oportunidades cruciais de apresentacão.
Este capitulo descreve propostas, relatorios e apresentacões. A Iorma e o conteudo Ii-
nais desses instrumentos de comunicacão variam de acordo com o tipo de proieto e o
grau de envolvimento exigido do pesquisador. Mas os exemplos usados aqui Iornecem
uma estrutura basica a partir da qual trabalhar. Os diIerentes elementos de cada um dos
instrumentos de comunicacão são explicados e ilustrados usando-se um proieto realiza-
do para o restaurante Samouel's. Ao Iazermos isso, descreveremos as caracteristicas es-
peciIicas da comunicacão eIiciente em cada estagio. O Apêndice 1-A inclui a proposta de
pesquisa para o Samouel's. O Apêndice 12-A é uma amostra de relatorio para Phil Sa-
mouel abrangendo as primeiras questões de pesquisa identiIicadas na proposta.
COMUNÌCAÇÃO ORAL E ESCRÌTA
O principal papel do pesquisador é colocar o administrador na melhor posicão possivel
para a tomada de decisão inIormada. O relatorio e a apresentacão devem salientar clara-
mente as principais descobertas que aIetarão a decisão organizacional. Entretanto, nem
todos os administradores processam as inIormacões da mesma maneira. Portanto, o pes-
quisador, ao preparar as comunicacões orais e por escrito, deve considerar o nivel de so-
Iisticacão do público.
SOFISTICAÇÃO DO PÚBLICO
O pesquisador deve apresentar os resultados da Iorma mais simples possivel sem ser en-
ganoso ou parecer misterioso. Consideremos os seguintes publicos: proIessores de admi-
nistracão, cientistas da NASA, administradores da marca Proctor & Gamble® e um em-
preendedor (ex-vendedor de carros) que deseia iniciar seu proprio negocio de comércio
de automoveis. O pesquisador provavelmente usaria diIerentes estilos de comunicacão
para cada tipo de publico. No entanto, o Iormato basico dos instrumentos de comunica-
cão não mudariam muito entre esses publicos.
Supõe-se que os cientistas da NASAe os proIessores, considerados como acadêmicos,
seriam relativamente soIisticados. Para esse publico acadêmico, o pesquisador coloca
mais ênIase nos aspectos técnicos dos métodos de pesquisa, e nos resultados, ia que um
acadêmico tem maior interesse e habilidade para compreendê-los. Do mesmo modo, um
cientista da NASA provavelmente esta Iamiliarizado com técnicas basicas de pesquisa.
CAPÍTULO 12 » RELATO E APRESENTAÇÃO DA PESQUÌSA 3 5 7
Mas devemos ter cuidado ao deIinir os principais termos administrativos que podem ser
desconhecidos para um publico técnico. Em geral, um nivel um pouco mais elevado de
soIisticacão pode ser usado quando se Iazem comunicacões com esses grupos.
Para os administradores de marca e o empresario de automoveis local, o relatorio
provavelmente colocaria menor ênIase nos aspectos técnicos. Detalhes de testes estatisti-
cos, por exemplo, seriam apresentados em um apêndice técnico. Além disso, as analises
estatisticas seriam demonstradas de um modo mais simples. Esse publico, no entanto,
provavelmente estaria mais Iamiliarizado com a terminologia administrativa.
Lembre-se de que os responsaveis pelas decisões provavelmente não agirão com ba-
se em resultados que não compreendem. Assim, o pesquisador deve aiustar a comunica-
cão oral e escrita ao nivel do usuario potencial menos soIisticado no publico. Esse proce-
dimento as vezes é chamado de principio do mínimo denominador comum.
COMUNICAÇÃO POR ESCRITO
Somente os Iatos é um slogan que Iicou popular através do Sargento Joe Friday, deteti-
ve policial Iicticio da cidade de Los Angeles. Ele era o personagem principal de livros,
programas de TV e Iilmes intitulados Dragnet. Embora o pesquisador possa não precisar
ser tão restrito quanto o Sargento Friday, somente os Iatos é um bom guia para redigir
documentos de pesquisa em administracão. O redator deve lembrar que o principal pro-
posito do documento não é entreter ou impressionar alguém com eloqüência literaria. Na
verdade, ele serve como auxilio para uma tomada de decisão. A secão Pesquisa em
acão a seguir oIerece a visão de um administrador em relacão a um relatorio comum de
pesquisa interna.
Orientações para redação técnica
As propostas e relatorios de pesquisa normalmente são considerados itens de redacão
técnica. As seguintes orientacões simples podem melhorar muito a qualidade de redacão
de um relatorio de pesquisa.
1. Páginas iniciais. O redator deve compreender que as primeiras paginas do re-
latorio são as mais lidas. Portanto, o pesquisador deve se empenhar em colocar
o maximo de conteudo possivel nessas primeiras paginas. Por isso, as princi-
pais descobertas, implicacões e recomendacões, se solicitadas, deverão apare-
cer nas primeiras paginas do documento, geralmente chamadas de resumo
executivo.
2. Brevidade e simplicidade. Uma das melhores orientacões para a redacão téc-
nica é que ela deve ser breve e direta. Siga estas orientacões:
‹ Frases mais curtas são melhores do que Irases longas.
‹ Palavras mais curtas são melhores do que palavras longas.
‹ Sintese de inIormacões em tabelas e graIicos quando possivel.
‹ Poucas preposicões (de, por, para, em, etc.)
‹ Poucas palavras do iargão de estatistica, se possivel.
3. Empatia. Lembre-se de que os leitores variam em sua habilidade de entender
inIormacões técnicas. Nem todos conseguem obter signiIicado a partir de deta-
lhes técnicos presentes no documento. Respeite o tempo do leitor, eliminando
inIormacões desnecessarias. Detalhes técnicos podem ser incluidos em um
apêndice, onde não distrairão o leitor menos soIisticado.
358 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
PESQUISA EM AÇÃO
MBAS EXAGERAM DE NOVO
Os administradores Ireqüentemente lutam para conseguir as inIormacões mais essenciais de um re-
latorio de pesquisa. Consideremos as seguintes visões administrativas:
Os supervisores de producão Iicam intimidados com os prolixos, complicados, enrolados
e longos relatorios postos em circulacão pelos iovens Iormados em Administracão de Em-
presas . O que esse supervisor não sabe é que o presidente da divisão virtualmente conIes-
sou a mesma coisa para mim durante um vôo para Los Angeles. Ele disse que os relatorios
de alguns membros de sua propria equipe - os pos-graduados - eram um pouco intimi-
dantes e o Iaziam recorrer ao dicionario mais de uma vez. Não sendo Iormado em admi-
nistracão, ele se sentia um pouco deslocado e relutava em discutir os relatorios diretamen-
te com eles e assim, talvez, deixar transparecer sua ignorância. Eles (os autores dos relato-
rios) cairam na armadilha sedutora de pensar que o cheIe Iicara impressionado com Iato
de terem Ieito todo o dever de casa se incluirem palavras soIisticadas em seus relatorios e
torna-los aparentemente notaveis.
Os relatorios de pesquisa seriam mais uteis se simplesmente abordassem os seguintes pontos:
1. Onde estamos agora?
‹ Descreva a situacão que provocou a pesquisa.
2. Para onde vamos?
‹ Mantenha a direcão e certiIique-se de que tudo no relatorio atinge seu obietivo.
3. Como propomos um caminho para chegar la?
‹ Descreva os resultados analiticos que aiudam a atingir o obietivo do relatorio.
4. Como saberemos que chegamos?
‹ CertiIique-se de que as respostas (ou resultado Iinal) seiam Iaceis de encontrar e que
não Iiquem ocultas no texto.
FONTE: Hull, William W. 1995. Writing Reports Ior Top Management. Supervision 56 (February): 8-13.
4. Orientacão para uma meta. Lembre-se de que o documento tem uma ou mai s
metas deIinidas. Ele é Iormulado para atingir algum proposito importante para
a empresa. Toda a redacão deve ser estruturada dentro do contexto de Iornecer
inIormacões. O leitor deve ser claro, portanto, a respeito de como o obietivo é
atingido.
5. Simplifique, simplifique, simplifique Elimine paragraIos, Irases e palavras
que não são necessarias para completar uma idéia na elaboracão do proieto.
6. Seja ponderado na ignorância. Evite topicos para os quais o relatorio não po-
de oIerecer esclarecimento. Além disso, quaisquer limitacões ou obstaculos do
estudo devem ser expressos claramente. Não so essa é a abordagem ética, co-
mo t ambém é melhor para o pesquisador revelar alguns problemas com o estu-
do do que vê-los descobertos pelo administrador mai s tarde.
7. Organizacão. Organize com clareza as secões do documento. Utilize varios ti-
tulos e subtitulos. Isso aiuda mui t o o leitor. Além disso, inclua uma listagem de
graIicos, Iiguras e tabelas para auxiliar o leitor a encontrar inIormacões no do-
cument o com a minima perda de tempo. Os titulos e subtitulos constituem um
esboco para o sumário.
CAPÍTULO 12 « RELATO E APRESENTAÇÃO DA PESQUÌSA 3 5 9
PROPOSTAS DE PESQUISA
As propostas de pesquisa são redigidas durante a Fase I (ver Capitulo 2, Figura 2-1, Fase
de Iormulacão) do processo de pesquisa. As propostas aiudam a garantir uma comunica-
cão eIiciente entre o pesquisador e o responsavel pela decisão. Elas descrevem as razões
do estudo, incluindo listagem e explicacão das questões de pesquisa, uma detalhada des-
cricão do estudo e instrumentos que serão utilizados (proieto de pesquisa) e um resumo
dos possiveis resultados. Finalmente, a proposta de pesquisa inclui uma clara aIirmacão
do cronograma e do orcamento para o proieto.
O Apêndice 1-A (Capitulo 1) contém exemplos de propostas. Uma delas resultou de
uma entrevista entre um pesquisador em administracão proIissional e Phil Samouel, pro-
prietario do restaurante Samouel's Greek Cuisine. O pesquisador utilizou varias técnicas
criativas para solucão de problemas na identiIicacão e reIinamento das seguintes ques-
tões de pesquisa:
1. Os Iuncionarios estão sendo administrados de modo a maximizar sua produti-
vidade e seu comprometimento com o sucesso do restaurante?
2. Quais são as melhores abordagens para atrair novos clientes e manter os clien-
tes existentes?
O processo de entrevista cria uma compreensão comum da situacão administrativa
enIrentada pelo restaurante Samouel's. E muito importante, no entanto, associar essa
compreensão a redacão. Assim Iazendo, é menos provavel que a pesquisa produza resul-
tados inuteis. Isso porque o administrador, nesse caso, Phil Samouel, revisara e assinara
a proposta descrevendo a pesquisa e seus obietivos antes de o proieto iniciar. Em outras
palavras, a proposta documenta o compromisso e o acordo entre o pesquisador e o res-
ponsavel pela decisão. As principais secões da proposta estão descritas na Figura 12-1.
A REDAÇÃO DO RELATÓRIO DE PESQUISA
O relatorio é o resultado tangivel de um proieto de pesquisa. Para uma pesquisa em an-
damento, os relatorios muitas vezes são gerados automaticamente através do DSS (Siste-
ma de Apoio as Decisões), descrito no Capitulo 3. Enquanto o conteudo dos relatorios é
muito parecido, este capitulo concentra-se em relatorios redigidos para proietos de pes-
quisa unicos. O Iormato de todos os relatorios de pesquisa é semelhante. Em alguns as-
pectos, eles simplesmente são construidos a partir da proposta de pesquisa descrevendo
o que aconteceu em vez do que acontecera.
Esboço de um relatório de pesquisa aplicada em administração
Lembre-se de que a pesquisa em administracão pode ser descrita como basica ou aplica-
da. O conteudo e o estilo do relatorio Iinal variam ligeiramente, dependendo do tipo de
pesquisa que esta sendo realizada. Primeiro, descrevemos um esboco de um proieto apli-
cado em administracão. Esse tipo de relatorio geralmente resulta de proietos realizados
por um consultor em pesquisa em administracão para um individuo responsavel pelas
decisões, como Phil Samouel. Posteriormente, discutiremos como as secões do relatorio
podem variar entre proietos de pesquisa basica e aplicada.
Página de rosto A página de rosto apresenta o titulo do proieto, o principal individuo
para quem a pesquisa esta sendo Ieita, a data e os nomes, aIiliacões e inIormacões para
contato do investigador. Os titulos devem ser curtos, mas ainda assim descrever a pesqui-
sa realizada.
3 6 0 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
FI GURA 12-1 SEÇÕES E CONTEÚDO DE UMA PROPOSTA DE PESQUISA
Secão Descrição
Ìnformações gerais
Declaração do probl ema e
das questões de pesquisa
Estratégia e métodos de
pesquisa
Esboço do relatório final
Orçamento e cronograma
Qualificações
Descreve a situação administrativa de interesse e o escopo do es-
tudo. Ìnclui um panorama de materiais afins e de pesquisas ante-
riores. O escopo i nclui a declaração de como os resultados deve-
rão ser interpretados. Por exemplo, o responsável pelas decisões
deseja que o pesquisador forneça recomendações operacionais,
como estratégias para melhorar as operações do restaurante
Samouel's, ou apenas um resumo dos resultados da pesquisa? Al -
guns administradores desejam que o pesquisador apenas respon-
da as questões específicas da pesquisa, deixando a verdadeira i n-
terpretação para eles.
Define claramente o problema de pesquisa. Lista e descreve as
questões de pesquisa a serem abordadas. Se for possível gerar hi -
póteses, estas devem ser listadas e explicadas.
Descreve como o estudo será realizado. Vol tando ao processo de
pesquisa básica ilustrados no Capítulo 2, essa seção descreve os
processos listados nas Fases ÌÌ e ÌÌÌ (ver Figura 2-1). Ou seja, des-
creve o projeto de pesquisa a ser desenvolvida, as variáveis que
devem ser mensuradas, a abordagem para coleta de dados, as
fontes de dados (amostra), como os dados serão coletados e as
técnicas estatísticas que serão usadas para analisar os dados, as-
sim, testando as questões de pesquisa.
Um esquema básico do relatório final é apresentado. Lista as pri n-
cipais seções do relatório final juntamente com uma breve des-
crição dos conteúdos esperados. É aqui que as tabelas simuladas
(ou pró-forma) podem ser utilizadas para ilustrar o tipo de resul-
tados quantitativos que o pesquisador espera encontrar.
Estimativas dos custos esperados para realização do projeto de
pesquisa, i ncluindo os honorários do pesquisador e as condições
de pagamento. Apresenta um cronograma para elaboração da
pesquisa.
Pode conter uma breve descrição das qualificações do pesquisador.
Resumo executivo Sem nenhuma duvida, essa é a parte mais lida de um relatorio de
pesquisa. Lembre-se de que os administradores são muito atareIados e deseiam que as
principais inIormacões seiam sintetizadas em um Iormato conciso e Iacil de ler. Na verda-
de, muitos administradores lêem somente essa secão. Trata-se, assim, de uma secão indi-
vidual com uma visão muito breve de todo o relatorio, enIatizando claramente as princi-
pais descobertas. Os conteudos do resumo executivo incluem (1) a aIirmacão do obietivo
e das principais questões de pesquisa, (2) a breve descricão do proieto de pesquisa e de-
talhes relacionados, (3) o resumo dos resultados estatisticos do teste das questões de pes-
quisa e/ou hipoteses, (4) a interpretacão das descobertas estruturadas como respostas pa-
ra as questões de pesquisa e (5), se solicitada, uma lista de implicacões administrativas
praticas derivadas da pesquisa.
Os resumos executivos devem ser curtos. Duas paginas são aceitaveis, mas é preIeri-
vel uma. E importante que as descobertas principais e/ou mais interessantes seiam apre-
sentadas de modo a atrair a atencão. Uma boa idéia é lista-las de uma Iorma clara e dire-
ta. O resumo executivo também é a oportunidade de vender o relatorio. Ele deve ten-
tar convencer os leitores de que o proieto atingiu seu obietivo e estimula-los a continuar
a leitura.
Sumário Um sumário torna o documento mais util. Deve listar os titulos e subtitulos por
numero de pagina. A localizacão de todas as Iiguras, tabelas e graIicos também deve ser
Iornecida por titulos.
CAPITULO 12 ‹ RELATO E APRESENTAÇÃO DA PESQUÌSA 361
Introducão A introducão é muito semelhante a da proposta. Descreve o obietivo do es-
tudo em detalhes, incluindo uma lista de questões de pesquisa e hipoteses iuntamente
com explicacões de cada uma. Também inclui inIormacões complementares sobre como
o estudo Ioi conduzido, apresentando ainda uma reIerência a proposta original. A intro-
ducão prepara o leitor para as inIormacões seguintes.
Métodos de pesquisa Essa secão, como na proposta, descreve o modo como o estudo Ioi
realizado. Inclui uma descricão do processo de amostragem e das caracteristicas da amos-
tra e os procedimentos para coleta de dados, incluindo uma descricão das mensuracões.
Além disso, a secão pode as vezes incluir um panorama resumido das variaveis, apresen-
tando Ireqüências basicas e/ou estatisticas descritivas de todas as variaveis. Essa secão
também pode Iazer reIerência aos apêndices incluidos no Iinal do documento. Os apên-
dices geralmente contêm uma copia dos instrumentos de coleta de dados, como os ques-
tionarios e tabelas que apresentam as Ireqüências e/ou estatisticas descritivas. Essa é
uma boa maneira de prover os usuarios com dados que podem ser interessantes, mas que
não abordam especiIicamente uma questão de pesquisa.
Resultados Nessa secão, os resultados dos testes que abordam as questões de pesquisa
e/ou hipoteses são apresentados. A escolha das técnicas de analise de dados é explicada,
e os detalhes dos resultados são demonstrados. Os resultados quantitativos são apresen-
tados em tabelas e/ou graIicos. Varios exemplos de tabelas e graIicos apropriados para
abordagens estatisticas especiIicas são mostrados nesse texto. Os administradores geral-
mente apreciam os resultados apresentados graIicamente. A Figura 12-3 mostra uma dis-
tribuicão de Ireqüência para a variavel X
16
. As Figuras 12-2 e 12-3 ilustram o uso de dois
graIicos versateis para apresentar diIerentes tipos de resultados.
O Iamoso graIico de pizza é especialmente util para demonstrar Ireqüências tabula-
das para variaveis nominais ou ordinais. O graIico de pizza exibido na Figura 12-2 mos-
tra a porcentagem dos Iuncionarios do restaurante Samouel's e sua probabilidade de pro-
curar um novo emprego. O tamanho da Iatia é proporcional ao numero (porcentagem) de
Iuncionarios em cada categoria. Nesse caso, o graIico traduz visualmente a probabilida-
de de procura de novo emprego. A partir das inIormacões oIerecidas no graIico de Ire-
qüência, podemos ver uma alta probabilidade de procura de novo emprego. De Iato,
53,5° dos Iuncionarios indicam no minimo alguma probabilidade de procurar um novo
trabalho (25,6 ¹ 11,6 ¹ 16,3 ÷ 53,5°). Isso é algo que precisa ser abordado por Phil Sa-
mouel no momento de desenvolver um novo plano administrativo para seu restaurante.
DISTRIBUIÇÃO DE FREQÜÊNCIA PARA X
16
- INTENÇÃO DE PROCURAR
NOVO EMPREGO
X
16
- Intenção de procurar novo emprego
FIGURA 12-2
362 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
FIGURA 12-3 APRESENTAÇÃO DE RESULTADOS EM RELATÓRIO UTILIZANDO GRÁFICOS DE PIZZA
A Figura 12-4 mostra como o graIico de barras pode ser usado para apresentar resul-
tados de tabulacão cruzada. Os graIicos comparam a intencão de procurar um novo em-
prego com o gênero e o tipo de trabalho. Nas categorias de probabilidade de procura de
novo emprego, os homens demonstram maior probabilidade, assim como os Iuncionarios
que trabalham em regime de meio turno. Essa situacão claramente merece a atencão de
Phil Samouel.
Os graIicos de pizza e de barras podem ser uteis na demonstracão de outros resulta-
dos. Por exemplo, os graIicos de barras são Iacilmente construidos com o uso de software.
Virtualmente todos os pacotes de planilhas possuem uma seqüência de cliques para cria-
cão de graIicos de pizza e de barras, bem como de outros tipos de graIicos. Finalmente,
pacotes estatisticos como o SAS e SPSS podem ser empregados para a construcão de al-
guns graIicos.
Uma vez mais, o pesquisador pode Iazer uso de um apêndice. O relatorio em si deve
ser mantido o mais livre de acumulos de inIormacões quanto Ior possivel. Embora todas
as analises estatisticas devam ser documentadas, nem todas elas precisam ser reIeridas no
relatorio. Os resultados estatisticos que não podem ser apresentados de uma maneira
simples e direta devem ser colocados no apêndice.
A principal ênIase na secão dos resultados é relatar as questões de pesquisa e/ ou hi-
poteses. Mas o pesquisador pode deseiar incluir uma secão que destaque outros resulta-
dos encontrados durante o estudo. Alguns podem parecer especialmente relevantes e
dignos de destaque, talvez sugerindo idéias para um estudo posterior. Tais resultados de-
vem ser considerados exploratorios, ia que não abordam uma questão ou hipotese daque-
la pesquisa.
Recomendacões e conclusões Essa secão do relatorio comeca com a sintetizacão dos re-
sultados em linguagem coloquial. E uma boa pratica usar um texto com itens em desta-
que para salientar os principais resultados que abordam questões especiIicas da pesqui-
sa. Quaisquer implicacões logicas, surgidas a partir dos resultados, também devem ser
discutidas. Se solicitada, uma lista de recomendacões devera ser Iornecida. As recomen-
dacões podem incluir sugestões para pesquisas posteriores a partir dos resultados encon-
trados. A secão de recomendacões e conclusões também apresenta uma discussão das li-
mitacões da pesquisa. Nenhum estudo é perIeito, mas o responsavel pelas decisões deve
conseguir avaliar a conIianca que se pode depositar nos resultados a luz de uma explica-
cão dos pontos Iracos do proieto.
CAPÍTULO 12 ‹ RELATO E APRESENTAÇÃO DA PESQUÌSA 363
FIGURA 12-4 APRESENTAÇÃO DE RESULTADOS EM RELATÓRIO USANDO GRÁFICOS DE BARRAS
Apêndices O apêndice contém o questionario, as estatisticas descritivas e as analises es-
tatisticas detalhadas. Um outro importante componente do apêndice é uma lista de reIe-
rências. Uma lista ae referências oIerece uma completa descricão das Iontes citadas no re-
latorio. Ha diversos estilos diIerentes para as listas de reIerências. Você observara algu-
mas listas de reIerências no Iinal dos capitulos deste livro.
364 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
Esboço de um relatório de pesquisa básica
A pesquisa basica é apresentada de uma Iorma muito parecida com a da pesquisa aplica-
da. Um relatorio de pesquisa basica tem as mesmas secões de um relatorio de pesquisa
aplicada. O resumo executivo é as vezes substituido por uma pequena sintese. Esta é
mais curta do que o resumo executivo. Contém de 100 a 150 palavras e descreve o propo-
sito geral do estudo e da uma idéia dos resultados alcancados.
Um relatorio de pesquisa basica geralmente apresenta uma posicão mais teorica. Por-
tanto, Iaz-se uma apresentacão mais completa da literatura existente sobre o topico abor-
dado. Espera-se que essa literatura possa ser usada para desenvolver as hipoteses, que
normalmente aparecem ao Iinal da revisão da literatura. Além disso, o termo historico
conceituai com Ireqüência é utilizado como titulo de uma secão especial concentrada no
modo como a pesquisa é conceitualizada. Ou seia, as relacões entre os diversos elemen-
tos que estão sendo examinados são visualmente apresentadas em um graIico, e o texto
do relatorio descreve e explica tais relacões.
As secões de métodos e de resultados da pesquisa diIerem um pouco das de um rela-
torio aplicado. Uma diIerenca no estilo dos relatorios baseia-se no publico alvo. O princi-
pal publico da pesquisa basica constitui-se de outros pesquisadores! Portanto, o redator
geralmente é mais técnico e apresenta mais detalhes sobre questões estatisticas e analiti-
cas. Por exemplo, um relatorio basico normalmente inclui tabelas com inIormacões mais
detalhadas, enquanto que um relatorio aplicado apresenta mais graIicos. Devido a supo-
sicão de que o leitor de um relatorio de pesquisa basica é mais soIisticado, o leitor casual
as vezes pode achar que os relatorios basicos são herméticos e diIiceis de entender.
A secão de implicacões e conclusões sera semelhante a do relatorio aplicado. Contu-
do, deve concentrar-se mais nos resultados teoricos. Isto é, quais são as implicacões para
aqueles que vierem a estudar a mesma questão? Como se trata de um relatorio basico, as
implicacões não estarão relacionadas com uma determinada empresa, mas com empresas
ou industrias em geral. Por exemplo, uma implicacão poderia ser a de que os Iunciona-
rios deveriam ter a possibilidade de Ilexibilizar seu numero de horas de trabalho sema-
nais. O resultado deseiado poderia ser um maior comprometimento dos Iuncionarios.
Um relatorio de pesquisa basica também pode Iornecer mais detalhes sobre pesquisas ba-
sicas Iuturas. Esses estudos são sugeridos como uma Iorma de dar prosseguimento a in-
vestigacão realizada. Desta Iorma, os pesquisadores basicos desenvolvem um coniunto
teorico de conhecimentos sobre topicos importantes.
Finalmente, o relatorio de pesquisa basica contém apêndices e uma lista de reIerên-
cias. Mas não é aconselhavel que os apêndices apresentem resultados estatisticos, uma
vez que grande parte desse material sera incluido no corpo do relatorio. Um esquema ti-
pico de um relatorio de pesquisa basica seria:
‹ Pagina de rosto
‹ Resumo
‹ Introducão
‹ Historico conceituai
‹ Métodos de pesquisa
‹ Resultados
‹ Implicacões e conclusões
‹ Lista de reIerências
‹ Apêndices
Exemplos de relatorios de pesquisa basica em administracão podem ser encontrados
em qualquer periodico acadêmico de acordo com a disciplina.
CAPÍTULO 12 » RELATO E APRESENTAÇÃO DA PESQUÌSA 3 6 5
APRESENTAÇÕES ORAIS
Os responsaveis pelas decisões muitas vezes solicitam que o pesquisador Iaca uma apre-
sentacão Iormal ao terminar o relatorio. Os pesquisadores devem acolher essa oportuni-
dade com entusiasmo. A apresentacão oIerece a chance de acompanhar o relatorio. As-
sim, o pesquisador pode esclarecer algum topico mais diIicil de entender por escrito. O
relatorio também é interativo. Isso signiIica que os membros do publico podem - e com
Ireqüência o Iazem - Iormular perguntas. Ao responder essas perguntas, o pesquisador
tem mais uma oportunidade de comunicar importantes descobertas. Dito de modo sim-
ples, a apresentacão é o melhor momento para vender a pesquisa e entusiasmar os res-
ponsaveis pelas decisões a serem tomadas.
Como na apresentacão por escrito, o pesquisador deve considerar as diIerentes habilida-
des dos administradores na compreensão do conteudo da apresentacão. Geralmente é
uma boa idéia tentar descobrir antes quem participara da apresentacão. As vezes, a apre-
sentacão pode ser Ieita somente para o individuo que solicitou a pesquisa. Mais Ireqüen-
temente, no entanto, outras pessoas estarão envolvidas. O responsavel pela decisão po-
dera convidar Iuncionarios que serão aIetados pelas decisões que serão tomadas. Isso po-
de incluir superiores e subordinados. Em algumas situacões, Iuncionarios com pouca ex-
periência técnica poderão estar presentes. Não é rara a apresentacão para grupos de oito
a doze pessoas em uma sala de reuniões. Considere que cada pessoa pode ter diIerentes
interesses. Um gerente de producão pode estar mais interessado no modo como a decisão
podera aIetar o cronograma de producão. Um contador provavelmente tem interesse no
impacto da decisão sobre os lucros e despesas da empresa. Um gerente de marca pode
concentrar-se mais no eIeito das decisões sobre a imagem da marca. A comunicacão é en-
riquecida quando o apresentador consegue adequar a apresentacão ao publico.
Os integrantes do publico quase sempre Iazem perguntas ou levantam questões du-
rante a apresentacão. Na verdade, pode ser um mau sinal se o publico não interage com
o apresentador. Eles adormeceram? Perguntas e comentarios devem ser incentivados. E
uma boa pratica tentar imaginar as perguntas que serão Ieitas e preparar as respostas an-
tes da apresentacão. Lembre-se de que os pesquisadores têm a obrigacão ética de garan-
tir a utilidade da pesquisa. Se os principais envolvidos compreenderem a pesquisa, maior
sera a probabilidade de ela ser util.
Ao preparar uma apresentacão oral, é uma boa idéia rever a Iase de criatividade do
processo de decisão administrativa (ver Capitulo 3). Instrumentos criativos podem ser
uteis na elaboracão de temas de apresentacão eIicientes, na identiIicacão de suposicões e
concepcões errôneas do publico potencial e no desenvolvimento de listas de perguntas
que poderão ser Ieitas. A criatividade é especialmente necessaria no desenvolvimento de
um titulo que seia atraente e inIormativo.
Formato da apresentacão
Ha muitas abordagens uteis para a apresentacão de pesquisas em administracão. Evite
uma apresentacão estritamente oral (Ialada). Mas, ainda mais importante, não leia o rela-
torio para seus ouvintes. A leitura do relatorio quase nunca causa um impacto positivo e
da a impressão de Ialta de Iamiliaridade com o proieto. Também pode parecer oIensiva,
ia que o material pode ser lido pelo publico. Os apresentadores podem utilizar sliaes.
transparências, videos, cartazes e pôsteres preparados com antecedência ou até mesmo
uma apresentacão por meio da Web. Os recursos visuais são vantaiosos tanto para o apre-
sentador quanto para o publico. Eles dirigem o publico para inIormacões importantes,
O PÚBLICO
366 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
bem como auxiliam a prender sua atencão. Além disso, também servem como dicas pa-
ra o apresentador, lembrando-lhe do Iluxo da apresentacão e garantindo que os pontos
importantes não seiam esquecidos.
Talvez o Iormato mais comum de apresentacão hoie seia a de sliaes através de compu-
tador. Varios pacotes de software podem ser usados para construir essas apresentacões, in-
cluindo o Presentation da Corel e o PowerPoint da MicrosoIt. Esses pacotes são seme-
lhantes e Iaceis de usar. Permitem que o apresentador prepare recursos graIicos proIissio-
nais, incluindo graIicos como os que discutimos anteriormente. Também Iacilitam modi-
Iicacões de ultima hora.
O que fazer e o que não fazer na apresentação
A seguir, apresentamos dez recomendacões para a preparacão de uma apresentacão eIi-
ciente:
1
1. Prepare seus próprios -´·¼»-ò O software para apresentacão é Iacil de usar, e
qualquer pessoa que apresenta pesquisas em administracão deveria aprender
um pouco sobre esses instrumentos importantes. Lembre-se de que, como
apresentador, você sera responsabilizado por qualquer problema que houver
nos recursos visuais. Você deseia conIiar essa tareIa a outra pessoa? Além disso,
preparando sua propria apresentacão, você maximiza sua Iamiliaridade com o
material.
2. Crie um título eficiente. Tente usar o titulo para comunicar. Ele deve ser cur-
to, mas inIormativo. Isso aplica-se ao titulo da apresentacão como um todo e
aos titulos dos sliaes. Suponhamos que um pesquisador esteia apresentando re-
sultados sobre a eIiciência de vendedores assalariados versus a de vendedores
comissionados sobre a satisIacão do cliente. O sliae poderia ser intitulado Re-
sultados estatisticos ou Comissão leva a satisIacão . Qual seria mais eIicien-
te?
3. Evite aglomeracão visual. Use uma Ionte simples como Arial ou Tahoma. Se
você deseiar ser um pouco mais diIerenciado, use negrito, italicos ou sombra
em Tahoma. Os titulos podem ter de 32 a 40 pontos. Titulos de textos organiza-
dos em itens são eIicientes quando têm de 24 a 28 pontos. Evite Iontes menores
do que 18 pontos para qualquer texto importante. Limite a seis o numero de li-
nhas de texto nos sliaes e a trinta o numero de palavras.
4. Use um fundo simples que produza bons contrastes. Fundos elaborados po-
dem ser decorativos, mas também podem distrair e as vezes inibir a leitura.
Use um Iundo escuro com letras claras ou um Iundo branco com letras escuras.
5. Diversifique a apresentacão dos -´·¼»-ò Os sliaes nem sempre precisam ter a
parte artistica do lado direito e o texto no lado esquerdo. Se não encontrar uma
ilustracão adequada ao conteudo de um sliae. não utilize nenhuma. Tire provei-
to do espaco em branco ao lado de graIicos para colocar (por meio de transicão
ou de animacão) uma palavra ou Irase signiIicativa.
6. Chegue cedo. Os apresentadores as vezes Iazem apresentacões em uma sala
conhecida com equipamento que conhecem. Mas, com mais Ireqüência, as
apresentacões ocorrem em ambientes desconhecidos com equipamentos diIe-
CAPÍTULO 12 » RELATO E APRESENTAÇÃO DA PESQUÌSA 3 6 7
rentes. Especialmente nessas situacões, chegue cedo o suIiciente para testar a
apresentacão. Por exemplo, diIerentes versões do mesmo software nem sempre
Iuncionam exatamente da mesma Iorma. Animacões e transicões podem Iun-
cionar de maneira diIerente ou até podem não Iuncionar. Chegue com tempo
suIiciente para poder Iazer modiIicacões de ultima hora a Iim de que a apre-
sentacão seia como deve ser.
7. Use o tempo disponível. Utilize bem todo o tempo destinado para a apresen-
tacão. Os executivos geralmente destinam entre 20 e 60 minutos para uma
apresentacão. Embora varie de pessoa para pessoa, uma regra pratica indica
que a apresentacão dura duas ou três vezes o numero de sliaes. Planeie usar to-
do o tempo disponivel, incluindo um periodo para perguntas. VeriIique anteci-
padamente que partes do material podem ser dispensadas se a apresentacão
atrasar. Fique até que todas as perguntas seiam respondidas.
8. Use o humor quando possível. Desenhos e Irases divertidas geralmente são
aceitaveis. Eles aiudam a atrair a atencão dos ouvintes e a quebrar a monotonia
do que poderia ser um material muito arido. O humor sempre deve ser de bom
gosto. Se houver alguma duvida quanto a adequacão de uma determinada
brincadeira, não o utilize.
9. Convide o público a participar. Faca perguntas ao publico. Por exemplo, se a
pesquisa envolve as reacões de Iuncionarios a uma nova politica da empresa,
convide um dos principais responsaveis pelas decisões a adivinhar como um
Iuncionario tipico responderia uma pergunta importante sobre a politica da
empresa. Isso mantém o interesse e aiuda as pessoas a participarem da apre-
sentacão. Lembre-se de sempre responder Iavoravelmente as respostas que lhe
derem. A reacão errada pode desmerecer os ouvintes.
10. Preocupe-se com os detalhes. Os apresentadores Iazem parte do pacote de
pesquisa, de modo que devem parecer conIiaveis e proIissionais. Preste aten-
cão aos detalhes, incluindo seu modo de vestir e seus maneirismos durante a
apresentacão. Vista-se adequadamente e lembre-se de que geralmente é melhor
estar muito bem vestido do que não estar vestido de acordo com a ocasião.
Gostando ou não, saiba que as pessoas baseiam seus iulgamentos em relacão a
você e a seu trabalho na sua aparência. Isso nem sempre signiIica usar um ter-
no. Se você estiver Iazendo uma apresentacão para administradores em um ho-
tel no Tahiti, um terno pode não causar boa impressão. Contudo, algo menos
Iormal para os mesmos administradores em um prédio comercial em Londres
seria muito arriscado. Além disso, não use maneirismos e Irases que distraiam
a atencão. Tente limitar o uso de né , por exemplo. Se isso Ior uma preocupa-
cão para você, peca que alguém assista a sua apresentacão e conte o numero de
vezes que você utiliza essas expressões. Você também pode Iilmar sua apresen-
tacão para identiIicar maneirismos. Em geral, a consciência dessas distracões é
a melhor Iorma de reduzi-las.
Alguns pesquisadores sentem-se desconIortaveis ao Iazerem apresentacões. Além
disso, analistas ou pesquisadores iniciantes raramente são designados para uma apresen-
tacão. No entanto, a medida que o pesquisador progride, isso vai mudando. A secão Pes-
quisa em acão aconselha aqueles que podem estar apreensivos quanto as apresentacões.
368 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
PESQUISA EM AÇÃO
Fazer uma apresentacão oral trata-se evidentemente de Ialar em publico. As apresentacões orais
assustam muitas pessoas. Falar sobre um topico comum ou Iazer uma apresentacão em sala de au-
la ia é diIicil. Uma apresentacão de pesquisa demonstra a competência proIissional do pesquisador,
bem como a competência dos colegas que também se envolveram com a pesquisa. Assim, ha uma
consideravel pressão para que se Iaca uma boa apresentacão. Se você esta com medo, leve em con-
sideracão estes conselhos:
1. Você cometera um erro durante a apresentacão! Mas mesmo o melhor apresentador cometera
erros. Eles não são Iatais. Parte de sua apreensão desaparecera quando você perceber que os
erros são inevitaveis e que pessoas razoaveis esperam que eles acontecam ocasionalmente.
2. Estude seu material. Uma das melhores maneiras de lidar com o nervosismo é estar extrema-
mente Iamiliarizado com o material. A discussão sobre o assunto, a uma certa altura, Iica in-
teriorizada. Torna-se Iacil como uma conversa no iantar. CertiIique-se de que conhece todos
os detalhes sordidos da pesquisa. Encontre pessoas com quem discutir a pesquisa antes da
apresentacão. Ensaiar a apresentacão alivia a ansiedade entre alguns apresentadores, mas ter
a seguranca de que conseguira Iazer algum comentario inteligente, não importa o que acon-
teca, é um bom modo de combater o medo da apresentacão.
3. Pratique sua apresentacão em voz alta. Fique sozinho em uma sala, talvez na Irente de um es-
pelho, e Iaca sua apresentacão. Tente Ialar mais devagar, Iaca pausas e mude o tom da voz pa-
ra evitar um som monotono. Quando não conseguir praticar em voz alta, ensaie a apresenta-
cão mentalmente.
4. Tire vantagem das oportunidades de Iazer o publico Ialar. Em algum ponto, você passa a sen-
tir-se a vontade na Irente de varios olhares Iixados em você.
5. Ria. Use o humor quando (a) Ior apropriado e (b) você tiver certeza de que os outros rirão
com você. Se você não se sentir seguro em relacão a uma brincadeira, não a Iaca. Uma Iala
que não tem graca so aumentara sua apreensão.
6. Seia conIiante. A razão por que você esta Iazendo a apresentacão é que provavelmente sabe
algo que seu publico desconhece. Portanto, você tem vantagem. Você pode dizer aquelas pes-
soas alguma coisa que vale a pena. Pretenda Iazer uma boa apresentacão e você geralmente
conseguira.
FONTE: Kaye, Steve. 1998. It's Showtime! How to Give EIIective Presentations . Supervision 60 (March): 8-10.
RESUMO
Destaque da importância da comunicação eficiente para o sucesso da pesquisa
A comunicacão é essencial para evitar desperdicio do esIorco destinado a pesquisa. A pro-
posta, o relatorio e a apresentacão da pesquisa oIerecem os meios para o pesquisador comu-
nicar o obietivo, a metodologia, os resultados e as implicacões do estudo. Se isso não é Ieito
de modo adequado, é menos provavel que a pesquisa venha a ser usada como auxilio para
a tomada de decisão. Portanto, esses veiculos vendem o proieto de pesquisa. Isso signiIi-
ca que tentam convencer os usuarios de que as inIormacões são uteis e proveitosas.
Descrição dos elementos de uma proposta de pesquisa
A propost a de pesquisa é empregada para maximizar, antes do inicio do estudo, as chan-
ces de entendiment o entre administrador e pesquisador quant o aos obietivos da pesqui-
sa e tipos de inIormacão que ela produzira. As propostas contêm uma introducão, uma
ANSIEDADE NA APRESENTAÇÃO? COM ESSES CONSELHOS NADA HÁ A TEMER
CAPÍTULO 12 « RELATO E APRESENTAÇÃO DA PESQUÌSA 3 6 9
lista das questões de pesquisa, uma descricão dos métodos de pesquisa, um esboco de
proposta do relatorio Iinal, incluindo tabelas, e uma descricão do tempo e dos recursos Ii-
nanceiros para realizacão do proieto.
Mostra de um panorama de relatórios de pesquisa eficientes
Ha muitas Iormas de aumentar a eIicacia dos relatorios de pesquisa. Os resumos executi-
vos precedem o relatorio. São, na verdade, pequenos relatorios. Incluem as seguintes se-
cões: (1) a declaracão do obietivo da pesquisa, (2) uma breve descricão do proieto e da im-
plementacão da pesquisa, (3) um resumo dos resultados derivados do teste das questões
e/ ou hipoteses de pesquisa, (4) uma interpretacão das descobertas estruturada como res-
posta para as questões de pesquisa e (5), se solicitada, uma lista de implicacões adminis-
trativas praticas derivadas do estudo. Dado que o resumo executivo Ireqüentemente é a
unica parte do relatorio que é lida em detalhes, deve-se tomar muito cuidado para que
comunique as inIormacões de maneira eIiciente. Ao preparar relatorios, o pesquisador
deve mostrar-se sensivel ao tipo de publico. Não sobrecarregue os leitores com iargão téc-
nico, a menos que eles esteiam Iamiliarizados com tais termos. Finalmente, os relatorios
de pesquisa não são uma obra de Iiccão e devem apresentar os Iatos de modo conciso.
Sintetização dos modos eficientes para apresentação de uma pesquisa
Da mesma Iorma que o relatorio, uma apresentacão oral eIiciente é Iundamental. Vale a
pena considerar o tipo de publico esperado, apresentando os resultados mais importan-
tes e prevendo perguntas e obiecões. Demos dez sugestões para conduzir uma apresenta-
cão. Algumas das mais importantes incluem usar recursos visuais de algum tipo, convi-
dar os ouvintes para participar e ser criativo no desenvolvimento de titulos e conteudos
eIicientes na apresentacão.
PALAVRAS-CHAVE
brevidade e simplicidade
Iolha de rosto
introducão
métodos de pesquisa
QUESTÕES DE REVÌSÃO
1. Liste e descreva brevemente os três mecanismos de comunicacão usados pelos
pesquisadores em administracão. Algum mecanismo é melhor do que os ou-
tros?
2. Liste e descreva brevemente os elementos de uma proposta de pesquisa.
3. O que é um resumo executivo? Por que é tão importante? Quantas paginas de-
ve ter?
4. O que é o principio do minimo denominador comum e como se aplica quando
se Iaz uma apresentacão para um grupo de oIiciais e recrutas militares?
5. Explique o papel do humor em uma apresentacão Iormal.
paginas iniciais publico
principio do minimo resumo executivo
denominador comum sumario
370 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
ATIVIDADES PARA DISCUSSÃO E APLICACÃO
1. Encontre um relatorio de pesquisa acadêmica. Pode ser qualquer artigo do The
Acaaemv of Management. The Journal of Management. The iournal of Marketing. The
Journal of Business Research ou The Journal of Retailing. entre outros. Leia o resu-
mo. Tente reescrevê-lo como se estivesse sendo apresentado para um grupo de
gerentes de producão, sendo que nenhum deles possui Iormacão acadêmica
em administracão.
2. O exemplo de relatorio de pesquisa no apêndice deste capitulo mostra os resul-
tados do exame de apenas duas questões de pesquisa para o estudo dos Iuncio-
narios. Desenvolva uma lista de pelo menos mais três questões de pesquisa e
diga por que elas precisam ser examinadas. Os resultados da pesquisa dos
clientes, por sua vez, concentraram-se em somente três questões de pesquisa.
Desenvolva uma lista de pelo menos três outras questões de pesquisa e diga
por que elas precisam ser examinadas.
3. Utilize software para analise de dados e examine as questões de pesquisa que
você criou no exercicio 2. Prepare um breve relatorio sintetizando suas desco-
bertas e recomendacões.
4. Usando o coniunto de dados dos clientes em SPSS que acompanha este livro,
Iaca uma tabulacão cruzada dos Iatores de selecão Preco (X
15
) e Funcionarios
(X
16
) por Restaurante (X
25
). Em outras palavras, os clientes do Gino's e do
Samouel's classiIicam os precos e os Iuncionarios como sendo igualmente im-
portantes? Apresente os resultados em graIicos de barras, como mostramos no
capitulo. Prepare os graIicos usando um pacote de software para apresentacões.
5. Prepare uma apresentacão de 20 minutos para Phil Samouel mostrando os re-
sultados exibidos no exemplo de relatorio de pesquisa no apêndice deste capi-
tulo. Suponha que ele estara presente com seu gerente Iinanceiro, o gerente ge-
ral do restaurante, o chefe um membro da equipe de garcons. Pense nas per-
guntas que poderão ser Ieitas.
ATIVIDADES NA INTERNET
1. Acesse o site deste livro (www.wiley.com/college/hair). Localize Presentation
Ior Samouel's . Avalie a apresentacão buscando possiveis areas a serem melho-
radas.
2. Va ao site http: / /powerreporting.com/. Analise-o e prepare um breve relato-
rio, sintetizando como um pesquisador poderia utilizar esse site.
3. Use um dispositivo de busca de sua escolha. Use as palavras-chave relatorio
de pesquisa . Prepare um breve relatorio, sintetizando o que você descobriu.
NOTAS
1. Kaye, Steve. 1999. It's Showtime! How to Give EIIective Presentations. Supervision 60 (March), 8-
10: Wareham, Holm. 2001. From the Podium. Across the Boara 38 (March/April), 67-69.
OPERAÇÕES NO RESTAURANTE SAMOUEL'S GREEK CUÌSÌNE:
MELHORÌA DAS RELAÇÕES COM FUNCÌONÁRÌOS E CLÌENTES
Pesquisa realizaaa para.
Phil Samouel
Proprietario, Samouel's Greek Cuisine
15 de marco de 2003
Pesquisa realizaaa por.
AdMark, International
3127 Tower Boulevard
Baton Rouge, LA 70803-6314
(225) 388-8614
Principal pesquisaaor.
Joseph F. Hair, Ph.D.
Analista Sênior
ihair(admark.com
SUMÁRÌO
Resumo executivo
Relatorio:
Introducão
Panorama: Estudo dos Iuncionarios
Panorama: Estudo dos clientes
Métodos de pesquisa: Estudo dos Iuncionarios
Métodos de pesquisa: Estudo dos clientes
Resultados: Estudo dos Iuncionarios
Resultados: Estudo dos clientes
Recomendacões e conclusões
Apêndices
2
4
4
5
6
7
7
8
11
12
para Phil Samouel
Apêndice 12-A: Relatorio de pesquisa
372 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
RESUMO EXECUTÌVO
OBJETIVO
O obietivo deste proieto é auxiliar a encontrar maneiras de aumentar a lucratividade do
restaurante Samouel's levando a satisIacão dos clientes e promovendo o comprometi-
mento dos Iuncionarios com a empresa. Foram realizados dois proietos de pesquisa sepa-
radamente. Primeiro, os Iuncionarios do Samouel's Ioram entrevistados para avaliacão
de variaveis importantes relativas ao comprometimento com a organizacão. Segundo, Ioi
conduzida uma survev dos clientes do restaurante para mensurar as variaveis relativas a
satisIacão e a lealdade. Os resultados das survevs são destacados como segue.
FUNCIONÁRIOS
‹ Funcionarios mais iovens, que trabalham meio turno, do sexo masculino e com
menos de um ano de trabalho no Samouel's demonstram maior probabilidade de
procurar um novo emprego.
‹ As abordagens de supervisão no Samouel's são percebidas como um ponto Iorte.
‹ A percepcão do Iuncionamento do grupo de trabalho é desIavoravel e precisa ser
melhorada.
CLIENTES
‹ Os clientes do Gino's relatam maior satisIacão (5,96) do que os clientes do
Samouel's (4,78).
‹ Apesar de as percepcões sobre a qualidade da comida estarem acima do ponto
intermediario da escala para o Samouel's (5,24), elas são melhores para o Gino's
(5,81).
‹ Os clientes do Gino's classiIicam os Iuncionarios de maneira signiIicativamente
melhor do que os clientes do Samouel's classiIicam os Iuncionarios deste restau-
rante.
‹ A satisIacão dos atuais clientes do Samouel's é mais aIetada por suas classiIica-
cões, primeiro, da qualidade da comida, depois do ambiente e, por ultimo, da
amabilidade dos Iuncionarios.
‹ A satisIacão dos atuais clientes do Gino's é mais aIetada pela qualidade da comi-
da e, em segundo lugar, pela amabilidade dos Iuncionarios.
Varias recomendacões emergem desses resultados. Quando implementadas, essas re-
comendacões devem tornar o Samouel's mais competitivo em relacão ao Gino's. Além
disso, aumentarão a lucratividade Iormando uma clientela e um grupo de Iuncionarios
mais estaveis e satisIeitos. As principais implicacões são:
‹ Colocar maior ênIase na experiência do setor como critério para contratacão de
Iuncionarios.
‹ OIerecer aos Iuncionarios oportunidades adicionais de treinamento.
‹ Contratar um chef com experiência para melhorar a percepcão da qualidade da
comida.
‹ Promover o Samouel's como um lugar divertido para reIeicões , com uma at-
mosIera excelente.
APÊNDICE 12-A « RELATÓRÌO DE PESQUÌSA PARA PHÌL SAMOUEL 373
ÌNTRODUÇÃO
QUESTÕES DE PESQUISA
Apos extensas discussões com Phil Samouel e seus Iuncionarios, duas questões de pes-
quisa (QP) Ioram identiIicadas:
QP1: Os Iuncionarios estão sendo administrados de modo a maximizar sua
produtividade e seu comprometimento com o sucesso do restaurante?
QP2: Quais são as maneiras de manter e desenvolver a atual clientela e para
atrair novos clientes?
Cada questão de pesquisa pode ser dividida em questões e hipoteses mais especiIicas.
ESTUDO DOS FUNCIONÁRIOS
A rotatividade dos Iuncionarios é uma questão a ser observada no Samouel's, assim co-
mo no setor de restaurantes em geral. Estatisticas da industria sugerem que as taxas de
rotatividade são muito altas nesse tipo de negocio, com variacões entre 50,100 ou mesmo
150° não sendo raras. Pesquisas basicas sobre a administracão de Iuncionarios docu-
mentam o importante papel da satisIacão no emprego e do comprometimento organiza-
cional na reducão da rotatividade. Phil Samouel acompanhou as mudancas de Iunciona-
rios e estima que a taxa de rotatividade seia de quase 100°. Isso signiIica que anualmen-
te ele tem que contratar um novo Iuncionario, em média, para cada Iuncionario atual. O
resultado é um aumento de custos devido as despesas de contratacão e treinamento.
Além disso, Iuncionarios sem experiência as vezes são a causa de um atendimento de
qualidade inIerior e, conseqüentemente, de clientes insatisIeitos. Portanto, Phil Samouel
gostaria de saber quais Iatores estão relacionados com o comprometimento organizacio-
nal e com as intencões de mudar de emprego.
Phil Samouel acredita que a idade e a experiência de seus Iuncionarios podem estar
relacionadas com as intencões de mudanca de emprego e com o comprometimento com
a empresa. Pesquisas basicas na industria de restaurantes e em administracão sugerem
que esses Iatores são importantes. Ele também acredita que o gênero pode ser importan-
te, e estudos em administracão relatam que as mulheres demonstram um comprometi-
mento um pouco maior do que o dos homens.
4
Assim, o estudo dos Iuncionarios explo-
rara as diIerencas com base no gênero e no regime de trabalho, como meio turno versus
turno integral. A suposicão, nesse caso, é de que Iuncionarios de tempo integral serão
mais dedicados e geralmente demonstrarão atitudes mais positivas em relacão ao traba-
lho do que os Iuncionarios de meio turno. E provavel que os Iuncionarios de meio turno
tenham outras prioridades que diminuem seu comprometimento com o Samouel's.
A equipe de supervisão do Samouel's poderia estar inIluenciando a satisIacão e o
comprometimento dos Iuncionarios. As percepcões dos Iuncionarios quanto a equipe de
supervisão são importantes para a compreensão das operacões do restaurante. Os Iuncio-
narios reagem Iavoravelmente a um tratamento eIicaz e empatico da supervisão. Portan-
to, esperamos que o comportamento da supervisão aIete de modo positivo o desempe-
nho e o comprometimento dos Iuncionarios (isto é, lealdade para com a organizacão),
além disso, Phil Samouel gostaria de saber qual a eIicacia dos incentivos monetarios na
melhoria da producão dos Iuncionarios. A gorieta é uma importante Ionte de renda para
seus Iuncionarios de atendimento. Pesquisas anteriores sugerem que as questões relacio-
nadas com a distribuicão do pagamento são importantes na reducão da rotatividade.
374 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
Inumeras hipoteses de pesquisa poderiam ser testadas a partir da survev com os Iun-
cionarios do Samouel's. Em discussões com seu consultor, Phil Samouel decidiu exami-
nar primeiro as intencões de procurar um novo emprego e o comprometimento com a or-
ganizacão. Essa decisão baseou-se nas opiniões expressas pelos Iuncionarios e em publi-
cacões que indicam que Iuncionarios altamente comprometidos trabalham mais e tratam
melhor os clientes, o que resulta em maior satisIacão e conservacão da clientela. O consul-
tor recomendou usar X
13
(Lealdade) como medida inicial do comprometimento organiza-
cional com base em seus proietos anteriores. Ao revisar medidas do ambiente de trabalho,
Phil e o consultor concluiram que o trabalho de equipe e a cooperacão entre os Iunciona-
rios e as abordagens da supervisão no restaurante seriam areas de acão em que relativa-
mente pouca melhora seria possivel (dentro de 30 a 60 dias). Varios itens que mensura-
vam essas duas areas Ioram incluidos na survev. Decidiu-se, portanto, examinar três hi-
poteses primeiro, como mostramos a seguir.
Hipótese para funcionários 1 (HF1)
O horario de trabalho, a idade e o gênero dos Iuncionarios estão relacionados com as in-
tencões de procurar novo emprego como segue: Iuncionarios de meio turno têm mais in-
tencões de procurar novo emprego do que os Iuncionarios de turno integral: Iuncionarios
mais iovens têm mais intencões de procurar novo emprego: os homens têm mais inten-
cões de procurar novo emprego do que as mulheres.
Hipótese para funcionários 2 (HF2)
As percepcões dos Iuncionarios quanto ao estilo de supervisão estão positivamente rela-
cionadas com seu comprometimento com a organizacão.
Hipótese para funcionários 3 (HF3)
As percepcões dos Iuncionarios quanto ao Iuncionamento do trabalho de equipe estão
positivamente relacionadas com seu comprometimento com a organizacão.
Outras hipoteses serão examinadas em um relatorio posterior.
PROJETO DE AVALIAÇÃO DOS CLIENTES
Phil Samouel identiIicou o Gino's Italian Restaurant como seu principal concorrente. Os
dois restaurantes provavelmente atingem o mesmo segmento de mercado, e os clientes
Ireqüentemente Iazem opcão por um deles. Portanto, é importante estabelecer o posicio-
namento competitivo de ambos os restaurantes. Phil espera que seus clientes esteiam
igualmente ou mais satisIeitos do que os clientes do Gino's.
Phil acredita que a satisIacão é determinada principalmente pela qualidade da comi-
da e do atendimento dispensado pelos Iuncionarios. Essa suposicão é sustentada por pes-
quisas basicas relatadas em periodicos comerciais e acadêmicos, bem como pela experiên-
cia deste consultor. Os clientes avaliam as industrias de servicos em geral com base em
duas classes amplas de atributos. Os principais atributos são os que mais diretamente
oIerecem o beneIicio buscado pelos clientes. No caso de um restaurante, os atributos re-
lativos a comida são importantes. Atributos relacionais são menos tangiveis e envolvem
interacões humano - humano e humano - ambiente. Para restaurantes, as percepcões dos
clientes em relacão ao ambiente e a amabilidade dos Iuncionarios enquadram-se nessa ca-
tegoria.
APÊNDICE 12-A « RELATÓRÌO DE PESQUÌSA PARA PHÌL SAMOUEL 3 7 5
Varios artigos em publicacões comerciais sobre o setor de restaurantes examinam as
percepcões dos clientes em relacão a sua satisIacão. Os artigos discutem a importância da
qualidade da comida, incluindo o Irescor e a variedade dos pratos e a limpeza do restauran-
te como dois Iatores centrais na Iormacão das percepcões de qualidade por parte dos clien-
tes. Deste modo, quando as percepcões relativas a comida, Iuncionarios e ambiente melho-
ram, sua satisIacão com o restaurante também deve melhorar. Phil Samouel gostaria de sa-
ber primeiro se os clientes classiIicam o restaurante Samouel's mais Iavoravelmente do que
o Gino's. Segundo, ele deseia conhecer as caracteristicas controlaveis do restaurante que de-
terminam a satisIacão da clientela. Esse raciocinio sugere as seguintes hipoteses.
Os clientes do Samouel's relatam estar mais satisIeitos do que os clientes do Gino's.
Hipótese para clientes 2 (HC2)
As percepcões dos clientes quanto aos Iuncionarios estão positivamente relacionadas
com sua satisIacão.
Hipótese para clientes 3 (HC3)
As percepcões dos clientes quanto ao ambiente do restaurante estão positivamente rela-
cionadas com sua satisIacão.
Hipótese para clientes 4 (HC4)
As percepcões dos clientes quanto a qualidade da comida estão positivamente relaciona-
das com sua satisIacão.
MÉTODOS DE PESQUISA: ESTUDO DOS FUNCIONÁRIOS
Amostra
Os dados Ioram coletados de uma amostra dos Iuncionarios do Samouel's. Os Iunciona-
rios Ioram solicitados a participar de um estudo geral de suas atitudes no restaurante. Ca-
da Iuncionario Ioi entrevistado Iora de seu local de trabalho e recebeu 5 dolares por sua
participacão. Foi assegurado aos Iuncionarios o sigilo absoluto quanto as suas respostas e
a não-identiIicacão das entrevistas. Participaram das entrevistas 63 Iuncionarios. Um per-
Iil demograIico da amostra demonstrou que esta é representativa de todos os Iuncionarios.
Mensurações
As mensuracões a partir dos perIis sociopsicologicos gerais Ioram usadas para avaliar o
ambiente de trabalho e as caracteristicas da producão. Foram selecionados itens para re-
presentar o comprometimento organizacional e o estilo de supervisão, entre outros aspec-
tos. Escalas Likert de sete pontos (Discorda ÷ 1: Concorda ÷ 7) Ioram utilizadas para a
maior parte das mensuracões. Os Iuncionarios indicaram suas intencões de deixar o em-
prego em uma escala de sete pontos com 7 ÷ Alta intencão de procura de novo empre-
go e 1 ÷ Baixa intencão de procura de novo emprego . Varias caracteristicas demogra-
Iicas também Ioram incluidas. (Uma copia desse questionario é encontrada no Capitulo 6
deste livro.)
Hipótese para clientes 1 (HC1)
376 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
MÉTODOS DE PESQUISA: ESTUDO DOS CLIENTES
Amostra
Os dados coletados possibilitam um exame das questões relevantes reIerentes aos clien-
tes. Entrevistas Ioram realizadas quando os clientes saiam do Gino's Italian Restaurant e
do Samouel's Greek Cuisine. As entrevistas Ioram Ieitas entre 11 e 30 e 14 horas e também
entre 19 e 22 horas, de segunda a sabado, por um periodo de dez dias (esse periodo Ioi se-
lecionado aleatoriamente a partir de um prazo realista de 90 dias para coleta dos dados).
Os clientes Ioram abordados aleatoriamente e solicitados a responder uma pergunta de
relacionamento e três perguntas de triagem: você ocasionalmente Iaz reIeicões em restau-
rantes? Você acabou de Iazer uma reIeicão no Samouel's/Gino's? Sua renda anual é de
20.000 dolares ou mais? Você respondeu um questionario para nossa empresa anterior-
mente? Um sim para as três primeiras questões e um não para a ultima acionavam a soli-
citacão para participar da pesquisa. Quando o cliente concordava, recebia uma pranche-
ta com o questionario e era encaminhado a um local conIortavel para preenchê-lo, rece-
bendo 5 dolares por sua participacão.
O obietivo era obter pelo menos 100 entrevistas de cada restaurante. Foi realizado um
total de 230 entrevistas. Entretanto, 30 apresentavam dados Ialtantes em numero suIicien-
te para exclui-las da analise. Ao todo, 447 clientes Ioram abordados, produzindo uma ta-
xa de respostas de 44,7° (200 respostas utilizaveis/447 tentativas).
Mensurações
As mensuracões para o estudo derivaram das entrevistas com Phil Samouel e da consul-
ta a pesquisas anteriores no setor. Escalas Likert de sete pontos (discorda ou concorda) Io-
ram usadas para mensurar as classiIicacões de varios critérios de avaliacão (por exemplo,
qualidade da comida, limpeza das instalacões, etc). Ver Apêndice 1-B para uma melhor
descricão das medidas. (Uma copia do questionario é oIerecida no Capitulo 7 deste livro.)
RESULTADOS: ESTUDO DOS FUNCIONÁRIOS
Resultados para a intenção de procurar novo emprego (HF1)
As primeiras analises envolvem as intencões de procurar novo emprego. As variaveis im-
portantes Ioram o horario de trabalho (meio turno ou turno integral), idade, gênero e
tempo de servico no Samouel's. Os graIicos de barras na Figura A-l mostram que os re-
sultados sustentam HF1. Como podemos ver, os Iuncionarios mais iovens, os de meio
turno, os do sexo masculino e os que trabalhamno Samouel's ha menos de um ano são os
que indicam maior probabilidade de procurar um novo emprego. Agora que esta claro
quem tem probabilidade de procurar um novo emprego, em um relatorio posterior exa-
minaremos as razões para isso e o que poderia ser Ieito para reduzir essa probabilidade.
Comprometimento/Lealdade dos funcionários
O proximo coniunto de analises examina o ambiente de trabalho e a producão. As seguin-
tes variaveis Ioram investigadas:
X
3
- Iuncionario acredita que o supervisor reconhece/elogia o trabalho bem Ieito
X
6
- Iuncionario acredita que o supervisor reconhece seu potencial
X
10
- Iuncionario acredita que o supervisor é simpatico e prestativo
X
4
- Iuncionario percebe cooperacão no grupo de trabalho
APÊNDÌCE 12-A ‹ RELATÓRÌO DE PESQUÌSA PARA PHÌL SAMOUEL 377
FIGURA A-1 ÌNTENÇÕES DE PROCURA DE NOVO EMPREGO
Intencão de procura por horário de trabalho
Xo - Iuncionario acredita que o grupo de trabalho Iunciona como uma equipe
X
u
- Iuncionario percebe a presenca de habilidades e necessidades de treinamento
no grupo de trabalho
~(
13
- Iuncionario demonstra lealdade ao restaurante Samouel's (representa compro-
metimento organizacional)
Duas hipoteses Ioram examinadas. Estas Ioram testadas veriIicando-se as relacões li-
neares entre a variavel dependente, lealdade, e as variaveis relativas a supervisão e ao
grupo de trabalho.
Essa hipotese prevê que as percepcões dos Iuncionarios quanto ao estilo da supervisão
estão positivamente relacionadas com o comprometimento com a organizacão. Para tes-
tar essa hipotese, usamos a lealdade (X
13
) como variavel dependente em um modelo de
regressão e as variaveis de supervisão (X
3
, X
6
e X
10
) como variaveis independentes. A re-
gressão multipla é utilizada porque ha uma unica variavel métrica dependente e três va-
riaveis métricas independentes. Os resultados do modelo são mostrados a seguir:
HF2
378 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
O modelo de regressão não é signiIicativo, como sugere o valor de F (dI ÷ 3,59) de
2,045 e o valor correspondente de p de 0,117. Portanto, HF2 não é sustentada. Isso indi-
ca que não ha relacão entre o estilo da supervisão e a lealdade com o restaurante
Samouel's. Phil deve, portanto, veriIicar outras inIormacões para compreender a ques-
tão da lealdade.
HF3
Essa hipotese prevê que as percepcões dos Iuncionarios quanto ao Iuncionamento do
grupo de trabalho estão positivamente relacionadas com o comprometimento organiza-
cional. Para testar essa hipotese, usamos a lealdade (X
13
) como variavel dependente na re-
gressão e as variaveis dos Iuncionarios (X
4
, X
8
e X
u
) como variaveis independentes. A re-
gressão multipla é utilizada porque ha uma unica variavel dependente métrica (interva-
lar ou de razão) e três variaveis independentes que também podem ser tratadas como in-
tervalares. Os resultados são mostrados na tabela abaixo.
Resumo do modelo
R R
2
F Sig.
0,637 0,405 13,401 0,000
Ìndicadores: Xn - Grupo de trabalho - HábilidadesA®»·²¿³»²¬±ô Èô ó Ù ®«°± ¼» ¬®¿¾¿´¸± ó Û¯«·°»ô Èòô ó Cooperação no
grupo de trabalho
A relacão entre as variaveis dos Iuncionarios e a lealdade é signiIicativa (F ÷ 13,401,
p · 0,000). Como o modelo prevê uma parte signiIicativa da variância em X
13
(lealdade),
um exame mais detalhado das principais variaveis de previsão é necessario. Isso é apre-
sentado na tabela abaixo.
Lembremos que as variaveis Ioram mensuradas utilizando uma escala de sete pontos
com 7 ÷ concordo totalmente e 1 ÷ discordo totalmente. A estatistica descritiva mostra
que, enquanto a lealdade parece relativamente alta (5,67 em uma escala de sete pontos),
as variaveis do grupo de trabalho parecem todas relativamente baixas. Isso indica que os
Iuncionarios podem não trabalhar em coniunto como deveriam e que podem achar que
não possuem as habilidades necessarias. Isso sugere que Phil Samouel precisa organizar
sessões de treinamento para que seus Iuncionarios intensiIiquem suas habilidades coope-
rativas. As inIormacões na tabela a seguir mostram que os pesos Beta para as três varia-
veis são signiIicativos (p · 0,05). Enquanto a cooperacão no grupo de trabalho (P ÷ 0,579)
e as habilidades/treinamento estão positivamente relacionadas com a lealdade, o grupo
de trabalho - equipe esta relacionado negativamente (p ÷ -0,355).
APÊNDICE 1 2 - A ‹ RELATÓRÌO DE PESQUÌSA PARA PHÌL SAMOUEL 3 7 9
Coeficientes
Variável dependente: X
13
- Lealdade
Como a relacão negativa entre grupo de trabalho como equipe e lealdade é contra-in-
tuitiva e incoerente com as demais variaveis de grupo de trabalho, um exame mais deta-
lhado dessas relacões torna-se necessario. A matriz de correlacão de Pearson entre as me-
didas envolvidas revela:
Grupo de trabalho - Equipe (X
8
) demonstra altas correlacões com as outras variaveis
independentes. Isso, iuntamente com outros diagnosticos de colinearidade detalhados,
sugere que o coeIiciente de regressão para essa variavel pode não ser conIiavel. Além dis-
so, o pesquisador recomenda uma analise adicional usando uma técnica de reducão de
dados, como a analise Iatorial.
Entretanto, os resultados para grupo de trabalho - cooperacão e grupo de trabalho -
habilidades/treinamento sustentam HF3, assim como as correlacões. Deste modo, uma
mão-de-obra mais cooperativa e treinada provavelmente produzira maior lealdade dos
Iuncionarios.
RESULTADOS: ESTUDO DOS CLIENTES
Questão de pesquisa de clientes: Satisfacão relativa
A segunda questão de pesquisa examina topicos relacionados com a satisIacão dos clien-
tes. HC1 testa a satisIacão relativa dos clientes do Gino's e do Samouel's. Um teste i de
amostras independentes comparando a medida de satisIacão (X
17
) dos dois grupos de
clientes (X
25
) Ioi usado para testar essa hipotese. Esse teste é apropriado porque a varia-
vel independente ou de grupo é nominal (concorrente ÷ clientes do Gino's versus clientes
do Samouel's) e a variavel dependente é intervalar (satisIacão). Os resultados do teste t
são apresentados a seguir.
Comparacão da satisIacão dos clientes do Samouel's e do Gino's: Teste t de amostras
independentes
esvio» Sig Diferenca
Concorrente N Média Padrão t (bicaudal) da média
X
17
- Samouel's 100 4,78 1,16 -7,793 0,000 -1,18
Satisfacão Gino's 100 5,96 0,97
380 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
Os clientes do Gino's relatam maior satisIacão na escala de sete pontos por uma mé-
dia de ï\è øìô éè ª»® -«- ëô çê÷ò Û³¾±®¿ »--¿ diIerenca seia signiIicativa (p · 0,000), ela não
sustenta HC1, ia que indica maior satisIacão entre os clientes do Gino's. A hipotese pre-
via o contrario. Além disso, em relacão as taxas médias de satisIacão na industria de res-
taurantes, nenhuma delas é especialmente alta. Phil Samouel precisa corrigir esse déIicit
na satisIacão. A analise de desempenho comparativo a seguir pode lancar alguma luz so-
bre a questão.
Desempenho comparativo
A questão do desempenho comparativo Ioi examinada aplicando-se o teste t de amostras
independentes para as 12 classiIicacões de atributos (X
a
- X
12
) para os dois restaurantes.
As médias por restaurante são apresentadas na tabela Teste t de amostras independentes.
Como podemos ver, o Gino's tem classiIicacão signiIicativamente mais alta do que o
Samouel's na qualidade da comida (p · 0,001), porcões generosas (p · 0,003), sabor dos
pratos (p · 0,001), valor do dinheiro (p · 0,005) e amabilidade dos Iuncionarios (p ·
0,000). O Samouel's tem melhor classiIicacão do que o Gino's quanto a decoracão interna
(p · 0,000), limpeza e organizacão (p · 0,00) e atmosIera divertida (p · 0,000). Assim, o
problema de Phil Samouel com seus Iuncionarios, identiIicado nos resultados da survev
dos Iuncionarios, também é evidente nos resultados da survev dos clientes. Mas o am-
biente do Samouel's é classiIicado mais Iavoravelmente do que o do Gino's, tanto ern ter-
mos de beleza quanto de diversão.
Teste t de amostras independentes
O QUE DETERMINA A SATISFAÇÃO DOS CLIENTES COM O SAMOUEL'S?
Três hipoteses, HC1, HC3 e HC4, abordam essa questão de pesquisa. As hipoteses suge-
rem o exame da relacão entre satisIacão e percepcões dos clientes quanto a simpatia dos
Iuncionarios, ambiente e qualidade da comida, respectivamente. As hipoteses Ioram tes-
tadas com um modelo de regressão unica usando a satisIacão (X
17
) como variavel depen-
dente e as três variaveis de desempenho do restaurante relativas as hipoteses (X
6
, X
2
e X
17
respectivamente) como variaveis independentes. A regressão é apropriada porque tanto
APÊNDÌCE ïî ó\ e RELATÓRÌO DE PESQUÌSA PARA PHÌL SAMOUEL 3 8 1
a variavel dependentes quanto as variaveis independentes podem ser tratadas como in-
tervalares (isto é, métricas). Além disso, para examinar essa questão, é possivel conside-
rar os dois restaurantes separadamente (os clientes do Samouel's e do Gino's avaliam so-
mente o restaurante onde Iizeram sua reIeicão, de modo que o modelo de regressão deve
ser testado separadamente para cada restaurante). E possivel que haia caracteristicas uni-
cas em cada amostra. Em outras palavras, os clientes do Gino's podem não reagir da mes-
ma Iorma que os clientes do Samouel's. Os resultados são mostrados na tabela a seguir.
O modelo de regressão para o restaurante Samouel's é altamente signiIicativo (p ·
0,000) e explica 44,0° da variância total na satisIacão dos clientes. O modelo de regressão
para o Gino's também é estatisticamente signiIicativo (p · 0,000), mas não prevê muita
variância na satisIacão dos clientes (R é 17,9° menor para o Gino's: 44,0 - 26,1 ÷ 17,9).
Ambos os modelos de previsão são uteis, no entanto, para identiIicar qual das três varia-
veis independentes esta mais Iortemente relacionada com a satisIacão. Outras variaveis
também podem estar relacionadas, mas serão examinadas em um relatorio posterior. Es-
pera-se que as outras variaveis aumentem o nivel de previsão para satisIacão. Mas esses
modelos de regressão para previsão iniciais são altamente signiIicativos e prevêem a sa-
tisIacão em um nivel razoavel, portanto são uteis.
Como encontramos modelos signiIicativos na previsão da satisIacão, é importante sa-
ber quais variaveis independentes que Iuncionam como Iortes indicadores de previsão.
Essas inIormacões estão na tabela CoeIicientes de indicadores importantes de previsão de
satisIacão. O ponto de intersecão para um indicador de previsão signiIicativo nessa anali-
se sera 0,10. Phil Samouel acredita que o risco maior (usar · 0,10 em vez de · 0,05) é acei-
tavel nessa situacão. Além disso, é coerente com o tamanho relativamente pequeno da
amostra de 100 por restaurante. Para o Samouel's, todos os três atributos são indicadores
positivos de previsão da satisIacão (p · 0,1). Ou seia, percepcões mais Iavoraveis quanto a
qualidade da comida, a beleza do ambiente e a amabilidade dos Iuncionarios estão asso-
ciados com niveis mais altos de satisIacão. Para o Gino's, somente dois atributos são indi-
cadores de previsão signiIicativos (p · 0,1) - a qualidade da comida e a amabilidade dos
Iuncionarios. Assim, HC2, HC3 e HC4 são sustentadas para o Samouel's. Apenas HC2 e
HC4 são sustentadas para o Gino's.
Coeficientes de indicadores importantes de previsão da satisfação
Gino's Samouel's
CoeIicientes CoeIicientes
padronizados padronizados
Atributos (Beta) í Sig. (Beta) r Sig.
È
¬
óQualidade da comida (HC4) 0,401 4,4964 0,000 0,367 4,531 0,000
X
2
-Beleza do ambiente (HC3) 0,108 1,227 0,223 0,305 3,795 0,000
X
6
- Funcionários simpáticos 0,385 4,3234 0,000 0,275 3,500 0,001
(HC2)
Variável dependente: X,7 - Satisfação
382 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
RECOMENDAÇÕES E CONCLUSÕES
A pesquisa descrita neste relatorio aborda duas questões gerais, reIerentes a explicacão
do comprometimento dos Iuncionarios e a satisIacão dos clientes. Os resultados dessas
questões são sintetizados a seguir.
FUNCIONÁRIOS
‹ Funcionarios mais iovens, Iuncionarios de meio turno, Iuncionarios do sexo mas-
culino e os que trabalham no Samouel's ha menos de um ano são os que apresen-
tam maior probabilidade de procurar outro emprego.
‹ As abordagens da supervisão no Samouel's são percebidas como um ponto Iorte.
‹ O Iuncionamento do grupo de trabalho não é bem percebido e precisa ser melho-
rado.
CLIENTES
Samouel's (4,78).
‹ Embora as percepcões quanto a qualidade da comida esteiam acima do ponto in-
termediario da escala para o Samouel's (5,24), elas são melhores para o Gino's
(5,81).
‹ Os clientes do Gino's classiIicam os Iuncionarios de maneira signiIicativamente
melhor do que os clientes do Samouel's.
‹ A satisIacão dos atuais clientes do Samouel's é mais aIetada por suas classiIica-
cões da qualidade da comida, seguida pelo ambiente e pela simpatia dos Iuncio-
narios.
‹ A satisIacão dos atuais clientes do Gino's é mais aIetada por suas classiIicacões
da qualidade da comida e depois pela simpatia dos Iuncionarios.
RECOMENDAÇÕES
Varias recomendacões derivam diretamente desses resultados. Elas incluem:
1. OIerecer oportunidades adicionais de treinamento para os Iuncionarios. Diver-
sas universidades locais, bem como a American Restaurant Association, têm
programas de treinamento em servicos para supervisores, garcons e equipe de
cozinha. Recomendamos que todos os Iuncionarios Ireqüentem sessões de trei-
namento Iormal anualmente. Isso lhes dara um melhor conhecimento dos pa-
drões da industria e das expectativas dos clientes. Mais ainda, a reducão da ro-
tatividade é critica para a lucratividade do Samouel's. O Samouel's deveria
tentar atingir uma taxa de rotatividade signiIicativamente mais baixa do que a
média da industria dentro de 12 meses.
2. Contratar mais Iuncionarios acima da idade de 25 anos. Os resultados clara-
mente sugerem que os Iuncionarios mais iovens têm maior probabilidade de
largar o emprego. Funcionarios acima dessa idade tendem a ser mais estaveis.
Uma mão-de-obra mais estavel signiIica uma reducão de custos e provavel-
mente maior satisIacão dos clientes. Talvez deva-se considerar a contratacão de
aposentados que deseiam Iazer algum tipo de trabalho.
Ñ- ½´·»²¬»- ¼± Ù·²±ù- ®»´¿¬¿³ ³¿·±® satisIacão (5,96) do que os clientes do
APÊNDICE 12 - A » RELATÓRÌO DE PESQUÌSA PARA PHÌL SAMOUEL 3 8 3
3. Contratar um chef executivo com experiência. Os clientes do Gino's relatam
maior satisIacão do que os clientes do Samouel's. Esse é um grande ponto Ira-
co. Os clientes do Gino's também classiIicam a qualidade da comida melhor do
que os clientes do Samouel's. Além disso, a qualidade da comida é um dos
principais determinantes da satisIacão dos clientes. Portanto, Phil Samouel de-
ve melhorar a qualidade da comida, especialmente se deseia atrair clientes do
Gino's com mais Ireqüência. A atual equipe de cozinha Iaz um bom trabalho na
preparacão de itens tradicionais do Samouel's. Um novo chef executivo pode
melhorar a qualidade da comida dando maior variedade ao cardapio, oIerecen-
do treinamento mais Iormal aos Iuncionarios da cozinha, aumentando a credi-
bilidade do restaurante e melhorando a preparacão e apresentacão dos pratos.
A melhora da qualidade da comida não so gerara maior satisIacão da atual
clientela, como também, ia que os clientes do Gino's são mais sensiveis a essa
caracteristica, podera atrair alguns clientes deste restaurante.
4. Promover a importância de um ambiente limpo, atraente e divertido. O
Samouel's tem melhor classiIicacão do que o Gino's em termos de ambiente. A
persuasão pode ser conseguida por meio da mudanca de crencas ou de avalia-
cões. Se Ior possivel Iazer com que os clientes acreditem que um ambiente lim-
po e divertido oIerece valor adicional, eles poderão tornar-se mais sensiveis a
essa caracteristicas. Se isso acontecer, o Samouel's sera beneIiciado.
LIMITAÇÕES
Varias limitacões devem ser observadas. Primeiro, as amostras usadas em ambos os estu-
dos têm limitacões. A amostra de Iuncionarios consistiu de somente 63 pessoas. Qual é a
singularidade dos Iuncionarios do Samouel's? Uma amostra mais abrangente envolven-
do mais Iuncionarios de outros restaurantes de categoria semelhante pode vir a ser mais
aproIundada e permitir uma avaliacão relevante do Samouel's. Além disso, a amostra de
clientes incluiu somente dois restaurantes. Isso permitiu que a pesquisa se concentrasse
no modo como o Samouel's é comparado com seu principal concorrente. Entretanto, não
possibilita compreender como o Samouel's pode enquadrar-se na populacão mais geral
de clientes de restaurantes de Nova York.
Em segundo lugar, os questionarios Ioram limitados em nome da conveniência.
Questionarios mais longos podem permitir uma melhor avaliacão de construtos como o
desempenho dos Iuncionarios, o comprometimento organizacional, a satisIacão dos
clientes e a sua percepcão de valor.
FUTURAS PESQUISAS
Algumas descobertas sugerem a realizacão de outros estudos. Por que os Iuncionarios de
meio turno são menos comprometidos e mais inclinados a procurar uma novo emprego?
Talvez isso tenha algo a ver com as politicas e o tratamento do Samouel's relativos aos re-
gimes de meio turno e de turno integral. Além disso, diIerentes sistemas de gratiIicacão in-
Iluenciam a satisIacão do cliente? As percepcões dos clientes quanto aos precos não Ioram
examinadas muito detalhadamente aqui. Um Iuturo estudo poderia examinar as trocas
que os clientes estão dispostos a Iazer. Por exemplo, quanto mais eles estariam dispostos a
pagar pela melhor qualidade dos pratos e do atendimento? Esses estudos podem oIerecer
percepcões que não se encontram disponiveis aqui. Como alternativa, eles podem ainda
Iornecer maior sustentacão para as recomendacões apresentadas. Antes de realizar outros
estudos, recomendamos que as inIormacões desta pesquisa seiam melhor examinadas.
384 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
APÊNDICES
Apê ndi c es t écni cos d e v e m s egui r o c or po do t r abal ho, i nc l ui ndo u ma des cr i cão do ques -
t i onar i o, t oda s as est at i st i cas descr i t i vas e de t al hes especi Ii cos das anal i s es r eI er i das no
rel at ori o.
NOTAS
1. Berta, Dina. 2000. Operators See Outside Volunteer Work as a Wise Way to Lower Turnover. Nation´s
Restaurant News 34 (December 18): 20-21. Também Prewitt, Milrod. 1999. Purdue Study: Low
BeneIits Boost Turnover, Increase Net Labor Costs. Nation' s Restaurant News 33 (December 6): 1.
2. Sheridan, Margaret. 2000. Serving Notice. Restaurants ana Institutions. 110 (March 15): 50.
3. Russ, Frederick A. and Kevin A. McNeilly. 1995. Links Among SatisIaction, Commitment and
Turnover Intentions: The Moderating EIIect oI Experience, Gender and PerIormance. The Journal of
Business Research 34 (Sep/Oct): 57-65.
4. Marsden, Peter V, Ame L. Kalleberg and Cynthia R. Cook. 1993. Gender DiIIerences in
Organizational Commitment. Work and Occupations 20 (August): 368-390.
5. Prewitt, 1999.
6. Klara, Robert. 1999. Fast and Fancy. Restaurant Business 98 (June 1): 19-21. Também Stern, Jane and
Michael Stern. 2000. Familiarity Usually Breeds Regular Restaurant Customers. Nation' s Restaurant
News 34 (November 20): 24-26.
Tópicos Avançados em Pesquisa
em Administração
CapítuIo 13: Outras técnicas multivariadas
CapítuIo 14: Abordagens avançadas de análise
e apresentação
P A R T E
Outras Técnicas Multivariadas
CAPI TULO
388 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
ÌNTRODUÇÃO
Os proietos de pesquisa as vezes incluem reducão e/ou simpliIicacão de dados em seus
obietivos. Em tais casos, usamos técnicas estatisticas que não designam as variaveis como
dependentes ou independentes. Em vez disso, analisam somente as variaveis dependen-
tes ou somente as variaveis independentes. As duas técnicas apropriadas nessa situacão
são a analise Iatorial e a análise de conglomerados. A primeira técnica que cobrimos nes-
te capitulo é a analise Iatorial. Ela é utilizada para sintetizacão de dados. A segunda téc-
nica a ser discutida, a analise de conglomerados, pode ser usada para identiIicar subgru-
pos homogêneos da amostra total.
Nos capitulos anteriores, mostramos como avaliar a capacidade de previsão usando
a analise de regressão com uma unica variavel dependente métrica e uma ou mais varia-
veis independentes métricas. Contudo, não examinamos como avaliar a capacidade de
previsão quando ha apenas uma variavel dependente não-métrica e diversas variaveis in-
dependentes métricas. A técnica estatistica apropriada nessa situacão é a análise discri-
minante. Essa sera a terceira técnica que discutiremos neste capitulo.
TÉCNÌCAS DE DEPENDÊNCÌA E DE ÌNTERDEPENDÊNCÌA
As técnicas estatisticas de regressão multipla e de analise discriminante são chamadas de
técnicas de dependência. Isso porque as variaveis são divididas em coniuntos de depen-
dentes e independentes para Iins de analise. As vezes deseiamos examinar somente um
coniunto de variaveis por vez para simpliIica-las ou entendê-las melhor. Em tais casos,
analisamos somente as variaveis independentes ou apenas as variaveis dependentes em
vez de ambos os coniuntos ao mesmo tempo. Quando usamos uma técnica estatistica
com um so coniunto de variaveis por vez, chamamos esse procedimento de técnica de in-
terdependência. A analise Iatorial e a analise de conglomerados são técnicas de interde-
pendência. A secão Pesquisa em acão mostra como essas e outras técnicas estatisticas
multivariadas estão sendo usadas por muitas organizacões para melhorar sua tomada de
decisão.
ANÁLÌSE FATORÌAL
A analise Iatorial é uma técnica estatistica multivariada que pode sintetizar as inIormacões
de um grande numero de variaveis em um numero muito menor de variaveis ou Iatores.
IdentiIicando relacões latentes (não Iacilmente identiIicaveis) e combinando variaveis em
alguns Iatores, a analise Iatorial simpliIica nossa compreensão dos dados. Quando se uti-
liza a analise Iatorial, as variaveis não são divididas nas categorias dependente e indepen-
dente. Em vez disso, todas as variaveis são analisadas iuntas para identiIicar padrões ou
Iatores subiacentes. A técnica pode ser usada para analisar em Iatores tanto variaveis inde-
pendentes quanto variaveis dependentes consideradas separadamente.
Vamos comecar nossa discussão da analise Iatorial com um exemplo intuitivo. O
McDonald's® tem mais de 30.000 restaurantes em todo o mundo, enquanto que o Burger
King® tem somente 12.000. O Burger King gostaria de compensar essa deIasagem e esta-
beleceu como meta abrir 500 novos restaurantes por ano no mundo todo. Para isso, eles
acreditam que uma survev para determinar os Iatores de selecão de restaurantes para os
clientes do McDonald's versus os clientes do Burger King aiudaria a desenvolver uma es-
tratégia de marketing para conquistar uma porcão do mercado do McDonald's e atrair
clientes para os novos restaurantes. O Burger King pesquisou 1.000 clientes ae fast fooa
CAPÍTULO 13» OUTRAS TÉCNÌCAS MULTÌVARÌADAS 389
PESQUISA EM AÇÃO
Quem decide se você pode comprar uma casa ou carro novo? Hoie em dia, é mais provavel que se-
ia o que em vez de quem - um programa de computador baseado em calculos matematicos que
Iornece um escore classiIicando-o como digno ou não de crédito. Cada vez mais, agências de em-
préstimos, negociantes e até mesmo companhias de seguro consideram o escore de crédito de um
cliente como um instrumento central na previsão de seus lucros com ele. Os escores baseiam-se em
suposicões matematicas complexas e estritamente reservadas, desenvolvidas por San RaIael, Cali-
Iornia, da Pair, Isaac and Company, e calculadas utilizando-se métodos estatisticos multivariados.
Na verdade, a Fair, Isaac and Company lidera a industria de modo tão absoluto que os escores de
crédito são Ireqüentemente chamados de escores FICO, iniciais da empresa.
O que é exatamente o escore de crédito? E um numero de três digitos derivado em parte da his-
toria de crédito de um candidato a Iinanciamento. A Iormula FICO Ioi desenvolvida comparando-
se inIormacões Iinanceiras atuais e passadas Iornecidas pelos três principais agentes de crédito do
pais - EquiIax, Experian e Trans Union - sobre uma grande amostra de consumidores e usando-se
então esses dados para Iazer previsões sobre o comportamento Iuturo. Essas inIormacões aiudam a
determinar se as tendências do candidato a crédito combinam com as dos agentes Iinanciadores,
que não aceitam dividas, declaracão de Ialência ou outros tipos de problemas Iinanceiros.
O segredo de um escore FICO de um individuo é que ele não é apenas uma simples inIormacão,
mas sim o resultado da interacão de diIerentes variaveis. De acordo com o site da Fair, Isaac and
Company (www.Iairisaac.com), o historico dos pagamentos do consumidor e o valor da divida res-
pondem por 35° e 30° do escore, respectivamente. Os outros 35° são determinados pelo tempo
que o consumidor tem crédito, o quanto ele procura por novo crédito e os tipos de crédito que uti-
liza. Na escala FICO, quanto mais alto o escore, melhor. Um escore baixo de 300 indica que um con-
sumidor oIerece risco de crédito, enquanto que um escore alto de 850 representa um modelo de bom
candidato a empréstimo. De acordo com a empresa, o escore médio é de aproximadamente 720.
Então, como você descobre o que muitos agentes Iinanciadores ia sabem sobre sua classiIicacão
FICO? Depois de soIrer pressão politica e dos consumidores, a Fair, Isaac recentemente lancou o
www.myIico.com, um site da Web que da aos consumidores acesso aos seus escores FICO. Por uma
taxa de 12,95 dolares, um consumidor tem 30 dias de acesso ao seu relatorio FICO on-line. De acor-
do com empresa, mais de um milhão de consumidores pagaram por esse servico, que opera emioint
venture com o EquiIax. Além de seus escores, os consumidores que compram o servico basico myIi-
co.com obtêm uma copia de seu relatorio de crédito EquiIax e uma explicacão geral dos Iatores que
poderiam estar contribuindo para escores de crédito baixos. Futuros desenvolvimentos do myIi-
co.com incluem uma calculadora online que permitira que os consumidores veiam como as sete va-
riaveis principais poderiam aIetar seu escore FICO. Por exemplo, segundo um prototipo do servico,
um consumidor com um escore de 707 poderia elevar até 20 pontos pagando 750 dolares de 2.230
dolares de saldo do cartão de crédito.
Os métodos estatisticos multivariados que estão sendo usados pela Fair, Isaac para desenvolver
seu modelos de escores estão sendo incorporados por muitas empresas, bem como por outras orga-
nizacões, como a Receita Federal, que os utiliza para identiIicar empresas e individuos que devem
passar por auditoria. Tenha em mente que, no ambiente empresarial de hoie, entender a relacão en-
tre variaveis é tão importante quanto coletar as inIormacões. Assim, a importância dos métodos es-
tatisticos multivariados que são utilizados para compreender relacões tem crescido drasticamente
nos ultimos anos.
FONTE: www.Iairisaac.com: Simon, Ruth. 2002. Numbers Game: Looking to Improve Your Credit Score? The Wall Street
Journal March 19: A1. Morning Aavocate. 2001. September 30:41.
atuais e potenciais e pediu-lhes que classiIicassem 2 Þ«®¹»® Õ·²¹ » 2 ӽܱ²¿´ ¼ù - »³ -»·-
º¿¬±®»- ¼» selecão - sabor, t amanho da porcão, Irescor, simpatia, cortesia e competência
dos Iuncionarios. As classiIicacões de seis clientes que responderam a pesqui sa são mos-
t radas na Figura 13-1. Os clientes que der am classiIicacões mais baixas em simpatia t am-
bém deram classiIicacões inIeriores em competência e cortesia. Do mesmo modo, quan-
DAR CRÉDITO A QUEM MERECE CRÉDITO
390 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
FÌGURA 13-1 CLASSÌFÌCAÇÕES DE RESTAURANTES Ì
do você examina as classiIicacões de sabor, tamanho da porcão e Irescor, você pode ver
que elas são bastante altas em todas as três variaveis. A partir de uma inspecão visual das
classiIicacões, portanto, as seis medidas podem ser combinadas em dois Iatores compos-
tos chamados de comida e Iuncionarios (ver Figura 13÷2).
Como Iica demonstrado pelo exemplo anterior, a analise Iatorial possibilita o exame
das relacões subiacentes para um grande numero de variaveis e sua combinacão em um
coniunto menor de Iatores compostos. A analise Iatorial é uma técnica estatistica que de-
senvolve combinacões lineares de variaveis que sintetizam as variaveis originais com ba-
se em seus padrões subiacentes (relacões latentes). Para o exemplo anterior, Ioi Iacil iden-
tiIicar visualmente as relacões porque tinhamos somente seis respondentes e seis varia-
veis. Mas, com maior numero de variaveis e respondentes, evidentemente precisariamos
de um computador para usar a analise Iatorial.
A, analise Iatorial é mais util com um grande numero de variaveis. Mas, ao aplica-la,
o pesquisador deve ter um tamanho minimo de amostra de cinco vezes o numero de va-
riaveis analisadas. Isto é, se você estiver analisando Iatorialmente 15 variaveis, então o ta-
manho minimo de sua amostra sera 75.
Derivação de fatores
Um Iator é uma combinacão linear das variaveis originais. A analise Iatorial pode derivar
tantos Iatores quantas Iorem as variaveis analisadas. Usando o exemplo na Figura 13-2,
um maximo de seis Iatores pode ser derivado. O primeiro Iator derivado é a combinacão
de variaveis que responde por uma parte da variância nos dados como um todo maior do
FÌGURA 13-2
ANALÌSE FATORÌAL DE FATORES DE SELEÇÃO DE RESTAURANTES
CAPÍTULO 13 ‹ OUTRAS TÉCNÌCAS MULTÍVARÌADAS 391
que qualquer outra combinacão linear das variaveis originais. O segundo Iator responde
pela variância mais residual (sobra ou resto) depois que o primeiro Iator é extraido. Cada
Iator subseqüente responde por menos variância do que os anteriores, mas ainda é o me-
lhor em termos de explicacão da maior quantidade de variância residual. O pesquisador
examina as solucões Iatoriais e decide quando Iatores adicionais precisam ser derivados
porque a variância adicionada explicada é muito pequena.
Para derivar Iatores, o analista primeiro deve responder duas questões: (1) que tipo
de modelo Iatorial deve ser usado e (2) como a solucão Iatorial inicial deve ser articulada
para Iacilitar a interpretacão. Ha dois modelos Iatoriais basicos. Um é chamado de anali-
se de componentes principais, e o outro é a analise Iatorial comum. A analise de compo-
nentes principais usa toda a variância no coniunto de dados enquanto que a analise Iato-
rial comum baseia-se somente na variância comum.
Modelos de análise fatorial Para aiuda-lo a compreender as diIerencas entre os dois mo-
delos de analise Iatorial, vamos esclarecer o que queremos dizer com variância. Lembre-
se de que a variância descreve a variabilidade na distribuicão dos dados. Em analise es-
tatistica, supõe-se que cada variavel tenha uma variância total igual a um. Avariância to-
tal pode ser dividida em três tipos - comum, unica e erro, como mostra a Figura 13-3. A
variância comum é a porcão da variância total que é compartilhada com todas as varia-
veis originais na analise. Ou seia, a porcão da variância para a qual todas as variaveis co-
variam iuntas. A variância única é a porcão da variância total que é especiIica ou unica
para somente uma variavel. A variância de erro é a porcão da variância que resulta, por
exemplo, de um erro na mensuracão ou na coleta de dados. A analise de componentes
principais usa todos os três tipos de variância para derivar solucões Iatoriais. A analise Ia-
torial comum utiliza somente a variância comum para derivar Iatores.
A analise de componentes principais emprega toda a variacão no coniunto de varia-
veis que estão sendo analisadas. O procedimento reduz o coniunto original de variaveis
a um grupo menor de variaveis compostas, chamado de componentes principais. Cada
componente principal é Iormado pela combinacão linear das variaveis originais. O obie-
tivo é explicar o maximo possivel da variância original no coniunto de dados por alguns
componentes principais. Como exemplo de analise de componentes principais, conside-
remos as 12 variaveis de percepcão da survev de clientes do Samouel's. Se tivéssemos que
executar um programa de analise Iatorial de componentes principais, esperariamos que
as 12 variaveis Iossem reduzidas a três, ou talvez quatro, componentes, que iuntos expli-
FÌGURA 13-3 TIPOS DE VARIÂNCIA NA ANALISE FATORIAL
392 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
cariam 70° ou mais da variância nas variaveis originais. Cada um dos novos componen-
tes representaria um Iator composto separado.
A analise Iatorial comum utiliza somente as variaveis comuns para derivar uma so-
lucão Iatorial. O obietivo é identiIicar dimensões subiacentes (latentes) reIeridas como Ia-
tores comuns. Se houver subconiuntos das variaveis originais que esteiam mensurando o
mesmo construto subiacente, as novas dimensões comuns serão signiIicativas e interpre-
taveis. Ou seia, poderemos descrever as variaveis originais em termos de suas dimensões
subiacentes comuns. A analise Iatorial comum Ireqüentemente é usada no desenvolvi-
mento de escalas de varios itens para veriIicar se os construtos individuais são verdadei-
ramente unidimensionais (representam um unico construto).
A analise de componentes principais (ACP) e a analise Iatorial comum (as vezes cha-
mada de analise Iatorial exploratoria - AFE) estão disponiveis na maioria dos pacotes es-
tatisticos populares. Se o pesquisador em administracão sabe que as variâncias unica e de
erro são uma porcão relativamente pequena da variância total e deseia reduzir o coniun-
to original de variaveis em um grupo menor de variaveis compostas, então os componen-
tes principais geralmente são usados. Por outro lado, quando pouco se sabe sobre a va-
riância unica e de erro e o pesquisador deseia examinar as variaveis originais em termos
de suas dimensões subiacentes comuns, então a analise Iatorial comum é empregada.
Os Iatores iniciais derivados com o uso de ACP são constituidos principalmente da
variância comum e de uma porcão muito menor da variância unica e de erro. Além dis-
so, as solucões Iatoriais de componentes principais tendem a ser mais estaveis. Por essas
razões, a analise de componentes principais é de longe a abordagem mais usada na pes-
quisa em administracão, de modo que nos concentraremos somente nesse método. Ha di-
versas outras diIerencas analiticas e computacionais entre a ACP e a AFE que estão além
do escopo deste livro. Para mais inIormacões, ver Hair J., et ai., Multivariate Data Analvsis.
With Reaaings. 6
th
Edition, Prentice Hall, 2003.
Rotacão de análise fatorial A solucão inicial em uma analise de componentes principais
não tem rotacão. A solucão sem rotacão produz Iatores independentes (não-correlaciona-
dos), mas que quase sempre são de diIicil interpretacão. Por essa razão, o pesquisador Iaz
a rotacão dos Iatores para obter outra visão de sua estrutura. Ha duas opcões para a rota-
cão de Iatores - rotacão ortogonal ou rotacão oblíqua. Quando escolhemos uma solucão
ortogonal, os Iatores soIrem rotacão de modo a serem independentes uns dos outros, e a
correlacão entre eles é zero. Uma solucão obliqua permite que os Iatores derivados seiam
correlacionados uns com os outros.
A rotacão de Iatores oIerece ao pesquisador diIerentes visões dos mesmos dados. E
semelhante ao processo de girar um pequeno obieto como um diamante nas mãos para
encontrar o melhor ângulo de visão. Ou seia, é o processo que permite compreender me-
lhor. Na analise Iatorial, o termo estrutura simples é usado para descrever os resultados
da analise em que cada variavel original tem uma alta carga de somente um Iator e rela-
tivamente poucas cargas de outros Iatores derivados. Uma carga de Iator representa a
correlacão entre uma variavel original e um Iator derivado. Não ha garantia de que um
determinado coniunto de dados possa produzir uma estrutura simples. Da perspectiva
da mensuracão, no entanto, resultados coerentes com uma estrutura simples Iornecem al-
guma evidência de validade convergente e discriminante. A estrutura simples torna cla-
ro que uma variavel original esta altamente relacionada a somente um Iator latente. Uma
das principais razões para a rotacão de Iatores é examinar se uma estrutura simples pode
ou não ser obtida.
Fatores em rotacão ortogonal e obliqua são ilustrados na Figura 13-4. A linha vertical
representa o Iator sem rotacão dois. A linha horizontal é o Iator sem rotacão um. Os Iato-
res sem rotacão são mostrados em um ângulo de 90°, o que signiIica que não são correia-
CAPÍTULO 13 ‹ OUTRAS TÉCNÌCAS MULTÍVARÌADAS 393
FÌGURA 13-4 ROTAÇÃO ORTOGONAL E OBLÌQUA DE FATORES
cionados. Quando Iazemos a rotacão, mostramos os Iatores movendo-se no sentido hora-
rio. Os Iatores soIrem a rotacão até que cheguem mais perto da intersecão com as varia-
veis que os carregam. Quando Iazemos a rotacão dos eixos iuntos e mantemos o ângulo
de 90°, essa é uma rotacão ortogonal (representada com a linha cheia). Quando Iazemos a
rotacão de cada eixo individualmente e deixamos ambos os eixos Iormarem um ângulo
obliquo (menos de 90°), essa é uma rotacão obliqua (representada com a linha pontilha-
da). Se nosso obietivo de pesquisa é ter Iatores não-correlacionados, então utilizamos
uma rotacão ortogonal - por exemplo, se quiséssemos usar escores de Iator em um mo-
delo de regressão subseqüente como mostramos no Capitulo 4. Por outro lado, se sim-
plesmente queremos representar a estrutura de Iator que retrata a relacão entre as varia-
veis de modo mais aproximado, então usamos a rotacão obliqua. No mundo real, os Iato-
res são quase sempre correlacionados, mas, para atender as suposicões estatisticas de
nosso problema de pesquisa, podemos optar por usar uma rotacão ortogonal e represen-
tar os Iatores como não-correlacionados.
Uma rotacão ortogonal é de longe a abordagem mais usada na pesquisa em adminis-
tracão, por isso concentraremos nossa discussão somente nesse método. Ha diIerentes
opcões para derivar uma solucão ortogonal, mas usaremos a opcão Varimax, ia que ela
também é a mais amplamente empregada. Para sintetizar nossas decisões, usaremos a
analise Iatorial de componentes principais que soIre rotacão ortogonal com base no pro-
cedimento Varimax. Para quem deseia obter mais inIormacões sobre modelos Iatoriais e
abordagens de rotacão, ver Hair J., et. ai , Multivariate Data Analvsis. With Reaaings. 6
th
Edi-
tion, Prentice Hall, 2003.
Número de fatores
Os pesquisadores usam a analise Iatorial em uma tentativa de sintetizar as inIormacões
em muitas variaveis utilizando apenas alguns Iatores. Assim, uma questão importante
envolve o numero de Iatores que são necessarios para eIetivamente representar as varia-
veis. Nosso exemplo do restaurante derivou somente dois Iatores, mas a maioria das si-
394 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
tuacões envolve varios Iatores. Decidir quanto Iatores reter é um procedimento comple-
xo, pois a maior parte dos problemas de analise Iatorial pode ter mais de uma solucão
possivel. Ou seia, uma solucão de quatro Iatores pode ser muito comparavel, e é necessa-
rio discernimento para selecionar o melhor. Discutiremos dois dos métodos mais utiliza-
dos para decidir o numero de Iatores a serem retidos - os critérios de raiz latente e de
porcentagem de variância. Para explicacão de outras abordagens, ver Hair {.. et. ai., Mul-
tivariate Data Analvsis. With Reaaings. 6
th
Edition, Prentice Hall, 2003. Esses dois métodos
são usados iuntamente com a habilidade de interpretar e nomear os Iatores na decisão de
quantos reter.
O método mais largamente usado para decidir o numero de Iatores é o critério de raiz
latente. A raiz latente é a medida da quantidade de variância que um determinado Iator
representa. Esse critério estabelece que, com Iatores da analise de componentes principais
que têm raiz latente (também chamados de autovalores) igual a um ou mais são retidos.
Fatores com raiz latente menor do que um são considerados insigniIicantes e não são re-
tidos. Cada variavel original tem uma variância igual a um. Portanto, se você Iaz a anali-
se de Iator em um coniunto de 12 variaveis, a variância total é 12. Como qualquer Iator re-
tido deve ter uma raiz latente igual a um ou mais, cada Iator mantido representara pelo
menos 8,3° da variância total (1/12 ÷ 8,3°).
O critério da raiz latente é a opcão em aefault na maioria dos programas de software
estatistico. Mas o analista precisa compreender que ela é calculada com base na solucão
sem rotacão. Apos a rotacão, parte da variância dos Iatores anteriores é modiIicada para
Iatores posteriores, que então têm uma raiz latente maior. Assim, se a solucão Iatorial ini-
cial tem quatro Iatores com base no critério de raiz latente, o analista precisara buscar
também uma solucão de cinco Iatores para avaliar. Isso porque, apos a rotacão, o quinto
Iator pode ter um autovalor de um ou mais. Além disso, a rotacão de mais Iatores pode
Iacilitar sua interpretacão.
Um segundo critério para decidir o numero de Iatores a serem mantidos é a porcen-
tagem de variância nos dados originais, que é explicada por todos os Iatores considera-
dos em coniunto. Um pacote de software para analise Iatorial (como o SPSS ou o SAS) Ior-
necera a porcentagem de variacão explicada por cada Iator, bem como a variância total
explicada por todos os Iatores. Um ilustracão das cargas de fatores e de variância extrai-
da é mostrada na Figura 13-5. Trata-se de uma solucão de três Iatores para nossas seis va-
riaveis ae fast fooa. Nesse exemplo, os dois primeiros Iatores são decididamente bons.
Quando reunidos, explicam um total de 69,4° (38,7 ¹ 30,7 ÷ 69,4°) da variabilidade nas
seis variaveis originais, e sua raiz latente esta acima de 1,0. Como o terceiro Iator explica
somente 7,68° da variância e tem uma raiz latente de apenas 0,45, ele não sera retido. Na
verdade, teriamos que executar a analise Iatorial novamente e, ou usar o critério em ae-
fault de retencão de Iatores com raizes latentes maiores do que 1,0, ou buscar somente
dois Iatores de modo a poder eliminar o terceiro Iator.
Quase todos os analistas interrompem a analise Iatorial quando Iatores adicionais
não Iazem mais sentido, pois a variância que explicam Ireqüentemente contém uma gran-
de quantidade de erro. A regra pratica para esse critério é que uma solucão Iatorial deve-
ria explicar um minimo de 60° da variância total. Mas cada situacão pode variar, depen-
dendo dos obietivos da pesquisa, e tanto a menor variância quanto a maior variância ex-
plicadas podem ser iustiIicadas. Em algumas situacões, o acréscimo de mais um Iator pa-
ra atingir o critério de 60° não pode ser iustiIicado porque nenhuma variavel é carrega-
da no Iator (isto é, carga ~ 0,30). Dessa Iorma, o Iator adicionado é chamado de não-inter-
pretavel, e a solucão Iatorial é inaceitavel.
Na maioria das situacões, o numero de Iatores retidos baseia-se no valor da raiz la-
tente, na porcentagem de variância extraida e na habilidade de nomear logicamente os Ia-
tores resultantes. EspeciIicamente, o pesquisador em administracão retém somente Iato-
CAPÍTULO 13 ‹ OUTRAS TÉCNÌCAS MULTÌVARÌADAS 395
res que atingem o critério de raiz latente minima de um, mas a variância total explicada
por todos os Iatores deve ser mais de 60° e os Iatores em rotacão devem ser capazes de
receber um nome logico. Ao aplicar essas três consideracões, por exemplo, o pesquisador
com mais Ireqüência selecionara a solucão de cinco Iatores se todos os Iatores tiverem
uma raiz latente igual a um ou mais. Mas uma solucão de quatro Iatores pode ser escolhi-
da em vez da de cinco Iatores mesmo se o quinto Iator tiver uma raiz latente igual a um.
Em tais casos, a solucão de quatro Iatores deve explicar um minimo de 60° da variância
total, e a logica para nomeacão dos Iatores deve ser mais Iacilmente sustentavel e teorica-
mente correta do que a de cinco Iatores. A meta basica é derivar um coniunto de Iatores
que são teoricamente signiIicativos e relativamente Iaceis de interpretar e que explicam o
maximo possivel da variância original.
Ha inIormacões adicionais na Figura 13-5 que você precisa entender. Os numeros nas
colunas sob cada Iator (e ao lado de cada uma das seis variaveis) são chamados de cargas
de Iatores. O numero na parte inIerior de cada coluna de cargas de Iatores é a soma das
cargas de Iatores ao quadrado, também chamado de autovalor. Para obter esse numero,
você simplesmente eleva cada carga de Iator ao quadrado para um determinado Iator e
soma-os. A soma das cargas de Iatores ao quadrado indica a importância relativa de cada
Iator para explicar a variância no coniunto de variaveis que estão sendo analisadas. Ob-
serve que a soma de quadrados para os Iatores 1,2 e 3 são 2,32,1,83 e 0,45, respectivamen-
te. A porcentagem de traco para cada um dos três Iatores também é mostrada na parte in-
Ierior da tabela. O traco é a quantidade total de variância em uma analise Iatorial. Nesse
caso, o traco é seis (seis variaveis ÷ traco de 6). Para obter a porcentagem de traco, divide-
se a soma de cargas ao quadrado de um Iator pelo traco. Por exemplo, para o Iator 1,2,32
dividido por 6 é igual a 38,7°.
Na extremidade direita da matriz de Iator esta a coluna de comunalidades. Ela repre-
senta a soma das cargas de Iatores ao quadrado. Para obter a comunalidade, elevamos ao
quadrado cada uma das cargas de Iatores para uma variavel (variavel K
=
ã ðôçí
î
õ ð\ç
î
õ
ðôðç ã ðôçï÷ » ¿- -±³¿³±-ò ß ½±³«²¿´·¼¿¼» ¼·¦ ¯«¿²¬± ¼¿ variância em uma determina-
da variavel é explicada pela solucão do Iator (todos os Iatores combinados). Grandes co-
munalidades indicam que uma grande quantidade da variância original em uma dada va-
riavel é explicada pela solucão do Iator. Por exemplo, uma comunalidade de 0,91 para K
=
ÛÈÛÓÐÔÑ ÜÛ ÓßÌÎ×Æ ÚßÌÑÎ×ßÔ ÜÛ ÝÑÓÐÑÒÛÒÌÛÍ ÐÎ×ÒÝ×Ðß×Í ÝÑÓ ROTAÇÃO
VARIMAX
FIGURA 13-5
396 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
- Simpatia indica que a solucão do Iator respondeu por mais variância naquela variavel do
que para a variavel X
5
- Tamanho da porcão, que teve uma comunalidade de apenas 0,65.
Interpretacão de fatores
Para interpretar uma matriz de Iator, examinamos as cargas de Iator. As cargas de Iator
são as correlacões entre cada uma das variaveis originais e os Iatores recém extraidos. Ca-
da carga de Iator é uma medida da importância relativa de uma determinada variavel na
representacão daquele Iator. Semelhante aos coeIicientes de correlacão, as cargas de Iator
podem variar de ¹1,0 a -1,0. Se a variavel X
x
- Simpatia estiver estreitamente associada
com o Fator 1, a carga do Iator sera alta. O software de analise Iatorial executara a analise
estatistica e calculara as cargas de Iator entre cada Iator recém criado e cada variavel ori-
ginal. Uma amostra dos resultados para essa analise estatistica é oIerecida em nosso
exemplo. Na Figura 13-5, as três variaveis X
x
, X
2
e X
3
têm altas cargas no Fator 1. De Ior-
ma parecida, as variaveis X
4
, X
5
e X
6
têm altas cargas no Fator 2. Um pesquisador em ad-
ministracão usaria o padrão de cargas para nomear cada um dos Iatores. Mas, antes que
o padrão para essas variaveis pudessem ser interpretados, a solucão de Iator deveria ser
executada novamente para buscar uma solucão de dois Iatores.
Quais são as orientacões sobre quais cargas de Iatores devem ser usadas na nomea-
cão de um Iator? Quanto maior o valor absoluto de uma carga de Iator, mais importante
ela é na nomeacão e interpretacão de um Iator. Orientacões tipicas usadas por pesquisa-
dores em administracão para importantes cargas de Iator são: ¹/0,30 são considerados
aceitaveis: ¹/0,50 são moderadamente importantes: ¹/0,70 são muito importantes.
Em seguida, designamos um nome para os Iatores resultantes. Para isso, o pesquisa-
dor examina as variaveis que têm as cargas mais altas de cada Iator. O que estamos pro-
curando é um signiIicado subiacente comum entre as variaveis que têm altas cargas de
um dado Iator. Também preIerimos que não haia cargas de variaveis em um Iator que não
esteiam relacionadas com outras variaveis com altas cargas. Em nosso exemplo, as três
variaveis X
x
(simpatia), X
2
(cortesia) e X
3
(competência) Ioram todas carregadas no mes-
mo Iator, que nomeamos como Funcionarios, pois as três variaveis estão relacionadas
com a experiência do cliente com os Iuncionarios do restaurante. De modo semelhante, as
percepcões de sabor (X
4
), tamanho da porcão (X
5
) e Irescor (X
6
) têm altas cargas no mes-
mo Iator, que recebera o nome Comida, pois as três variaveis têm a ver com os pratos que
são servidos no restaurante. Nesse exemplo, os dois Iatores são puros porque cada varia-
vel tem uma alta carga em um Iator e uma carga muito menor nos outros Iatores. InIeliz-
mente, na pratica, muitas vezes uma variavel tera cargas semelhantes em mais de um Ia-
tor. Quando isso acontece, não signiIica que a solucão Iatorial esta incorreta ou não pode-
mos utiliza-la. Simplesmente preIeririamos que uma variavel Iosse carregada em apenas
um Iator porque seria mais Iacil de interpretar, supondo-se que todas as variaveis carre-
gadas em somente um Iator estão de algum modo relacionadas. Quando as variaveis car-
regam em mais de um Iator, porém, a denominacão dos Iatores torna-se complicada.
O processo de nomear Iatores é subietivo. Combina logica e intuicão com a avaliacão
das variaveis com altas cargas em cada Iator. Devido a sua abordagem subietiva, deve-
mos ser cautelosos ao criar nomes para representar os Iatores de Iorma a garantir que os
nomes não representem mal seu signiIicado subiacente.
Exemplo de análise fatorial
Phil Samouel gostaria de saber se poderia simpliIicar seu entendimento das percepcões
dos dois restaurantes reduzindo o numero de variaveis a menos de 12. Isto é, se ele pode
representar as 12 variaveis originais de percepcão (Xi - X
12
) com um numero menor de Ia-
CAPÍTULO 13 ‹ OUTRAS TÉCNÌCAS MULTÌVARÌADAS 397
FIGURA 13-6
DOZE VARIÁVEIS DE PERCEPÇÃO A PARTIR DA SURVEY DE CLIENTES DOS
RESTAURANTES
Abaixo, temos um conjunto de características que poderiam ser usadas para descrever o Samouel's
Greek Cuisine e o Gino's Ristorante. Usando uma escala de 1 a 7, com 7 = "Concorda totalmente"
e 1 = "Discorda totalmente". Até que ponto você concorda ou discorda de que o Samouel's tenha
as seguintes caraterísticas:
398 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
tores signiIicativos. A hipotese nula é a de que as 12 variaveis de percepcão não podem
ser representadas por um coniunto menor de Iatores signiIicativos. As 12 variaveis de
percepcão conIorme mensuradas na survev dos clientes são apresentadas na Figura 13-6.
Vamos examinar primeiro as inIormacões na tabela de estatistica descritiva mostrada
na Figura 13-7. Podemos veriIicar as médias e os tamanhos de amostra para garantir que
os dados Ioram corretamente analisados. Por exemplo, se o tamanho da amostra não é
200, então podemos ter analisado o coniunto errado de dados ou alguns respondentes po-
dem ter sido eliminados devido a dados Ialtantes.
Agora olhamos a tabela de matriz de componentes com rotacão (também chamada
de matriz de fatores com rotacão) mostrada na Figura 13-8. Os nomes das 12 variaveis
analisadas (X
x
- X
12
) aparecem na coluna da esquerda. Observe que a ordem das variaveis
não esta apresentada de 1 a 12, mas sim de acordo com as cargas de cada variavel nos Ia-
tores. Ou seia, as maiores cargas estão no topo da coluna e vão diminuindo até a base. Pa-
ra tornar mais Iacil a interpretacão da solucão de Iatores, não mostramos cargas de Iator
abaixo de 0,30 na matriz. Isso é chamado de "matriz de fácil leitura", pois não mostra as
cargas menores e menos signiIicativas. Nos pacotes comuns de software. essa é uma opcão
que deve ser selecionada. Deve-se compreender que as cargas para todas as variaveis ain-
da estão computadas, mas simplesmente não são mostradas. Fica mais Iacil detectar al-
gum problema com essa estrutura simples quando essa opcão é selecionada.
A direita da descricão das variaveis, ha colunas de numeros representando as cargas
de Iator para uma solucão de quatro Iatores. Somente podemos ver três numeros para ca-
da um dos Iatores. Isso porque todas as outras cargas de Iator estão abaixo de 0,30 e não
são mostradas nessa matriz de Iacil leitura . Como você deve lembrar, nossa preIerên-
cia é por uma solucão simples (pura) em que cada variavel original carrega em somente
um Iator, e é o que acontece em nosso exemplo. Mas em muitos casos isso não acontece.
Ao contrario, uma ou mais variaveis carregarão em dois Iatores.
Antes de tentar nomear os Iatores, vamos decidir se quatro Iatores são suIicientes
ou se precisamos de mais. Nosso obietivo aqui é ter o menor numero possivel de Iato-
res, mas que respondam por uma quantidade razoavel das inIormacões contidas nas 12
variaveis originais. Agora olhamos as inIormacões apresentadas na tabela de variância
total explicada (ver Figura 13-8). Ela mostra que quatro Iatores respondem por 74,614°e
da variância nas 12 variaveis originais. Isso é mais do que a quantidade minima de va-
riância que devemos explicar (60°), e reduzimos o numero de variaveis originais para
cerca de dois tercos - de 12 para quatro, por isso, vamos veriIicar se nossos Iatores pa-
recem logicos.
Para determinar se nossos Iatores são logicos e teoricamente signiIicativos, veriIica-
mos as variaveis originais que se combinam para Iormar os novos Iatores. O Iator 1 é Ior-
mado por X
4
- Sabor, X
9
- Variedade do cardapio e X, - Qualidade da comida. O Iator 2 é
constituido por X
6
- Funcionarios simpaticos, X
u
- Funcionarios cordiais e X
12
- Funcio-
narios competentes. O Iator 3 compõe-se de X
8
- Lugar divertido, X
2
- Ambiente atraente
e X
7
- Limpeza e organizacão, enquanto que o Iator 4 consiste de X
3
- Porcões generosas,
X
5
- Valor do dinheiro e X
10
- Precos razoaveis. Para analisar a logica das combinacões,
veriIicamos as variaveis com as maiores cargas (maiores tamanhos absolutos). Essa é a ra-
zão por que apenas as cargas iguais ou superiores a 0,30 são exibidas na Figura 13-8. O Ia-
tor 1 esta relacionado com Comida , o Iator 2 esta relacionado com Funcionarios, e o Ia-
tor 3 esta relacionado com Ambiente . O Iator 4 consiste das variaveis reIerentes as por-
cões e aos precos. E um pouco mais diIicil de interpretar, mas ainda é logico. Recebeu o
nome de Valor . A logica desse nome é que os clientes que percebem as porcões como
sendo um pouco maiores também acreditam que os precos são relativamente mais razoa-
veis (correlacão positiva entre as variaveis). No todo, os clientes acreditam que as porcões
são aceitaveis, mas necessariamente boas (média ÷ 3,89 em uma escala de sete pontos).
Para as variaveis de preco, as médias são ligeiramente superiores, mas ainda não muito
CAPÍTULO 13 ‹ OUTRAS TÉCNÌCAS MULTÍVARÌADAS 399
ESTATÍSTICA DESCRITIVA PARAA SURVEY DE FUNCIONÁRIOS
Método de extração: Análise de componentes principais. Método de rotação: Varimax.
Variância totaI expIicada
Iavoraveis (média para Valor ÷ 4,33 e para Precos razoaveis ÷ 4,06). Dessa Iorma, decidi-
damente ha espaco para melhoria no modo como os clientes percebem o valor de seu di-
nheiro.
A analise Iatorial das 12 variaveis de percepcão desenvolveu uma solucão de quatro
Iatores. Os quatro Iatores respondem por uma quantidade aceitavel de variância (acima
FIGURA 13-7
SOLUÇÃO DE FATOR COM ROTAÇÃO PARA AS PERCEPÇÕES NA SURVEY DE CLIENTES
Componentes (fatores)
FIGURA 13-8
400 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
PESQUISA EM AÇÃO
USO DE SPSS NO DESENVOLVIMENTO DE UMA SOLUÇÃO DE FATOR PARA A
SURVEY DE CLIENTES
Para essa analise, usamos todos os 200 respondentes e não dividimos a amostra. Isso porque esta-
mos procurando padrões comuns no coniunto de todos os clientes dos restaurantes. A seqüência de
cliques em SPSS é: ANALYZE -~ DATA REDUCTION -»FACTOR, o que leva a uma caixa de dialo-
go onde você seleciona as variaveis de X
1
a X
12
. Depois de coloca-las na caixa Variables, veia as alter-
nativas embaixo. Clique primeiro na caixa Descriptives e depois na Univariate Descriptives. Desa-
tive a caixa Initial Solution, pois não a examinaremos, e então clique em Continue. A seguir, clique
na caixa Extraction. Usaremos o método em aefault de Principal Components e o aefault Extraction
de autovalores acima de 1: desative a solucão de Iator sem rotacão em Display e clique em continue.
Depois, va a caixa Rotation, onde o aefault é None. Como Iaremos a rotacão da solucão de Iator ini-
cial, clique em Varimax como sua opcão para rotacão (isso remove o aefault None) e em Continue.
Finalmente, va até a caixa Options e clique em Sorted by Size, mude Supress Absolute Values me-
nores do que 0,10 para 0,3 e clique em continue. As duas ultimas opcões tornam mais Iacil a leitura
dos resultados porque eliminamos inIormacões que não utilizaremos. Não calcularemos escores
neste momento, de modo que podemos clicar em OK para rodar o programa. Os resultados deve-
rão ser os mesmos exibidos nas Figuras 13-7 e 13-8.
de 60°) e apresentam logica nas combinacões das 12 variaveis originais. Com essa solu-
cão de quatro Iatores, em vez de termos que pensar em 12 variaveis, podemos agora pen-
sar sobre apenas quatro - Comida, Funcionarios, Ambiente e Valor.
Ha ainda um topico Iinal para tratarmos na interpretacão de uma matriz de Iatores.
Em nosso exemplo, todas as cargas de Iatores Ioram positivas. Como as cargas de Iatores
são iguais aos coeIicientes de correlacão, elas podem ter um sinal positivo (¹) ou negati-
vo (-). Não é raro ter algumas variaveis com cargas positivas e outras com cargas negati-
vas no mesmo Iator. Se uma variavel tem uma carga com sinal negativo, signiIica que es-
ta negativament e relacionada com aquele Iator. Como os Iatores são ortogonalmente in-
dependent es, uma carga negativa para uma variavel no primeiro Iator não tem nenhuma
relacão com os outros Iatores na solucão.
A simpliIicacão e a reducão das 12 variaveis de percepcão originais a quatro Iatores
poderi am ser um Iim em si. Em outras palavras, poderiamos concluir que, reduzindo-se
as 12 variaveis a soment e quatro Iatores, teriamos alcancado nosso obietivo de pesquisa.
Em alguns casos, no entanto, podemos deseiar utilizar os novos Iatores como variaveis
i ndependent es em uma analise discriminant e ou de regressão. O novo obietivo de pes-
quisa, então, seria veriIicar se as quatro variaveis de Iator poderi am prever com precisão
uma unica variavel dependent e, como a satisIacão ou a probabilidade de recomendar o
restaurante a um amigo. Damos um exemplo de tal situacão no Capitulo 14.
ANALÌSE DE CONGLOMERADOS
A analise de conglomerados é uma técnica multivariada de interdependência. Ela possi-
bilita combinar obietos (por exemplo, individuos, marcas, loias) em grupos de Iorma que
os obietos em cada grupo seiam semelhantes entre si e diIerentes dos obietos dos outros
grupos. A analise de conglomerados combina obietos para que t enham alta homogenei-
dade interna (dentro do conglomerado) bem como alta heterogeneidade externa (entre
aglomerados). Quer dizer, a analise de conglomerados tenta identiIicar agrupamentos na-
turais usando diversas variaveis. Mas nenhuma das variaveis é considerada como varia-
vel dependent e ou independente. Se a analise Ior bem-sucedida, os obietos dentro dos
CAPÍTULO 13 ‹ OUTRAS TÉCNÌCAS MULTÌVARÌADAS 401
conglomerados estarão muito proximos e os obietos em diIerentes conglomerados esta-
rão muito distantes.
Para melhor explicar o processo da analise de conglomerados, vamos usar um exem-
plo intuitivo. O Sam's Clubs® esta interessado em identiIicar clientes que, quando Iazem
compras, são dominados ou impulsionados pelos precos baixos e oIertas. Para isso, a em-
presa conduziu uma survev de individuos em um raio de cinco milhas de dez de suas lo-
ias. No questionario, ha perguntas como com que Ireqüência você usa cupons do ior-
nal? , com que Ireqüência você usa cupons enviados pelo correio? , com que Ireqüên-
cia você compra em loias que anunciam precos baixos? , etc. A empresa também coletou
inIormacões demograIicas, tais como idade, renda, escolaridade, etc. Depois de coletar os
dados, seu analista estatistico Iaz a analise de conglomerados nas questões relativas a Ire-
qüência de uso de cupons e de compras Ieitas com base em oIertas e precos baixos. A ana-
lise de conglomerados identiIica grupos de individuos que são mais motivados por oIer-
tas de cupons e precos baixos e os que não são. Em vez de usar abordagens arbitrarias co-
mo a média ou a mediana, a analise de conglomerados identiIica os agrupamentos natu-
rais onde os individuos de cada conglomerado são mais semelhantes. Assim Iazendo, o
Sam's Clubs pode identiIicar um ou mais segmentos de economias domésticas mais incli-
nadas a comprar oIertas em suas loias. Assim que o segmento motivado pelo preco é
identiIicado, a publicidade, os produtos e os servicos da empresa podem ser adequados
para atrair esses clientes.
A Figura 13-9 identiIica três conglomerados ou segmentos potenciais para o Sam's
Clubs. O conglomerado 1 contém economias domésticas que raramente compram oIertas
ou usam cupons, o conglomerado 2 inclui economias domésticas que ocasionalmente
aproveitam as oIertas, e o conglomerado 3 apresenta as economias domésticas que Ire-
qüentemente compram com base nos precos baixos e utilizam cupons. Observe que os
conglomerados 1 e 3 são muito diIerentes (nenhuma sobreposicão), enquanto que os con-
glomerados 2 e 3 têm alguma semelhanca (grande sobreposicão). Examinando as carac-
teristicas associadas com cada conglomerado, a administracão do Sam's Clubs pode de-
cidir quais conglomerados obietivar e a melhor maneira de atingi-los através de suas /2ó
Ú×ÙËÎß ïíóç TRÊS CONGLOMERADOS DE TIPOS DE COMPRADORES
402 FUNDAMENTOS DE MÉTODOS DE PESQUÍSA EM ADMÌNÌSTRAÇÃO
municacões de marketing. Nesse caso, o Sam's Clubs decididamente teria como alvo o
conglomerado 3 e possivelmente o conglomerado 2.
A analise de conglomerados é util para o pesquisador em administracão em muitas
situacões diIerentes. Por exemplo, uma empresa que coletou dados de survev muitas ve-
zes encara um grande numero de observacões em que é diIicil identiIicar padrões, a me-
nos que grupos menores e mais homogêneos seiam identiIicados. O pesquisador poderia
usar a analise de conglomerados para identiIicar grupos como o de Iuncionarios que são
leais e altamente comprometidos versus os que não o são, boas chances de crédito versus
mas chances de crédito, Iuncionarios altamente satisIeitos versus Iuncionarios insatisIei-
tos, etc. A analise de conglomerados pode ser usada para desempenhar essa tareIa a par-
tir de critérios obietivos em vez de bases arbitrarias»
Derivação de conglomerados
Os conglomerados podem ser desenvolvidos a partir de graIicos de dispersão. Mas esse
processo é demorado e inclui tentativa e erro, rapidamente tornando-se tedioso a medida
que a amostra aumenta. Felizmente, existem pacotes de software disponiveis para esse Iim
que podem ser usados para eIicientemente executar o processo. A matematica subiacente
aos diversos procedimentos de conglomerados esta além do escopo deste livro. Mas todos
os procedimentos são baseados no conceito de partir de alguns limites em torno do coniun-
to inicial de elementos (respondentes individuais que se encontram distanciados) e aiustar
esses limites até que as distâncias dentro das Ironteiras do conglomerado (dentro da varia-
cão do conglomerado) seiam as menores possiveis em relacão as distâncias médias entre
conglomerados. A Figura 13-10 mostra a variacão entre e dentro de conglomerados. Portan-
to, a abordagem geral para os programas de conglomerados é semelhante e envolve a men-
suracão da semelhanca (ou diIerenca) entre obietos com base em uma medida de distância.
A analise de conglomerados envolve três Iases separadas. A primeira Iase divide a
amostra total em subgrupos menores. A segunda Iase veriIica se os grupos são estatisti-
camente diIerentes e teoricamente signiIicativos. A terceira Iase Iaz o perIil dos conglome-
rados descrevendo as caracteristicas de cada um em termos de demograIia, psicograIia
ou outras caracteristicas relevantes.
Fase 1
Durante essa Iase, devemos responder três perguntas. Como medimos as distâncias en-
tre os obietos que estamos aglomerando? Que procedimento sera usado para agrupar ob-
VARÌAÇÃO ENTRE E DENTRO DE CONGLOMERADOS Figura 13-10
CAPÍTULO 13 « OUTRAS TÉCNÌCAS MULTÌVARÌADAS 403
ietos semelhantes em conglomerados? Quantos conglomerados serão derivados? InIeliz-
mente, ha muitas respostas diIerentes para essas perguntas e, dependendo das circuns-
tâncias, mais de uma delas pode estar correta. Portanto, daremos algumas orientacões ge-
rais e indicaremos outra Ionte para mais detalhes: Hair {.. et. ai., Multivariate Data Analv-
sis. With Reaaings. 6
th
Edition, Prentice Hall. 2003.
As distâncias entre os obietos que estamos aglomerando podem ser medidas de va-
rias maneiras. A medida mais comumente usada é a distância Euclidiana. Outras opcões
incluem as distâncias Euclidianas ao quadrado, a soma das diIerencas absolutas e a dis-
tância Mahalanobis. Muitos estatisticos recomendam a Mahalanobis como a melhor me-
dida, mas poucos pacotes estatisticos incluem essa opcão. As distâncias Euclidianas ao
quadrado apresentam o menor numero de pontos Iracos entre as medidas restantes, de
Iorma que a recomendaremos aqui. Antes de rodar o programa de conglomerados, suge-
rimos que você identiIique e remova pontos extremos onde Ior apropriado, ia que os pro-
cedimentos de conglomerados são muito sensiveis a eles. Também recomendamos que
você padronize as variaveis incluidas na analise de conglomerados se elas Iorem medidas
em escalas com diIerentes unidades de mensuracão. Por exemplo, se você estiver usando
duas variaveis para desenvolver conglomerados, com uma sendo a satisIacão mensura-
da em uma escala de sete pontos e a outra a quantidade comprada medida em uma esca-
la de 1-100, você devera padronizar os dados antes de proceder a analise de conglomera-
dos. Senão, a quantidade comprada tera um peso maior, pois a variacão de respostas pos-
siveis é muito mais ampla.
Uma segunda questão que devemos responder na Iase 1 é qual procedimento sera
usado para agrupar obietos semelhantes. Muitas abordagens estão a disposicão, mas to-
das elas podem ser classiIicadas em dois tipos: hierarquicas e não-hierarquicas. Ambos os
tipos tentam maximizar as diIerencas (distâncias) entre conglomerados em relacão a va-
riacão dentro deles, como mostra a Figura 13-10.
Conglomerado hierárquico Um procedimento de conglomerado hierárquico desenvol-
ve uma hierarquia ou um modelo em Iormato de arvore. Isso pode ser Ieito utilizando-se
uma abordagem construtiva ou uma abordagem divisoria. A abordagem construtiva,
também chamada de aglomerativa, inicia com todos os obietos (respondentes) como con-
glomerados separados e os combina um de cada vez até que haia apenas um conglome-
rado representando todos os obietos. A abordagem divisória inicia com todos os obietos
como um unico conglomerado e então retira um obieto de cada vez até que cada obieto
esteia em um conglomerado separado. Discutiremos somente a abordagem aglomerativa,
que é mais amplamente utilizada.
A Figura 13-11 ilustra a abordagem construtiva (aglomerativa) para uma amostra de
cinco obietos. A ilustracão é chamada de dendograma, ou graIico em Iorma de arvore.
Observe que os obietos 4 e 5 combinam-se para Iormar o primeiro conglomerado (linhas
verticais indicam onde dois obietos se combinam). Os obietos 2 e 3 combinam-se a seguir
para Iormar o segundo conglomerado. Então o obieto 1 combina-se com o conglomerado
anteriormente Iormado pelos obietos 2 e 3. O estagio Iinal é quando os obietos 1, 2 e 3
combinam-se com os obietos 4 e 5 para Iormar um conglomerado.
Os pacotes de software estatistico comuns incluem varias opcões diIerentes para cal-
cular conglomerados aglomerativos. Exemplos dessas opcões incluem: ligacão entre gru-
pos, ligacão dentro de grupo, vizinho mais proximo, vizinho mais distante, centeriods,
mediana e Ward. Cada uma dessas opcões calcula as distâncias entre conglomerados de
maneira diIerente, tem pontos Iortes e pontos Iracos e Ireqüentemente produz diIerentes
resultados. Um exame de cada método esta além do escopo desse livro. Recomendamos
Hair J., et. ai., Multivariate Data Analvsis. With Reaaings. 6* Edition, Prentice Hall, 2003 pa-
ra explicacões adicionais. O método de Ward é muito popular e, mais do que outros mé-
todos, tende a resultar em conglomerados com aproximadamente o mesmo numero de
obietos. Portanto, recomendamos que você o utilize primeiro e talvez tente as outras
404 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
DENDOCRAMA PARA ANÁLISE DE CONGLOMERADOS HIERÁRQUICA
abordagens para Iins de comparacão. Hair J., et. ai., Multivariate Data Analvsis. With Rea-
aings. 6 Edition, Prentice Hall, 2003.
Conglomerado não-hierárquico Os procedimentos de conglomerados não-hierárqui-
cos, chamados de conglomerados K-means, não envolvem o processo em Iorma de arvo-
re do conglomerado hierarquico. Em vez disso, um ou mais elementos de conglomerado
(pontos de partida) são selecionados, e obietos dentro de uma distância pré-especiIicada
dos elementos iniciais do conglomerado são considerados como pertencentes a um deter-
minado conglomerado. Um elemento inicial pode ser um unico obieto (respondente) que
é escolhido como centro de um novo conglomerado ou varios obietos que, iuntos, repre-
sentam o ponto inicial.
Varios procedimentos diIerentes podem ser usados para executar o conglomerado
não-hierarquico. Eles diIerem, dependendo do numero de elementos inicialmente sele-
cionados, da seqüência em que Ioram selecionados e se um unico obieto pode ser redesig-
nado a um outro conglomerado Iormado posteriormente, ia tendo sido designado a um
conglomerado Iormado antes. De Iato, uma vantagem de alguns procedimentos de con-
glomerado não-hierarquicos é a de que os obietos podem ser removidos de um conglo-
merado anterior e redesignados a um outro conglomerado Iormado depois na seqüência.
Isso não é possivel com procedimentos hierarquicos. A redesignacão de obietos pode ser
uma desvantagem, no entanto, ia que exige mais capacidade de computacão e, com gran-
des amostras, pode não ser possivel em um PC. Mas a desvantagem mais signiIicativa do
conglomerado não-hierarquico é a Ialta de um método obietivo, teoricamente baseado,
para identiIicar os elementos iniciais do conglomerado. Por causa disso, os procedimen-
tos hierarquicos são muito mais usados, e vamos nos concentrar neles no restante de nos-
sa discussão.
Uma ultima pergunta a ser respondida na Iase 1 é quantos conglomerados devem
ser retidos. As vezes, o pesquisador pode saber com antecedência que deseia dois, três
ou algum outro numero de conglomerados. Outras vezes, pode haver consideracões
teoricas que sugerem o numero adequado de conglomerados. Ainda em outras oca-
siões, o pesquisador pode examinar até onde as variâncias de erro são reduzidas a me-
dida que se passa de um numero menor de conglomerados para um numero maior. As
variâncias de erro são muito grandes com um conglomerado, mas caem substancial-
mente quando se escolhe uma solucão de dois conglomerados. A medida que se passa
de dois conglomerados para três, quatro e assim por diante, as variâncias de erro con-
tinuam a cair, mas não tão rapidamente. Como um numero menor de conglomerados é
FÌGURA 13-11
CAPÍTULO 13 ‹ OUTRAS TÉCNÌCAS MULTÌVARÌADAS 405
mais Iacil de avaliar, recomendamos a execucão de solucões de dois, três e quatro con-
glomerados e a selecão daquele que Ior mais logico e que mais estreitamente atingir os
obietivos da pesquisa.
Fase 2
Depois de determinar o numero de conglomerados a reter, veriIica-se que os grupos são,
na verdade, estatisticamente diIerentes e teoricamente signiIicativos. Esse processo en-
volve a execucão de testes estatisticos das diIerencas entre as médias dos conglomerados
escolhidos. Se uma ou mais médias das variaveis usadas na analise de conglomerado Ior
estatisticamente signiIicativa, então examina-se a logica das diIerencas nas médias de
grupo para seus signiIicados subiacentes. Por exemplo, lembre-se de que o Sam's Clubs
estava interessado em identiIicar individuos que reagiriam as oIertas de cupons e de des-
contos. Se o Sam's Clubs executa uma solucão de dois conglomerados e examina as mé-
dias, a administracão espera encontrar um conglomerado que Ireqüentemente utiliza cu-
pons e que responde as oIertas de precos baixos e um outro grupo que pode ser menos
sensivel a tais apelos. Se os grupos demonstram essa logica e são estatisticamente diIeren-
tes, então a solucão de dois grupos é validada e podemos rotular um grupo como Sensi-
veis ao preco e o outro como Insensiveis ao preco ou usar outros rotulos semelhantes.
Fase 3
A terceira Iase na analise de conglomerados examina a demograIia e outras caracteristi-
cas dos individuos em cada conglomerado e tenta explicar por que os obietos Ioram agru-
pados de uma determinada maneira. Por exemplo, imaginariamos que o grupo Sensi-
veis ao preco , identiIicado acima, talvez tivesse rendas mais baixas ou sentisse mais pra-
zer em comprar oIertas. Por outro lado, o grupo Insensiveis ao preco provavelmente te-
ria rendas mais altas e menos prazer em procurar as melhores oIertas. Esse processo é as
vezes chamado de perIil de conglomerados. Como no exemplo com o Sam's Clubs, 2
°»®º·´ ¼» ®»-«´¬¿¼±- ¼¿ analise de outros conglomerados pode permitir ao pesquisador
em administracão identiIicar Iuncionarios com maior probabilidade de serem promovi-
dos rapidamente, as acões com maior probabilidade de exceder a média Dow Jones In-
dustrial ou os setores de uma Iabrica com maior probabilidade de entrar em greve.
Exemplo de analise de conglomerados
Phil Samouel esta tentando decidir entre usar ou não diIerentes abordagens administra-
tivas com diIerentes clientes. De uma perspectiva de pesquisa em administracão, isso im-
plica uma questão de pesquisa que considere se ha diIerentes subgrupos (segmentos) de
clientes de restaurantes que exibem percepcões distintas. Ao discutir o problema com seu
consultor, ele observa que as variaveis X
a
a X
12
são percepcões dos clientes mensuradas
metricamente. A tareIa é determinar se ha subgrupos ou conglomerados dos 200 respon-
dentes que seiam distintos. Poderiamos proceder a técnica de conglomerados usando to-
das as 12 variaveis de percepcão. Mas o uso de um numero menor de variaveis oIerecera
um exemplo mais Iacil de compreender. Também estara mais concentrado em um unico
conceito em vez de varios conceitos relacionados, mas diIerentes, representados pelas 12
variaveis de percepcão (lembre-se de que, em nossa analise Iatorial, identiIicamos quatro
Iatores/conceitos diIerentes).
406 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
Ao selecionar quais variaveis de percepcão para analisar, procurariamos as que estão
relacionadas logicamente. Também poderiamos considerar os resultados de nossa anali-
se Iatorial na secão anterior. Das 12 variaveis, as três reIerentes a comida (sabor, varieda-
de e qualidade) estão relacionadas, assim como as três relativas aos Iuncionarios (simpa-
tia, cortesia e competência). Vamos trabalhar com as três variaveis dos Iuncionarios - XV
X
u
e X
12
. O obietivo da pesquisa sera então tentar identiIicar conglomerados de respon-
dentes que tenham percepcões diIerentes em relacão aos Iuncionarios do restaurante. A
hipotese nula é a de que não existem diIerentes conglomerados com base nas variaveis de
percepcão dos clientes quanto aos Iuncionarios do restaurante.
Exemplo - Fase 1 O consultor administrativo de Phil recomendou que a abordagem pa-
ra analise de conglomerados seia o método de Ward e que a mensuracão seia em distân-
cias Euclidianas ao quadrado. Essas recomendacões Iundamentam-se em seu trabalho
anterior, semelhante a essa questão de pesquisa. O proximo passo é decidir o numero de
conglomerados a manter na solucão.
Quando as percepcões dos Iuncionarios são examinadas como um unico grupo, ge-
ralmente ha muito erro associado com o grupo, pois estamos combinando muita variabi-
lidade. Quando separamos o grupo unico em dois, o erro é reduzido substancialmente e
continua a diminuir a medida que mais grupos (conglomerados) são identiIicados. A re-
ducão no erro é mensurada por um coeIiciente de erro. A Figura 13-12 mostra os coeIi-
cientes de erro associados com o conglomerado de variaveis dos Iuncionarios a partir da
survev dos clientes. Os numeros nessa coluna demonstram quanto erro é reduzido pas-
sando-se de um conglomerado para dois, de dois para três, etc. Quando comparamos os
coeIicientes para solucões de um e de dois conglomerados, vemos uma grande queda (di-
Ierenca) no coeIiciente de erro. Cada vez que subimos na coluna, a queda (diIerenca) nos
numeros Iica menor. Ao comparar os coeIicientes, estamos procurando o ponto onde a di-
Ierenca entre eles torna-se substancialmente menor. Pequenas quedas no coeIiciente de
erro não iustiIicam um maior numero de conglomerados.
Como exemplo (ver Figura 13-12), se a diIerenca nos coeIicientes de erro entre uma
solucão de três conglomerados e uma solucão de quatro Ior pequena, o erro não tera sido
reduzido o suIiciente. Em nossa analise de conglomerados das variaveis de percepcão
dos Iuncionarios, a mudanca é um tanto pequena entre três conglomerados (÷ 251,618) e
quatro (÷203,529), urna diIerenca de somente 48,089 (251,618 - 203,529 - 48,089). A diIe-
renca entre os numeros quando passamos de três para quatro conglomerados é relativa-
mente pequena, e uma solucão de quatro conglomerados é muito mais diIicil de interpre-
tar. Para essa solucão, portanto, decididamente escolheriamos três conglomerados em
vez de quatro.
Uma outra opcão é decidir entre dois e três conglomerados. Quando passamos de
dois para três, ha uma queda no coeIiciente de erro igual a 66,969 (318,587 - 251,618 ÷
66,969). De Iorma semelhante, quando dois conglomerados são Iormados a partir de um,
observa-se uma queda de 356,143 (674,730 - 318,587 ÷ 356,143). Certamente dois conglo-
merados poderiam ser usados, pois reduziriamos muito o erro passando de um para dois
| COEFICIENTES PE ERRO PARA SOLUÇÕES PE CONGLOMERADOS
Coeficientes de erro Redução de erro
Quatro congíomerados = 203,529 3 - 4 conglomerados =48,089
Três conglomerados =251,618 2 - 3 conglomerados = 66,969
Dois congíomerados =318,587 1 -2 conglomerados =356,143
Um conglomerado = 674,730
FÌGURA 13-12
CAPÍTULO 13 ‹ OUTRAS TÉCNÌCAS MULTÌVARÌADAS 407
PESQUISA EM AÇÃO
USO DE SPSS PARA ÌDENTÌFÌCAR CONGLOMERADOS PARA AS VARÌÁVEÌS DE
PERCEPÇÃO SELECÌONADAS NA SURVEY DE CLÌENTES
Para esse exemplo, analisamos a amostra total porque estamos procurando subgrupos entre to-
dos os clientes dos restaurantes. A seqüência de cliques em SPSS é: ANALYZE ‰~ CLASSIFY ‰~
HIERARCHICAL CLUSTERS. Isso levara a caixa de dialogo onde você seleciona as variaveis X
6
,
X
n
e X
12
e coloca-as na caixa Variables. Observe as outras opcões abaixo. Usaremos todos os ae-
faults mostrados na caixa de dialogo, bem como os aefaults para as opcões Statistics e Plots abai-
xo. A seguir, clique na caixa Methods e selecione Ward embaixo de Cluster Method (é a ultima).
Squared Euclidean Distances é o aefault sob Measure, e nos o utilizaremos. Agora não precisare-
mos da opcão Save, por isso clique em OK para rodar o programa.
Quando o programa terminar, procure uma tabela chamada Agglomeration Schedule. Ha varios
numeros nela, mas so utilizamos os da coluna CoeIIicients (na parte central da tabela). Na parte in-
Ierior da tabela, localize os numeros da coluna CoeIIicients. O numero bem de baixo sera o maior. A
medida que você sobe pela coluna, os numeros (coeIicientes de erro) Iicam menores. Por exemplo,
o numero bem de baixo é 674,730, e o que precede é 318,587. Os demais numeros são mostrados na
Figura 13-12.
conglomerados, e dois podem ser mai s Iaceis de ent ender do que três. Nesse exemplo,
poderi amos usar uma solucão de dois ou de três conglomerados. A decisão por uma so-
lucão de três conglomerados estaria baseada no que Iosse mais util para planeiar uma no-
va estratégia administrativa. Isto é, se houver logica administrativa em usar três grupos,
então a queda na variânci a de erro sera suIiciente para considerar uma solucão de três
congl omerados.
Exemplo - Fase 2 Phil e seu consultor administ rat ivo conversaram e concordaram que,
com base em outros est udos e em seu discernimento, inicialmente devem examinar uma
solucão de doi s conglomerados. Na Iase 2, devemos veriIicar se os dois grupos são esta-
tisticamente diIerentes e teoricamente signiIicativos.
PESQUISA EM AÇÃO
USO DE PROGRAMA ANOVA SPSS PARA COMPARAR MEDÌAS DE GRUPOS
Para esse procedimento, primeiro devemos criar uma nova variavel que nos indique a qual conglo-
merado cada um dos 200 respondentes Ioi designado. Use a seqüência SPSS: ANALYZE ‰~ CLAS-
SIFY ó3â Ø×ÛÎßÎÝØ×ÝßÔ ÝÔËÍÌÛÎå ½´·¯«» ²¿ ½¿·¨¿ Í¿ª»ò Í«¿- opcões são criar uma nova variavel
de participacão em um conglomerado para uma unica solucão ou para uma série de solucões. Cli-
que em Single Solution e coloque um 2 na caixa. Isso criara uma variavel de participacão em um
grupo para a solucão de dois grupos. A nova variavel esta localizada na extremidade direita de seu
coniunto de dados e é chamada de clu2l. Você vera um 1 para respondentes designados ao conglo-
merado 1 e um 2 para os designados ao conglomerado 2.
Agora devemos determinar se as médias das variaveis dos Iuncionarios são signiIicativamente di-
Ierentes. Para isso, executamos uma ANOVA de um Iator usando a nova variavel de participacão em
um conglomerado. A hipotese nula é a de que não ha diIerencas nas médias dos grupos. A seqüência
de cliques é: ANALYZE -~ COMPARE MEANS -» ONE-WAYANOVA. Em seguida, destaque as va-
riaveis X
6
, X
n
e X
12
e coloque-as na caixa Variables. Depois posicione a nova variavel de participacão
em um conglomerado na caixa Factor. Essa é a nova variavel em seu coniunto de dados chamada
clu2l. Clique na caixa Options e depois em Descriptives. Usamos os aefaults para todas as outras op-
cões, por isso, clique em OK para executar o programa. Os resultados são mostrados na Figura 13-13.
408 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
As inIormacões da tabela descritiva na Figura 13-13 mostram os tamanhos das amos-
tras para cada conglomerado (N) e as médias de cada variavel para cada um deles. Por
exemplo, o tamanho da amostra do conglomerado 1 é 101, e para o conglomerado 2 é 99.
Além disso, a média para X
6
- Simpatia no conglomerado 1 é 4,61, enquanto que no con-
glomerado 2 a média é 2,68. As médias para cortesia e competência têm um padrão seme-
lhante - mais altas no conglomerado 1 do que no 2. Para ver se as diIerencas entre as mé-
dias dos grupos são estatisticamente signiIicativas, vamos a tabela ANO VA na Figura 13-
13. As diIerencas nas médias dos conglomerados para todas as variaveis de Iuncionarios
são altamente signiIicativas (0,000). Assim, reieitamos a hipotese nula, que supunha a ine-
xistência de diIerencas.
Comparamos as médias das variaveis para cada um dos grupos para entender os
conglomerados. Os respondentes no conglomerado 1 percebem os Iuncionarios como
sendo muito mais simpaticos (média do grupo 1 ÷ 4,61 versus média do grupo 2 ÷ 2,68).
bem como mais cordiais (média do grupo 1 ÷ 2,83 versus média do grupo 2 ÷ 1,53). Desta
Iorma, o conglomerado 1 apresenta percepcões muito mais Iavoraveis dos Iuncionarios
do que o conglomerado 2. Mas, o que é interessante, em uma escala de sete pontos (7 ÷
muito Iavoravel), os Iuncionarios têm ainda muito para melhorar (em muitos casos, estão
bem abaixo da média de 3,5).
Na Iase 2, conseguimos identiIicar diIerentes conglomerados. Mais ainda, as solucões
de conglomerados são teoricamente signiIicativas porque podemos dizer que o grupo 1
apresenta percepcões signiIicativamente mais Iavoraveis em relacão aos Iuncionarios do
que o grupo 2. Assim, agora podemos passar para a Iase 3, de modo que Phil possa utili-
zar essas descobertas em seu plano administrativo.
Exemplo - Fase 3 A Iase 3 da analise de conglomerados envolve o perIil das caracteristi-
cas demograIicas dos conglomerados. Pode-se executar uma ANOVA de um Iator entre
os dois conglomerados para comparar os perIis demograIicos.
A tabela descritiva na Figura 13-14 apresenta as médias das variaveis demograIicas
para cada conglomerado, e a tabela ANOVA mostra os testes estatisticos de diIerencas.
FIGURA 13-13 CARACTERÍSTICAS DE SOLUÇÃO DE CONGLOMERADOS DE DOIS GRUPOS
CAPÍTULO 13 ‹ OUTRAS TÉCNÌCAS MULTÌVARÌADAS 409
Não ha diIerencas estatisticas entre os grupos quanto ao gênero (0,895). Contudo, existem
diIerencas signiIicativas quanto a idade, renda e concorrência. Lembre-se de que as per-
cepcões do conglomerado 2 eram muito menos Iavoraveis do que as do conglomerado 1.
Sendo assim, os clientes mais velhos e com maior renda percebem os Iuncionarios de ma-
neira muito menos positiva do que os mais iovens e de menor renda. De Iorma semelhan-
te, o conglomerado 2 tem mais clientes do Samouel's, enquanto que o conglomerado 1 tem
mais clientes do Gino's (os do Samouel's são codiIicados com 0, e os do Gino's são codiIi-
cados com 1). Interpretando as médias das variaveis demograIicas de conglomerado, pa-
rece que o grupo de mais idade tem 40 anos ou mais (média ÷ 3,30) e renda média anual
proxima de 75.000 dolares ou mais (média ÷ 3,80). Para Iazer essas interpretacões, deve-
mos examinar como essas variaveis Ioram codiIicadas, como é mostrado no Apêndice 1-B.
A solucão de dois conglomerados poderia Iinalizar a analise. Ou poderiamos prosse-
guir e examinar a solucão de três grupos. Mas também poderiamos usar os conglomera-
dos que identiIicamos em um outro tipo de analise. No Capitulo 14, demonstraremos co-
mo utilizar a analise de conglomerados em um coniunto de variaveis dependentes e como
combinar seu uso com a analise discriminante, topico da proxima secão deste capitulo.
ANALÌSE DÌSCRÌMÌNANTE MÚLTÌPLA
Lembre-se de que no Capitulo 11 a selecão da técnica estatistica apropriada baseia-se em di-
versas consideracões, incluindo o modo como as variaveis são mensuradas. Os pesquisado-
res em administracão podem Iacilmente deIrontar-se com um problema de pesquisa envol-
vendo uma variavel dependente não-métrica e diversas variaveis independentes métricas.
Por exemplo, o pesquisador em administracão pode deseiar prever quais são os Iuncionarios
com probabilidade de procurar outro emprego versus Iuncionarios com menor probabilida-
de de procurar um novo emprego ou avaliar outras categorias não-métricas semelhantes
usando variaveis independentes métricas relevantes. Da mesma Iorma, o pesquisador pode
deseiar prever quais os clientes com mais probabilidade de comprar um determinado produ-
to versus os que se sentem menos inclinados a compra-lo, quem assiste e quem não assiste a
um comercial de TV ou Iuncionarios satisIeitos versus Iuncionarios insatisIeitos. A analise dis-
criminante é um procedimento estatistico que pode ser usado para prever a probabilidade de
um individuo pertencer a um grupo, usando duas ou mais variaveis independentes.
Como com as analises Iatorial e de conglomerados, usamos um exemplo intuitivo
para aiuda-lo a compreender a analise discriminante. Vamos retomar nossa survev de
1.000 clientes do McDonald's e do Burger King, discutida na secão de analise Iatorial
deste capitulo. O Burger King gostaria de saber se seus clientes têm percepcões diIeren-
tes das dos clientes do McDonald's. Duas das variaveis de percepcão mensuradas na
PESQUÌSA EM AÇÃO
USO DO SPSS PARA COMPARAR
MÉDÌAS DE GRUPOS DE SOLUÇÕES DE CONGLOMERADOS
A seqüência de cliques do SPSS é: ANALYZE -» COMPARE MEANS -~ ONE-WAYANO VA. De-
pois, remova as variaveis X
6
, X
u
e X
12
da caixa Variables, mova as variaveis X
22
, X
23
, X
24
e X
25
para
dentro dela e deixe a variavel Cluster Membership na caixa Factor. Clique na caixa Options e então
emDescriptive. Nos usamos aefaults para todas as outras opcões e então clicamos a caixa OKpara
obter o resultado. Os resultados serão os mesmos vistos na Figura 13-14.
410 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
FÌGURA 13-14
PERFÌS DEMOGRÁFÌCOS DE SOLUÇÃO DE DOÌS CONGLOMERADOS
survev Ioram lugar divertido e sabor dos pratos . Os resultados da comparacão dos
dois grupos de clientes poderiam ser apresentados em graIico bidimensional como o
que é mostrado na Figura 13-15.
O diagrama de dispersão dos dados da survev mostra dois grupos - um contendo
mais clientes do Burger King e outro com mais clientes do McDonald's. O graIico relati-
vo ao McDonald's é maior porque essa rede de restaurantes tem mais clientes do que a re-
de do Burger King. A partir desse exemplo, parece que o sabor é mais importante para os
clientes do Burger King e menos importante para os clientes do McDonald's. Por outro la-
do, o lugar divertido para criancas é mais importante para os clientes do McDonald's do
que para os clientes do Burger King. As duas areas se sobrepõem, mas não muito. Para ter
uma alta capacidade de previsão, deve haver uma sobreposicão minima entre os grupos
examinados em uma analise discriminante. O graIico indica que os clientes do Burger
King e os do McDonald's são Iundamentalmente diIerentes em termos do que é impor-
tante na selecão de um restaurante. Assim, o Burger King tera diIiculdade em atrair os
clientes do McDonald's, a menos que se torne mais parecido com este.
A analise discriminante multipla é a técnica estatistica apropriada para testar a hipo-
tese nula de que as médias das variaveis independentes de dois ou mais grupos são as
mesmas. A técnica emprega diversas variaveis independentes métricas para prever uma
unica variavel dependente métrica. A variavel dependente pode ter duas, três, quatro ca-
tegorias ou mais. Quando aplicamos a analise discriminante, examinamos as diIerencas
dos grupos descobrindo uma combinacão linear das variaveis independentes - a funcão
discriminante -, que identiIica diIerencas entre as médias dos grupos. Deste modo, a
analise discriminante é um instrumento estatistico que desenvolve combinacões lineares
de variaveis independentes para prever os participantes de um grupo conIorme é deIini-
do pela variavel dependente.
Figura 13-14
CAPITULO 13 ‹ OUTRAS TECNICAS MULTIVARIADAS 4 1 1
Para explicar a abordagem analitica utilizada na analise discriminante, usaremos
nossa survev dos clientes do Burger King e do McDonald's. A variavel dependente, Z, é
medida com uma escala nominal (isto é, clientes do Burger King versus clientes do Mc-
Donald's), e as variaveis independentes - lugar divertido e sabor - são variaveis métri-
cas. O obietivo estatistico é prever se um individuo é cliente do Burger King ou do Mc-
Donald's, usando as inIormacões da survev. Para tanto, o pesquisador deve encontrar
uma combinacão linear das variaveis independentes que identiIique diIerencas estatis-
ticamente signiIicativas entre as médias dos grupos.
Os escores discriminantes (escores Z) são determinados empiricamente por uma
Iuncão linear. Ou seia, o computador analisa as variaveis independentes, desenvolve uma
Iuncão linear e a utiliza para prever o grupo a que um respondente da survev pertence. O
escore Z é calculado para cada respondente usando-se a seguinte equacão:
z ÷ w
1
x
1
+ w
2
x
2
+...w
n
x
n
Onde:
Z ÷ escore discriminante para cada respondente
W
n
÷ peso discriminante para a variavel n
X
n
÷ valor do respondente na variavel independente n
Os pesos discriminantes (W
n
) são estimativas do poder de previsão de cada variavel
independente. O pacote de software de analise discriminante calcula os pesos de modo
que atiniam o valor otimo para previsão dos grupos. Cada variavel independente tem seu
proprio peso. O valor dos pesos é determinado pela estrutura de variância das variaveis
independentes. As variaveis independentes com boas possibilidades de previsão são atri-
buidos pesos maiores. As variaveis que não têm muita capacidade de previsão recebem
pesos pequenos.
Uma ilustracão de analise discriminante de dois grupos aparece na Figura 13-16. Su-
ponhamos que temos dois grupos, A e B, e duas variaveis, X
t
e X
2
, para cada responden-
te nos dois grupos. Poderiamos colocar no diagrama de dispersão a associacão da varia-
412 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
DIAGRAMA DE DISPERSÃO E PROJEÇÃO DE ANÁLISE DISCRIMINANTE
DE DOIS GRUPOS
vel X
a
com X
2
para cada grupo. A identidade do grupo é mostrada pelos pontos no grupo
A e pelas estrelas no grupo B. As elipses resultantes abrangem uma proporcão especiIica
dos pontos para cada grupo, em torno de 95°. Se uma linha reta atravessar os dois pon-
tos de intersecão das elipses e Ior proietada a um novo eixo Z, poderemos dizer que a so-
breposicão entre as distribuicões univariadas de A' e B' é menor do que a que seria obti-
da por qualquer outra linha desenhada através das elipses representando os pontos em
dispersão. O novo eixo Z é a Iuncão discriminante, um composto linear das duas varia-
veis independentes.
A Iuncão discriminante em uma analise discriminante é muito semelhante a uma
equacão de regressão. Uma equacão de regressão usa uma combinacão balanceada de va-
lores para variaveis independentes métricas selecionadas a Iim de prever o valor de um
obieto em uma variavel dependente mensurada (Y). Com a analise discriminante, a Iun-
cão discriminante utiliza uma combinacão balanceada dos valores de variaveis indepen-
dentes para classiIicar um obieto (em geral, um respondente) em um dos grupos de va-
riaveis dependentes. Quer dizer, atribui ao obieto um valor que o identiIica como perten-
cente a um dos grupos de variaveis dependentes. A Iuncão discriminante, portanto, é
urna soma balanceada de valores (Z) de variaveis independentes individuais.
Como o escore Z é usado para identiIicar membros de um grupo? O pesquisador de-
ve especiIicar um escore de corte. Obietos com escores discriminantes maiores do que o es-
core de corte são designados a um grupo, e obietos com escores menores do que o escore
de corte são colocados em um outro grupo de variavel dependente. Se houver dois grupos,
havera apenas um escore de corte. Mas quando ha três grupos, deve haver dois escores de
corte. Se, por exemplo, o escore de corte Iosse 0,567, então qualquer respondente com um
escore Z abaixo desse valor seria designado a um grupo e qualquer respondente com um
escore Z superior seria designado a um outro grupo. Seguindo o mesmo procedimento, ca-
da respondente na analise é classiIicado em um ou outro grupo de variavel dependente,
conIorme seus valores nas variaveis independentes individuais e seus pesos.
A menos que não haia absolutamente nenhuma sobreposicão entre os grupos de va-
riaveis dependentes, estamos destinados a cometer erros de classiIicacão. Quanto maior
a sobreposicão, mais erros de classiIicacão são Ieitos. O conceito de um escore de corte e
de previsão da Iuncão discriminante é ilustrado na Figura 13-7. Na ilustracão ao alto (a),
a Iuncão discriminante Iaz uma boa previsão, pois ha muito pouca sobreposicão. Na ilus-
tracão de baixo (b), a Iuncão discriminante não Iaz uma boa previsão, ia que existe uma
grande sobreposicão. O escore de corte esta no meio e, portanto, a Iuncão discriminante
tem igual probabilidade de prever que um respondente esteia no grupo errado. Mas, se o
FIGURA 13-16
CAPÍTULO 13 ‹ OUTRAS TÉCNÌCAS MUUÌVARÌADAS 413
FIGURA 13-17 EIXO Z DE FUNÇÃO DISCRIMINANTE E ESCORES DE CORTE
escore de corte é movido para a direita ou esquerda no eixo Z, muda a probabilidade de
previsão do grupo a que um respondente é designado. Por exemplo, se o escore de corte
é movimentado para a direita, o pesquisador pode alcancar uma precisão de previsão de
100° para o grupo A e uma precisão substancialmente inIerior para o grupo B.
O pesquisador em administracão deve decidir onde colocar o escore de corte com ba-
se nos custos da ma classiIicacão de um determinado respondente. Se os custos de classi-
Iicacão errônea são iguais, a linha de escore de corte é tracada no centro. Se são diIeren-
tes, então escolhe-se o escore de corte que resulta no menor custo de ma classiIicacão.
Para esclarecer a natureza da Iuncão discriminante, vamos nos reIerir novamente ao
nosso exemplo ae fast fooa. Mas desta vez vamos supor ainda que acrescentamos uma ter-
ceira variavel - simpatia dos Iuncionarios. Suponhamos que a Iuncão discriminante esti-
ma os pesos como são mostrados na equacão abaixo:
Z ÷ WJXJ ¹ W
2
X
2
¹ W
3
X
3
Z ÷ 0,66X
X
¹ 0,37X
2
¹ 0,12X
3
Os resultados acima mostram que Xi - Sabor é a variavel mais importante na discri-
minacão entre clientes do Burger King e do McDonald's. A variavel X
2
- Ambiente (lugar
divertido para criancas), com um coeIiciente de 0,37, também tem um bom poder de pre-
visão. Por outro lado, a variavel X
3
- Simpatia, com um peso de 0,12, tem pouca capacida-
de de previsão.
O primeiro passo na analise discriminante é determinar se a Iuncão é estatisticamen-
te signiIicativa. Com uma amostra grande, podemos encontrar uma Iuncão estatistica-
mente signiIicativa com pouca capacidade de previsão. Portanto, se encontrarmos uma
Iuncão estatisticamente signiIicativa, deveremos testa-la para veriIicar se ela classiIicara
obietos (individuos) nos grupos corretos. Em nosso exemplo, o obietivo é classiIicar cor-
retamente os respondentes nos grupos de clientes do Burger King e do McDonald's. A hi-
potese nula seria a de que não ha diIerencas entre os grupos e, portanto, nenhum poder
de previsão.
Os resultados do uso de uma Iuncão discriminante para prever os membros de um
grupo são apresentados em uma tabela chamada de matriz de classiIicacão (previsão). A
Figura 13-18 é a matriz de classificacão para nosso exemplo de fast fooa. Ela mostra que a
414 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
Iuncão estimada classiIicou corretamente os clientes do Burger King em 80° das vezes e
incorretamente em 20°. Por outro lado, a Iuncão discriminante classiIicou corretamente
os clientes do McDonald's 95° das vezes e incorretamente em somente 5°. No todo, a
exatidão de previsão Ioi de 87,5°. Essa precisão é muito maior do que seria esperado por
acaso (dois grupos ÷ 50°).
A exatidão total de previsão de uma Iuncão discriminante é chamada de hit ratio. A
hit ratio é a porcentagem de obietos (respondentes) corretamente classiIicados pela Iuncão
discriminante. Em nosso exemplo anterior, Ioi de 87,5°, o que é muito alto. Mas que hit
ratio é considerada aceitavel ou boa? Uma exatidão de previsão de 70° é boa? Para res-
ponder essas questões, devemos determinar a porcentagem de obietos que poderiam ser
corretamente previstos por acaso (sem usar a Iuncão discriminante). Quando dois grupos
e as amostras são do mesmo tamanho, a probabilidade de acaso é 50°. De maneira seme-
lhante, quando temos três grupos e as amostras são do mesmo tamanho, a probabilidade
de acaso é 33°. Isso porque poderiamos arbitrariamente colocar todos os obietos em um
grupo sem usar uma Iuncão discriminante e sua exatidão de previsão, por exemplo, para
a situacão de dois grupos, seria de 50°.
Quando os tamanhos de amostra nos grupos são diIerentes, a probabilidade de aca-
so tem como base o grupo maior. Por exemplo, se temos um amostra de 100 com 60 obie-
tos em um grupo e 40 em outro, a probabilidade de acaso é de 60°. Isso ocorre porque
poderiamos colocar todos os obietos no grupo deIinido pelo tamanho de amostra de 60 e
sua exatidão de previsão seria de 60°.
Para responder a pergunta de quanto da precisão de previsão estaria relacionado ao
acaso, oIerecemos as seguintes orientacões. A precisão de classiIicacão deveria ser, no mi-
nimo, 25° maior do que o acaso. Por exemplo, se a exatidão de previsão por acaso é de
50°, recomendamos 62,5°. De Iorma semelhante, se a exatidão de previsão por acaso é
de 33°, recomendamos 41,5°. Na analise Iinal, essa decisão deve ser baseada no custo
versus o valor das inIormacões previstas. Se os custos associados com a previsão em 60°
(precisão de previsão ao acaso ÷ 50°) Iorem pequenos em relacão ao valor, então devere-
mos usar a analise discriminante. Se os custos Iorem altos, então não a utilizaremos. Para
mais inIormacões sobre esse topico, ver Hair J., et. ai., Multivariate Data Analvsis. With Rea-
aings. 6
th
Edition, Prentice Hall, 2003.
Antes de mostrarmos um exemplo de analise discriminante, varias questões preci-
sam ser esclarecidas. Primeiro, supomos que as amostras de dois ou mais grupos são
comparaveis em tamanho. Segundo, os tamanhos das amostras dos grupos deve ser pe-
lo menos cinco vezes o numero de variaveis independentes. Isto é, se sua Iuncão discri-
minante tiver cinco variaveis independentes, então o menor tamanho de amostra de qual-
quer grupo devera ser 25. Finalmente, supõe-se que a variância das variaveis entre gru-
pos seia igual. Na pratica, essa ultima suposicão é Ireqüentemente violada, e Ielizmente,
como a técnica é consistente, isso não cria muitos problemas.
CAPÍTULO 13 ‹ OUTRAS TÉCNÌCAS MULTÌVARÌADAS. 415
PESQUISA EM AÇÃO
DE CLIENTES
Com o SPSS, a seqüência de cliques para executar uma analise discriminante é: ANALYZE ‰~ CLAS-
SIFY ‰~ DISCRIMINANT. Isso leva a uma caixa de dialogo onde as variaveis são selecionadas. Pri-
meiramente, destaque a variavel X
25
e coloque-a na caixa Grouping Variable no alto. Agora clique
na caixa DeIine Range logo abaixo para especiIicar os numeros minimos e maximos para o agrupa-
mento de variaveis. Para nosso exemplo, o minimo é 0 ÷ Samouel's e o maximo é 1 ÷ Gino's. Colo-
que esses dois numeros na caixa e clique em Continue. A seguir, destaque as variaveis X
v
X
4
, X
6
, X
9
,
XJJ e X
12
e posicione-as na caixa Independents. Va a caixa Statistics na parte inIerior e clique em
Means, ANOVAS univariadas e Continue. Usaremos o aefault Method. Clique em ClassiIy e use o
aefault - AUGroup Equal (lembre-se de que Phil entrevistou 100 de seus clientes e 100 clientes do Gi-
no's). Se você não soubesse que os grupos tinham o mesmo tamanho, você deveria veriIicar Com-
pute da opcão Group Sizes. Agora clique em Summary Table e Continue. Nenhuma das opcões
abaixo de Save são usadas, por isso, clique em OK para executar a analise discriminante. Os resul-
tados serão os mesmos que você pode ver nas Figuras 13-19 a 13-22.
Phil Samouel gostaria de saber se seus clientes percebem seu restaurante de um modo di-
Ierente da maneira como os clientes do Gino' s percebem este restaurante. A analise discri-
minant e pode ser usada para responder essa questão. A variavel dependent e não-métrica
é X
25
- Concorrência. Essa variavel é codiIicada como 0 ÷ entrevistas com clientes do
Samouel' s e 1 ÷ entrevistas com clientes do Gino' s. As variaveis independentes métricas
poderiam ser as 12 variaveis de percepcão do restaurante. Mas, para simpliIicar a questão
de pesquisa, vamos veriIicar soment e as três variaveis relativas a comida (X
v
X
4
e X
9
) e as
três variaveis dos Iuncionarios (X
6
, X
u
e X
12
). A hipotese nul a é a de que não ha diIerenca
nas percepcões dos dois restaurantes quant o as variaveis para comida e Iuncionarios.
O obietivo é determinar se as percepcões dos clientes do Samouel' s, mensuradas pe-
las seis variaveis de percepcão, são diIerentes das percepcões dos clientes do Gino' s. Ou
seia, as varaveis de percepcões relativas a comida e aos Iuncionarios podem prever se os
respondentes são clientes de um restaurante especiIico? O Lambda de Wilk é uma esta-
tistica que avalia se a Iuncão discriminant e identiIicou uma diIerenca estatistica entre
dois grupos ou mais. Para nosso exemplo, o Lambda de Wilk é altamente signiIicativo
(0,000), como mostra a Figura 13-19. Quando essa estatistica é signiIicativa, passamos pa-
ra as inIormacões dos resultados de classiIicacão (também na Figura 13-19). VeriIicando
a part e inIerior da tabela, vemos que a habilidade total de previsão da Iuncão discrimi-
nant e é 83°. Sem a Iuncão discriminante, poderiamos prever apenas com 50° de preci-
são (nossos tamanhos de amostras são Samouel' s ÷ 100 e Gino' s ÷ 100, assim, se dissésse-
mos que todos os respondentes eram clientes do Samouel' s, preveri amos com 50° de
precisão). Portanto, essa é uma excelente hit ratio (capacidade de previsão). Com base nes-
sas descobertas, podemos reieitar a hipotese nula de que as médi as dos grupos são as
mesmas para as variaveis de comida e de Iuncionarios.
Podemos observar ainda que a Iuncão discriminante é ligeiramente mai s precisa na
previsão dos clientes do Gino' s (86°) do que na dos clientes do Samouel' s (80°). Inter-
pretando essa tabela, vemos que a Iuncão discriminante previu com precisão os clientes
do Samouel' s 80° das vezes e que, em 20° delas, disse que um cliente do Samouel' s era
um cliente do Gino' s. Do mesmo modo, em 86° das vezes, a Iuncão discriminante previu
acuradament e os clientes do Gino' s e, em 14° delas, disse que um cliente do Gino' s era
um cliente do Samouel' s.
USO DE SPSS PARA EXECUTAR UMA ANÁLISE DISCRIMINANTE COM A SURVEY
EXEMPLO DE ANÁLISE DISCRIMINANTE
416 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
FIGURA 13-19 ANALISE DISCRIMINANTE DE SURVEYS DE CLIENTES
Como conseguimos desenvolver uma Iuncão discriminante altamente capaz de pre-
visão, agora estamos interessados em descobrir quais as variaveis independentes que têm
maior poder de previsão. Para isso, examinamos as inIormacões nas Figuras 13-20 e 13-
21. Primeiro, as inIormacões da tabela de testes de igualdade de médias de grupo mos-
tram quais as variaveis de percepcão são signiIicativamente diIerentes em uma base uni-
variada. Vemos que todas as variaveis, exceto X
9
- Variedade do cardapio, são altamente
signiIicativas em termos de estatistica e provavelmente capazes de boas previsões. A va-
riavel X
9
não é signiIicativa e, portanto, também tem pouca capacidade de previsão. As-
sim, as percepcões dos dois restaurantes são muito diIerentes em uma base univariada,
com excecão de uma variavel
Agora queremos examinar as variaveis independentes a partir de uma perspectiva
multivariada. Para tanto, podemos veriIicar os CoeIicientes de Funcão Discriminante Ca-
nonicos ou as correlacões da Matriz de Estrutura. Os pesquisadores em administracão
normalmente usam as correlacões da Matriz de Estrutura porque são consideradas mais
precisas: deste modo, também as adotaremos aqui (ver Figura 13-21). Devemos primeiro
identiIicar os numeros (correlacões) na coluna de Iuncões que são considerados signiIica-
tivos. Como com a analise Iatorial, os numeros representam a correlacão entre as varia-
veis individuais e a combinacão linear de todas as variaveis independentes. O nivel de
corte é determinado de uma maneira semelhante a da carga de Iatores. Todas as variaveis
de 0,30 ou mais são consideradas uteis na previsão dos membros de um grupo.
FIGURA 13-20 TESTES DE IGUALDADE DE MEDIAS DE GRUPOS
CAPÍTULO 13 ‹ OUTRAS TÉCNÌCAS MULTÌVARÌADAS 417
MATRIZ DE ESTRUTURA PARA VARIÁVEIS DE PERCEPÇÃO DE RESTAURANTES
Variáveis* Função
1
X
6
- Funcionários simpáticos 0,843
X
12
- Funcionários competentes 0,791
Xœ - Funcionários cordiais 0,571
X
4
- Comida de excelente sabor 0,267
X, - Comida de excelente qualidade 0,255
X
9
- Grande variedade de pratos 0,050
* Variáveis ordenadas por tamanho absoluto da correlação com função
A ordem das cargas na Figura 13-21 é decrescente (não a ordem em que Ioram lista-
das no banco de dados). Semelhante aos resultados uni variados, a variavel com a menor
carga (X
9
) é a que não Ioi signiIicativa em uma base univariada. A questão, agora, é se de-
vemos ou não considerar as variaveis Xi e X
4
como capazes de previsão signiIicativa. De
acordo com nossa regra pratica, elas não são consideradas uteis porque têm cargas meno-
res do que 0,30. Mas, em uma base univariada, são altamente signiIicativas (0,001), de
modo que podemos estar tendo um problema com a multicolinearidade. Uma outra Ior-
ma de avaliar essa situacão seria realizar uma analise discriminante passo a passo para
determinar se elas entram na equacão e melhoram a precisão de previsão. Também pode-
riamos realizar a analise discriminante sem essas variaveis e ver se a capacidade de pre-
visão das Iuncões é menor. O que podemos concluir, neste momento, é que as percepcões
reIerentes aos Iuncionarios são muito importantes na diIerenciacão entre os dois restau-
rantes: as percepcões quanto a comida são relativamente menos importantes: e a varieda-
de de pratos não é importante. Phil Samouel decididamente deve desenvolver um plano
para implementar melhorias no setor de Iuncionarios de seu restaurante.
Como observado anteriormente, o resultado de previsão da Iuncão discriminante Ioi
moderadamente alto, com uma hit ratio de 83°. A interpretacão da Iuncão discriminante
baseia-se nas médias de grupo na tabela de estatisticas de grupo (ver Figura 13-22). Usan-
do nossa regra pratica para cargas signiIicativas (0,30), observamos que as variaveis X
6
,
X
u
e X
12
são todas signiIicativas em termos de previsão. Para essas três variaveis, as per-
cepcões para o Gino's são mais Iavoraveis do que para o Samouel's (médias mais altas in-
dicam percepcões mais Iavoraveis). Isso sugere que ou o Gino's emprega Iuncionarios
muito melhores, ou os treina melhor do que o Samouel's. Assim, as percepcões quanto
aos Iuncionarios são signiIicativamente diIerentes entre os dois restaurantes e são bons
indicadores de quais respondentes que Iazem reIeicões em um restaurante especiIico.
Mas as descobertas sugerem que Phil Samouel deve avaliar seus Iuncionarios e elaborar
um método para melhorar seu desempenho. Isso poderia ser especialmente proveitoso,
ia que, embora o Gino's tenha melhor classiIicacão de seus Iuncionarios, este restaurante
ainda não é classiIicado muito Iavoravelmente (duas ou três variaveis estão consideravel-
mente abaixo do ponto intermediario da escala).
Uma abordagem Iinal para exame de diIerencas entre grupos é o centeriod. Em uma
analise discriminante, um escore Z é calculado para cada respondente. O centeriod é a
média de todos os escores Z dos respondentes em um determinado grupo. Uma analise
discriminante de dois grupos tem dois centeriods, e uma analise de três grupos têm três.
Os centeriods para nosso exemplo dos restaurantes são mostrados na Figura 13-22. Ob-
serve que o centeriod do Samouel's é -0,916, enquanto que o do Gino's é 0,916. Essa é
FIGURA 13-21
418 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
Variáveis Média
Funções discriminantes canónicas avaliadas em médias de grupo
uma medida de sintese global que indica que o Gino's é percebido de maneira muito mais
Iavoravel do que o Samouel's.
ANÁLISE DISCRIMINANTE PASSO A PASSO
Como com a analise de regressão multipla, a analise discriminante pode ser aplicada uti-
lizando-se uma abordagem passo a passo para selecionar as variaveis independentes. Po-
demos inserir todo o coniunto de variaveis independentes na Iuncão discriminante. En-
tão, podemos deixar a Iuncão discriminante selecionar um coniunto menor de variaveis
independentes que, espera-se, seia capaz de Iazer uma boa discriminacão dos grupos. O
coniunto menor de variaveis independentes é possivel devido as intercorrelacões ou re-
dundâncias entre as variaveis independentes. Mas, como na analise de regressão, deve-
mos ter cautela com a multicolinearidade. Os programas de software estatistico comuns
oIerecem a opcão da abordagem passo a passo.
RESUMO
Diferença entre técnicas de dependência e de interdependência
Existem dois tipos mais abrangentes de técnicas estatisticas multivariadas. Um tipo é cha-
mado de técnicas de dependência. Essas técnicas são utilizadas quando uma (ou mais)
das variaveis é identiIicada como variavel dependente e as outras, como variaveis inde-
pendentes. As técnicas de interdependência são aquelas em que você analisa somente um
coniunto de variaveis e não identiIica nenhuma delas como independente ou dependen-
te. Neste livro, discutimos três técnicas de dependência - regressão multipla, ANOVA e
analise discriminante. Duas técnicas de interdependência Ioram estudadas - a analise Ia-
torial e a analise de conglomerados.
FIGURA 13-22 MÉDIAS DE VARIÁVEIS INDEPENDENTES PARA RESTAURANTES
Compreensão de como utilizar a análise fatorial para simplificar a análise de dados
A analise Iatorial é uma técnica de interdependência. E mais usada para sintetizar e redu-
zir as variaveis independentes. Mas também podemos utiliza-la para simpliIicar o con-
iunto de variaveis dependentes. A analise Iatorial examina as correlacões subiacentes en-
tre as variaveis e descobre aquelas que têm semelhanca. A partir dai, combina o grande
coniunto de variaveis usando uma abordagem linear em um coniunto menor de Iatores
que têm relacões comuns.
Demonstracão da a utilidade da análise de conglomerados
A analise de conglomerados também é uma técnica multivariada de interdependência. A
analise de conglomerados possibilita combinar obietos (como clientes, marcas, produtos)
em grupos de modo que os obietos de cada grupo seiam semelhantes entre si e diIerentes
dos obietos de todos os outros grupos. A analise de conglomerados combina obietos para
que haia uma alta homogeneidade interna (dentro do conglomerado), bem como uma al-
ta heterogeneidade externa (entre conglomerados). Isto é, a analise de conglomerados
tenta identiIicar agrupamentos naturais usando diversas variaveis sem designar nenhu-
ma delas como dependente. Se bem-sucedida, os obietos dentro dos conglomerados esta-
rão muito proximos e os obietos em diIerentes conglomerados estarão muito distantes.
Compreensão de quando e como usar a análise discriminante
A analise discriminante multivariada usa diversas variaveis independentes métricas pa-
ra prever uma unica variavel dependente não-métrica. A variavel dependente pode ter
duas, três, quatro ou mais categorias. A partir de uma perspectiva estatistica, isso envol-
ve avaliar as diIerencas de grupos com base na descoberta de uma combinacão linear de
variaveis independentes - a Iuncão discriminante - que identiIica diIerencas entre as mé-
dias dos grupos. Assim, a analise discriminante é um instrumento estatistico para deter-
minacão de combinacões lineares de variaveis independentes que prevêem os membros
de um grupo deIinidos pela variavel dependente.
PALAVRAS-CHAVE
analise de conglomerados
analise discriminante
analise Iatorial
autovalor
carga de Iator
centeriod
comunalidade
conglomerado hierarquico
(construtivo ou aglomerativo)
conglomerado hierarquico
(divisorio)
conglomerado não-
hierarquico
critério de porcentagem
de variância
critério de raiz latente
dendograma
distância Euclidiana
escores discriminantes
(escores Z)
estrutura simples
Iator
Iuncão discriminante
hit ratio
matriz de Iacil leitura
matriz de classiIicacão
matriz de componente de
Iator com rotacão
perIil
pesos discriminantes
rotacão de Iator
rotacão obliqua
rotacão ortogonal
técnicas de dependência
técnicas de
interdependência
variância comum
variância de erro
variância unica
CAPITULO 13 ‹ OUTRAS TECNICAS MULTIVARIADAS 419
420 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
DÌLEMA ÉTÌCO
Uma comissão de loteria estadual conduziu uma analise de conglomerados para melhor
compreender as atitudes publicas no estado em relacão a loteria e as apostas. A comissão
planeiou usar os dados para elaborar programas de marketing com o obietivo de aumentar
o apoio e a participacão nos sorteios semanais da loteria. A pesquisa identiIicou cinco con-
glomerados distintos de cidadãos. Não Ioi surpresa que o maior conglomerado (27°) era
dos que se opunham a loteria e tinham pouca compreensão do impacto econômico que as
apostas exerciam no estado. O menor conglomerado (13°) era composto de pessoas que
adoravam a loteria. Esse grupo também entendia melhor o impacto da loteria no estado. Os
outros três grupos Iicaram em algum ponto entre atitude e conhecimento - apoio qualiIica-
do (25°), neutro (22°) e não-apostadores que vêem algum beneIicio para o estado (13°).
Antes de a equipe de marketing comecar a criar a estratégia das comunicacões para ca-
da publico, o grupo considerou divulgar na imprensa os resultados da pesquisa, concen-
trando-se no Iato de que a maioria dos cidadãos era a Iavor da loteria - isso, supunham,
passaria uma impressão positiva da legislacão do estado. Somente um integrante da co-
missão não se sentiu a vontade com o plano porque achava que estariam exagerando na
divulgacão dos resultados. O que você acha? A equipe de marketing esta Iazendo uma ma
representacão dos dados para o publico?
QUESTÕES DE REVÌSÃO
1. Qual é a diIerenca entre técnicas de dependência e de interdependência?
2. O que é analise Iatorial e quando o pesquisador em administracão a utilizaria?
3. Como o pesquisador decide quantos Iatores reter?
4. Em que a analise de conglomerados diIere da analise Iatorial?
5. Explique as três Iases da analise de conglomerados.
6. Por que os pesquisadores utilizariam a analise discriminante em vez da analise
de regressão?
ATÌVÌDADES PARA DÌSCUSSÃO E APLÌCAÇÃO
1. Descreva um problema de pesquisa que se beneIiciaria com uma analise Iato-
rial. Quais são as variaveis e o que você esperaria alcancar?
2. Como o pesquisador poderia usar a analise de conglomerados para melhorar a
validade de um problema de pesquisa? Dê um exemplo para esclarecer sua res-
posta.
3. Descreva um problema de pesquisa que exigiria o uso de analise discriminan-
te. Por que a analise discriminante seria usada em vez da regressão?
4. Aplicacão SPSS. Execute uma analise Iatorial usando as 12 variaveis de percep-
cão do banco de dados da survev de Iuncionarios. Prepare um breve relatorio
de suas descobertas.
CAPÍTULO 13 ‹ OUTRAS TÉCNÌCAS MULTÌVARÌADAS 421
5. Aplicacão SPSS. Execute uma analise de conglomerados usando as três varia-
veis de comprometimento organizacional (X
13
, X
14
e X
ls
) do banco de dados da
survev de Iuncionarios. Prepare um breve relatorio de suas descobertas.
6. Aplicacão SPSS. Execute uma analise discriminante passo a passo usando as 12
variaveis de percepcão do banco de dados da survev de clientes. Prepare um
breve relatorio de suas descobertas.
7. Aplicacão SPSS. Execute uma analise de conglomerados usando as 12 variaveis
de percepcão do banco de dados da survev de clientes. Desenvolva uma solu-
cão em três conglomerados em vez da solucão de dois relatada no capitulo.
Prepare um breve relatorio de suas descobertas.
EXERCÍCÌOS NA ÌNTERNET
1. Use as palavras-chave multivariaao e analise ae aaaos multivariaaa com os dispo-
sitivos de busca www.google.com e www.dogpile.com. prepare um breve rela-
torio do que você encontrou e sobre como as buscas diIerem.
2. Use seu dispositivo preIerido de busca na Internet. Digite as palavras-chave
analise Iatorial, analise de conglomerados e analise discriminante. Prepare um
breve relatorio sobre as semelhancas e diIerencas que você encontrou. IdentiIi-
que um site interessante e clique nele. Inclua uma descricão do que você en-
controu.
Abordagens Avançadas de Análise
e Apresentação
CAPÍTULO
CAPÍTULO 14 > ABORDAGENS AVANÇADAS DE ANÁLÌSE E APRESENTAÇÃO 423
Nos capitulos anteriores, apresentamos varias técnicas estatisticas. Através de sua aplica-
cão aos bancos de dados das survevs de Iuncionarios e clientes dos restaurantes, demons-
tramos seu valor para uma melhor compreensão de problemas administrativos quando
as técnicas são usadas isoladamente. Neste capitulo, primeiro ilustraremos como duas ou
mais técnicas multivariadas podem ser usadas para analisar dados e melhor representar
as relacões subiacentes. Depois, explicaremos como e por que os pesquisadores poderiam
deseiar usar escores somados. Por Iim, demonstraremos como o mapeamento de percep-
cão pode ser usado para comunicar seus resultados de modo mais eIiciente.
Quando pesquisadores em administracão utilizam a analise de conglomerados, um dos
principais obietivos de pesquisa é identiIicar subgrupos homogêneos. No Capitulo 13,
ilustramos a analise de conglomerados usando as três variaveis independentes dos Iun-
cionarios a partir da survev de clientes (simpatia, cortesia e competência), em que os gru-
pos eram identiIicados, validados e caracterizados. Nesse exemplo, demonstramos como
podemos utilizar a analise de conglomerados em um coniunto de variaveis dependentes.
Lembre-se de que as variaveis de conglomerados devem ser logica e/ ou teoricamen-
te relacionadas. VeriIicando as cinco variaveis de relacionamento dependentes, de X
17
a
X
21
, da survev de clientes (Figura 14-1), vemos que as três primeiras (X
17
- SatisIacão do
cliente, X
18
- Probabilidade de retomo e X
19
- Recomendacão a um amigo) representam
variaveis de satisIacão que estão bem estabelecidas na literatura. Poderiamos optar pelos
conglomerados usando essas três variaveis. No entanto, permanece a questão de como li-
dar com as outras duas medidas de relacionamento. As variaveis X
20
- Assiduidade e X
21
- Tempo como cliente estão relacionadas logicamente, mas não teoricamente, com as va-
riaveis X
17
- X
19
. Primeiro, elas são mais medidas comportamentais de satisIacão em opo-
sicão a variaveis de percepcão. Segundo, as variaveis X
20
e X
21
são mensuradas em uma
escala não-métrica de três pontos em vez de uma escala métrica de sete pontos. Por essas
FIGURA 14-1 VARIÁVEIS DE RELACIONAMENTO USADAS NA SURVEY DE CLÌENTES
17, Qual seu nível de satisfação com
o restaurante Samouei's?
18. Qual a probabilidade de você
retornar ao restaurante Samouei's?
19. Qual a probabilidade de você recomendar
o restaurante Samouei's a um amigo?
20. Com que freqüência você vem
ao restaurante Samouei's?
21. Há quanto tempo você é cliente
do restaurante Samouei's?
1 - Ocasionalmente (menos de uma vez por mês)
2 = Freqüentemente ( 1 - 3 vezes por mês)
3 = Muito freqüentemente (4 ou mais vezes por mês)
1 = Menos de um ano
2 = De um a três anos
3 = Mais de três anos
ÌNTRODUÇÃO
ANÁLÌSE DE CONGLOMERADOS E ANALÌSE DÌSCRÌMÌNANTE
424 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
razões, a analise de conglomerados sera baseada somente nas três variaveis dependentes
X
17
- X
19
. As duas variaveis restantes, X
20
e X
21
, serão usadas para validar os conglomera-
dos identiIicados com as outras variaveis de relacionamento.
QUESTÃO DE PESQUISA 1:
''OS CONGLOMERADOS PODEM SER IDENTIFICADOS?"
A primeira questão de pesquisa para esse exemplo é: os conglomerados podem ser iden-
tiIicados usando-se as três variaveis dependentes métricas de satisIacão ? Se pudermos
validar e Iazer um perIil logico dos conglomerados, então poderemos examinar se as va-
riaveis de percepcão poderão ser utilizadas para prever a participacão nos conglomera-
dos recém Iormados. A tareIa, então, é tentar identiIicar conglomerados de clientes que
tenham percepcões distintas quanto as variaveis de satisIacão (X
17
- X
19
). A hipotese nula
é a de que os diIerentes conglomerados não existem com base nas variaveis de satisIacão
da survev de clientes.
O consultor administrativo de Phil recomendou que a abordagem de analise de con-
glomerados Iosse o método de Ward, utilizando as distâncias Euclidianas ao quadrado
como critérios de mensuracão. Essas recomendacões Iundamentam-se em seus trabalhos
anteriores, semelhantes a essa questão de pesquisa. O proximo passo é decidir o numero
de conglomerados a reter na solucão.
Quando as percepcões dos clientes são combinadas em um unico conglomerado, nor-
malmente ha muito erro associado com esse conglomerado. Quando separamos o unico
conglomerado em dois, o erro é reduzido substancialmente e continua a decrescer a me-
dida que mais grupos (conglomerados) são identiIicados. A reducão no erro é mensura-
da por um coeIiciente de erro. A Figura 14-2 mostra os coeIicientes de erro associados
com a aglomeracão das variaveis de satisIacão dependentes na survev de clientes. Os nu-
meros na coluna da esquerda mostram a quantidade de erro associado com uma determi-
nada solucão de conglomerados. Os numeros na coluna da direita mostram quanto erro
é reduzido ao passarmos de um para dois conglomerados, de dois para três, e assim por
diante. Observe que, passando de um unico conglomerado (todas as 200 observacões) pa-
ra uma solucão de dois conglomerados, o coeIiciente de erro é reduzido em 551,405, pas-
sando de 834,255 para 282,850 (834,255 - 282,850 ÷ 551,405). Quando passamos de dois
para três conglomerados, a reducão é de 99,972 (282,850 -182,878 ÷ 99,972) e de três para
quatro conglomerados a reducão é de 42,013.
Agora devemos decidir se usaremos uma solucão de dois, três ou quatro conglome-
rados. Todas as solucões de conglomerados exibirão uma queda substancial no coeIicien-
te de erro. Se houvesse outras consideracões, como pesquisas anteriores, teoria ou logica
administrativa, o pesquisador poderia optar por uma solucão de três ou quatro conglo-
merados. Solucões com cinco conglomerados ou mais raramente são usadas, pois são
muito diIiceis de interpretar. Na verdade, as solucões de quatro conglomerados também
FIGURA 14-2
COEFICIENTES DE ERROS E REDUÇÃO DE ERRO PARA SOLUÇÃO DE
CONGLOMERADOS DE VARIÁVEIS DE SATISFAÇÃO
Coeficientes de erro Redução de erro
Quatro conglomerados = 140,865 3 - 4 conglomerados = 42,013
Três conglomerados =182,878 2 - 3 conglomerados = 99,972
Dois conglomerados =282,850 1 - 2 conglomerados = 551,405
Um conglomerado = 834,255
CAPÍTULO 14 » ABORDAGENS AVANÇADAS DE ANALÌSE E APRESENTAÇÃO 4 2 5
não são usadas com muit a Ireqüência. A decisão mais comum esta entre usar dois ou três
conglomerados. Em nosso exemplo, a reducão no erro, ao passarmos de uma solucão de
três para quatro grupos é menor do que a met ade da passagem de dois para três. Devido
a menor reducão do erro e a complexidade de interpretacão de uma solucão de quatro
grupos, o consultor administrativo de Phil decidiu considerar soment e as solucões de
dois e de três grupos.
Quando estamos selecionando o numer o de conglomerados a serem retidos, além de
veriIicar a reducão do erro, também examinamos o padrão das médias para os conglome-
rados. EspeciIicamente, comparamos as médias de cada uma das variaveis usadas na
analise de conglomerados entre todos os grupos. As Figuras 14-3 e 14-4 mostram as mé-
dias e seus graIicos para solucões de dois e de três conglomerados.
A revisão das médias e de seus graIicos podem nos aiudar a decidir o numero de con-
glomerados a reter. VeriIicando a solucão de dois conglomerados, Iica claro que o grupo
1 avalia os restaurantes de uma Iorma substancialmente inIerior a do grupo 2 em todas as
variaveis de satisIacão. Na solucão de três conglomerados, o grupo 1 não muda (N ÷ 80)
e esse grupo coerentemente outra vez da a menor avaliacão aos restaurantes. O grupo 2
da solucão de três conglomerados (N ÷ 120) é agora dividido em dois grupos adicionais
na solucão de três conglomerados. O novo grupo 2 agora tem N ÷ 75, e o novo gr upo 3
tem N ÷ 45 (75 ¹ 45 ÷ 120). Na solucão de três conglomerados, o novo grupo 2 avalia os
restaurantes de maneira mais Iavoravel em todas as variaveis de satisIacão, e o novo gru-
po 3 Iica no meio. Nesse ponto, devemos decidir selecionar entre uma solucão de dois ou
de três conglomerados. A solucão de três conglomerados demonstra um padr ão coerente
de diIerencas entre eles e poderi a oIerecer uma oportuni dade de compreender melhor as
diIerencas dos grupos. Mas o consultor de Phil recomendou a solucão de dois conglome-
rados devido a simplicidade para compreensão das diIerencas. Além disso, o consultor
acredita que sera mais rapido e mai s Iacil desenvolver uma estratégia administrativa pa-
ra competir de maneira mais eIiciente com o Gino' s.
Agora examinamos as médias da solucão de dois conglomerados para caracterizar as
diIerencas nos grupos. As médias do grupo 2 são coerentemente mai s altas em todas as
três variavei s de satisIacão. Na verdade, as médias dessas três variavei s para o gr upo 2
são 5,53 ou mais, e isso é muito Iavoravel, considerando-se que utilizamos uma escala de
sete pontos (7 ÷ muit o Iavoravel). Por outro lado, as médias do grupo 1 variam de baixa
(3,61) em X, para alta (4,14) em X
17
. Deste modo, enquant o o grupo 1 não é desIavoravel,
as percepcões de satisIacão são, de modo coerente, relativamente menos Iavoraveis do
que as do grupo 2. Além disso, quando as diIerencas entre grupos são examinadas para
veriIicacão de diIerencas signiIicativas (como mostra a Figura 14-5), observamos que, pa-
O obietivo é identiIicar os conglomerados que podem ser desenvolvidos usando-se as variaveis X
17
-
X
19
. A seqüência de cUques em SPSS é: ANALYZE -~ CLASSIFY -~ HIERARCHICAL CLUSTER, que
leva a uma caixa de dialogo onde você seleciona as variaveis X
17
, X
18
e X
19
. Depois de coloca-las na cai-
xa Variables, veriIique as outras opcões abaixo. Mantenha todos os aefaults mostrados na caixa de
dialogo. Você também deve usar os aefaults para as opcões Statistics e Plot abaixo. Clique na caixa
Methods e selecione Ward's embaixo de Cluster Method (é a ultima, por isso va até a parte inIerior),
mas use o aefault das distâncias Euclidianas ao quadrado sob Measure. Não Iazemos nada com a op-
cão Save nesse momento, por isso, você pode clicar em OKno alto da caixa de dialogo para executar
a analise de conglomerados. Os resultados serão os mesmos que apresentamos na Figura 14-2.
426 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
FIGURA 14-3 GRÁFICOS DE MÉDIAS E MEDIANAS PARA SOLUÇÃO DE DOIS CONGLOMERADOS
ra todas as três variaveis, as diIerencas são altamente signiIicativas (0,000). O grupo 2 po-
de ser identiIicado, portanto, como o conglomerado altamente satisIeito, enquanto que o
grupo 1 esta apenas moderadamente satisIeito.
QUESTÃO DE PESQUISA 2: "OS CONGLOMERADOS SÃO VÁLIDOS?"
Agora vamos avaliar a validade de previsão dos conglomerados. Ou seia, podemos com-
parar os resultados dos dois grupos com uma outra variavel para validar nossa solucão
de conglomerados. Para isso, selecionamos uma ou mais variaveis que tenham uma rela-
cão de base teorica com as três variaveis de satisIacão. As duas variaveis que se enqua-
CAPÍTULO 14 > ABORDAGENS AVANÇADAS DE ANÁLÌSE E APRESENTAÇÃO 4 2 /
FÌGURA 14-4 MÉDÌAS E GRÁFÌCOS DE MÉDÌAS PARA SOLUÇÃO DE TRÊS CONGLOMERADOS
dram nesse critério são X
20
- Assiduidade e X
21
- Tempo como cliente. Os resultados nas
tabelas da Figura 14-6 mostram que as duas variaveis são muito diIerentes entre os dois
grupos. Mais ainda, as médias para as variaveis de validacão são signiIicativamente me-
nores para o grupo 1 do que para o grupo 2. E logico que o grupo com variaveis de satis-
Iacão mais Iavoraveis (grupo 2) seria também o grupo de clientes que Ireqüentam p res-
taurante com mais assiduidade e ha mais tempo. Portanto, estabelecemos a validade pa-
ra previsão na solucão de dois conglomerados com base nas três variaveis de satisIacão
dependentes métricas.
428 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
RESULTADOS ANOVA PARA SOLUCÃO DE DOIS CONGLOMERADOS DE VARIAVEIS DE
SATISFACÃO
FIGURA 14-5
FIGURA 14-6
ESTATISTICA DE VALIDACÃO PARA SATISFACÃO EM DOIS CONGLOMERADOS
Descricão
Variaveis Grupos Média
ANOVA
Variaveis
X
20
- Assiduidade
X
21
-Tempo como ciiente
Entre grupos 139,289 0,000
Entre grupos 178,330 0,000
QUESTÃO DE PESQUISA 3:
"AS VARIÁVEIS DE PERCEPÇÃO PREVÊEM OS CONGLOMERADOS?"
Agora vamos nos voltar para a terceira questão de pesquisa. As variaveis de percepcão
podem ser usadas para prever a participacão em um grupo nos conglomerados recém-
Iormados? Para examinar essa questão, usamos a analise discriminante multipla. A varia-
vel dependente não-métrica é a variavel de participacão em grupo criada pela solucão de
dois conglomerados, e as variaveis independentes métricas são as de percepcão.
Phil Samouel gostaria de saber como e por que os dois conglomerados de clientes
vêem o restaurante de maneira diIerente. Esse conhecimento o aiudara a preparar um
plano administrativo melhor para competir com o Gino's. A analise discriminante pode
ser usada para responder essas perguntas. A variavel dependente não-métrica é a varia-
vel de identiIicacão de dois conglomerados recém-criada. Ou seia, a variavel identiIica se
um respondente pertence ao grupo moderadamente Iavoravel ou ao altamente Iavoravel.
Essa variavel é codiIicada como 1 ÷ grupo 1 (clientes menos Iavoraveis) e 2 ÷ grupo 2
(cliente mais Iavoraveis). As variaveis independentes métricas poderiam ser as 12 varia-
veis de percepcão dos restaurantes. Mas, para simpliIicar a questão de pesquisa, veriIica-
mos somente as três variaveis relativas a comida (X
lr
X
4
e X
9
) e as três reIerentes aos Iun-
cionarios (X
6
, X
n
e X
12
). A hipotese nula é a de que não ha diIerencas nas percepcões dos
clientes dos dois conglomerados de satisIacão com base nas variaveis relacionadas corn a
comida e com os Iuncionarios.
O obietivo é determinar se as variaveis de percepcão são signiIicativamente diIeren-
tes entre os dois grupos de satisIacão. Quer dizer: as variaveis de percepcão sobre comi»
N
CAPÍTULO 14 ‹ ABORDAGENS AVANÇADAS DE ANÁLÌSE E APRESENTAÇÃO 429
PESQUISA EM AÇÃO
USO DE SPSS PARA IDENTIFICAR PARTICIPAÇÃO EM GRUPO E COMPARAR
MÉDIAS DE CONGLOMERADOS
Agora que determinamos que uma solucão de dois conglomerados é melhor (com base na reducão
do coeIiciente de erro), precisamos Iazer o perIil dos grupos para avaliar sua logica. Devemos pri-
meiro criar uma nova variavel que identiIique a participacão em grupo para os respondentes nos
conglomerados recém-Iormados. Fazemos isso rodando o programa de conglomerados mais uma
vez e usando a opcão Save. Mantenha todas as mesmas opcões de antes, mas va a opcão Save, cli-
que em Single Solution e coloque um 2 na caixa para solicitar uma nova variavel de identiIicacão de
grupo para a solucão de dois grupos. Essa nova variavel sera criada no Iinal de seu banco de dados
de clientes, e seu nome é clu2l.
A seguir, devemos comparar as médias dos dois conglomerados que desenvolvemos usando as
três variaveis de relacionamento X
17
- X
19
. Para isso, a seqüência de cliques em SPSS é: ANALYZE ‰~
COMPARE - MEDIAS -» One-Way ANO VA. Quando você obtém a caixa de dialogo, clique nas va-
riaveis X
17
- X
19
para coloca-las na caixa Dependent List. Coloque a variavel de identiIicacão de dois
conglomerados recém-criada (clu2l) na caixa Factor e clique em Continue. Para Options, clique em
Descriptives, Mean Plots e Continue. Agora clique emOKpara rodar o programa. Os resultados são
os mesmos que apresentamos nas Figuras 14-3 e 14-4.
da e Iuncionarios podem prever se os respondentes são membros do conglomerado al-
tament e satisIeito ou do conglomerado moder adament e satisIeito? O Lambda de Wilk
é uma técnica estatistica que avalia se a Iuncão discriminant e identiIicou diIerenca esta-
tistica entre doi s ou mai s grupos. Para nosso exemplo, o Lambda de Wilk é altament e
signiIicativo (0,000), como mostra a Figura 14-7. Quando essa estatistica é signiIicativa,
veriIicamos então as inIormacões dos resultados de classiIicacão (também mostrados na
Figura 14-7). Ol hando a part e inIerior da tabela, vemos que a habilidade total de previ-
são da Iuncão discriminant e é 79,0°. Sem a Iuncão discriminante, so poderi amos prever
com 60° de precisão (nossas amostras são: grupo altament e satisIeito ÷ 120 e modera-
dament e satisIeito ÷ 80: assim, se disséssemos que todos os respondentes estariam no
grupo altament e satisIeito, estariamos Iazendo uma previsão com 60° de precisão, pois
120 / 200 ÷ 60°). Portanto, 79° é uma hit ratio (capacidade de previsão) aceitavel. Com
FIGURA 14-7 PREVISÃO DE CONGLOMERADOS DE SATISFAÇÃO DE CLIENTES
Lambda de WiIk
Teste de função(ões) Lambda de WiIk df Sigo
1 0,671 6 0,000
* 79 dos casos de grupos originais corretamente classificados (53 + 105 = 158/200 = 79 ).
4 3 0 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
FI GURA 14-8 MATRI Z DE ESTRUTURA PARA SOLUÇÃO DE DOI S CONGLOMERADOS
VariáveI Função 1
X6 - Funcionários simpáticos 0,777
X12 - Funcionários competentes 0,752
X, - Excelente uaiidade da comi da 0,510
X4 - Comida de excelente sabor 0,387
Xt ] - Funcionários cordiais 0,384
Xg - Gr ande variedade de pratos 0,189
Variáveis ordenadas por tamanho absoluto de correlação.
base nessas descobertas, podemos reieitar a hipotese nula de que as variaveis relativas a
comida e aos Iuncionarios não podem ser usadas para prever a participacão em um con-
glomerado.
As inIormacões na tabela da matriz de estrutura na Figura 14-8 possibilitam determi-
nar quais as variaveis que têm capacidade de previsão. A correlacão entre a Iuncão discri-
minante derivada e as seis variaveis independentes é interpretada de um modo seme-
lhante ao de uma carga de Iator. Portanto, devemos chegar a um consenso quanto ao ni-
vel de corte para variaveis signiIicativas. Em geral, a carga minima é 0,30, como na anali-
se Iatorial. Utilizando um critério de 0,30 como minimo, podemos concluir que cinco das
seis variaveis de percepcão exibem um nivel minimo de capacidade de previsão para par-
ticipacão em um dos dois conglomerados de satisIacão. As variaveis signiIicativas, na or-
dem de sua capacidade de previsão, são X
6
, X
12
, Xi, X
4
e X
u
.
A tareIa Iinal para essa questão de pesquisa é interpretar a média dos conglomerados
nas variaveis independentes. As inIormacões na Figura 14-9 mostram as médias de gru-
po (conglomerado) para as seis variaveis de percepcão. Lembre-se de que o grupo 1 era
signiIicativamente menos Iavoravel do que o grupo 2 nas variaveis de percepcão X
19
, X
20
e X
2|
. Comparando as médias dos dois grupos, notamos que, para as variaveis indepen-
dentes com capacidade de previsão signiIicativa, em todos os casos as médias do grupo
1 são mais baixas do que as do grupo 2. Isso sugere que as percepcões Iavoraveis nessas
variaveis sobre comida e Iuncionarios levarão a uma maior probabilidade de Ireqüência
e de satisIacão com um restaurante.
ANALÌSE FATORÌAL E REGRESSÃO MÚLTÌPLA
No capitulo sobre analise Iatorial, vimos que a identiIicacão de Iatores pode ser o Iim do
proieto de pesquisa. Mas, em alguns casos, podemos deseiar usar os resultados de uma
analise Iatorial com uma outra técnica multivariada, tais como a regressão multipla. E
normal Iazer isso quando temos um grande numero de variaveis com multicolinearida-
de. Podemos então combinar o numero maior de variaveis em um coniunto menor de va-
riaveis ortogonalmente independentes (não exibem multicolinearidade). Podemos de-
monstrar isso com o exemplo do Capitulo 13, onde combinamos as 12 variaveis de per-
cepcão em quatro Iatores - Comida, Funcionarios, Ambiente e Valor. A matriz de Iator do
Capitulo 13 é exibida na Figura 14-10.
Se não utilizarmos a analise Iatorial, então deveremos examinar as percepcões dos
clientes utilizando 12 caracteristicas separadas. Mas, se usarmos a analise Iatorial, so te-
CAPÍTULO 14 » ABORDAGENS AVANÇADAS DE ANÁLÌSE E APRESENTAÇÃO 431
remos que considerar quat ro caracteristicas (Iatores). Além disso, eliminaremos o proble-
ma da multicolinearidade. Para usar os quatro Iatores em uma regressão multipla, pri -
meiro devemos calcular os escores de fator. Lembre-se de que os escores de Iator são es-
cores compostos calculados para cada respondente em cada um dos Iatores derivados. As
inIormacões na Figura 14-11 mostram como são os escores de Iator para os cinco primei -
ros respondentes na survev dos clientes. Para cada respondente, os dados originais das 12
variaveis de percepcão é substituido por quatro escores de Iator. A secão Pesquisa em
acão mostra como usar o SPSS para calcular os escores de Iator.
USO DE ESCORES DE FATOR EM UMA ANÁLISE DE REGRESSÃO
Agora podemos usar a analise de regressão multipl a para determi nar se as percepcões
dos restaurantes medi das pelos quatro Iatores estão relacionadas com a satisIacão. Nesse
exemplo, queremos comparar a capacidade de previsão dos restaurantes Samouel' s e Gi-
no' s separadamente. Nossa unica variavel métrica dependent e é X
17
- SatisIacão, e as va~
PESQUISA EM AÇÃO
CONGLOMERADOS DE SATISFAÇÃO
A tareIa é determinar se as variaveis de percepcão da comida e dos Iuncionarios podem prever os
conglomerados recém-Iormados com base nas variaveis de satisIacão. Um outro modo de colocar is-
so é: as seis variaveis de percepcão podem prever se os respondentes estão no conglomerado mode-
radamente Iavoravel ou no conglomerado altamente Iavoravel? A seqüência de cliques em SPSS é:
ANALYZE -~ CLASSIFY -~ DISCRIMINANT, que leva a uma caixa de dialogo onde você seleciona
as variaveis. A variavel não-métrica dependente é a variavel de conglomerado recém-criada (clu2l).
A primeira coisa a Iazer é colocar a variavel de participacão em conglomerado na caixa Grouping Va-
riable. Clique então na caixa DeIine Range logo abaixo para poder dar entrada nos numeros minimos
e maximos para a variavel de agrupamento. Nesse caso, o minimo é 1 ÷ Conglomerado 1 e o maximo
é 2 ÷ Conglomerado 2: por isso, simplesmente coloque esses numeros e clique em Continue. A seguir,
coloque as variaveis de percepcão para comida e Iuncionarios X
v
X
4
, X
6
, X
9
, X
u
e X
12
na caixa Indepen-
dents. Então clique na caixa Statistics na parte inIerior e veriIique Means, Univariate ANOVAS e Con-
tinue. Usaremos o aefault Method. Agora clique emClassiIy e desative o aefault All Group Equal, cli-
que em Compute Irom Group sizes (sabemos que os tamanhos das amostras não são iguais, por isso
marcamos a opcão Compute Irom Group Sizes). Você também deve clicar em Summary Table e em
continue. Não utilizamos as opcões abaixo de Save, por isso clique emOKpara rodar o programa. Os
resultados deverão ser os mesmos que mostramos nas Figuras 14-7 a 14-9.
FIGURA 14-9
Estatística de grupo
Média Média
VariáveI Grupo 1 Grupo 2
USO DE SOFTWARE SPSS ANÁLISE DISCRIMINANTE PARA PREVER OS
MÉDIAS DE GRUPOS PARA AS VARIÁVEIS INDEPENDENTES COMIDA E FUNCIONÁRIOS
432 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
FIGURA 14-11 ESCORES DE FATOR PARA CINCO RESPONDENTES NA SURVEY DE CLIENTES
riaveis independentes são os escores de Iator para os quatro Iatores. Portanto, executare-
mos dois modelos de regressão multipla separados - uma para o Samouel's e outro para
o Gino's.
As inIormacões da Figura 14-12 apresentam a estatistica descritiva para os dois mo-
delos de regressão multipla. Primeiro, observe que as médias de satisIacão são de 4,78 e
5,96 para o Samouel's e o Gino's, respectivamente. As médias dos escores de Iator para os
quatro Iatores são mostradas ao lado de cada Iator para cada restaurante. Como podemos,
ver, são menores do que 1, pois os escores de Iator são mensurados para terem uma mé-
dia de zero e um desvio-padrão de 1,0.
SOLUÇÃO DE FATOR COM ROTAÇÃO PARA 12 VARIÁVEIS DE PERCEPÇÃO NA SURVEY
DE CLIENTES
FIGURA 14-10
CAPITULO 14 ‹ ABORDAGENS AVANCADAS DE ANALISE E APRESENTACÃO 4 3 3
PESQUISA EM ACÃO
USO DE SPSS PARA CALCULAR ESCORES DE FATOR
O programa SPSS calcula escores de Iator. Para esta analise, usamos todos os 200 respondentes e não
dividimos a amostra. Isso porque estamos procurando padrões comuns entre todos os clientes dos
restaurantes. A seqüência de cliques em SPSS é a seguinte: ANALYZE -» DATA REDUCTION -»
FACTOR, que leva a uma caixa de dialogo onde você seleciona as variaveis K
=
ó È
ïî
ò Ü»°±·- ¼» ½±´±s
½¿® »--¿- variaveis na caixa Variables, veriIique as alternativas abaixo. Clique primeiro na caixa Des-
criptives e depois na Univariate Descriptives. Desative a caixa Initial Solution, porque não a exami-
naremos, e clique em Continue. A seguir, clique na caixa Extraction. Usaremos o aefault Principal
Components como método e também o aefault Extract de Autovalores acima de 1, mas desative a so-
lucão de Iator sem rotacão embaixo de Display e clique em Continue. Em seguida, va a caixa Rota-
tion, onde o aefault e None. Como Iaremos a rotacão da solucão de Iator inicial, clique em Varimax
como opcão (esta remove o aefault None) e em Continue. Finalmente, va a caixa Options e clique em
Sorted by Size, mudando Supress Absolute Values Less Than de 0,10 para 0,3, e clique em Continue.
As duas ultimas opcões tornam mais Iacil de ler o resultado porque eliminamos inIormacões que
não serão utilizadas. VeriIicando a parte inIerior da caixa de dialogo, você vê a caixa Scores, que não
usamos antes. Clique nessa caixa e depois em Save as Variables. Quando você Iizer isso, havera mais
opcões, mas use apenas o aefault - Regression. Agora clique em Continue e em OK e você calculara
os escores de Iator. O resultado sera quatro escores de Iator para cada um dos 200 respondentes (ca-
da respondente tem um escore para cada um dos quatro Iatores). Eles aparecerão na extremidade
direita de seu banco de dados original e serão denominados Iacll (escores para o Iator 1), Iac2l
(escores para o Iator 2) e assim por diante. Um exemplo de escores de Iator para os cinco primeiros
respondentes do banco de dados de clientes é apresentado na Figura 14-11.
VeriIicando a tabela de r esumo do model o na Figura 14-13, vemos que R
z
é 0,365 pa-
ra o Samouel ' s e 0,300 par a o Gi no' s. Esses R
2
são estatisticamente signiIicativos em um
nivel de 0,000, como mostra a tabela ANO VA na Figura 14-13. Isso signiIica que 36,5° da
variacão na satisIacão para o restaurant e Samouel' s podem ser explicados a partir das
quat ro variaveis i ndependent es - os escores de Iator. De Iorma semel hante, 30,0° da va-
riacão na satisIacão para o restaurant e Gi no' s podem ser explicados a part ir das quat ro
variaveis i ndependent es - os escores de Iator.
Examinamos os coeIicientes padronizados (betas) na Figura 14-14 para determinar quads
das variaveis de escore de Iator têm boa capacidade de previsão signiIicativa para satisIacão.
FIGURA 14-12 ESTATISTICA DESCRITIVA PARA REGRESSÃO MULTIPLA USANDO ESCORES DE FATOR
Samouel's
X
25
- Concorrência Variaveis Média N
Médias apresentadas para três digitos signiIicativos.
Gino's
434 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
PESQUISA EM ACÃO
USO DE SPSS COM ESCORES DE FATOR EM UMA ANALÍSE DE REGRESSÃO
MULTIPLA
Para comparar as percepcões dos clientes do SamoueFs com as dos clientes do Gino's, va ao menu
Data para dividir a amostra. Desca e clique em Split File e depois em Compare Groups. Destaque a
variavel X
25
e coloque-a na caixa chamada Groups Based on e clique em OK.
Agora você pode rodar os modelos de regressão e comparar os dois restaurantes. A seqüência
de cliques em SPSS é: ANALYZE -~ REGRESSION -~ LINEAR. Destaque X
17
e coloque-a na caixa
Dependent Variables. Destaque os escores de Iator recém-criados e coloque-os na caixa Indepen-
dent Variables. Use o aefault Enter na caixa Methods. Clique em Statistics e use os aefaults para Es-
timates e Model Fit. A seguir, clique em Descriptives e em Continue. Ha varias outras opcões que
você poderia selecionar na parte inIerior da caixa de dialogo, mas por enquanto usaremos os ae-
faults do programa. Clique em OK para executar a regressão. Os resultados são os que aparecem
Primeiro, os resultados revelam que o Fator 1 - Comida e o Fator 2 - Funcionarios são sig-
niIicativos para previsão da satisIacão tant o para o SamoueFs quant o para o Gino' s. Os
resultados indicam um coeIiciente beta positivo, signiIicando uma relacão positiva, e um
resultado de teste t signiIicativo para cada variavel para cada restaurante. Assim, os mo-
delos de regressão sugerem que as percepcões sobre comida e Iuncionarios têm Iorte ca-
paci dade de prever a satisIacão, com comida sendo ligeiramente mai s Iavoravel do que
Iuncionarios para o SamoueFs (p ÷ 0,433 versus (3 ÷ 0,319, respectivamente) e Iuncionarios
sendo ligeiramente mai s Iavoravel do que comida para o Gino' s ((3÷ 0,480 versus (3 ÷ 0,421,
respectivamente). Essa conclusão Iundamenta-se na magni t ude relativa de beta para um
dos Iatores. Por outro lado, os Iatores 3 e 4 não têm boa capacidade de previsão (usando-
se (3 de 0,05), embora o valor para o SamoueFs esteia muit o proximo da signiIicância (sig.
÷ 0,054) e certamente devesse ser considerado por Phil na preparacão de seu plano admi -
nistrativo.
Nesta secão do capitulo, demonst ramos como você pode usar uma técnica multiva-
riada - analise Iatorial - com uma outra técnica - regressão - para melhor compreender
Ìndicadores: (Constante), Fator Comida, Fator Funcionários, Fator Ambiente, Fator Valor
nas Figuras 14-12 a 14-14.
CAPÍTULO 14 » ABORDAGENS AVANÇADAS DE ANÁLÌSE E APRESENTAÇÃO 4 3 5
Coeficientes padronizados
X25 - Concorrência ModeIo beta t Sig.
SamoueI s 1 (Constante) 39,221 0,000
Fator comi da 0,433 5,155 0,000
Fator Funcionários 0,319 3,736 0,000
Fator Ambiente 0,137 1,564 0,121
Fator Valor 0,162 1,951 0,054
Gino's 1 (Constante) 45,521 0,000
Fator Comida 0,421 4,673 0,000
Fator Funcionários 0,480 5,305 0,000
Fator Ambiente 0,028 0,318 0,752
Fator VaIor 0,091 1,052 0,296
Variável dependente: X17 - Satisfação
seus dados. Também é possivel, no entanto, usar as técnicas multivariadas em combina-
cão. Por exemplo, também usamos a analise de conglomerados com a analise discrimi-
nante no primeiro exemplo deste capitulo. Na proxima secão, mostraremos como calcu-
lar escores somados e como usa-los em outra analise estatistica.
ESCORES SOMADOS
Na secão anterior, demonstramos como usar os escores de Iator em uma analise de regressão.
Os escores de Iator são uteis porque eliminam a multicolinearidade das variaveis indepen-
dentes. Mas um problema na sua utilizacão é que, em vez de ser mensurado como as varia-
veis originais, são padronizados com uma média de 0 e um desvio-padrão de 1 (ver Figura
14-12). Isso torna mais diIicil a comparacão dos grupos e a compreensão de suas diIerencas.
Para superar esse problema, o pesquisador pode calcular os escores somados para re-
presentar os construtos da analise Iatorial. Por exemplo, na secão anterior, desenvolve-
mos quatro Iatores a partir das 12 variaveis de percepcão da survev de clientes. Cada Ia-
tor Ioi Iormado por três variaveis. Em vez de usar escores de Iator para representar os
quatro Iatores, podemos calcular escores somados em que as médias serão as mesmas de
uma escala de sete pontos como as variaveis originais.
Para calcular escores somados, simplesmente tomamos as respostas originais mensura-
das em escala e as adicionamos e calculamos a média. Lembre-se de que a solucão de Iator
para as 12 variaveis de percepcão na survev de clientes identiIicou quatro Iatores - comida,
Iuncionarios, ambiente e valor. O Iator Comida consistiu das variaveis X
v
X
4
e X
9
. Para calcu-
lar o escore somado de umrespondente para esse Iator, somariamos as respostas das três va-
riaveis e calculariamos a média. Por exemplo, os dados brutos para os cinco primeiros res-
pondentes na survev dos clientes são mostrados na Figura 14-15. Para calcular o escore soma-
do para o respondente 1 teriamos 6 ¹ 6 ¹ 6/3 ÷ 6, e para o respondente 2 seria 6 ¹ 4 ¹ 6/3 ÷
5,33. O Iator Funcionarios consiste das variaveis X
6
, X
u
e X
12
. Para calcular o escore somado
para o Iator Funcionarios com o respondente 1, outra vez somariamos as respostas das três
variaveis e as dividiriamos por três (4 ¹ 3 ¹ 2/3 ÷ 3): para o respondente 2, seria 4 ¹ 4 ¹ 3/3
÷ 3,67. Esse mesmo processo seria completado para todos os respondentes nos quatro Iatores.
O calculo dos escores somados para cada respondente em cada Iator dara quatro no-
vas variaveis. Essas variaveis serão como as exibidas na Figura 14-16 para os cinco pri-
ÝÑÛÚ×Ý×ÛÒÌÛÍ ÜÛ REGRESSÃO PARA MODELOS DE REGRESSÃO | FIGURA 14-14
436 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
FIGURA 14-15 DADOS BRUTOS PARA 12 VARIÁVEIS DE PERCEPÇÃO NA SURVEY DE CLIENTES
Variáveis de percepção
melros respondentes na survev de clientes. Os numeros abaixo de comiaas são os escores
somados para os respondentes 1 - 5 no Iator 1: sob funcionarios são os escores somados
para o Iator 2: sob ambienteis. para o Iator 3: e sob valors, para o Iator quatro. Ha quatrc
novas variaveis para cada um dos 200 respondentes da survev de clientes. Essas novas va-
riaveis podem ser usadas em uma analise de acompanhamento como variaveis indepen-
dentes métricas para representar os quatro Iatores. O calculo dos escores somados pode
ser um longo e entediante processo. A secão Pesquisa em acão mostra como utilizar :
SPSS para calcular os escores somados.
USO DE ESCORES SOMADOS EM UMA ANÁLISE DISCRIMINANTEMÚLTIPLA
Phil esta interessado em descobrir se os escores somados para os Iatores podem ser usa-
dos para prever os dois conglomerados de satisIacão identiIicados na analise de conglo-
merados examinada anteriormente neste capitulo. Ele acredita que isso seria um meio
eIetivo de simpliIicar sua compreensão dos dados da survev dos clientes. Seu consultor
diz que ele pode usar a analise discriminante com a variavel não-métrica dependente sen-
do os dois conglomerados e as variaveis métricas independentes sendo os escores soma-
dos para os quatro Iatores. A avaliacão da Iuncão discriminante é relatada na Figura 14-
17. Ela é altamente signiIicativa (0,000), e a hit ratio é de 79°. Deste modo, os escores so-
mados podem prever os conglomerados de satisIacão.
PESQUISA EM AÇÃO
USO DE SPSS PARA CALCULAR ESCORES SOMADOS
O programa SPSS calcula escores somados. Para esta analise, usamos todos os 200 respondentes. Ya
ao editor de dados SPSS e procure o menu TransIorm. A seqüência de cliques em SPSS é: TRANS-
FORM -~ COMPUTE, que leva a uma tela Compute Variable. Na caixa de dialogo Target Variable
digite uma denominacão para a nova variavel (escore somado) que você deseia criar. Nesse caso, es-
taremos calculando o escore somado para o Fator Comida, por isso chamaremos a nova variavel de
comiaas. A seguir, va a caixa Numeric Expression com um clique. Agora clique nos sinais de parên-
teses () abaixo para coloca-los na caixa Numeric Expression. Coloque as variaveis X
v
X
4
e X
9
dentro
dos parênteses e um sinal de mais entre cada uma: (X
:
¹ X
4
¹ X
9
). O sinal de mais é colocado clicar -
do nele, embaixo da caixa Numeric Expression. Coloque agora a divisão com o sinal (/) Iora dos pa-
rênteses e um 3 para calcular a média das três variaveis nos parênteses. Clique em OK, e uma nova
variavel de escore somado sera criada na extremidade direita de seu banco de dados. Os numeras
serão os mesmos que apresentamos na Figura 14-17. O mesmo processo é seguido para todos :s
quatro Iatores para criar escores somados.
CAPÍTULO 14 ‹ ABORDAGENS AVANÇADAS DE ANÁLÌSE E APRESENTAÇÃO 4 3 7
FÌGURA 14-16
Novas variáveis de escores somados por respondente
FÌGURA 14-17
Teste de Iuncão(ões) Lambda de Wilk Sig.
1 0,716 0,000
* 79,0° de casos originais corretamente classiIicados.
Agora vamos descobrir quais Iatores de escores somados têm boa capacidade de pre-
visão. Isso é mostrado na Figura 14-18. Observe que as três variaveis têm capacidade sig-
niIicativa de previsão (cargas ~ 0,30). As variaveis Iuncionarios, comida e valor apresen-
tam poder signiIicativo de previsão. Além disso, veriIicando a Figura 14-19, vemos que,
para essas três variaveis, as médias são todas mais altas no conglomerado altamente sa-
tisIeito. Assim, melhorando as percepcões quanto a Iuncionarios, comida e valor, Phil po-
de estar certo de que os clientes de seu restaurante Iicarão mais satisIeitos e demonstra-
rão maior probabilidade de retornar e de recomenda-lo para amigos.
Na Figura 14-18, usamos os escores somados com analise discriminante multipla. De-
veria ser observado, porém, que os escores somados podem ser usados como variaveis
compostas com quase todas as técnicas estatisticas. Por exemplo, eles poderiam ser as va-
riaveis independentes métricas em uma analise de regressão multipla. Os escores soma-
dos são muito uteis para melhorar a interpretacão das descobertas de pesquisa, mas não
eliminam a multicolinearidade, como Iaz a analise Iatorial.
MAPEAMENTO DE PERCEPÇÕES
O mapeamento de percepcões é um processo usado para desenvolver mapas que mos-
tram as percepcões dos respondentes. Os mapas são representacões visuais das percep-
cões dos respondentes em relacão a uma empresa, um produto, um servico, uma marca
ou qualquer outro obieto em duas dimensões. Um mapa de percepcões geralmente tem
Resultados de classificacão
Participacão prevista
ANÁLISE DISCRIMINANTE COM ESCORES SOMADOS
ESCORES SOMADOS PARA CINCO RESPONDENTES DA ÍËÎÊÛÇ DE CLIENTES
ID comidas Iuncionarios arnbientes valor¸s
438 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
FIGURA 14-18
FIGURA 14-19
INDICADORES SIGNIFICATIVOS NA FUNÇÃO DISCRIMINANTE
Função
Variáveis
Correlações entre variáveis discriminantes e a função discriminante. Variáveis ordenadas por tamanho absoluto de
correlação com a função.
MÉDIAS DE CONGLOMERADOS PARA VARIÁVEIS DE ESCORE SOMADO
Médias
eixos horizontais e verticais rotulados com adietivos descritivos, Um excelente exemplo
de mapeamento de percepcões de dados é a analise de importância-desempenho. Ilustra-
mos essa abordagem nas paginas seguintes.
GRÁFICOS DE IMPORTÂNCIA-DESEMPENHO
Um dos procedimentos de mapeamento de percepcões mais utilizado é chamado de grá-
fico importância-desempenho. Esses graIicos têm um eixo vertical e um eixo horizontal
e distribuem os valores para essas medidas. O eixo vertical reIere-se as medidas de im-
portância, e o eixo horizontal estabelece as medidas de desempenho. Os quadrantes (qua-
tro quadrados divididos pelos eixos horizontais e verticais) são denominados como se-
gue: quadrante direito superior ÷ continue com o bom trabalho: quadrante esquerdo su-
perior ÷ precisa de atencão imediata: quadrante direito inIerior ÷ excesso (recursos de-
mais): e o quadrante esquerdo inIerior ÷ não precisa se preocupar. Os graIicos de impor-
tância-desempenho são Iaceis de interpretar e podem ser muito uteis no desenvolvimen-
to de planos de acão.
Podemos usar nosso banco de dados da survev de clientes para ilustrar um graIico de
importância-desempenho. Os valores de mediana para os Iatores de selecão de restauran-
te (X
13
- X
16
) mostrados na Figura 14-20 podem ser usados para distribuir as classiIicacões
de importância. Para as medidas de desempenho, escolhemos K
=
ó Ï«¿´·¼¿¼» ¼¿ ½±³·¼¿ô
È
è
ó Ô«¹¿® ¼·ª»®¬·¼±ô È
ïð
ó Precos razoaveis e X
12
- Funcionarios competentes. As médias
para essas variaveis são mostradas na Figura 14-21. Distribuimos os ranqueamentos mé-
dios dos Iatores de selecão de restaurante no eixo vertical e as médias das quatro varia-
veis de percepcão no eixo horizontal. O graIico é apresentado na Figura 14-22.
A Figura 14-22 ilustra como distribuir as descobertas de pesquisa em administracão
para Iacilitar a interpretacão. Observe que os clientes do Samouel's classiIicam melhor a
qualidade da comida (mediana ÷ 4) e também colocam esse aspecto como a caracteristica
1
CAPÍTULO 14 ‹ ABORDAGENS AVANÇADAS DE ANÁLÌSE E APRESENTAÇÃO 4 3 9
*Existem modas múltiplas. O menor valor é mostrado.
de melhor desempenho (5,24). Isso é indicado pelo simbolo encontrado no ponto onde 4,
no eixo vertical, atravessa 5,24 no eixo horizontal. Os clientes do Gino's também indicam
a qualidade da comida como sendo mais importante. No entanto, o Gino's tem melhor
desempenho do que o Samouel's na classiIicacão da qualidade da comida, como é indi-
cado pelo simbolo para o Gino's na intersecão de 4 e 5,81 nos eixos vertical e horizontal,
respectivamente. O desempenho superior do Gino's é observado por seu posicionamen-
to adiante a direita. Por outro lado, se considerarmos o ambiente, o Iator de selecão clas-
siIicado em segundo lugar em importância para ambos os restaurantes (com um 3), o
Samouel's (classiIicacão ÷ 3,65) esta apresentando um desempenho melhor do que o do
Gino's (classiIicacão ÷ 3,12), como é indicado pelo simbolo do Samouel's emposicão mais
avancada a direita do graIico. Distribuindo as classiIicacões restantes de importância e
desempenho para cada restaurante, os outros Iatores de selecão podem ser interpretados
de maneira parecida. O Gino's esta tendo melhor desempenho na classiIicacão dos Iun-
440 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
FIGURA 14-22
DADOS DA SURVEY DE CLIENTES
cionarios, e o Samouel's esta melhor na classiIicacão preco/valor. Muitas vezes, uma re-
presentacão graIica como essa é mais Iacilmente interpretada pelos administradores do
que os relatorios e tabelas contendo somente numeros. Os administradores podem com-
preender rapidamente seu posicionamento relativo percebendo a localizacão dos simbo-
los. Muitas planilhas e pacotes estatisticos Iacilitam a producão desses graIicos.
Essa não é a unica Iorma de preparar um mapa de percepcões. Ha muitas outras. Por
exemplo, a analise Iatorial é comumente usada. Os escores de Iator, como os descritos an-
teriormente, são distribuidos em dimensões representando os Iatores derivados. Além
disso, outras técnicas estatisticas, como o escalonamento multidimensional, podem ser
usadas para desenvolver mapas de percepcões. O tratamento detalhado dessas técnicas
encontra-se além do escopo deste texto sobre pesquisa em administracão basica. Entre-
tanto, incentivamos o leitor a explorar os pacotes estatisticos como o SPSS ou o SAS para
obter mais inIormacões sobre esses procedimentos e a procurar mais dados em algumas
outras Iontes ia mencionadas.
RESUMO
Compreensão de como usar a análise de conglomerados com a análise discriminante
A analise de conglomerados pode ser usada com a analise discriminante para melhorar a
compreensão que o pesquisador em administracão tem sobre os dados. A analise de con-
glomerados pode ser usada para identiIicar subgrupos de variaveis independentes ou
dependentes. E mais apropriada quando o pesquisador não sabe quais respondentes de-
vem ser colocados em um determinado grupo, tendo que usar, de outro-modo, uma me-
ILUSTRAÇÃO DE GRÁFICO IMPORTÂNCIA-DESEMPENHO USANDO O BANCO DE
CAPÍTULO 14 « ABORDAGENS AVANÇADAS DE ANÁLÌSE E APRESENTAÇÃO 4 4 1
dida arbitraria como a média ou a mediana. Por exemplo, no desenvolvimento da varia-
vel dependente de satisIacão neste capitulo, poderiamos ter Iormado dois grupos de sa-
tisIacão posicionando todos os respondentes com um escore médio acima de 3,5 (ponto
intermediario da escala de sete pontos) em um grupo e todos os com média abaixo de 3,5
no outro grupo. A analise de conglomerados possibilita Iazer isso usando uma aborda-
gem mais obietiva. Assim, conseguimos usar a analise discriminante para prever a parti-
cipacão nos conglomerados de satisIacão.
Compreensão de como usar a análise fatorial com regressão
A analise Iatorial Ioi usada para reduzir as 12 variaveis de percepcão dos clientes a qua-
tro novas variaveis de Iator. Os escores de Iator Ioram calculados para cada respondente
em cada um dos quatro Iatores. Os escores de Iator Ioram então usados para prever a uni-
ca variavel de satisIacão X
17
. Esse processo possibilitou que tivéssemos um modelo de re-
gressão mais simples em que não havia multicolinearidade entre as variaveis indepen-
dentes métricas.
Explicação do uso de escores somados em vez de escores de fator
Os escores de Iator são uteis porque eliminam a multicolinearidade das variaveis inde-
pendentes. Mas um problema em sua utilizacão é que, em vez de serem mensurados co-
mo as variaveis originais, são padronizados com uma média de 0 e um desvio-padrão de
1. Isso torna mais diIicil comparar grupos e compreender suas diIerencas. Para superar
esse problema, o pesquisador pode calcular escores somados para representar os constru-
tos da analise Iatorial. Essas novas variaveis podem ser usadas em uma analise de acom-
panhamento como variaveis independentes métricas para representar os quatro Iatores.
Compreensão do mapeamento de percepções
O mapeamento ou mapas de percepcões podem ser produzidos a partir de dados gera-
dos em uma analise estatistica. Os mapas oIerecem uma representacão visual de como
empresas, produtos, marcas ou outros obietos são percebidos em relacão a outros em atri-
butos importantes, como a qualidade do atendimento, sabor da comida, preparacão dos
pratos, etc. Um dos mapas de percepcão mais uteis, o da analise de importância-desem-
penho, Ioi ilustrado no capitulo.
PALAVRAS-CHAVE
escores de Iator graIico de importância- Lambda de Wilk (k)
escores somados desempenho mapeamento perceptual
DÌLEMA ÉTÌCO
A Monarch é uma empresa de produtos ao consumidor em Iase de crescimento com ven-
das em todo o pais. A empresa tem um longo relacionamento com o The Data Group,
uma empresa de pesquisa de marketing cuio crescimento esta muito ligado ao da Mo-
narch. Quando Barbara Newcomb é contratada como nova presidente da Monarch para
aiudar a empresa a alcancar o proximo nivel de crescimento, ela programa uma reunião
com Steve Harris, o presidente do The Data Group, para discutir o aumento do nivel de
soIisticacão da pesquisa de marketing que esta sendo Ieita pela empresa. Durante a reu-
nião, Barbara solicita especiIicamente que o The Data Group realize uma analise Iatorial
442 FUNDAMENTOS DE MÉTODOS DE PESQUÌSA EM ADMÌNÌSTRAÇÃO
para uso em analise Iutura e escalonamento multidimensional para aiuda-la a compreen-
der as diIerencas entre os atributos reais e os atributos percebidos dos produtos da Mo-
narch. Steve sente-se bem quanto a capacidade de sua empresa executar a analise Iatorial,
mas sabe que essa é a primeira vez que um cliente solicita um escalonamento multidi-
mensional e que precisara adquirir novo software e treinar seus Iuncionarios para atender
a solicitacão. A Monarch é a maior cliente da empresa, e ele não quer arriscar-se a perder
o negocio desapontando a nova presidente. O que ele deveria Iazer?
QUESTÕES DE REVÌSÃO
1. Como a analise de conglomerados pode ser usada com variaveis dependentes?
2. Quais critérios são usados para determinar o numero de conglomerados a reter?
3. O que são escores de Iator?
4. Por que usamos escores de Iator em analise subseqüente?
5. O que são escores somados?
6. Por que usamos os escores somados?
7. O que é mapeamento de percepcões?
8. O que é analise de importância-desempenho?
ATÌVÌDADES PARA DÌSCUSSÃO E APLÌCAÇÃO
1. Descreva um problema de pesquisa que possa ser melhor compreendido se
duas ou mais técnicas multivariadas Iorem usadas para analisar os dados. Que
técnicas seriam usadas e por quê?
2. Por que o pesquisador em administracão poderia decidir usar classiIicacões so-
madas em vez de escores de Iator?
3. Aplicacão SPSS. Execute uma analise Iatorial usando as 12 variaveis de percep-
cão do banco de dados da survev de Iuncionarios. Calcule os escores de Iator e
os escores somados que representam os Iatores. Prepare um breve relatorio sin-
tetizando as diIerencas entre os escores de Iator e os escores somados.
4. Aplicacão SPSS. Execute uma analise de conglomerados usando as três varia-
veis de comprometimento organizacional (X
13
, X
14
e X
15
) do banco de dados da
survev de Iuncionarios. Selecione a solucão de três conglomerados para a varia-
vel dependente não-métrica e os escores somados para a solucão de quatro Ia-
tores como variaveis independentes métricas em uma analise discriminante.
Prepare um breve relatorio sobre como você utilizou a analise de conglomera-
dos, a analise Iatorial, os escores somados e a analise discriminante iuntos para
melhor compreender seu problema de pesquisa.
CAPÍTULO 14 » ABORDAGENS AVANÇADAS DE ANÁLÌSE E APRESENTAÇÃO 4 4 3
EXERCÍCÌOS NA ÌNTERNET
1. Va ao site da Data and Story Library em http://lib.stat.cmu.edu/DASL. Fami-
liarize-se com o site clicando primeiro em dataIiles e depois em stories .
Agora clique em Power Search e digite a palavra-chave multivariate. Percorra
os topicos e encontre dois ou três que você achar interessantes. Prepare um bre-
ve relatorio do que você encontrou.
2. Va ao site de BRINT em www.brint.com. Procure em ReI .Biz o link Sciences e
clique. Na proxima tela clique em Math , na seguinte em Statistics e sob os
Related Topics clique em Education .* Percorra as paginas. Descubra três links
que lhe parecam interessantes e analise-os. Prepare um breve relatorio sobre o
que você acha do portal BRINT e o que você descobriu nos links que visitou.
* N. de R.T.: Esse site tem atualizacão Ireqüente e seu lavout pode ser modiIicado sem prévio aviso. O caminho indicado nes-
ta edicão brasileira Ioi revisto e atualizado em 30/07/2004.
Glosssario
A
abordagem tipo funil criacão de
um questionario de Iorma que as
pergunt as gerais seiam colocadas
no inicio e as mais especiIicas no
Iinal
administracão de crise uma si-
tuacão de tomada de decisão que
ocorre chamando pouca atencão e
apresentando um grande poten-
cial para implicacões negativas
administracão de questionário
mét odo usado para administrar
um questionario a respondentes,
tais como teleIone, entrevista pes-
soal, correio, Internet, etc.
amostra pequeno subconiunto da
populacão usado para derivar
conclusões sobre as caracteristicas
da popul acão
amostra proporcionalmente es-
tratificada cada estrato na amos-
tra tem um t amanho de amostra
proporcional ao t amanho dos es-
tratos em relacão ao t amanho to-
tal da amostra
amostra representativa amostra
que reIlete as caracteristicas da
populacão, assim mini mi zando o
erro associado com a amost ragem
amostragem aleatória simples es-
tilo de amostragem em que cada
elemento da populacão alvo tem
igual probabilidade de ser sele-
cionado
amostragem bola-de-neve tam-
bém chamada de amostra de reIe-
rência, envolve inicialmente a se-
lecão de respondent es através de
mét odos de probabilidade e então
utiliza-os para aiudar a identiIicar
os outros respondent es na popu-
lacão alvo
amostragem de conglomerados
retirada de uma amostra de con-
glomerados aleatoriamente sele-
cionados ou de subpopulacões da
populacão alvo: na amost ragm
estratiIicada, retiram-se amostras
de todos os estratos, mas, na
amost ragem de conglomerados,
os conglomerados individuais de
onde são retiradas as amostra são
escolhidos aleatoriamente e nem
todos eles são considerados
amostragem de conveniência se-
lecão de elementos de amostra
mais prontament e disponiveis
para participacão em um estudo
ou que podem Iornecer as inIor-
macões necessarias
amostragem desproporcional-
mente estratificada cada estrato
da amostra tem um t amanho de
amostra que não é proporcional
ao tamanho daquele estrato em
relacão ao tamanho total da
amostra: o t amanho da amostra
do estrato individual baseia-se
em alguns outros critérios, como
a importância de um determina-
do estrato para as descobertas da
pesquisa
amostragem estratificada a po-
pulacão alvo é dividida em sub-
grupos relativamente homogê-
neos, distintos e não-sobrepostos
chamados estratos
amostragem não-probabilística a
inclusão ou exclusão de elemen-
tos em uma amostra é deixada a
critério do pesquisador: nem to-
dos os elementos de uma popula-
cão têm a chance de serem sele-
cionados para a amostra, e o erro
associado com a amostra não é
conhecido
amostragem por conglomerado
de vários estágios Iorma de
amost ragem por conglomerado
em que os principais conglomera-
dos são primeiramente seleciona-
dos de Iorma aleatoria e depois, a
partir deles, um segundo coniun-
to de conglomerados é aleatoria-
mente selecionado, do qual os da-
dos serão coletados
amostragem por julgamento as
vezes chamada de amostragem
intencional: envolve a selecão de
elementos na amostra para Iins
especiIicos
amostragem por quotas seme-
lhante a amostragem aleatoria es-
tratiIicada, mas a selecão dos ele-
mentos do estrato é Ieita com ba-
se na conveniência
amostragem probabilística ba-
seia-se na premissa de que cada
elemento da popul acão alvo tem
uma probabi lidade conhecida,
mas não necessariamente igual,
de ser selecionado par a uma
amostra: se realizada de modo
adequado, a amost ragem proba-
bilistica assegura que a amostra
sera representativa e que o erro
associado com ela sera conhecido
amostragem processo de contatar
e coletar inIormacões de uma
amostra
amostragem sistemática aborda-
gem de amostragem aleatoria que
envolve a selecão aleatoria de um
ponto de partida inicial e depois a
selecão de todo elemento n na es-
trutura da amostra
amostras independentes duas
amostras de dados i ndependen-
tes, como homens e mulheres
446 GLOSSÁRÌO
amostras relacionadas dados do
mesmo grupo que comparam
duas variaveis relacionadas, co-
mo a comparacão da média de
Coca-Colas * consumidas por dia
por um grupo de mulheres com a
média de xicaras de caIé consu-
midas por dia pelo mesmo grupo
análise conjunta técnica que pos-
sibilita ao pesquisador determi-
nar as preIerências dos indivi-
duos em termos de produtos e
servicos e quais de suas caracte-
risticas que são mais valorizadas
análise de conglomerados abor-
dagem estatistica multivariada
que combina obietos (como indi-
viduos, marcas, loias) em grupos
de modo que os obietos dentro
deles seiam semelhantes uns aos
outros e diIerentes dos obietos de
todos os outros grupos
análise de conteúdo método de
obtencão de dados por meio da
observacão e analise do conteu-
do ou mensagem de um texto es-
crito
análise discriminante procedi-
mento estatistico que pode ser
usado para prever a probabilida-
de de participacão de um indivi-
duo em um grupo usando duas
ou mais variaveis independentes
métricas
análise fatorial técnica estatistica
multivariada que pode sintetizar
as inIormacões de um grande nu-
mero de variaveis mensuradas
convertendo-as em um numero
menor de variaveis latentes ou Ia-
tores
ANOVA de dois fatores envolve
duas ou mais variaveis indepen-
dentes não-métricas em uma uni-
ca variavel dependente métrica:
também chamada de aesign Iato-
rial
ANOVA de um fator envolve
uma unica variavel independente
não-métrica e uma unica variavel
dependente métrica
ANOVA iniciais de analise de va-
riância: testa se as médias de dois
grupos ou mais são estatistica-
mente diIerentes em uma unica
variavel dependente métrica
aprendizagem organizacional as-
similacão de inIormacões internas
e externas a serem usadas como
auxilio na tomada de decisão
armazém de dados inventario
eletrônico de conhecimento orga-
nizacional
assimetria mede o ponto de parti-
da de uma distribuicão simétrica
ou equilibrada
autovalor representa a quantida-
de de variância em um coniunto
de dados que é representado por
um unico Iator: pode ser encon-
trado somando-se as cargas de Ia-
tor ao quadrado para um Iator
3
barreiras para a criatividade ten-
dências comportamentais e cogni-
tivas naturais que tornam a criati-
vidade desaIiadora (como pensa-
mento de grupo, inibicão emocio-
nal e conveniência)
O
½¿®¹¿ ¼» º¿¬±® correlacão entre
um Iator e uma variavel indivi-
dual
censo contata e coleta inIorma-
cões de todos os elementos da po-
pulacão
centeriod média de todos os esco-
res Z dos respondentes em um
determinado grupo
ciência o que se conhece sobre
um obieto deIinivel
codificacão atribuicão de um nu-
mero a uma determinada respos-
ta de modo que ela possa ser inse-
rida em um banco de dados
coeficiente de correlacão de or-
dem de ranqueamento de Spear-
man medida correlacionai apro-
priada para dados nominais e or-
dinais que não Iaz suposicões so-
bre a distribuicão
coeficiente de correlacão usado
para avaliar a covariacão entre
duas ou mais variaveis
coeficiente de determinacão qua-
drado do coeIiciente de correla-
cão: mede a quantidade de varia-
cão em uma variavel explicada
por uma ou mais variaveis
coeficiente de regressão valor
numérico para as variaveis inde-
pendentes que indica quanto da
variância na variavel dependen-
te é explicada por uma determi-
nada variavel independente:
também chamado de peso de re-
gressão
coeficientes não-padronizados
coeIicientes (pesos) de regressão
que não são padronizados
coeficientes padronizados coeIi-
cientes de regressão que são pa-
dronizados, chamados de pesos
beta
coercão uso da participacão Ior-
cada de um respondente com im-
plicacões indeseiaveis no caso de
o individuo recusar-se a partici-
par
comitê de revisão de recursos
humanos grupo que realiza uma
revisão de pesquisa usando parti-
cipantes humanos com ênIase na
veriIicacão de procedimentos de
pesquisa para garantir que todos
os participantes seiam tratados
com ética
comunalidade representa a quan-
tidade de variância em uma unica
variavel que é explicada pelos Ia-
tores extraidos em uma analise Ia-
torial: pode ser encontrada pela
adicão de cargas de Iator ao qua-
drado em todos os Iatores extrai-
dos para a variavel (através do
padrão do Iator)
conceito idéia genérica Iormada
na mente de um individuo, tam-
bém chamada de construto
confiabilidade um instrumento
de survev e conIiavel se sua apli-
cacão repetida resultar em escores
coerentes
conglomerado hierárquico (divi-
sório) abordagem de conglomera-
do que comeca com a suposicão
inicial de que toda observacão
pertence a um conglomerado, se-
parando os conglomerados mais
distantes para que resultem em
dois, depois três, quatro ou mais
conglomerados: o processo conti-
nua até que todas as observacões
representem um conglomerado
separado
GLOSSÁRÌO 447
conglomerado não-hierárquico
abordagem de conglomerado em
que as observacões dentro de
uma distância pré-especiIicada a
partir dos elementos iniciais são
consideradas como parte de um
certo conglomerado: as observa-
cões podem então ser redistribui-
das em diIerentes conglomerados
como Iorma de melhorar a diIe-
renca entre grupos
correlacão de Pearson medida
correlacionai que supõe dados in-
tervalares ou de razão (métricos),
uma relacão linear e uma distri-
buicão normal
correlacão examina a associacão
entre duas variaveis métricas: a
Iorca da associacão é mensurada
pelo coeIiciente de correlacão
covariacão quando uma variavel
muda coerente e sistematicamen-
te em relacão a uma outra varia-
vel
criacão de questionário processo
de desenvolvimento de um ques-
tionario (instrumento de survev)
para coletar dados
critério de raiz latente o numero
de Iatores extraidos (computa-
dos) durante uma analise Iatorial
é igual ao numero de componen-
tes principais com uma raiz laten-
te (autovalor) igual ou maior do
que 1,0
critérios de avaliacão caracteristi-
cas usadas para iulgar os méritos
de diIerentes alternativas
curtose medida dos picos ou
achatamentos de uma distribui-
cão
D
dados faltantes dados de survev
que estão Ialtando, normalmente
devido a problemas na coleta ou
na entrada dos dados
dados inIormacões registradas
que pretendem representar Iatos
dados objetivos as medidas são
independentes da opinião de
uma pessoa
dados primários inIormacões co-
letadas com o proposito de reali-
zar o atual proieto de pesquisa
dados projetivos dados resultan-
tes de uma entrevista em que as
respostas a um estimulo ambiguo
são usadas para inIerir caracteris-
ticas do respondente
dados qualitativos descricões
realizadas sem a atribuicão direta
de numeros
dados quantitativos mensuracões
em que os numeros são usados
diretamente para representar as
propriedades de algo
dados secundários inIormacões
coletadas previamente para al-
gum outro proposito de pesquisa
dados subjetivos medida que re-
presenta a opinião de uma pessoa
(respondente ou pesquisador)
decisões baseadas na intuicão
decisões que não apresentam
uma base logica aparente
decisões baseadas na teoria deci-
sões baseadas em raciocinio teori-
co
dendograma graIico em Iorma
de arvore que mostra como o
agrupamento ocorreu em uma
analise de conglomerados hierar-
quicos
desvio-padrão indice que descre-
ve a dispersão ou variabilidade
dos valores de distribuicão da
amostra a partir da média: é a
raiz quadrada da variância
diagramas de dispersão também
chamados de graIicos de disper-
são, são apresentacões visuais dos
valores de duas variaveis para to-
das as observacões em uma
amostra
diálogo por computador método
para responder perguntas online
através do uso de um computa-
dor pessoal
dilemas éticos situacões em que
uma pessoa se conIronta com
acões que têm implicacões éticas
divergentes
distância Euclidiana medida co-
mumente usada que representa
as distâncias entre obietos em
uma analise de conglomerados
distribuicão de freqüência tabela
de numeros que apresenta as res-
postas associadas com cada valor
de uma variavel
distribuicão normal uma curva
simétrica em Iorma de sino que
abrange quase todos os valores
de uma variavel
E
edicão de dados inspecão de da-
dos para veriIicar se estão com-
pletos e se são coerentes
efeito de contexto ver tendencio-
sidade de posicão
efeito de demanda grau até onde
a tareIa experimental permite que
um suieito determine ou adivinhe
uma hipotese de pesquisa
elementos individuos ou obietos
que estão sendo contatados em
uma amostra
entrada de dados insercão de da-
dos em um banco de dados
entrevista em profundidade ses-
são de discussão individual entre
um entrevistador treinado e um
respondente em que este geral-
mente pode Iornecer percepcões
unicas sobre um topico especiIico
entrevista estruturada entrevista
em que o entrevistado segue uma
seqüência predeterminada de
perguntas normalmente abertas
entrevista não-estruturada entre-
vista conduzida sem o uso de
uma seqüência de questões: o
pesquisador obtém as inIorma-
cões por meio de uma discussão
livre e aberta sobre o topico de in-
teresse
entrevista o pesquisador Iala di-
retamente com o respondente, Ia-
zendo perguntas e registrando as
respostas
entrevista pessoal entrevista que
envolve contato direto Iace-a-Iace
com o respondente
entrevista semi-estruturada o
pesquisador utiliza uma seqüên-
cia de questões, mas Iica livre pa-
ra exercer sua propria iniciativa
para Iormular perguntas a partir
da resposta do entrevistado
entrevista telefônica entrevista
realizada por teleIone e não Iace-
a-Iace
equivalência de traducão um tex-
to pode ser traduzido de uma lin-
gua para outra e novamente para
448 GLOSSÁRÌO
a lingua original sem distorcão de
signiIicado
erro do Tipo I ocorre quando os
resultados da amostra levam a re-
ieicão da hipotese nula quando
esta é verdadeira
erro do Tipo II ocorre quando os
resultados da amostra não levam
a reieicão da hipotese nula quan-
do esta é Ialsa
escala categórica escala de opi-
nião nominalmente mensurada
com duas ou mais categorias de
resposta
escala de classificacões gráficas
mede conceitos em um continuo
na Iorma de uma linha com ânco-
ras numeradas ou nomeadas
escala de classificacões somadas
escala que mensura atitudes e
opiniões de respondentes obtida
pela soma das classiIicacões de
varias escalas de Likert indivi-
duais
escala de comparacão aos pares
escala que pede que os respon-
dentes comparem dois atributos
(obietos) e selecionem o de sua
preIerência
escala de itens múltiplos escala
que consiste de um numero de
aIirmacões individuais estreita-
mente relacionadas cuias respos-
tas são combinadas em um escore
composto ou classiIicacão soma-
da usada para mensurar um con-
ceito
escala de Likert medida de atitu-
des ou opiniões usando uma uni-
ca escala para avaliar a intensida-
de de concordância ou discordân-
cia de individuos quanto a uma
determinada aIirmacão: outros
adietivos, como Iavoravel e desIa-
voravel ou positivo e negativo,
também podem ser usados com
essa escala
escala de ordem de ranqueamen-
to escala ordinal que pede que os
respondentes classiIiquem em or-
dem um coniunto de obietos ou
caracteristicas em termos de pre-
Ierência, semelhanca, importância
ou outros aspectos
escala de razão escala com um
unico ponto zero (Iixo): mede não
so a magnitude das diIerencas en-
tre pontos na escala, mas também
as diIerencas proporcionais
escala de soma constante pede
que o respondente divida uma
soma constante em varias catego-
rias para indicar, por exemplo, a
importância relativa dos atributos
escala diferencial semântica va-
rias escalas individuais combina-
das: os pontos Iinais são bipolares
e nomeados por adietivos, e os
pontos intermediarios são nume-
rados ou têm lacunas para serem
marcadas
escala equilibrada escala em que
o numero de categorias de res-
postas Iavoraveis e desIavoraveis
é igual
escala instrumento usado por
pesquisadores para mensurar in-
dividuos, obietos ou eventos em
variaveis que se relacionam com
o problema de pesquisa
escala intervalar escala que utili-
za numeros para classiIicar obie-
tos ou eventos em que as distân-
cias entre os numeros são iguais e
o ponto zero é arbitrario (não-Ii-
xo): pode ser usada para mensu-
rar a magnitude das diIerencas
entre pontos em uma escala
escala métrica escalas intervala-
res e de razão são métricas e con-
sideradas quantitativas
escala não-equilibrada escala em
que o numero de categorias de
respostas Iavoraveis e desIavora-
veis não é igual
escala nominal uso de numeros
como rotulos para identiIicar e
classiIicar individuos, obietos ou
eventos em uma escala
escala numérica utiliza numeros
como opcões de resposta em vez
de descricões verbais
escala ordinal colocacão de obie-
tos ou individuos em uma catego-
ria predeterminada em uma esca-
la cuia ordem é ditada por algum
critério
escalas não-métricas escalas no-
minais e ordinais são não-métri-
cas e consideradas qualitativas: as
vezes chamadas de escalas com-
parativas
escolha forcada escala sem ponto
intermediario que possa ser con-
siderado como neutro ou sem
opinião
escolha não-forcada escala com
um ponto intermediario que pode
ser considerado neutro ou sem
opinião
escores de fator escores compos-
tos que calculam um valor para
cada Iator para cada respondente
com base nos resultados da anali-
se Iatorial
escores discriminantes (escores
Z) valores calculados pela inser-
cão de valores adequados para
uma observacão na Iuncão discri-
minante e usados para atribuir
uma observacão a um grupo
escores somados os escores de
varios itens individuais (ques-
tões) são adicionados, e a média é
calculada: podem ser usados em
vez dos escores de Iator para re-
presentar varios itens combina-
dos
estatística de amostra variaveis
ou medida computadas a partir
de uma amostra
estrutura de amostra lista abran-
gente dos elementos de onde a
amostra é retirada
estrutura simples termo usado
para reIerir-se aos resultados da
analise Iatorial em que cada va-
riavel carrega altamente em so-
mente um Iator: isso representa o
que é chamado de solucão de Ia-
tor puro
estudos longitudinais estudo que
oIerece uma descricão de uma
amostra no decorrer do tempo
usando dados em uma série tem-
poral, ou seia, a mesma unidade
de amostra é mensurada varias
vezes
estudos transversais estudos que
oIerecem uma descricão de uma
amostra em determinado ponto
no tempo
ética administrativa campo de
estudo que aborda a aplicacão de
principios morais e/ou padrões
éticos a acões humanas no proces-
so de relacionamento
GLOSSARIO 449
experimento de campo experi-
mento em que a manipulacão da
variavel causal ocorre em um am-
biente natural, como um contexto
administrativo relevante, que en-
Iatiza a validade externa
experimento proieto causal em
que um pesquisador controla
uma causa potencial (variavel ex-
perimental) e observa qualquer
mudanca correspondente nos
eIeitos hipotéticos
experimentos de laboratório ma-
nipulacão da variavel causal, que
ocorre em um ambiente artiIicial
para enIatizar a validade interna
F
face ª¿´·¼·¬§ ver validade de con-
teudo
fator combinacão matematica li-
near das variaveis originais da
Iormula Fi ÷ XJXJ ¹
2
X
2
·... ·
W · ei
FIV signiIica Iator de inIlacão de
variância e mensura a multicoli-
nearidade entre as variaveis inde-
pendentes: o FIV maximo aceita-
vel é de 5,0, sendo que qualquer
valor acima disso indica proble-
ma de multicolinearidade: o con-
trario de tolerância
folha de rosto pagina que apre-
senta o titulo do proieto de pes-
quisa, o principal responsavel pe-
las decisões para quem o relatorio
esta sendo preparado, a data e os
nomes dos principais investiga-
dores com indicacões para conta-
to
forca de associacão magnitude
ou extensão até onde duas ou
mais variaveis estão relacionadas
funcão discriminante combina-
cão linear de variaveis indepen-
dentes usada para prever a parti-
cipacão em um grupo: sua Iormu-
la é Z ÷ WiX, ¹ W
2
X
2
¹... W
n
X
n
S
garimpagem de dados aplicacão
eletrônica de algoritmos matema-
ticos que percorrem bancos de
dados em busca de relacões entre
variaveis que possam levar a me-
lhores decisões
generalizacões semelhantes a
leis expectativas do que acontece-
ra sob circunstâncias especiIicas
que permitem a previsão da reali-
dade
GPS Global Positioning Satellite
Svstem*
gráfico de barras graIico que
apresenta dados na Iorma de bar-
ras que podem ser distribuidas
vertical ou horizontalmente
gráfico de caixas demonstracão
visual da localizacão, dispersão,
Iorma, comprimento de cauda e
pontos extremos da distribuicão
gráfico de importância-desempe-
nho mapa de percepcões em duas
dimensões em que a importância
percebida é colocada em um eixo
vertical e as medidas de desem-
penho são posicionadas em um
eixo horizontal
gráfico de pizza circulo mostran-
do Iatias que representam as pro-
porcões de respostas a uma ques-
tão
gráficos caule-e-folha instrumen-
to diagnostico estreitamente rela-
cionado com os histogramas que
mostra valores de dados reais que
podem ser inspecionados direta-
mente
grupos de foco discussões relati-
vamente inIormais tendo de oito
a doze respondentes orientados
por um moderador que mantém
o grupo concentrado em um topi-
co principal
H
hipótese alternativa aIirmacão
que representa o oposto da hipo-
tese nula
hipótese nula aIirmacão que pos-
tula ausência de diIerencas ou re-
lacões entre variaveis
hipótese suposicão ou proposicão
não comprovada que tenta expli-
car certos Iatos ou Ienômenos
* N. de R. Nòæ Í·-¬»³¿ ¼» localizacão e
rastreamento via satélite.
histograma graIico de barras ver-
ticais construido as partir de in-
Iormacões sobre uma distribuicão
de Ireqüência
¸·¬ ratio proporcão de observa-
cões classiIicadas corretamente
pela analise discriminante
interacão eIeito combinado de di-
versas variaveis
interrogatórios instrumento cria-
tivo para tomada de decisão que
aiuda a garantir que um proble-
ma não seia analisado mediante
uma visão limitada: envolve a
descricão da situacão com varias
perguntas comecando com as pa-
lavras o que. onae. por que. quanao.
quem e como
intranet rede semelhante a Inter-
net que liga computadores inter-
namente em uma organizacão
introducão parte do relatorio que
descreve o obietivo e apresenta as
questões e hipoteses da pesquisa
L
lambda de Wilk (X) estatistica
que avalia se a Iuncão discrimi-
nante identiIicou uma diIerenca
estatistica entre dois ou mais gru-
pos
M
manipulacão alteracão intencio-
nal de uma variavel causal (expe-
rimental) em diIerentes niveis ou
condicões
MANOVA semelhante a ANO-
VA, mas pode examinar diIeren-
cas de grupos para duas ou mais
variaveis dependentes métricas
ao mesmo tempo
mapeamento de percepcões
abordagem que usa inIormacões
de outras técnicas estatisticas pa-
ra mapear as percepcões do clien-
te relativas a produtos, marcas,
empresas, etc.
matriz "de fácil leitura" matriz
de Iator que apresenta cargas de
somente um Iator que atingem
450 GLOSSÁRÌO
um tamanho minimo pré-especi-
Iicado, geralmente 3,0 ou mais
matriz de classificacão (previsão)
tabela que apresenta os resulta-
dos de participacão prevista em
um grupo a partir dos resultados
da analise discriminante
matriz de fator com rotacão ma-
triz de numeros em uma analise
Iatorial mostrando as cargas de
Iator com rotacão
média valor médio de um con-
iunto de valores: uma das medi-
das mais usadas de tendência
central
mediana medida de tendência
central, é o valor que se localiza
no centro da distribuicão
medidas de dispersão descrevem
a tendência de as respostas da
amostra partirem de uma tendên-
cia central
medidas de tendência central
média, mediana e moda: são me-
didas usadas para descrever a
distribuicão dos dados
memória organizacional dados
totais resultantes do processo de
aprendizagem organizacional
mensuracão envolve a atribuicão
de numeros a uma variavel de
acordo com certas regras
método científico método que os
pesquisadores usam para obter
conhecimento sobre as coisas
métodos de pesquisa parte do re-
latorio de pesquisa que descreve
os métodos usados na realizacão
do estudo
mínimos quadrados técnica ma-
tematica que assegura que a linha
reta computada em um modelo
de regressão é a que melhor re-
presentara a relacão entre as va-
riaveis dependentes e indepen-
dentes
MIS Management (ou Marketing)
InIormation System, sistema que
gera relatorios usando inIorma-
cões inseridas no computador
através de mecanismos automati-
cos ou manuais
moda medida de tendência cen-
tral que identiIica o valor mais
Ireqüente na distribuicão da
amostra
monitoramento avaliacão do
ponto até onde uma decisão esta
atingindo seu obietivo estipulado
multicolinearidade correlacão
entre as variaveis independentes
O
observacão método de coleta de
dados envolvendo observacão
sistematica e registro do compor-
tamento e das atividades de pes-
soas, eventos ou obietos
dados off-the-shelf inIormacões
prontamente disponiveis (incluin-
do resultados de pesquisa), com-
piladas e vendidas por empresas
oportunidade situacão (ponto
particular no tempo e/ou no es-
paco) que torna possivel um re-
sultado potencialmente vantaioso
através de uma boa decisão
i
:
páginas iniciais colocacão do ma-
ximo possivel do conteudo mais
importante nas primeiras paginas
do relatorio
painel método de coleta de dados
através do uso de um mesmo
grupo de respondentes no decor-
rer de um periodo de tempo
parâmetros de populacão varia-
veis ou mensuracões que descre-
vem a populacão
parcimônia teoria que postula
que uma solucão mais simples é
superior a uma solucão complexa
perfil ato de descrever grupos
identiIicados pela analise de con-
glomerados com base em diIeren-
cas de caracteristicas Iacilmente
identiIicaveis, como a demograIia
pergunta aberta questão que não
coloca restricões aos responden-
tes, que Iicam livres para respon-
der com suas proprias palavras
pergunta fechada questão em
que o respondente recebe a opcão
de escolher entre um numero pre-
determinado de respostas
pesos discriminantes estimativas
do poder de previsão de cada va-
riavel independente
pesquisa busca da verdade atra-
vés do discernimento
pesquisa causal pesquisa que tes-
ta se um evento causa outro
pesquisa contínua pesquisa reali-
zada constantemente e não dire-
cionada a uma questão especiIica
pesquisa descritiva pesquisa que
descreve algo mensurando carac-
teristicas de eventos, obietos, pes-
soas ou atividades
pesquisa em administracão apli-
cada pesquisa motivada por uma
tentativa de resolver um proble-
ma especiIico enIrentado por uma
determinada organizacão
pesquisa em administracão basi-
ca pesquisa motivada pelo deseio
de melhor compreender Ienôme-
nos administrativos de toda uma
industria ou de toda a adminis-
tracão em geral
pesquisa em administracão Iun-
cão de busca da verdade que reu-
ne, analisa, interpreta e relata in-
Iormacões de modo a tornar mais
eIicientes as decisões administra-
tivas
pesquisa etnográfica método de
pesquisa que envolve a observa-
cão de experiências de vida reais
pesquisa exploratória util quan-
do as questões de pesquisa são
vagas ou quando ha pouca teoria
disponivel para orientar as previ-
sões
pesquisa externa pesquisa con-
duzida por alguém que não é Iun-
cionario da organizacão que de-
vera tomar a decisão
pesquisa interna pesquisa con-
duzida por Iuncionarios da pro-
pria organizacão que tomara a
decisão
pesquisa reproduzível quando
um outro pesquisador pode pro-
duzir os mesmos resultados como
relatados na pesquisa original
usando procedimentos idênticos
aos empregados pelo pesquisador
original
pesquisas de opinião tendencio-
sas teleIonemas breves com o
proposito de divulgar inIorma-
cões negativas, Ireqüentemente
Ialsas, sobre um candidato ou
questão a guisa de entrevista
GLOSSÁRÌO 451
ponto extremo pont o de dados
para um respondent e, notavel-
ment e distinto dos valores dos
outros respondent es
populacão alvo grupo completo
de obietos ou elementos relevan-
tes para o proieto de pesquisa: são
relevantes porque têm as inIor-
macões que o proieto de pesquisa
tenta coletar
populacão total de todos os ele-
ment os que comparti lham algum
coniunto de caracteristicas co-
muns: t ambém chamado de gru-
po de pessoas de conhecimento:
ver universo
porcentagem de critério de va-
riância critério usado para deter-
mi nar o numer o de Iatores a ex-
trair: quando aplicado, o numer o
de Iatores baseia-se na quantida-
de total de variaveis explicadas
pela solucão de Iator, geralmente
um mi ni mo de 60°
preparacão de dados exame de
dados para valida-los e corrigir
problemas quando possivel
presenca de relacão avalia se
existe uma relacão sistematica en-
tre duas ou mais variaveis
pré-teste avaliacão da probabili-
dade de precisão e coerência de
respostas a um questionario
usando-se uma pequena amostra
de respondent es com caracteristi-
cas semelhantes a da popul acão
alvo
princípio do mínimo denomina-
dor comum preparacão de comu-
nicacão oral e escrita de acordo
com o nivel de entendimento do
usuario potencial com menor so-
Iisticacão do publico a que a co-
municacão é dirigida
processo CAB processo de toma-
da de decisão criativa - analitica -
administrativa
processo de pesquisa em admi-
nistracão roteiro basico de três Ia-
ses que Iornece as orientacões pa-
ra realizacão do proieto de pes-
quisa: inclui as Iase de Iormula-
cão, de execucão e de analise
projeto em sujeitos proieto expe-
rimental em que cada suieito rece-
be diversas combinacões de trata-
ment os experimentais
projeto entre sujeitos proieto ex-
perimental em que cada suieito
recebe somente um nivel de cada
tratamento experimental (uma
combinacão com diversas varia-
veis experimentais)
projeto fatorial proieto experi-
mental que controla os niveis de
dois ou mais tratamentos experi-
mentais ao mesmo t empo
projetos de pesquisa tiro único
pesquisa criada para abordar
uma unica questão em um deter-
minado ponto no tempo
proposta de pesquisa document o
que descreve as razões para um
estudo, indica as questões de pes-
quisa, oIerece um panorama do
estudo e de seus instrumentos,
um resumo dos resultados poten-
ciais e uma proposta de cronogra-
ma e de orcamento
público os individuos que são o
obietivo de uma mensagem quan-
do apresentacões orais e por es-
crito são preparadas
Q
questão de classificacão questão
colocada no Iinal de um questio-
nario para coletar dados, geral-
ment e demograIicos, a serem usa-
dos na classiIicacão dos indivi-
duos para analise de dados e per-
Iil
questão de ramificacão questão
usada para orientar os respon-
dentes de Iorma que respondam
as perguntas certas e na seqüên-
cia adequada
questão de triagem tipo de ques-
tão usada para garantir que os
respondentes incluidos em um
estudo são os que at endem a de-
terminados critérios da popula-
cão alvo
questão dominante questão que
deixa implicito que uma determi-
nada resposta é correta ou que le-
va um respondente a escolher
uma dada resposta
questão múltipla questão que in-
clui dois ou mais topicos e que
torna a interpretacão diIicil e Ire-
qüentement e impossivel
questionário assistido por entre-
vistador questionario em que um
entrevistador aiuda o responden-
te a responder as pergunt as len-
do-as e registrando as respostas
questionário auto-administrado
questionario completado por um
respondente sem a presenca de
um pesqui sador
questionário coniunto predeter-
mi nado de questões com o obieti-
vo de captar dados dos respon-
dentes
questões coisas que, se alteradas,
Iecharão a lacuna entre o estado
real e o deseiado
questões de pesquisa questões
que aIirmam proposicões gerais
sobre os Ienômenos que estão
sendo estudados
qui-quadrado teste estatistico
usado para avaliar diIerencas en-
tre grupos usando dados nomi -
nais ou ordinais
R
razão F estatistica que avalia a
signiIicância estatistica do mode-
lo total de regressão: é a razão da
variância explicada para a variân-
cia não-explicada (residuo)
rede sistemas de computadores
conectados uns aos outros através
de varios servidores
regra de decisão normativa expli-
ca o que alguém deveria Iazer
quando conIrontado com uma si-
tuacão descrita por uma teoria
regressão bivariada tipo de re-
gressão com uma unica variavel
dependent e métrica e uma unica
variavel independent e métrica
regressão logística tipo especial
de regressão que pode ter uma
variavel dependent e não-métrica
regressão múltipla passo a passo
cada variavel independent e é
considerada para inclusão no mo-
delo de regressão, e a ordem em
que são colocadas parte daquela
que mais contribui para a previ-
são da variavel dependent e: so-
ment e variaveis que contribuem
452 GLOSSÁRÌO
signiIicativamente são inseridas
no modelo de regressão
regressão múltipla tipo de re-
gressão com uma unica variavel
dependente métrica e diversas
variaveis independentes métricas
relacão causal uma mudanca em
um evento ocasiona uma mudan-
ca correspondente em um outro
evento
relacão linear associacão em li-
nha reta entre duas ou mais varia-
veis
relacão não-linear Ireqüentemen-
te chamada de curvilinea, é me-
lhor descrita por uma curva em
vez de uma linha reta
relacão situacão em que as varia-
veis apresentam uma ligacão coe-
rente e sistematica entre elas
residuo variância ou erro não-ex-
plicados em um modelo de re-
gressão
respondentes participantes hu-
manos na pesquisa em adminis-
tracão
resumo executivo panorama in-
dividual muito breve do relatorio
de uma pesquisa enIatizando as
mais importantes descobertas
reunião de informacão discussão
que acontece depois de uma ses-
são experimental, envolvendo a
revelacão do verdadeiro proposi-
to do experimento, seu patrocina-
dos e, geralmente, uma sessão de
perguntas e respostas
rigidez funcional termo que des-
creve o Iato de que, uma vez que
alguém aprende uma regra ou
acão eIicaz, sua maior Iamiliari-
dade com o processo torna diIicil
ver outros modos de Iazer a mes-
ma coisa, mesmo se Iorem mais
simples
rotacão de fator representacão di-
Ierente, mas matematicamente
equivalente, da combinacão li-
near que Iorma um Iator
rotacão oblíqua técnica de rota-
cão de Iator que permite que os
Iatores seiam correlacionados uns
com os outros
rotacão ortogonal técnica de rota-
cão de Iator que produz Iatores
independentes uns dos outros (a
correlacão entre quaisquer dois
Iatores é zero)
s
significância estatística relacão
entre duas ou mais variaveis que
é verdadeira e não se deve a erro
ou a eventos aleatorios
significância prática relacão en-
tre duas ou mais variaveis que é
signiIicativa não apenas estatisti-
camente
sintomas sinais de que alguma
mudanca pode ser necessaria pa-
ra evitar problemas Iuturos ou
para tirar vantagem de alguma
oportunidade
Sistema de Apoio às Decisões
(DSS) software que permite ao ad-
ministrador interagir com o MIS
para examinar resultados poten-
ciais relacionados com decisões
comuns
sistema especializado compo-
nente do DSS que automatiza al-
gumas decisões
soma de quadrados de regressão
variância explicada na equacão
de regressão
soma de quadrados residual va-
riância não-explicada na equacão
de regressão
soma de quadrados total variân-
cia total em um modelo de regres-
são
sorting escala que pede que os
respondentes indiquem suas
crencas ou opiniões organizando
obietos (itens) com base na seme-
lhanca percebida ou em algum
outro atributo
Statistical Package for the Social
Sciences (SPSS) 2 ÍÐÍÍ basico é
um pacote de software estatistico
Iacil de usar que oIerece acesso a
procedimentos estatisticos como
os discutidos neste livro
sujeito respondente que participa
de um experimento
sumário apresenta os titulos e
subtitulos do relatorio de pesqui-
sa por numero de pagina
survev eletrônica abordagem de
survev auto-administrada em que
os dados são coletados via e-mail.
disquete ou Internet
survev por correspondência sur-
vev enviada ao respondente pelo
correio, por Iax ou por servico de
entrega em 24 horas
survev procedimento usado para
coletar dados primarios dos indi-
viduos
T
tabelas simuladas tabelas usadas
em uma proposta de pesquisa pa-
ra mostrar resultados hipotéticos
do mesmo tipo que resultarão do
estudo sugerido
tabulacão cruzada distribuicão
de Ireqüência das resposta em
duas ou mais variaveis
técnicas de dependência instru-
mentos estatisticos em que as va-
riaveis são divididas em coniun-
tos de dependentes e indepen-
dentes e analisadas iuntas para
testar a dependência
técnicas de interdependência
instrumentos estatisticos em que
as variaveis não são divididas em
dependentes e independentes: as
variaveis dependentes e indepen-
dentes são analisadas individual-
mente
tendenciosidade de posicão si-
tuacão em que uma questão é po-
sicionada anterior a outra em um
questionario, tendendo a inIluen-
ciar a resposta desta ultima: tam-
bém pode ser chamada de eIeito
de contexto
teoria coniunto de aIirmacões sis-
tematicamente relacionadas, in-
cluindo algumas generalizacões
semelhantes a leis que podem ser
testadas empiricamente
teoria descritiva tenta descrever
o modo como as coisas realmente
são
teste bivariado teste estatistico de
signiIicância utilizando duas va-
riaveis
teste de acompanhamento teste
estatistico para identiIicar a signi-
Iicância entre três ou mais médias
de grupos
teste de mercado experimento
que avalia um novo produto ou
campanha promocional sob as
reais condicões de mercado
GLOSSARIO 453
teste empírico avaliacão de uma
idéia pela coleta e analise de dados
teste ¬ avalia se as diIerencas ob-
servadas entre as médias de duas
amostras são signiIicativas
testes não-paramétricos testes es-
tatisticos usados quando o pes-
quisador não consegue supor
uma distribuicão normal
testes paramétricos testes estatis-
ticos usados quando o pesquisa-
dor consegue supor uma distri-
buicão normal
tolerância medida de multicoli-
nearidade entre as variaveis inde-
pendentes: pequenos valores
(·0,10) indicam que a multicoli-
nearidade é um problema: o con-
trario do FIV
transformacão de dados processo
de mudanca da Iorma original
dos dados para uma nova Iorma
8
«²·¼¿¼»- ¼» ¿³±-¬®¿¹»³ »´»s
³»²¬±- ±« ±¾¶»¬±- disponiveis pa-
ra selecão durante o processo de
amostragem
universo grupo de pessoas que
pode ser conhecido: ver populacão
V
validade até onde um construto
(escala) mensura o que deve men-
surar
validade concorrente escores em
duas variaveis (escalas) simultâ-
neas são examinados para veriIicar
se são altamente correlacionados
validade de construto tipo de
validacão avaliada usando-se
métodos de validade convergen-
te para veriIicar se duas escalas
são positivamente relacionadas
ou métodos de validade discri-
minante para veriIicar se duas
escalas são negativamente rela-
cionadas
validade de conteúdo avaliacão
sistematica mas subietiva da habi-
lidade de uma escala para mensu-
rar o que deve mensurar: também
chamada aeface valiaitv
validade de critério examina se
uma escala (construto) tem o de-
sempenho esperado em relacão a
outras variaveis signiIicativas
validade de previsão avalia a ha-
bilidade de uma escala (constru-
to), mensurada em um ponto no
tempo, de prever um outro crité-
rio em um ponto no Iuturo
variacão distribuicão das respos-
tas: distância entre o maior e o
menor valor da distribuicão de
Ireqüência de uma amostra
variância comum porcão da va-
riância total de uma variavel que
é compartilhada com todas as ou-
tras variaveis na analise: porcão
da variância que covaria entre to-
das as variaveis
variância de erro porcão da va-
riância que resulta de erro na co-
leta ou na mensuracão dos dados
variância medida da variacão ou
dispersão dos dados
variância única parte da variância
total em uma variavel, especiIica
ou particular daquela variavel
variável dependente mensuracão
que depende de, ou é determina-
da por, outras variaveis do estudo
(variaveis independentes)
variável muda variavel que tem
dois ou mais niveis distintos codi-
Iicados como 0 e 1: variaveis mu-
das possibilitam o uso de varia-
veis independentes não mensura-
das utilizando-se escalas interva-
lares ou de razão para prever a
variavel dependente
verificacão de manipulacão per-
gunta de acompanhamento para
avaliar se um respondente enten-
deu o tratamento em um experi-
mento: por exemplo, se um res-
pondente vê dois anuncios, um
deles devera ser engracado e o
outro não: pede-se então que o
respondente indique se interpre-
tou os anuncios de maneira ade-
quada, ou seia, se Ioi percebido o
humor do anuncio engracado e se
o outro anuncio Ioi visto sem a si-
tuacão de humor
VTOCS acrônimo para cinco ca-
racteristicas das inovacões bem-
sucedidas (vantagem, testagem,
observacão, coerência e simplici-
dade).*
*N. deR.X: Em inglês, no original, é
tido como ATOCS (aavantageous.
trialabilitv. observable. consistent. sim-
plicitv).
indice
NOTA: Os numeros de pagina em
italico reIerem-se a entradas constan-
tes nas Iiguras e na secão Pesquisa
em acão
abordagem construtiva, 403-404.
Jer tambem analise de conglomera-
dos
abordagem divisoria, 403-404
abordagem do tipo Iunil, 223-225
Acme Rent-A-Car, 43-44
ACP (analise de componentes prin-
cipais), 390-395,398-400.431-433
adequacão de distribuicão, 293-294
administracão de conhecimento,
256-257
administracão de crise, 113-114,224-
225
administracão de tempo e movi-
mento, 31-32
alcance, 272-273. Jer tambem disper-
são
American Business InIormation,
202-202,262-263
amostra representativa, 158, 238-
241,248-250
amostragem aleatoria simples, 240-
242, 241-242
amostragem bola-de-neve, 240-241.
247-248
amostragem de area geograIica,
245-246
amostragem de conglomerados,
240-241, 244-247, 250-251
amostragem de conveniência, 240-
242, 246-247
amostragem de estagios multiplos,
240-242, 245-247. Jer tambem amos-
tragem, sobre
amostragem desproporcionalmente
estratiIicada, 243-245
amostragem geral, 56-57, 240-248,
250-251
amostragem intencional, 246-247
amostragem não-probabilistica,
237-238,240-242,246-248,250-251
amostragem por quotas, 240-241.
246-248
amostragem probabilistica, 237-238,
240-247,250-251
amostragem proporcionalmente es-
tratiIicada, 243-244,244-245
amostragem, sobre, ver tambem pes-
quisa descritiva: populacões: méto-
dos de amostragem
amostra para razão de realizacão,
241-242
censo os. amostra, 237-239, 289-
291
erro, 87-88,283-284,327-328
estatistica de amostra, 284-286,
289-291,305-306
Iator de correcão de populacão Ii-
nita, 248-250
implementacão, 248-250
independente, 296-297,380-381
média, estimativa do tamanho da
amostra de, 248-249
mensuracões, 87-88
panorama, 237-249,248-251,284-
285
segmentos de clientes, 42i
selecão de estrutura, 240-241,
248-251
suposicões, 87-88
tabelas de amostra aleatoria, 242-
243
amostras independentes, 296-297,
380-381. Jer tambem amostragem,
sobre
analise associativa, 310. Jer tambem
analise de correlacão: analise de re-
gressão
analise coniunta, 319-321
analise de componentes principais
(ACP), 390-395, 398-400. 431-433
analise de conglomerados
ANOVA, 427-429
com analise discriminante, 423-
431,436-438,440-441
em SPSS, 407-411.428-431
erro em, 405-406,64-122
hipoteses nulas, 405-408,423-424,
428-429
média de grupo, 404-411
panorama, 319-321,348,388,400-
411,418-419
variância, 404-408
analise de conteudo, 154-157
analise de correlacão
coeIicientes, 311-316,320-322,
332-334,341
correlacão de ordem de ranquea-
mento de Spearman, 184,316-321
correlacões de Pearson, 312-316,
335-336. 339.341,378-379
de Iatores, 392-394
em Excel, 315-316
escalas e, 316-319
hipoteses nulas, 312-315
panorama, 310, 312-316, 319-321,
341
signiIicância estatistica, 311-312,
315-316
tabelas, 314-318,335-336
analise de dados, ver tambem ANO-
VA (Analise de Variância): software
SPSS: técnicas estatisticas: varia-
veis, sobre
analise de conteudo, 154-157
analise de correlacão, 312-316
analise de sensibilidade ao preco,
124-125
de escalas nominais, 181-182
de interacões, 41-43, 94-95, 95-96 ,
103-104,310-311
documentacão de, 362-363
estatistica de amostra vs. parâme-
tros de populacão, 284-286, 289-
291, 305-306
panorama de técnicas estatisticas,
318-320
proposta para, 56-57
456 ÍNDÌCE
tendência central, 269-273,278-
279
transIormacão de dados, 63-64,
261-262
XLSTAT, 282-283
analise de regressão
analise de residuos, 324-326, 336-
337,348-354
analise discriminante comparada
com, 411-412,417-418
bivariada, 319-326
coeIicientes, 324-328,332-335,
337-338. 340-341.341-342
com analise Iatorial, 429-435,440-
441
de satisIacão, 380-382
em SPSS, 324,327-328, 332,336-
338,340-342,353-354
escores somados, 437-438,440-
441
Iormula de regressão linear, 321-
322
hipoteses nulas, 328-329,332-332,
334-335
multicolinearidade, 326-327, 332-
336, 341-342
multipla, 319-321,325-338, 340-
342, 344-354, 377-379, 429-435
panorama, 318-319-323, 341-342
signiIicância estatistica, 324-328,
329-332,335-336
simples, 321-322
soma de quadrados, 324-326, 348,
353-354,378-379,380-381,432-
432
suposicões, 321-322, 325-326,344-
345,353-354
tabelas, 362-363, 380-381, 433-435
variâncias, 378-379
variaveis mudas, 344-347, 353-
354
analise discriminante
com analise de conglomerados,
423-431,437-438,440-441
em SPSS, 415-416.424-425
escores Z, 410-413
estudo de caso Burger King/Mc-
Donald' s, 409-414
Iuncão discriminante, 410-419
média de grupo, 409-411,414-418,
430-431
multipla, 409-415
opcões de dados Ialtantes, 260-
261
panorama, 319-321, 388,400-401,
414-419
passo a passo, 418
pesos, 411-415
suposicões, 414-415
tabelas, 414-416
validade, 197-198.200,202-203,
392-393
variância, 411-412,414-415
analise estatistica, ver analise de da-
dos: técnicas estatisticas
analise Iatorial comum, 390-393
Analise Fatorial Exploratoria (AFE),
390-395, i399.398-400.431-433
analise Iatorial, ver tambem ANOVA:
escalas nominais: escalas ordinais
AFE, 390-391-394-395,398-400.
431-433
analise de componentes princi-
pais, 390-395, 398-400.431-433
calculos de média, 430-431
carga de Iator, 394-401
com analise de regressão, 429-
435,440-441
com XLSTAT, 282-283
comunalidade, 391-394
correlacão de ordem de ranquea-
mento de Spearman, 184,316-
319
critério de raiz latente, 393-395,
398-400
determinacão do tamanho da
amostra, 248-250
em SPSS, 394-395, 398-400.407-
408.432-434
escalas de ranqueamentos de Ia-
tor de selecão, 60-62
escores de Iator, 392-393,430-437,
432-434.440-441
estrutura simples, 392-394
estudo de caso Burger
King/McDonalds, 388-391
estudo de caso do restaurante
Samouel's, 396,398-401
exemplo de escores FICO, 389
Iator comum, 390-393
Iator de correcão de populacão Ii-
nita, 248-250
Iatores compostos, 389-391
FIV (Fator de InIlacão de Variân-
cia), 334-336,390-391.341-342
hipoteses nulas, 396,398
interpretacão de, 395-396,398
panorama, 103-104, 302, 319-321,
388-391
porcentagem de variância, 298-
301, 393-396
procedimento Varimax, 392-395,
398-400.431-433
proietos experimentais, 94-98
resultados experimentais Iato-
riais, 94-96
rotacão de Iator, 392-394
rotacão em, 392-394, 396,398,399.
431-432
solucões Iatoriais, 394-396,398-
400
soma de cargas de Iatores ao qua-
drado, 394-396
suposicões, 391-393
survevs de clientes, 59-62,183-184,
193-194
tabelas, 433-435
testes Qui-quadrado, 286, 289,
292-297,305-307
variância unica, 391-393
variância, 390-396,399-401,433-
434
variaveis, 94-96,388,400-401,
440-441
analise residual
variâncias, 336-337
ANOVA (Analise de Variância), ver
tambem analise Iatorial: técnicas es-
tatisticas
analise de conglomerados, 406-
409,427-429
analise de regressão, 324-325,
331-332.333-335,336-338,345-
348
conceito de percepcão, 347
de dois Iatores, 302-305
de um Iator, 297-302, 409-411
em SPSS, 298-301,303-304.407-
408
escalas métricas, 286, 289
escores de Iator, 433-434
hipoteses nulas, 297-301,302-305
panorama, 297-302, 305-307, 319-
321
proieto de avaliacão de cliente,
297-305
signiIicância estatistica, 300-301
suposicões, 300-301
tabelas, 298-300, 324-325, 333-338,
345-347,406-409
testagem de hipotese, 292-293,
297-305
teste F. 298-300, 302-303,324, 332
teste ScheIIé, 300-302
Apêndices, 362-365,383-384. Jer
tambem propostas e relatorios de
pesquisa
aplicacões em marketing. 33-34
aplicacões industriais, 33-34
aprendizagem/memoria organiza-
cional, 40-43
ÍNDÌCE 457
assimetria, 273-275
associacão de palavras, 85-86
atitudes/opiniões de respondentes,
158,175-177,184-194,216-217
autovalor, 393-396, 398-400
avaliacão, ver tambem tomada de de-
cisão
com testes de mercado, 91-93,93-
94.123-125
critérios, 122-124,376-377
de alternativas, 125-126
de questões de pesquisa, 117-118,
122-124,126-127, 215-216, 376-
377
processo CAB, 109-111,117-118,
122-127
VTOCS, 123-124
avaliacões
conIiabilidade, 196-200, 202
de conceitos, 196-204
eIeito de demanda, 139-141
esboco de proposta, 55-57
SWOT, 52-53
validade, 196-198,200,202-204
:
bancos de dados, 40-41,110-111,
135-136
banco de dados Lexis-Nexis, 101-
102
brevidade e simplicidade, 357-359
Burger King/McDonald' s, 296-297,
388-391,409-414. Jer tambem estu-
do de casos
Burke Marketing Research, 201
O
ÝßÏËßÜÍ øݱ³°«¬»® ß--·-¬»¼
Ï«¿´·¬¿¬·ª» Ü¿¬¿ ß²¿´§-·- ͱº¬©¿s
®»÷ ô ïë ë óïë ê
caracteristicas. Jer variaveis
Carlson, Chester, 118-120
carta-proposta, 54
categorias, divisão ou combinacão,
261-262
causalidade de associacão não-es-
puria, 89-91
censo, 40-41,101-102, 237-239, 290-
291
centeriod, 403-404,416-418
Chance (site da Web), 287
Chrysler, 166-167
ciência, 80-84, 91-94,103-104. Jer
tambem proietos de pesquisa em
administracão: proieto experimen-
tal
ciências sociais na pesquisa em ad-
ministracão, 31-32
Circuit City, 123-125
classiIicacão
erro, 412-414
questões, 59-60.183,215-219,222,
224-225
resultados, 414-415,428-430,436-
437
variaveis, 59-62,411-415
classiIicacões cruzadas, 87-88
classiIicacões de Nielsen, 89-90
Coca-Cola, 32-33
codiIicacão, 260-261
coeIiciente de determinacão multi-
plo. Jer R
coeIicientes de conIiabilidade alIa,
199-200
coeIicientes de Iuncão discriminan-
te canonicos padronizados, 415-
416,417-415
coeIicientes. Jer tambem R
2
alIa de Cronbach, 199-201
beta, 325-326, 326-328, 329-332,
334-337,341-342,346-347,378-
379
correlacão, 311-316,320-322,332-
334,341
correlacões de Pearson, 312-315
determinacão (r
2
), 313-314,323,
325-327,341-342
erro, 405-408,423-425,428-429
não-padronizados, 325-326,329-
331,331-332.334-335
padronizados, 325-326, 329-331,
331-332,334-335.378-379.381-
382.415-416,417-418.433-435
regressão, 324-327-328,332-335,
337-338.340-341.341-342
tabelas, 239-240,325-326,329-332,
334-335,346-347, 378-379
coercão vs. incentivos, 136-138
coerência, 123-124. Jer tambem con-
Iiabilidade
coleta de dados, ver tambem dados:
entrevistas: processo de criacão de
questionario: questionarios: sur-
vevs
dados de percepcão, 56-57,59-61,
214-215. 226-228, 245-247
garimpagem de dados, 40-43
GPS, 41-44
observacão, 152-157,169-170
panorama, 152,169-171,282-283
revisão de literatura, 84-85
tecnologia, 152
colinearidade, 334-335,338,340-341,
348-350. Jer tambem multicolineari-
dade
comitê de revisão de recursos hu-
manos, 140-141
comprometimento organizacional,
38-39,58-60,175-177,184-185,190-
191,373-374
comunalidade, 394-396
comunicacão, ver tambem Internet:
relacionamento pesquisador-clien-
te: propostas e relatorios de pes-
quisa
de métodos de pesquisa, 356-358,
375-377
moderadores de grupo, 84-86,
100,102-104,165-166
obrigacões do responsavel pelas
decisões, 140-142
orientacões para redacão técnica,
357-359
panorama, 116-118, 356-358,367-
369
técnicas de apresentacão, 365-368
conceito de satisIacão
analise bivariada, 321-328, 341-
342
analise de conglomerados, 402-
403,423-430,423-431,440-441
analise de dados, 265-267
analise de residuos, 348-354
analise Iatorial e regressão multi-
pla, 429-435
analise multivariada, 328-333,
336-338,340-342
coleta de dados, 35-37, 98-99
critérios de avaliacão, 122-123
desenvolvimento de conceito,
175-176,218
desenvolvimento de hipoteses,
61-62,91-92
em SPSS, 266-267
escores de Iator em analise de re-
gressão, 431-437
escores somados, 434-438
mapeamento de percepcões, 437-
441
medidas de pesquisa de campo,
61-62, 84-85, 220-222
mensuracão, 175-176-177,178,
180,195-196,206-207
métodos de amostragem, 243-244
panorama, 33-34,98-99
proposta de pesquisa, 55-57
458 ÍNDÌCE
relacões entre variaveis, 310
relatorio de pesquisa, 372-376,
379-384
testagem de hipoteses, 285-286,
290-291,296-305
variaveis mudas, 344-347,353-
354
conceitos/construtos, ver tambem
conceito de satisIacão: escalas: es-
tatisticas: validade
adequacão de distribuicão, 293-
294
avaliacão, 196-204
avaliacão e escolha, 122-127,167-
169,170-171
causalidade, 89-92
cigarro sem Iumaca, 134-136
desenvolvimentos de escalas,
203-206
historico conceituai, 363-364,373-
376
imagem do restaurante
Samouel's, 203-206
itens multiplos, 201
marketing de relacionamento, 38-
39,47-48,59,61-62
medidas de construtos, 205
mensuracão de, 175-178,180,185-
194,199-200
minicaminhonete, 84-85
mudanca/participacão dos clien-
tes, 38-39
niveis de mensuracão, 179-187,
193-198
panorama, 175, 206,216-217,229-
230,232-233
questões de pesquisa para men-
suracão, 59-62
relacões entre variaveis, 54-108
validade de, 200,202-203,230-231
variaveis como componentes,
203-204,213
conexão em rede, 39-40
conIiabilidade de coerência interna,
198-200
conIiabilidade de Iormas alternati-
vas, 197-199
conIiabilidade entre avaliadores,
100,102-103
conIiabilidade split-half. 199-200
conIiabilidade teste-reteste, 197-198
conIiabilidade, 194-200, 202, 206-
207
conIlitos de interesse, 132-135,156-
158. Jer tambem ética
conglomerado não-hierarquico,
403-405
conhecimento, derivacão de, 96-98
consideracões do publico, 356-358,
364-366
construtos, 205. Jer tambem concei-
tos/construtos
consultores, 44-47,359-360
controle (experimentos), 89-91
conveniência, 114-115.118-120
correlacão de ordem de ranquea-
mento de Spearman, 184,316-321
correlacões bivariadas de Pearson,
313-316, 335-336
correlacões de matriz de estrutura,
415-417
correlacões de Pearson, 312-314,
339.341,378-379
covariância, 89-91,311-313,390-392
criatividade
alternativas de implementacão,
124-125
aprendizagem, 120-122
barreiras para a, 118-120
desenvolvimento, 120-123,126-
127
processo CAB, 109-111,118-123
relatorios orais, 365-366
critérios/variância de raiz latente,
393-396,398-400
curtose, 274-275
D
dados de percepcão
analisando, 319-323, 328-333, 347
coletando, 56-57.59-61,224-225,
226-228,245-247
de survevs. 203-205
Iundamentacão para, 84-85, 87-
88,98-99
mensurando com, 175-178,181-
182.184-185,190-191,201
natureza subietiva dos, 98-99
panorama, 98-99
variaveis, 202, 266-267, 397-399.
400-401,427-430
dados Ialtantes, 66-68,257,259-261
dados narrativos. Jer dados qualita-
tivos
dados qualitativos, ver tambem esca-
las não-métricas
Iontes de, 152-51,154-155
panorama, 100,102,102-103.104-
105,170
software de analise, 155-157
testagem de hipotese, 100,102-
103
dados quantitativos, 100,102, 202-
203,104-105,152,158,170. Jer tam-
bem escalas métricas
testagem de hipotese, 100,102-
103
dados secundarios, 98-105
testagem de hipotese, 98-100
dados subietivos, ver dados de per-
cepcão
dados, ver tambem analise de dados:
coleta de dados, preparacão de da-
dos: tipos de dados
coniuntos de dados, 96-98
Data and Store Library (DASL),
287
entrada/edicão, 63-65,257,259,
260-261, 275-276
garimpagem de dados, 40-43
panorama, 82-83,96-98
dados/estudos transversais, 87-90,
241-242. Jer tambem questionarios,
survevs
DASL (Data and Store Library), 2S7
Decision Analyst, Inc., 159-160
decisões baseadas na teoria, 79-81
decisões intuitivas, 79-81
Delicato, Inc., 39-40
dendograma, 403-404
Department oI Commerce, 101-102
DesaIio Pepsi, 32-33
descoberta, 80-83, 202-203
desvio-padrão, ver tambem tendên-
cia central: pesquisa descritiva: dis-
persão: variância, sobre
analise de regressão, 350-353,
432-433
ANOVA, 303-304
calculando com software. 274-277
calculando tamanho de amostra
de uma média, 248-249
de populacão, 248-250
dispersão, 272-275,278-280
em Excel, 71-72, 274-275
escalas com, 184-187,206-207,
286,289
escores somados, 434-435,440-
441
graIicos de pizza, 269-270
histograma, 265-266
panorama, 266-267,273-274
pesquisa descritiva, 83-84
testagem univariada, 291-292
teste i de duas médias, 297-298
Deteccão de Interacão Automatica
(DIA), 41-43
diagramas/graIicos de dispersão,
312-313, 321-322, 350-352. 401-405,
422-422
dialogo por computador, 168-169
direitos de propriedade intelectual,
35-37
INDICE 45 9
Discagem Digital Aleatoria (RDD),
239-240, 241-242
dispersão, 271-276,278-280,286. Jer
tambem variâncias
variâncias, 271-276,278-280, 286
distância Euclidiana, 402-403
distribuicão de Ireqüência, 261-270,
292-294,348-352,361-362
distribuicão normal, 268-272, 272-
273,289. Jer tambem procedimen-
tos estatisticos paramétricos
correlacões de Pearson, 313-314
de erro em analise de residuos,
348-353
distribuicão t. 297-298
Documents Center da Universidade
de Michigan, 287
DoubleClick, 136-137
DSS (Sistema de Apoio as Deci-
sões), 112-114,359-360
E
EBSCO, 101-102
Edison, Thomas, 118-120
eIeito do contexto, 226-228
eIeitos principais, 94-96,103-104
eIeitos/caracteristicas de demanda,
94-95,122-126,137-144,223-224
Electronic Encyclopedia oI Statisti-
cal Exercises and Examples (EE-
SEE), 287
elementos, 237-238
empresas/produtos so de inIorma-
cão , 34-37
entrevistas com o respondente pre-
sente, 157,159,162-165,168-169,
169.170-171. Jer tambem técnicas
de entrevista
entrevistas em proIundidade, 85-86,
100,102-104,167-171. Jer tambem
pesquisa exploratoria: entrevistas
entrevistas estruturadas, 86-87,163-
165,170-171. Jer tambem pesquisa
descritiva: entrevistas
entrevistas não-estruturadas, ver
tambem grupos de Ioco: entrevistas:
pesquisa qualitativa
dados qualitativos de, 100,102
entrevistas em proIundidade, 85-
86,100,102-104,167-171
moderadores, 84-85-85-86,100,
102-104,165-166
panorama, 84-85-85-86,100,102-
104,165-168,170-171
pessoal, 158-157,159,162-165,
168-171,169
selecão de participantes, 237-238
técnica de sondagem, 84-86,100,
102-104
utilizacão de, 165-166-166-167
entrevistas pessoais, 158-157,159,
162-165,168-171,169. Jer tambem
entrevistas
entrevistas por teleIone, 158.168-
171,169.230-232
entrevistas proietivas, 85-87
entrevistas semi-estruturadas, 163-
167
entrevistas, ver tambem coleta de da-
dos: técnicas de entrevista
amostras de conveniência, 246-
247
analise de sensibilidade ao preco
com, 124-125
de responsaveis pelas decisões,
133-135
entrevistadores passivos vs. en-
trevistadores ativos, 102-103
panorama, 170-171
equivalência de traducão, 37-38
erro (em pesquisa). Jer tambem erro
padrão
aceitavel, 247-249
aleatorio, 283-284
amostragem, 87-88, 283-284, 327-
328
analise de conglomerados, 304-
305,423-425
analise de residuos, 348-352,352-
353
classiIicacão, 412-414
coeIicientes de erro, 405-408,423-
425,428-429
entrada de dados, 275-276
erro de mensuracão, 196-198
erro padrão da média, 273-274
método dos minimos quadrados,
325-326
padrão, em tabelas de coeIicien-
tes, 325,331-335,337-338,340-
341, 346-347
termos de erro, 321-352,351-352
Tipo I e Tipo II, 285-286
variância, 348,353-354,291-293,
394-395,404-408
erro humano, 260-261
erro padrão, ver tambem erro (em
pesquisa)
calculando tamanho de amostra
de uma média, 248-250
da média, 273-274
de assimetria, 275-276
em analise de regressão multipla,
433-434
em tabelas de coeIicientes, 325,
331-335,337-338,340-341,346-
347
eSampling, 239-240
escalas comparativas. Jer escalas
não-métricas
escalas continuas. Jer escalas métri-
cas
escalas de classiIicacões. Jer tambem
escalas métricas
graIico, 190-191, 248-249
panorama, 184-185
somadas, 185-188,194-195,198-
199, 261-262, 262-263,434-436
escalas de comparacão em pares,
192-194. Jer tambem escalas não-
métricas
escalas de escolha não-Iorcada, 195-
196
escalas de ordem de ranqueamento,
184-185,186-188.191-193, 316-321.
Jer tambem escalas ordinais
escalas de pontos, ver tambem pes-
quisa descritiva: escalas
alcance, 272-275
analise de conglomerados, 407-
409, 423-425, 440-441
capacidade do respondente para
entender, 194-195
classiIicacões graIicas, 190-191
classiIicacões somadas, 185-188,
434-436
codiIicacão inversa, 199-200,202,
261-262
concorda/discorda de cinco pon-
tos, 175
concorda/discorda de sete pon-
tos, 59-62, 66-68, 262-265, 267-
268,270-272, 290-291
diagnosticos de casos, 352-353
diIerenciais semânticas, 188-198,
191
escalas éticas de 100 pontos, 131-
132
intensidade de, 179-178,180
Likert de sete pontos, 184-188,
328-331,375-377
medida de relacões, 61-62
mensuracão de percepcão, 60-61,
87-89, 94-95
numéricas, 186-189
padronizacão de dados, 402-403
ranqueamento de dez pontos,
197-199
ranqueamento de sete pontos,
179-178,180,273-275,297-298
ranqueamento ordinal, 184-185
4 6 0 ÍNDÌCE
ranqueamentos de Iator de sele-
cão, 60-61
risco percebido, 179
separando ou combinando cate-
gorias, 261-262
survev de ambiente de trabalho,
181-182
variaveis de classiIicacão, 61-62
veriIicacão da credibilidade da
Ionte, 179
veriIicacão de preco, 178,180
escalas de ranqueamento graIico,
186-188.190-191. Jer tambem esca-
las métricas
escalas de ranqueamentos de Iator
de selecão, 60-62. Jer tambem anali-
se Iatorial
escalas de razão. Jer tambem escalas
métricas: desvio padrão
analise de regressão, 321-322,
344-345,353-354,377-379
ANOVA, 297-300
coeIicientes de correlacão de
Pearson, 312-315
estatisticas paramétricas, 289-297
média, estimativa do tamanho da
amostra para, 248-249
médias de grupo, 296-297
medida de tendência central, 269-
271
panorama, 178,180-181,185-187,
206-207,305-306,316
pontos de zero absoluto,. 185-187
variaveis continuas, 180-181, 206-
207, 296-298
escalas de soma constante, 186-188.
192-193. Jer tambem escalas não-
métricas
escalas intervalares, ver tambem
ANOVA: escalas métricas
analise de regressão, 321-322,
344-345,353-354,377-378,380-
381
coeIicientes de correlacão de
Pearson, 312-315
escalas de soma constante com-
paradas com, 192-193
escalas Likert, 184-188, 328-331,
375-377
panorama, 178,180-181,184-187,
195-198,206-207,316
pontos zero arbitrarios, 184
técnicas estatisticas, 184-185, 286,
289,306-307,319-320
tendência central, 269-271
testagem de hipotese univariada,
290-293,296-298
testagem de hipoteses, 290-293,
296-298
teste t de amostras independen-
tes, 379-380
variaveis continuas, 180-181, 206-
207
variaveis, 296-298
escalas métricas. Jer tambem escalas
nominais: escalas ordinais: escalas
calculos de média, 269-271,286.
289,296-297
calculos de mediana, 206-207,
286. 289
classiIicacões graIicas, 186-188.
190-191
classiIicacões somadas, 185-188,
194-195,198-199,261-262,262-
263,434-436
correlacão de Pearson, 184-185,
185-187
diIerencial semântica, 186-188.
188-191,192
numéricas, 186-189,205
panorama, 186-188.191
escalas não-métricas, ver tambem
analise discriminante: escalas no-
minais: escalas ordinais: escalas
analise de dados, 206-207
calculos de mediana, 317-318
comparacão em pares, 186-188.
192-194
dados Ialtantes, 260-261
demonstracão de resultados, 362-
363
escalas/variaveis categoricas,
191-192,297-298,304-305
panorama, 186-188.191, 206-207
soma constante, 186-188.192-193
sorting. 186-188.191-193
técnicas estatisticas, 184,316-321
variaveis mudas, 260-261,321-
322,344-347,353-354
variaveis, 180-181, 206-207, 297-
298,302-303
escalas nominais, ver tambem analise
discriminante: analise Iatorial: mo-
da: escalas não-métricas
analise de dados, 181-182
dados nominais, 270-271,292-
294,306-307
panorama, 178,180-182, 206-207
técnicas estatisticas, 286, 289, 316-
321,410-411
variaveis discretas, 180-181, 206-
207
variaveis, 362-363,379-380
escalas numéricas, 186-198,205. Jer
tambem escalas métricas
escalas ordinais, ver tambem moda:
escalas não-métricas
como escala intervalar, 184-185
dados ordinais, 184,270-271
graIicos de pizza, 362-363
ordem de classiIicacão, 184-185,
186-188.191-193,316-321
panorama, 178,180-184,191-194,
206-207
técnicas estatisticas, 184-185,286,
289,292-293,305-307,317-318,
319-320. 321-322
variaveis discretas, 180-181,206-
207
escalas sorting. 191-193. Jer tambem
escalas não-métricas
escalas, ver tambem escalas métricas:
escalas não-métricas: escalas de
pontos: questões de pesquisa
analise de correlacão, 316-319
avaliacões de validade/conIiabi-
lidade, 196-205
classiIicacão somada, 185-188,
194-195,198-199,261-262,262-
263,434-436
correlacão de Pearson, 184-187
de escolha Iorcada, 195-196
de multipla escolha, 194-195,197-
198,198-199. 201. 202-204, 206-
207, ver tambem conceitos/cons-
trutos
desenvolvimento de, 193-198,
203-206
diIerenciais semânticas, 186-188.
188-191,191
equilibradas, 194-196
escalas/variaveis categoricas,
191-192,297-298,304-305
Iontes de inIormacão, 205-206
Iontes de, 205-206
Likert, 184-188,328-329,375-377
não-equilibradas, 194-196
panorama, 56-57.59-62,178,180-
181, 206-207, 261-262
para calculo de média, 269-271,
82-83, 289, 296-297
para calculo de mediana, 206-207,
286, 289
para calculos de moda, 181-182,
206-207,286,289
rotulos de categoria, 195-198
selecão de, 193-198
testagem de hipotese, 286, 289
variaveis/escalas discretas, 180-
181,206-207
ÍNDÌCE 461
escalas/variaveis categoricas, 191-
192,297-298,304-305. Jer tambem
escalas nominais: escalas ordinais:
variaveis
escopo de processo, 53-54. 360-361
escores de crédito, 389
escores FICO, 389
escores somados, 261-262,262-263,
434-438,440-441
escores somados médios, 262-263
escores Z, 410-109. Jer tambem ana-
lise discriminante
espaco de solucão, 116-118,120-122
especiIicidade, 215-216
estatistica descritiva, ver tambem
pesquisa descritiva: desvio-padrão
correlacões, 87-88
analise Iatorial, 399
contagens de Ireqüência, 83-84,
87-88
médias de grupo, 87-88
panorama, 83-84,87-88,267-269,
282-283,361-362
ranqueamentos, 87-88
em relatorios de pesquisa, 361-
362,362-363,378-379,383-384
em SPSS, 264-265, 268-269,272-
273, 275-276, 276-279. 294-296.
300-301. 303-304
apresentacão em tabela, 300-304,
314-315,323,328-331,339. 396,
398-399,432-433
estatistica, ver tambem estatistica
descritiva
contribuicão de Nightingale para,
267-268
Iontes para, 40-41,101-102. 287-
288
inIerencial, 282-286, 305-306
paramétrica, 289
estatisticas para a populacão ameri-
cana, 158
estrutura simples (analise Iatorial),
392-394
estudo de caso do restaurante
Samouel's, ver tambem estudos de
casos: proieto de avaliacão de
clientes: estudo de Iuncionarios:
conceito de satisIacão
amostra de conglomerados, 245-
246
conceito de imagem de restau-
rante, 203-206
desenvolvimento de hipoteses,
283-284
exemplo de analise de conglome-
rados, 404-411
exemplo de analise Iatorial, 396,
398-401
exemplo de multicolinearidade,
333-336
exemplo de pontos extremos e re-
siduos, 348-353
exemplo de regra de decisão nor-
mativa, 78-79
exemplo de regressão multipla
passo a passo, 336-338,340-341
exemplo de selecão de amostra
aleatoria, 242-243
exemplo de variaveis mudas,
345-347
introducão, 47-48,58-62,238-239
proposta de pesquisa, 55-57
relatorio de pesquisa, 371-384
survev de clientes, 214-215
tabulacão cruzada com teste qui-
quadrado, 292-297
teste i de diIerenca em duas mé-
dias, 296-298
testes estatisticos univariados,
290-293
testes t de uma amostra, 290-293
estudo de Iuncionarios, ver tambem
restaurante Samouel's: conceito de
satisIacão
analise de, em SPSS, 58-60
exemplo de correlacão bivariada
de Pearson, 313-316
exemplo de dispersão, 274-276
hipoteses, 373-379
histograma de, 348-352
panorama, 375-376
preparacão de dados, 262-267,
273-274, 274-276, 276-279
proposta de pesquisa, 58-60
questionario, 181-183. 216-217
recomendacões e conclusões, 381-
382
resultados, 376-380
tabulacão cruzada de, 292-296
estudos de casos. Jer tambem proie-
to de avaliacão de cliente: estudo
de Iuncionarios: Gino's Ristorante:
Samouel's Restaurant
Burger King/McDonald' s, 296-
297,388-391,409-414
Chrysler, 84-85,166-167
consumo de reIrigerantes, 269-
271,273-274, 283-286, 296-297,
316
Pontiac, 166-167
R. J. Reynolds, 134-136
Starbucks/Maxwell House, 286
video-cassete Hito, 179-180
estudos longitudinais, 88-90. Jer
tambem pesquisa descritiva
ética administrativa
acões sem ética, 143-145
de participantes, 141-144
do pesquisador, 96-98,134-141,
152-155
do responsavel pela decisão, 140-
142,144-145
panorama, 131-135,138-139,143-
146
pesquisa causai, 136-141
exatidão, ver validade
Excel (MicrosoIt), 70-72,272-272,
274-275, 282-283, 315-316
exemplo da bitola dos trilhos de
trem, 116-117
exemplo da sexta-Ieira inIormal, 82-
83
experimentos de campo, 91-94,103-
104,123-125,137-138. Jer tambem
proieto experimental: pesquisa ex-
ploratoria
experimentos de laboratorio, 91-94,
96-97,103-104. Jer tambem proieto
experimental: pesquisa explorato-
ria
P
face valiaitv. 200, 202
Fair, Isaac and Company, 389
Ialar em publico, 365-368
Iase analitica (processo de pesquisa
em administracão), 76-78,102-103
Iase de execucão (processo de pes-
quisa em administracão), 76-77, 86-
87,98-99,102-105
Iase de Iormulacão (processo de
pesquisa em administracão), 76-78,
83-84,113-114
Iator de correcão de populacão Iini-
ta, 248-250
Fator de InIlacão de Variância (FIV),
334-336,338.340-341.341-342
Iatores compostos, 389-391
FDA (Food and Drug Administra-
tion), 143-144
Federal Express, 39-40,115-116
FEDSTATS, 287
Ienômenos. Jer conceitos/constru-
tos: hipoteses
Iontes de inIormacão, ver tambem
software
amostragem de survev. 239-240
analise de conteudo, 155-156
criacão de questionarios, 213
462 ÍNDÌCE
dados qualitativos, 152
dados secundarios, 99-100,102,
101-102.103-105
desenvolvimento de questiona-
rios, 231-232
escalas, 205-206
estatisticas, 40-41,101-102. 287-
288
inIormacões online e bancos de
dados, 25S-260
relatorios de pesquisa em admi-
nistracão, 364-365
Researcher Sourcebook‡.159-160
SIRS Knowledge Source, 101-102
Tamtam.com 44-45
Iorca de associacão, 311,312
Iormula de regressão linear, 321-
322. Jer tambem analise de regres-
são
Iracasso como aprendizagem, 125-
126
Frito Lay, 86-87,93-94
Gallup Organization, 177
Gaz, 35-37
General Social Survey, 101-102
generalizacões semelhantes a leis,
77-78
Gino's Ristorante, 47-48,58-59. Jer
tambem estudos de casos: proieto
de avaliacão de clientes: restauran-
te Samouel's
Global Interact Network Mailing
List (GINLIST), 101-102
GolIBC, 113-114
Good Clinical Practices (GCP), 143-
144
Google, 79-80. 99-100
GPS (Global Positioning Satellite),
41-44,154-155
graIico importância-desempenho,
437-440
graIicos caule-e-Iolha, 277-278, i278-
279.279-280
graIicos de barras, 69,111-112.266-
268, 317-318, 363-364, 376-378
graIicos de caixas, 275-280
graIicos de pizza, 267-270, 361-363
graIicos. Jer quadros e graIicos
grupos de Ioco, ver tambem pesquisa
exploratoria: amostragem não-pro-
babilistica
analise de conteudo, 155-156
coleta de dados, 152-154,166-167
despesas com, 166-167
entrevistas em proIundidade
comparadas com, 167-169
sondagem, 84-86,100,102-104
H
Harrah' s Cassinos, 42
heterogeneidade, 244-246,248-250,
400-401, 418-419
hipoteses nulas. Jer tambem hipote-
ses: testagem de hipoteses
analise associativa, 310
analise de conglomerados, 405-
408,423-424,428-429
analise de correlacão, 312-315
analise de regressão, 328-329,
332-332,334-335
analise discriminante multipla,
410-415
analise Iatorial, 396, 398
ANOVA de dois Iatores, 302-305
ANOVA, 297-301
correlacão de ordem de ranquea-
mento de Spearman, 316
erros de Tipo I e de Tipo II, 285-
286
panorama, 283-286
parâmetros de populacão, 282-
283
poder estatistico, 285-286
reieicão de, 312-314
signiIicância estatistica, 312-312
testagem bivariada, 297-298
testagem de hipotese univariada,
290-293
testagem de hipoteses bivariadas,
323-324
hipoteses, ver tambem suposicões:
testagem de hipoteses: hipoteses
nulas
alternativas, 283-286,290-292,
296-297,323,328-329
analise de dados de, 284-286
desenvolvimento de, 61-62, 202-
204,167-169,283-285
direcionais, 284-285
eIeitos de demanda, 94-95,122-
126,137-144,223-224
estudo de Iuncionarios, 372-379
exemplo da sexta-Ieira inIormal,
82-83
experimentos de campo, 91-92
método cientiIico, 80-83,103-104
não-direcionais, 284-285
obietividade a partir de dados
quantitativos, 100,102,104-105
panorama, 76-77, 77-78, 80-92,
282-284
pesquisa descritiva, 88-89
propostas/relatorios de pesquisa,
359-364,367-369,372-382
signiIicância estatistica, 284-286
suposicões como, 283-284
hit ratio. 413-417, 428-429, 436-437
homogeneidade
em amostragem, 242-250
em analise de conglomerados,
388,400-402,418-419,423
Hoover' s Business Press, 101-102
I
idéias, 80-81,117-118,120-124,126-
127,175
identiIicacão de problema. Jer
questões de pesquisa
implementacão (processo O`_÷ô
ïïðóïïïô ïîíóïîê
·³°±--·¾·´·¼¿¼» ¼» preiuizo, 137-
139
incentivos vs. coercão, 136-138
indicadores. Jer variaveis substitu-
tas: variaveis
indices. Jer escalas
inIormacão, 139-144
inIormacões demograIicas
analise de conglomerados, 402-
405, 408-409
Iontes de, 36-37.101-102.304-305
matriz RAGE, 157.159
para survevs de painel, 158
perIil, 375-376,408-409
questões sobre, 224
inibicões emocionais, 118-120
instrumentos diagnosticos. Jer pre-
paracão de dados
intencões dos suieitos, 186-189. Jer
tambem participantes: survev
intensidade de respostas, 180-181,
184-188. Jer tambem escalas de pon-
tos
interacões, 41-43, 94-95, 95-96.103-
104, 310-311. Jer tambem técnicas
estatisticas
Internal Revenue Service (IRS), 41-
43
Internet
dialogo por computador, 168-169
e-mail. 39-40,152-154.161-163,
224,230-232,239-240
ÍNDÌCE 463
empreendimento de supermerca-
dos on-line. 33-34
inIormacões do consumidor, 236-
137
survevs de painel on-line. 159-160.
231-232.239-240
survevs via Web, 39-40,159-160.
161-163,166-169,239-240
interrogatorios, 115-117. Jer tambem
questões de pesquisa
intervalo de seguranca, 242-243.
300-302
introducão (relatorio de pesquisa),
360-362,372-374
1
Job Mart, 159-160
Johns Hopkins University, 140-141
Journal of Statistics Eaucation. 288
Knowledge Discovery in Dabases
(KDD), 40-43
Kodak, 118-120
L
lambda de Wilks (A,), 428-430
limitacões (relatorio de pesquisa),
383-384
lista de itens de ética, 144-145
lista de reIerência, 362-363
lucratividade de linha de produto,
39-40
M
mahalanobis, 402-403
Management InIormation Systems
(MIS), 112-114, 205
manipulacão, ver tambem variaveis,
sobre
eIeitos de demanda, 94-95,122-
126,137-144, 223-224
em experimentos causais, 89-92
em survevs eletrônicas, 162-163
panorama, 96-97
preiudicial, 137-139
veriIicacão de manipulacão, 257,
259
MANO VA (Analise Multivariada
de Variância), 304-305,319-321. Jer
tambem ANOVA
mapeamento de percepcões, 319-
321,423,437-439,441-442. Jer tam-
bem técnicas estatisticas de interde-
pendência
marketing de relacionamento, 38-39,
47-48,59,61-62
matriz de componente de Iator com
rotacão, 396, 398, 399
matriz RAGE, 258
média de grupo, ver tambem pesqui-
sa descritiva: média
analise de conglomerados, 404-
411
analise discriminante, 409-411,
414-418,430-431
em SPSS, 348.407-411
hipotese nula, 283-284
panorama, 306-307,418-419
testagem de hipoteses, 292-293
teste de diIerencas em, 296-305
média, ver tambem pesquisa descriti-
va: média de grupo
analise bivariada, 300-305,314-
315,323-325
analise de conglomerados, 400-
401, 406-409,424-428, 440-441
analise de correlacão, 339
analise de regressão, 329-336,
346-347,350-354,377-381,432-
435
analise Iatorial, 391-392,297-300,
430-431
ANOVA, 297-300,300-305
ao quadrado, 302-303. 324-325,
331-334. 337-338.346-347.433-
434
apresentacão de, 362-363
centeriod, 416-418
classiIicacões de desempenho,
379-381
dados Ialtantes, 260-261, 264-266
dados intervalares, 184-185
dispersão, 271-275,278-280
em Excel, 71-72
em SPSS, 260-261, 297-298
erro padrão da, 273-274
escalas utilizando, 269-271,286,
289,296-297
escores somados, 434-436
graIico de caixas, 276-278
graIico importância-desempe-
nho, 439-440
graIicos de pizza, 269-270
hipoteses e alternativas, 283-284
histogramas, 264-267
interacão de duas, 95-96
substituindo a, 260-261
suposicões para estima, 248-249
tendência central, 83-84,269-273,
278-280, 286, 289
testagem univariada, 290-293
testes i, 296-298
variância de, 272-274
mediana
analise de conglomerados, 400-
401, 403-404, 440-441
correlacão de ordem de ranquea-
mento de Spearman, 317-319
dispersão, 271-273, 274-275
em Excel, 71-72
escalas utilizando, 206-207, 286,
289
graIico importância-desempe-
nho, 438-439
graIicos caule-e-Iolha, 277-278
graIicos de caixas, 276-277
tendência central, 269-272, 278-
279
medidas. Jer tambem questionarios:
questões de pesquisa
de ambiente de trabalho, 59,262-
263
de construtos, 205
de dispersão, 271-276,278-280
de interacões de clientes, 175
de percepcões, 60-61
de relacionamento, 59, 61-62
de satisIacão, 423-424
de tendência central, 269-272,
272-273,278-280
de uma populacão, 284-285, 312-
314
obietivas, 96-99,178,180
mensuracão, ver tambem medidas:
escalas
da complexidade de produto per-
cebida, 191
de atitudes/opinião, 87-88,158,
175-177,184-194
de intencões de comportamento,
186-189,1205I
de intensidade, 180-181,184-188
erro, 196-198
niveis de, 180-187
panorama, 175-181,186-188. 206-
207
mercados livres, 35-37
Merrill Lynch, 113-114
método do minimo quadrado, 321-
322,325-326
464 ÍNDÌCE
métodos de amostragem, ver tam-
bem grupos de Ioco: amostragem,
sobre
aleatoria simples, 240-241.241-
242
amostra para razão de realizacão,
241-242
amostra representativa, 158, 238-
241, 248-250
area geograIica, 245-246
bola-de-neve, 240-241.247-248
conglomerado, 240-241, 240-241.
244-247, 250-251
conveniência, 240-241.246-247
de varios estagios, 240-241. 245-
247
determinacão do tamanho, 247-
251, 270-271,294-295
em SPSS, 241-243,292-292
estatistica de amostra, 284-286,
289-291,305-306
estratiIicada, 240-241,243-245
intencional, 246-247
intervalo de amostragem, 241-244
não-probabilistica, 237-238, 240-
241, 246-248,250-251
painéis, 89-90,156-157.158,159-
160.231-232.239-240
panorama, 56-57. 240-248, 250-
251
por iulgamento, 240-241. 246-247
por quota, 240-241.246-248
por reIerência, 240-241.247-248
probabilistica, 237-238,240-247,
250-251
relacionadas, 296-297
sistematica, 240-241. 241-244
unidade de amostra, 239-240
métodos e estratégias, ver pesquisa
causal: pesquisa descritiva: pesqui-
sa exploratoria: técnicas de entre-
vista: métodos de amostragem: es-
calas: técnicas estatisticas
Michalko, Michael, 116-117
MIS (Management InIormation Sys-
tems), 112-114: 205
moda, ver tambem pesquisa descriti-
va
dispersão, 271-276, 278-280, 286
em Excel, 71-72
escalas utilizando, 181-182, 206-
207, 286, 289
graIicos caule-e-Iolha, 276-277
graIicos importância-desempe-
nho, 438-439
tendência central, 83-84, 269-273,
278-280,286, 289
modelo de pesquisa de qualidade
de atendimento, 189-190
modelo de qualidade de atendi-
mento, 189-190
moderadores, de grupo, 84-86,100,
102-104,165-166
Moen, Inc., 154-155
monitoramento, 124-125
mudanca de clientes, 38-39
multicolinearidade, 326-327,332-
336, 341-342. Jer tambem colineri-
dade: técnicas estatisticas multiva-
riadas
Multivariate Data Analvsis (Hair),
336-337
N
National Decision Systems, 36-37
Nightingale, Florence, 267-268
niveis de tratamento, 93-98,300-303
niveis/graIicos de probabilidade,
348-354
nivel de seguranca, 248-249. 298-301
nivel de seguranca/precisão, 247-
248, 248-249
nivel de signiIicância, 290-293. Jer
tambem signiIicância estatistica
O
observabilidade (de idéias), 122-123
observacões, 80-82,88-90,96-98,
152-157,169-170. Jer tambem pon-
tos extremos
Occupational SaIety and Health
Administration (OSHA), 131-132
oportunidade, 111-112,224-125
orcamentos (pesquisa), 53-54.57.
360-361
orientacões para redacão técnica,
357-359
"
padrões, pesquisa, 143-144
paginas iniciais, 357-359
panorama de pesquisa em adminis-
tracão, 31-44, 46-47, 76-84. Jer tam-
bem ética: relacionamento pesqui-
sador-cliente: relacionamento pes-
quisador-participante
parcimônia, 83-84
participacão de clientes, 38-39, 42
participantes
atitudes/opiniões de, 158,175-
177,184-194, 216-217
comitê de revisão de recursos hu-
manos, 140-141
eIeitos de demanda, 94-95,122-
126,137-144,223-224
niveis de tratamento de, 93-98
obrigacões éticas dos, 141-146
questões de privacidade, 135-139,
142-144
tratamento ético dos, 135-141,
152-155
pensamento de cabeca para baixo,
120-123
pensamento de grupo, 118-120
pensamento, 114-116,120-123
percepcão tematica, 85-86
percepcões. Jer conceito de satisIa-
cão
Percept Technology, 36-37
perIil, 408-409
pergunta Iechada, 218-219
perguntas abertas, 218-219
perguntas multiplas, 226-227
pesquisa causai, ver tambem proces-
so de criacão de questionario: sur-
vevs
covariância, 89-91, 312-313, 390-
392
ética, 136-141
experimentos, 89-94
hipoteses em, 89-92
panorama, 83-84, 89-92
revisões de literatura, 84-85
selecionando, 96-98,103-104
variaveis, 89-92,103-104,310,
321-322
pesquisa conIirmatoria, 103-104. Jer
tambem testes empiricos
pesquisa de opinião do Baruch Col-
lege-Harris, 202-102
pesquisa descritiva, ver tambem esta-
tistica descritiva: média de grupo:
média: moda: amostragem, sobre:
desvio-padrão: survevs
dados quantitativos, 100,102,
202-203,104-105,152,158,170
distribuicão de Ireqüência, 261-
270, 292-294,348-352, 361-362
entrevistas estruturadas, 86-87,
163-165,170-171
estudos longitudinais, 88-90,157,
159
estudos transversais, 87-89
ética, 138-139
panorama, 83-84, 86-88,103-104
proietos, 83-84,86-91
questões de pesquisa, 96-98
selecão de variaveis, 103-104
ÍNDÌCE 465
survevs de painel, 89-90,156-157.
158,159-160. 231-232. 239-240
tabelas, 300-304,323,328-331,
378-379,396,398,399.408-409
tendência central, 83-84, 269-273,
278-280, 286, 289
teoria da concorrência, 77-80
testagem de hipoteses, 86-89,102-
103,282-283
pesquisa em administracão aplica-
da, 32-34,77-78,155-156,359-363.
Jer tambem pesquisa em adminis-
tracão basica
pesquisa em administracão basica,
ver tambem propostas e relatorios
de pesquisa
amostragem, 237-250
experimentos, 91-98
panorama, 32-34
processo, 76-78,102-104
proietos, 83-92,96-98-102-104
pesquisa etnograIica, 36-37,154-155
pesquisa exploratoria, ver tambem
proieto experimental: técnicas de
entrevista exploratoria: dados qua-
litativos
amostragem não-probabilistica,
237-238, 246-248, 250-251
minicaminhonete Chrysler, 61-62
panorama, 83-87,103-104
perguntas abertas, 218-219
questões de pesquisa, 96-98
revisão de literatura, 84-85
selecão de variavel, 103-104
tecnologia e, 84-86
testes empiricos, 77-78,82-83,
103-104,110-111,283-284
pesquisa externa, 44-47
pesquisa interna, 44-47
pesquisa internacional, 36-38
pesquisa qualitativa, ver tambem
grupos de Ioco: entrevistas não-es-
truturadas
entrevistas em proIundidade, 85-
86,100,102-104,167-171
variaveis, 180-181,206-207
pesquisa quantitativa, 218-219. Jer
tambem escalas métricas
variaveis, 180-181,206-207
pesquisa reproduzivel, 32-33,100,
102-103
pesquisas de opinião tendenciosas,
138-139
placebos, 139-140
planeiamento de pesquisa
testagem de hipotese, 82-84
planilhas, 70-72, 260-261
poder estatistico, 285-286
Pontiac Aztec, 166-167
pontos de zero absoluto, 185-187
pontos extremos, 264-265,269-271,
275-276, 279-280,348-354
pontos zero arbitrarios, 184
pontos zero, 184-187
populacões. Jer tambem amostra-
gem, sobre
alvo, 215-216, 238-240, 248-251
comparando duas ou mais, 297-
305
Iator de correcão de populacão Ii-
nita, 248-250
Iator de correcão de populacão,
248-250
medidas de, 284-285, 312-314
panorama, 237-238
parâmetros, 282-286, 289-291,
305-306
populacão GLBT, 158
variaveis paramétricas, 284-285,
305-306
porcentagem de variância,298-301,
393-396. Jer tambem analise Iatorial
preparacão de dados, ver tambem
dados
codiIicacão e entrada de dados,
260-261
dados Ialtantes, 66-68,257,259-
261
dispersão, 271-276,278-280,286
distribuicão de Ireqüência, 261-
267
distribuicão normal, 268-272,272-
273,289
edicão de dados, 257,259
em SPSS, 264-269, 272-273, 275-
279
graIicos de caule-e-Iolha, 277-280,
278-279
graIicos, 266-269
padronizacão de dados, 402-403
panorama, 257, 259, 277-280
transIormacão de dados, 63-64,
261-262
presenca (relacões entre variaveis),
310. Jer tambem variaveis, sobre
presenca de relacão, 310
pré-testes, 229-231,237-238
principio do minimo denominador
comum, 357-358
procedimento Varimax, 392-395,
398-400.431-433. Jer tambem anali-
se Iatorial
procedimentos estatisticos não-pa-
ramétricos, ver tambem Qui-qua-
drado: escalas nominais: escalas
ordinais
desenvolvimento de hipoteses,
285-286
dispersão, 271-276,278-280,286
suposicões, 289
procedimentos estatisticos paramé-
tricos, 285-286. 289. Jer tambem
ANOVA: escalas intervalares: dis-
tribuicão normal: escalas ordinais:
testes t
processo CAB
avaliacão e escolha, 109-111,117-
118,122-127
criatividade, 109-111,118-123
implementacão, 110-111,123-126
panorama, 109,125-126
questões de pesquisa, 109,112-
119,125-127
processo de criacão de questiona-
rios, ver tambem questões de pes-
quisa
avaliacão da conIiabilidade, 197-
200, 202
eIeito de contexto, 226-228
estrutura, 218-225
instrucões, 229-230
panorama, 212, 213, 231-233
preparacão de questões, 225-228
pré-testagem, 229-231
questões de abertura, 223
programa de GratiIicacões Casino,
42
programa Total Rewards (Har-
rah's), 42
Progressive Insurance, 43-44
proieto de avaliacão de clientes. Jer
tambem restaurante Samouel's: con-
ceito de satisIacão
analise bivariada, 292-297, 316-
319, 323-326
analise com SPSS, 415-416.424-
425
analise de, em SPSS, 59-63
ANOVA, 297-305
banco de dados de clientes, 59-62
panorama, 374-377
questionario, 214-215
recomendacões e conclusões, 382-
384
resultados, 379-382
testagem de hipotese univariada,
290-293
teste t de duas médias, 297-298
proieto experimental. Jer tambem
proietos de pesquisa em adminis-
tracão: pesquisa causal: analise Ia-
torial
intersuieitos, 93-97,300-303
intra-suieitos, 93-98
4 6 6 INDICE
panorama, 89-98,103-104
protecão do participante, 136-141
variaveis, 95-96,137-138
proietos de pesquisa em adminis-
tracão, ver tambem pesquisa causal:
pesquisa descritiva: pesquisa ex-
ploratoria
basica, 83-92, 96-104
ciência, 80-84, 91-94,103-104
modelo de qualidade de atendi-
mento, 189-190
panorama, 152
planeiamento e implementacão,
51-57.178,180-181
Secure Customer Index, 203
proietos de pesquisa tiro unico, 32-
33,87-88
propostas e relatorios de pesquisa
apresentacões orais, 364-368
Children' s Health Foundation
Research Proposal, 52-54
cronograma, 53-54. 57. 360-361
estrutura, 53-54,359-365
hipoteses em, 359-364,367-369,
372-382
implicacões de pesquisa, 33-34,
360-361
panorama, 51,116-118, 356-360,
367-369
questões do topico de pesquisa,
34-35,223-224
resultados de pesquisa, 134-136,
361-363, 376-382
Samouel's Restaurant, 55-57,371-
384
survev business-to-business. 54
psicograIia, 36-37
publicidade
analise de conteudo, 156-157
atingindo grupos identiIicados,
400-401
campanhas, 124-125,166-167
medida dos eIeitos da, 206,316,
319-322
previsões de vendas a partir da,
325-327,341
vendas, eIeitos sobre, 77-79,81-
82,319-323
Q
quadros e graIicos, ver tambem soft-
ware SPSS: tabelas
analise de residuos, 348-353
diagramas de dispersão, 312-313
em Excel, 70-72
em SPSS, 66-69, 268-269. 276-277
Iontes de off-the-shelf. 101-102
graIicos de barras, 69,111-112,
266-268, 317-318, 363-364. 376-
378
graIicos de pizza, 267-270, 361-
363
nivel de pesquisa relacionado ao
risco, 111-112
panorama, 261-270, 272-279, 361-
363,363-364
resultados experimentais Iato-
riais, 94-96
tendências sazonais, 89-90
questionarios auto-adminis trados,
160-163, 215-216, 229-230
questionarios, ver tambem estudo de
Iuncionarios: entrevistas: mensura-
cões: survevs
administracão de, 215-216,230-
232
administrados por entrevistador,
162-169, 229-230
auto-administrado, 160-163,215-
216, 229-230
Gallup Q12,177
panorama, 158-161,170
survev de clientes, 59-62,184,224-
225
questões assistidas, 226-227
questões de abertura, 223
questões de pesquisa, ver tambem hi-
poteses: mensuracões: escalas de
pontos: escalas
abertas e Iechadas, 218-219
avaliacão de, 117-118,122-124,
126-127,215-216,376-377
classiIicacão, 59-60.183, 215-219,
222, 224-225
de aiuda, 226-226-227
descoberta de topico com, 117-
119
descoberta ou esclarecimento, 96-
98
descritivas, 86-87,96-98
desenvolvimento de, 83-87,114-
119,133-135,215-217
dominantes, 226-227
espaco de solucão, 116-118,120-
121
exemplo da sexta-Ieira inIormal,
82-83
hipoteses desenvolvidas a partir
de, 81-82
interrogatorios, 115-117
mensuracão de conceito, 59-62
multiplas, 226-227
panorama, 80-81
processo CAB, 109,112-119,125-
127
recomendacões, 362-363
selecão do proieto, 96-98
tendenciosidade de posicão, 226-
228
triagem, 142-143,223
viaveis, 109,113-114, 214-225,116-
119,125-127,163-165
questões de privacidade, 135-139,
142-144
questões de ramiIicacão, 224
questões, deIinicão, 117-127
Quirk' s Research Review, 159-160
R
R. J. Reynolds, 134-136
R (coeIiciente de determinacão
multiplo)
analise de regressão multipla,
329-333, 335-337, 341-342, 345-
346, 381-382
analise de residuos, 348,353-354
panorama, 327-328
r (coeIiciente de determinacão),
313-314, 323, 325-327
ranqueamentos de Iator de selecão,
60-62
razão F/teste F, 298-300, 302-303,
324, 332
razão, amostra para realizacão, 241-
242
recomendacões e conclusões, 362-
365,381-384. Jer tambem propostas
e relatorios de pesquisa
recomendacões para apresentacão,
365-368
recursos visuais, 365-366
regras de decisão normativa, 78-79
regressão logistica, 319-321. Jer tam-
bem analise de regressão
regressão multipla passo a passo,
326-327,336-338,340-342
relacão curvilinea (variaveis), 310-
311. Jer tambem variaveis, sobre
relacionamento cliente-pesquisador.
Jer tomada de decisão: relaciona-
mento pesquisador-cliente
relacionamento pesquisador-clien-
te, ver tambem propostas e relato-
rios de pesquisa
consenso, 140-141,141-142
consultor vs. pesquisador da em-
presa, 44-47
ética, 134-136,140-142
panorama, 43-44,144-146
ÍNDÌCE 467
tabelas pro-Iorma, 114-115.116-
118, 360-361.367-369
relacionamento pesquisador-parti-
cipante, ver tambem entrevistas: téc-
nicas de entrevista
caracteristicas do moderador,
165-166
consideracões sobre a criacão das
questões, 215-216
obrigacões éticas do pesquisador,
135-141
questões de abertura, 223
relacionamento vendas/publicida-
de, 77-79, 81-82,319-323,325-327,
341
relacões. Jer variaveis, sobre
relacões lineares (variaveis), 310-4-
315,319-320, 351-352.390-391. Jer
tambem variaveis, sobre
relacões não-lineares (variaveis),
310-311. Jer tambem variaveis, so-
bre
relatorios de pesquisa. Jer propos-
tas e relatorios de pesquisa
Researcher Sourcebook ´ . 159-160
residuos padronizados, 348-354
respondentes. Jer participantes
resultados de proieto, 133-134
Resumo Executivo, 357-363, 372-
373. Jer tambem propostas e relato-
rios de pesquisa
resumos, 362-364
revelacão de inIormacões, 138-140
revisões de literatura, 84-85, 363-364
revolucão da inIormacão. Jer tecno-
logia
rigidez Iuncional, 114-115.115-121,
125-126
risco. Jer signiIicância estatistica
Rogers, Everett, 122-124
rotacão obliqua, 392-394
rotacão ortogonal, 392-394
rotulos de categorias para escalas,
195-198
s
Sales and Marketing Index (SAMI),
40-41
Samuel Adams Beer, 123-124
segmentos de clientes, 42
selecão de amostra aleatoria
em SPSS, 241-243
série temporal, 88-89
Siemens, 84-85
signiIicância estatistica
analise de regressão, 324-332,
335-336
ANOVA, 300-301
de coeIicientes de correlacão, 311-
312, 315-316
desenvolvimento de hipoteses,
284-286
erros de Tipo I e de Tipo II, 285-
286
hipoteses nulas, 311-109
hipoteses, 284-286
panorama, 305-306, 310,311-312,
341-342
testagem de hipotese univariada,
290-292
testes bivariados/univariados,
290-297,314-315
signiIicância pratica, 315-316
Simmons Market Research Bureau,
158
simplicidade (de idéias), 123-124
sintomas, deIinicão, 117-119
SIRS Knowledge Source, 101-102
Sistema de Apoio as Decisões
(DSS), 112-114,359-360
Sistemas de InIormacões GeograIi-
cas (GIS), 40
sistemas de valor. Jer ética adminis-
trativa
sistemas de valores pessoais. Jer
ética administrativa
sistemas especializados, 32-33,78-
79,110-111,113-114,125-126
Skoda, 37-38
software QSR NUDTST, 155-256
software SPSS
alIa de Cronbach, 199-201
analise de conglomerados, 407-
408.409-411. 428-431
analise de regressão, 324,327-328,
332,336-338,340-342,351-352,
353-354
analise de variância, 298-301
analise discriminante, 415-416.
424-425
analise Iatorial, 394-395,398-400.
407-408.432-434
ANOVA, 303-304.407-408
banco de dados de clientes, 59-63
banco de dados de Iuncionarios,
58-59-60
codiIicacão, 260-261
coeIiciente de correlacão de signi-
Iicância estatistica, 311-312
conceito de satisIacão, 266-267
correlacão de ordem de ranquea-
mento de Spearman, 317-318
correlacões bivariadas de Pear-
son, 314-315
diIerenca entre duas médias, 297-
298
dispersão, 275-276
escores somados, 262-263, 435-
436
graIicos caule-e-Iolha, 278-279
graIicos de barra e de pizza, 268-
269
graIicos de caixa, 276-277
graIicos, 66-69
MANOVA, 304-305
médias de grupos, 348.407-411
panorama, 63-69, 231-232, 256-
257,332-333
preparacão de dados com, 264-
269,272-273,275-279
qui-quadrado, 294-296
selecão de amostra aleatoria, 241-
243
substituicão da média, 260-261
survevs de clientes, 415-416. 424-
425
tabela de distribuicão de Ireqüên-
cia, 264-265
tendência central, 272-273
testes t. 291-292. 296-297
variaveis em, 64-68
variaveis mudas, 347
XLSTAT comparado com, 282-283
software TextSmart, 155-156
software. Jer tambem software SPSS
AID, 41-43
analise de conteudo, 155-156.
156-157
desenvolvimento de questiona-
rios, 231-232
DSS, 112-114
edicão, 63,71-72
Excel, 70-72,271-272, 274-275
QSR NUD*IST, 155-156
sistema de grupos, 169
sistemas especializados, 32-33,
78-79,110-111,113-114,125-126
SLSTAT, 282-283
TextSmart, 155-156
solucões multiplas, 117-118
soma balanceada de valores, 411-
412
soma de desvio ao quadrado, 273-
274, 321-322
soma de diIerencas absolutas, 402-
403
soma de quadrados, 298-300.302-
303. 324, 394-395. 395-396, 399. 433-
434
468 ÍNDÌCE
soma de variância de cargas de Ia-
tores ao quadrado, 394-396, 433-
434
soma de variância de quadrados,
301-302. 302-303. 324-325, 331-334.
428-429.346-347.347
soma total de quadrados, 324
somas de rotacão de variância de
cargas ao quadrado, 431-432
Standard & Poor's Corporate Re-
cords, 101-102
Statistics.com, 288
StatLib, 288
StatWeb, 283
suieitos, 93-94. Jer tambem partici-
pantes
supermercados on-line. 33-34
suposicões, ver tambem hipoteses
de relacão linear eIiciente, 311
em testes t. 297-298
hipoteses como, 283-284
incorretas, 114-116,125-127
na analise discriminante, 414-415
na analise Iatorial, 391-393
nas medidas de crédito FICO, 389
para amostras, 87-88
para analise de regressão, 321-
322,325-326,344-345,353-354
para calculo da média, 248-249
para coeIicientes de correlacão de
Pearson, 313-314
para procedimentos paramétricos
e não-paramétricos, 289
para questionarios auto-adminis-
trados, 160-161
para testes de acompanhamento
ANOVA, 300-301
testagem, 348-352
Survey Sampling Inc., 239-240
survevs de clientes
analise Iatorial, 59-62
survevs. ver tambem coleta de dados:
processo de criacão de questiona-
rios: questionarios
auto-administradas vs. adminis-
tradas por entrevistador, 157,
159,215-216
dados primarios de, 100,102
de painel, 89-90,156-157.158,
159-160.230-231.239-240
panorama, 87-89,157,159,169.
170
pela Web, 39-40,159-160.161-163,
166-169,239-240
por correio/Iax, 160-162, 269,
230-232
por e-mail. 39-40,252-154,161-
163,224,230-232,239-240
taxas de realizacão de, 241-242
Swaddling, JeIIrey Dœ 84-85
I
tabelas diagnostico de casos, 348-
353
tabelas. Jer tambem graIicos: softwa-
re SPSS
Agglomeration Schedule, 407-408
amostra aleatoria, 242-243
amostra estratiIicada, 244-245
analise de regressão, 380-381,
433-435
analise discriminante, 414-416
analise Iatorial, 388-401,394-395,
433-435
ANOVA, 298-300,324-325,333-
338, 345-347,406-409
beta, 378-379
coeIicientes, 239-240,325-326,
329-332,334-335,346-347,378-
379
comparacões multiplas, 304-305
contingência, 293-295
correlacões, 314-318,335-336
dados transversais, 88-89
descritivas, 300-304, 323, 328-331,
378-379,396,398,399.408-409
diagnosticas, 350-353
distribuicão de Ireqüência, 262-
270, 361-362
edicão (software). 63, 71-72
eIeitos entre suieitos, 300-303
estatistica de grupo, 416-418
estatistica residual, 350-353
lambda de Wilks (X). 428-430
matriz de classiIicacão, 412-414
matriz de componente de Iator
com rotacão, 399
matriz de correlacão de Pearson,
378-379
matriz de estrutura, 428-430
matriz de Técnica de Desenvolvi-
mento Heuristico de Ideias, 220-
122
pro-Iorma, 224-215,116-118,360-
362,367-369
resumo de modelo, 323,329-331,
333-338,345-347,377-379
simuladas, 224-225,116-117, 360-
361. 367-369
solucão de conglomerado, 429-
430
tendência central, 270-272
teste de amostras independentes,
380-381
teste Qui-quadrado, 294-296
teste t de uma amostra, 291-292
teste t. 297-298
variância total explicada, 399-400
tabulacão cruzada, 292-296, 362-363,
363-364
Tamtam.com, 44-45
Tauber, Ed, 120-122
taxas de resposta a survevs. 241-242
Técnica de Desenvolvimento Heu-
ristico de Idéias, 120-123
técnica de entrevista de sondagem
descoberta de questão com, 117-
119
entrevistas em proIundidade, 85-
86,100,102-104,167-171
grupos de Ioco, 84-85-85-86,100,
102-104
pré-teste de questionario, 230-231
técnicas analiticas. Jer analise de
conglomerados: analise Iatorial
técnicas de entrevista exploratoria,
ver tambem pesquisa exploratoria:
grupos de Ioco: técnicas de entre-
vista
Delphi, 44-45.85-86
em proIundidade, 85-86,100,102-
104,167-171
proietivas, 85-87
técnicas de entrevista, ver tambem
grupos de Ioco: entrevistas: sonda-
gem: entrevistas não-estruturadas
em proIundidade, 85-86,100,102-
104,167-171
estruturadas, 86-87,163-165,170-
171
pessoais, 158-157,159,162-165,
168-171,269
por teleIone, 258,168-169, 269,
170-171, 230-232
proietivas, 85-87
questionarios assistidos por en-
trevistador, 162-169,215-216
semi-estruturadas, 163-167
survevs de painel, 89-90,156-157.
158, 259-260,232-232,239-240
survevs pela Web, 39-40, 259-260,
161-163,166-169,239-240
técnica Delphi, 44-45.85-86
técnicas de independência. Jer tam-
bem analise discriminante
analise de regressão multipla,
325-334,344-354,377-379
ÍNDÌCE 469
regressão multipla passo a passo,
326-327,336-338,340-342
técnicas de interdependência esta-
tistica, ver tambem analise de con-
glomerados: analise Iatorial
mapeamento de percepcões, 319-
320-320-321,423,437-439,441-
442
técnicas de reducão de dados. Jer
analise de conglomerados: analise
Iatorial
técnicas estatisticas bivariadas, ver
tambem técnicas estatisticas multi-
variadas: técnicas estatisticas uni-
variadas
analise de regressão, 319-326
analise de residuos, 348,353-354
correlacão de ordem de ranquea-
mento de Spearman, 184, 316-
321
correlacões de Pearson, 313-315,
335-336
em SPSS, 295-296
hipoteses nulas, 297-298,323-324
panorama, 286,290-291,305-307,
318-320
regressão multipla comparada
com regressão bivariada, 341-
342
signiIicância estatistica, 290-297,
314-315
técnicas multivariadas compara-
das com, 327-328,332,335-336
testagem de hipotese, 292-297
testes t. 296-298
técnicas estatisticas de dependên-
cia. Jer tambem ANOVA: analise
discriminante
analise coniunta, 319-321
analise de regressão multipla,
319-321,325-334,343-354,377-
379,429-435
correlacão de ordem de ranquea-
mento de Spearman, 184,316-
321
panorama, 318-321
regressão logistica, 319-321
técnicas estatisticas de razão, 319-
321, 325-334, 344-354, 377-379, 429-
435. Jer tambem ANOVA: analise
de correlacão
técnicas estatisticas métricas, ver
tambem ANOVA: analise de corre-
lacão
analise coniunta, 319-321
analise de regressão multipla,
319-321,325-334,344-354,377-
379, 429-435
MANOVA, 304-305,319-321
técnicas estatisticas multivariadas,
ver tambem técnicas estatisticas
multivariadas: analise de conglo-
merado: analise Iatorial: técnicas
estatisticas univariadas
analise de regressão multipla
passo a passo, 336-338, 340-341
analise de regressão multipla,
319-321,325-333,344-354,377-
379,429-435
analise discriminante multipla,
409-415
MANOVA, 304-305
multicolinearidade com analise
de regressão multipla, 332-336
multicolinearidade, 326-327, 332-
336, 341-342
panorama, 286, 318-320
técnicas estatisticas univariadas,
286,290-298,300-302,305-306,318-
319,415-418. Jer tambem técnicas
estatisticas bivariadas: técnicas es-
tatisticas multivariadas, técnicas
estatisticas
técnicas estatisticas, ver tambem
ANOVA: técnicas estatisticas biva-
riadas: analise discriminante: ana-
lise Iatorial: analise de regressão
analise Iatorial, 388-401,418-419
analise residual, 348-354
correlacão de ordem de ranquea-
mento de Spearman, 316-321
correlacões de Pearson, 312-316,
335-336.339.341,378-379
multivariadas, 286,304-305,318-
320,388-401
panorama, 318-320
teste de uma amostra, 291-293
testes de qui-quadrado, 286,289,
292-297,305-307
univariadas, 286, 290-297,300-
302,318-319
tecnologia de satélites, 41-44,154-
155
tecnologia, ver tambem Internet: soft-
ware
bancos de dados, 40-41,110-111,
135-136
coleta de dados com uso de, 152
empresas de inIormacões, 34-37
era da inIormacão, 44-45
pesquisa exploratoria e, 84-86
redes, 39-40
sistemas especializados, 32-33,
78-79,110-111,113-114,125-126
tecnologia de satélite, 41-44,154-
155
tendência central, 83-84,269-273,
278-280,286,289
tendências promocionais, 88-89
tendências sazonais, 86-87, 88-90
tendências, 35-44,86-87,88-90, 102-
103
tendenciosidade de posicão, 226-
228
tendenciosidade do pesquisador,
257,259
teoria baseada na realidade, 79-81
teoria de aprendizagem comporta-
mental, 78-79
teoria matematica, 79-80
teorias
de concorrência, 77-78, 79-80
de relacão entre publicidade e
vendas, 77-79,81-82,319-323
implicitas, 93-94
panorama, 77-82,102-104
pesquisa exploratoria solidiIica,
83-87
regras de decisão normativa, 78-
79
validade estabelecida com, 200,
202-204
testagem de hipoteses, ver tambem
hipoteses: hipoteses nulas: escalas
especificas
analise de regressão multipla,
334-335
ANOVA, 292-293,297-305
com dados qualitativos, 100,102-
103
com dados quantitativos, 100,
102-103
conceito de satisIacão, 285-286,
290-291,296-305
dados secundarios, 98-100
erros de Tipo I e de Tipo II, 285-
286
escalas intervalares, 290-293,296-
298
escalas utilizadas, 286,289
hipoteses nulas, 290-293,323-324
MANOVA, 304-305
média de grupo, 292-293
niveis de signiIicância, 290-293
panorama, 284-287, 289, 305-307
pesquisa causal, 89-92
470 INDICE
pesquisa descritiva, 86-89,102-
103,282-283
proieto de avaliacão de clientes,
290-293
proieto de pesquisa, 82-84
reieicão de hipoteses, 312-314
signiIicância estatistica, 290-292,
tabulacão cruzada usando analise
de qui-quadrado, 292-297
técnicas de estatistica bivariada,
292-297
técnicas estatisticas, 286
teste t de diIerenca em duas mé-
dias, 296-298
testes univariados/bivariados,
290-298
testagem, 122-123
teste de acompanhamento, 298-301
teste de mercado de Olestra Potato
Chip, 93-94
teste de QI sobre tecnologia, 45-46
teste do choque elétrico, 139-140,
139-140
teste qui-quadrado de Pearson, 293-
296
teste ScheIIe, 300-301-302
testes com manchas de tinta, 85-86
testes de controle de qualidade, 237-
238
testes de mercado, 91-93,93-94.123-
125. Jer tambem pesquisa explora-
toria: testes/treinamento piloto
testes empiricos, 77-78,82-83,103-
104,110-111, 283-284
testes Qui-quadrado, 286,289,292-
297,305-307
testes I, 291-292,296-298,325,379-
380. Jer tambem ANOVA
testes/treinamento piloto, 91-93,
123-127, 248-251. Jer tambem pes-
quisa exploratoria: testes de merca-
do
Texas A&M University, I89-J90
tipos de dados, ver tambem dados de
percepcão: dados qualitativos: da-
dos quantitativos
de observacão,152-157
dependentes do pesquisador, 98-
99,102-103
obietivo, 96-99
off-the-shelf. 40-41,101-102.159-
160
primarios, 98-99,103-105
proietivos, 85-87
secundarios, 98-100,101-105
subietivos, 98-99
tolerância, 334-337, 338.340-341.
341-342. Jer tambem multicolineari-
dade
tomada de decisão, ver tambem pro-
cesso CAB: avaliacões: pesquisa
exploratoria
decisões estratégicas/taticas, 33-
35,143-144
obrigacões éticas, 140-142,144-
146
panorama, 76-82,109-225,117-
119,125-126
regras de decisão normativas, 78-
79
sistemas especializados, 32-33,
78-79,110-111,113-114,125-126
tendências sazonais, 86-87
Toyota, 31-33
3M (empresa), 118-120,154-155
8
ËòÍò Ý»²-«-ô ìð óìïô îð îóîð îôîçð óîçï
ËòÍò Ü»°¿®¬³»²¬ ±º ½±³³»®½»ô îð îó
îð î
União soviética, livre mercado na,
35-37
universo. Jer populacões
V
validade. Jer tambem concei-
tos/construtos
concorrente, 197-198.202-203
convergente, 197-198,202-203,
392-393
de conglomerados, 423-424,426-
428
de construto, 197-198, 200,202
de conteudo, 197-198,200,202
de critério, 197-198,202-203
de previsão, 197-198, 202-204
discriminante, 197-198,202-203,
392-393
interna vs. externa, 91-92-92-93
panorama, 196-198,206-207
vantagem (de idéias), 122-123
variância, sobre. Jer tambem ANO-
VA: coeIicientes: variaveis depen-
dentes: variaveis, sobre: variâncias
analise de conglomerados, 404-
408
analise de regressão, 431-432
analise discriminante, 411-412,
414-415
analise Iatorial, 390-396, 399-401
em SPSS, 298-301
MANOVA, 304-305,319-321
panorama, 272-274,310-311
porcentagem de variância, 298-
301,393-396
variabilidade /homogeneidade,
242-250
variâncias
analise Iatorial, 390-391,393-396,
399.398-400
comuns, 390-393
covariância, 89-91, 312-313,390-
392
de residuos, 324-325, 325-326,
336-337,348,353-354
dentro de grupos, 298-300, 302-
303
dentro de ou entre grupos, 298-
300,302-303
dispersão, 271-276, 278-280, 286
entre grupos, 298-300,302-303
erro, 348,353-354,391-393, 394-
395,404-408
explicadas, 324-326, 348, 353-354,
378-381
não-explicadas, 324-326, 336-337,
348,353-354
razão F, 302-303, 324, 332
regressão, 324-326,348,353-354,
378-381
soma de cargas de Iator ao qua-
drado, 394-396,433-434
soma de quadrados, 301-303. 324-
325,331-334.337-338. 346-347
somas de cargas ao quadrado
com rotacão, 431-432
teste i, 296-298
unicas, 391-393
variaveis
bloqueadoras, 95-97
categoricas, 297-298,304-305
causais, 89-92,103-104,310,321-
322
componentes principais, 390-395,
398-400.431-433
compostas, 261-262
continuas, 180-181, 206-207, 296-
298
de analise Iatorial, 94-96, 388,
400-401,440-441
de classiIicacão, 59-62,411-415
de gênero, 178
ÍNDÌCE 471
de resposta, 95-96,103-104,304-
305
de resultado, 95-96,103-104, 304-
305
discretas, 180-181, 206-207
experimentais, 95-96,137-138
independentes, 297-298,302-303,
312-313
intangiveis, 178,180
métricas, 178,180-181,206-207,
260-261,302-305,312-315
mudas, 260-261, 321-322, 344-348,
353-354
não-métricas, 180-181, 206-207,
297-298,302-303
panorama (de variaveis), 310-311
parâmetros de populacão, 284-
285,305-306
percepcões, 201,266-267, 397-399.
400-401, 427-430
qualitativas, 180-181, 206-207
quantitativas, 180-181,206-207
resultado de relacão, 304-305
substitutas, 178,179-178.180.
203-204
tangiveis, 178-179
variaveis de critério, 202-204. Jer
tambem variaveis
variaveis dependentes. Jer tambem
analise de regressão: variaveis
ANOVA/MANOVA, 302-305
graIicos, 312-313
mensurando, 318-320
multiplas, 304-305
niveis de tratamento e, 95-97
panorama, 93-94
teste do choque elétrico, 139-140
variaveis de critério, 202-204
variaveis, sobre. Jer tambem coeIi-
cientes: correlacão: analise de da-
dos: analise Iatorial: manipulacão:
escalas: técnicas estatisticas: va-
riância
atribuicão de valores, 65-66
como componentes de conceitos,
203-204,213
consideracões de aplicabilidade,
118-119
correlacão de ordem de ranquea-
mento, 316-321
covariância, 89-91,311-313,390-
392
diagramas de dispersão, 312-313
direcão de, 311
distribuicão de Ireqüência, 261-
270,292-295, 348-352,361-362
eIeitos principais, 94-96,103-104
em SPSS, 64-68
escolhas de técnicas estatisticas,
286,290-291,305-306
estatisticas de amostra, 284-285
explicacão, 118-119
Iorca de associacão, 311
hipoteses direcionais, 284-285
interacões, 94-95-95-96,103-104,
310-311
no teste do choque elétrico, 139-
140
organizacional, 156-157
panorama, 175-176,178,180-181,
206-207,310-311, 318-320, 326-
328,341
presenca, 310
presenca de relacão, 310
relacões curvilineas, 310,311
relacões lineares, 310-315,319-
320, 351-352
relacões não-lineares, 310-311
substitutas, 178,179-180
suposicões, 311
transIormacões logicas, 261-262
variabilidade/homogeneidade,
242-250,271-276 (ver tambem va-
riância, sobre)
variaveis/escalas discretas, 180-181,
206-207. Jer tambem escalas nomi-
nais: escalas ordinais: variaveis
veriIicacão de estruturacão de men-
sagem, 179
VTOCS (critérios de avaliacão), 122-
124
W
WebStat, 288
È
XLSTAT, 282-283
z
Zobel, Mark W., 84-85
INFORMACÔES E BANCOS DE DADOS ÑÒóÔ×ÒÛ NO BRASIL`
Banco de dados Tipo de dados
Rural business
Gestão Local - Rede de Bancos
de Dados em Gestão Local
www.web-brazil.com/gestaolocal
ABMN - Associacão Brasileira de
Marketing e Negócios
www.abmn.com.br
IPEA - Instituto de Pesquisa
Aplicada
www.ipeadata.gov.br
MAS Pesquisa de Mercado
www.maspesquisademercado.com.br
RIMAR - Revista Interdisciplinar de
Marketing
www.rimar-online.org
IB RE - Instituto Brasileiro de Economia
Fundacão Getúlio Vargas
www.ibre.fgv.br
SEADE - Fundacão Sistema Estadual
de Análise de Dados
www.seade.gov.br
InIormacões atualizadas sobre o mercado do agronegocio em
todo o pais. Analise de mercado, cotacão, indices Iinanceiros.
Reune num mesmo local o acesso a diversas instituicões com
proietos de gestão na area publica, cuios bancos de dados são
disponibilizados gratuitamente para os usuarios
Banco de inIormacões totalmente digitalizado com acesso restrito
aos associados. OIerece assessoria de dados, contendo artigos/
matérias extraidas por principais veiculos no Brasil, resumo de
palestras, seminarios, congressos promovidos pela ABMN.
Fonte de dados estatisticos macroeconômicos e regionais sobre
agropecuaria, balanco de pagamentos, câmbio, comércio
exterior, consumo de vendas, contas nacionais, economia inter-
nacional, eleicões, emprego, estoque de capital, Iinancas publi
cas, geograIico, indicadores sociais, iuros, moedas e crédito,
populacão, precos, producão, proiecões, salario e renda, sinopse
macroeconômica e transporte.
Instituto especializado em coleta de dados, opiniões e intencões
a respeito de produtos, servicos, imagens satisIacão de e
clientes, usuarios e eleitores. Disponibiliza gratuitamente boa
parte dos resultados de suas pesquisas na pagina da Internet.
Mantém pesquisas on-line para serem respondidas pelos usuarios.
Fornece os links de acesso a bancos de dados, bibliotecas e perio-
dicos nacionais e internacionais sobre administracão, marketing
e areas aIins.
Desenvolve pesquisas aplicadas nas mais variadas areas publicas
e também na area social e do trabalho. Disponibiliza dados
gratuitamente para consulta.
Producão e disseminacão de pesquisas, analises e estatisticas
socioeconomicas e demograIicas do estado de São Paulo e
regionais sobre os temas: administracão agropecuaria, carac-
terizacão territorio, comércio, comunicacões, condicões de
vida, contas nacionais/regionais, cultura, demograIia, eco-
nomia, educacão, eleicões, energia, Iinancas publicas inIor-
macões municipais, habitacão, industria, iustica e seguranca,
meio ambiente, negocios e investimentos, politica urbana, pre-
vidência, renda e patrimônio, saneamento, saude, servicos,
sistema Iinanceiro, trabalho e transporte.
* N. de R.T: Quadros extra de inIormacões pesquisadas e incluidas pela revisão a Iim de melhor orientar o publico leitor brasileiro em
relacão a bancos de dados e inIormacões uteis de Iacil acesso no Brasil.
www.ruralbusiness.com.br

Sign up to vote on this title
UsefulNot useful