Professional Documents
Culture Documents
RESUMO
Este artigo realiza uma avaliao crtica da aplicao de Modelagem em Equaes Estruturais no Brasil, a partir de um estudo comparativo entre os trabalhos publicados na sub-rea de marketing do ENANPAD e nas sees de marketing de trs dos principais peridicos de administrao do Brasil: RAE, RAUSP e RAC, de 1994 a 2003. Os resultados obtidos foram comparados s estatsticas que resumem a utilizao de SEM em artigos publicados nos principais journals internacionais de marketing, tabulados e apresentados por Baumgartner e Homburg (1996). O texto se inicia por uma breve viso geral de SEM - surgimento, funes e caractersticas, etapas principais, aplicaes, aspectos essenciais e alguns aspectos problemticos da sua utilizao. Aps a discusso sobre os critrios utilizados para tabular os artigos, o panorama do uso de SEM no Brasil apresentado e comparado com as estatsticas dos trabalhos publicados em mbito internacional. O texto encerrado com uma avaliao geral da qualidade da utilizao desta abordagem no Brasil e apresentao de sugestes para futuras aplicaes da modelagem de equaes estruturais em marketing. Palavras-chave: modelagem em equaes estruturais; marketing; mtodos multi-variados.
A B S T R ACT
This article investigates the use of Structural Equation Modeling (SEM) in the published articles on the main brazilian business administration conference (ENANPAD) marketing track and also on the marketing section of the most important brazilian business administration journals (RAE, RAUSP and RAC) in the last ten years: 1994 to 2003. In addition to the analysis of the published articles, the authors present a comparison with Baumgartner and Homburgs (1996) findings in their investigation on SEM usage, which explored the papers published at main international marketing journals. The text begins with a brief overview of SEM its origins, functions and characteristics, main steps, some applications, its essentials and some problematic aspects of the method. Then the criteria used to analyze the papers are presented. The results are shown in detail, including a comparison with Baumgartner and Homnburgs findings. This article ends with an overall evaluation about the quality of the use of SEM in Brazil, along with some suggestions for future applications of SEM in marketing. Key words: structural equation modeling; marketing; multivariate methods.
131
I N T ROD U O
O uso da Modelagem em Equaes Estruturais (daqui para frente chamada pela abreviao do nome original em ingls Structural Equation Modeling SEM) recebeu grande impulso por volta do final da dcada de 70 e incio dos anos 80 do sculo passado, com o trabalho de Bentler (1980) e com a popularizao do software LISREL (Steenkamp & Trijp, 1991). Desde ento, tem sido cada vez mais utilizada dentro do campo das pesquisas sociais e comportamentais (Baumgartner & Homburg, 1996). Ao trabalho de Bagozzi (1980) costuma ser creditada a primeira aplicao da tcnica na rea de marketing e, mais especificamente, nas pesquisas sobre comportamento do consumidor. SEM vem tendo, desde ento, utilizao crescente, como pode ser observado em muitos peridicos internacionais de marketing. Em trabalho de reviso da aplicao de SEM em marketing, Hulland et al. (1996) e Baumgartner e Homburg (1996) identificaram 186 publicaes entre 1980 e 1994, e 149 publicaes entre 1977 e 1994, respectivamente. Apenas para efeito de exemplificao da sua crescente popularidade, MacCallum e Austin (2000) analisaram aproximadamente 500 publicaes em que a tcnica SEM foi aplicada, num total de 16 journals de psicologia entre 1993 e 1997. James e James (1989) identificaram 55 aplicaes na rea de pesquisa organizacional, tendo Medsker, Williams e Holohan (1994) identificado outras 28. No Brasil, a modelagem em equaes estruturais demorou a ser utilizada na rea de marketing, em comparao ao cenrio internacional anteriormente descrito. Por exemplo, considerando o perodo de dez anos (1994-2003), a primeira utilizao de SEM em marketing no ENANPAD Encontro Nacional do Programa de Ps-Graduao em Administrao, usualmente o frum de ponta em termos de pesquisas na rea de administrao no Pas, data apenas de 1998, tendo, porm, aumentado nos anos seguintes. A crescente popularidade de SEM no exterior e no Brasil pode ser creditada a dois fatores. Em primeiro lugar houve, nos ltimos anos, grande popularizao de programas de computador para utilizao de SEM, como LISREL, EQS, AMOS, COSAN, EZPATH, LINCS, PROC CALIS (do SAS), RAMONA, e outros. Alm disso - e mais importante - a abordagem SEM tem bom potencial para investigaes empricas abrangentes de aspectos tericos e de mensurao
132
(Baumgartner & Homburg, 1996). Se por um lado, esses fatores favorecem a utilizao da abordagem, por outro eles so motivo de preocupao sobre eventuais usos inadequados ou problemticos de SEM em pesquisas empricas. A preocupao bastante pertinente, na medida em que existem muitos aspectos nos diversos estgios de aplicao da mesma que, se no forem observados, podem gerar no s resultados errneos, mas tambm concluses inadequadas ou imprecisas. A partir dessas observaes, este artigo realiza uma avaliao crtica da aplicao de SEM no Brasil, a partir de um estudo comparativo entre os trabalhos publicados na subrea de marketing do ENANPAD e nas sees de marketing de trs dos principais peridicos de administrao do Brasil: RAE, RAUSP e RAC. O perodo analisado, em ambos os casos, foi de 1994 a 2003 (entretanto, a primeira edio da RAC data de janeiro de 1997). Os resultados obtidos foram comparados s estatsticas que resumem a utilizao de SEM em artigos publicados nos principais journals internacionais de marketing, tabulados e apresentados por Baumgartner e Homburg (1996). Alm disso, para efeito de enriquecimento das comparaes, tambm foram consultados o trabalho de Jarvis, Mackenzie e Podsakoff (2003) e a reviso de MacCallum e Austin (2000).
V ISO G ERAL
DA
M ODELAGEM
EM
E QUAES E STRUTURAIS
O termo Modelagem em Equaes Estruturais no designa apenas uma nica tcnica estatstica, mas uma famlia de procedimentos relacionados (Kline, 1998). Pode-se considerar que sua funo principal a especificao e estimao de modelos de relaes lineares entre variveis. Essas variveis podem incluir tanto variveis mensurveis (VM) quanto variveis latentes (VL). VLs so construtos hipotticos que no podem ser mensurados diretamente. Em SEM, tais construtos so tipicamente representados por mltiplas VMs que servem como indicadores dos construtos. Assim, um modelo de equaes estruturais um suposto padro de relacionamentos lineares entre um conjunto de VMs e VLs. Apesar do termo SEM designar um conjunto de tcnicas ou mtodos, algumas funes e caractersticas em comum podem ser identificadas entre elas, tais como as descritas a seguir (MacCalum & Austin, 2000).
Funes e Caractersticas
Em primeiro lugar, SEM determinada a priori; ou seja, os programas de computador que automatizam alguns dos procedimentos estatsticos de SEM
RAC, v. 10, n. 4, Out./Dez. 2006
133
requerem que o pesquisador fornea diversas informaes como, por exemplo, quais variveis afetam o qu, e quais as direes desses efeitos. Esses relacionamentos entre variveis representam as hipteses do pesquisador. Neste sentido, SEM vista como uma tcnica confirmatria: o modelo deve ser desenvolvido antes da coleta dos dados, e o principal questionamento se os dados o confirmam ou no. Entretanto este suporte emprico pode, por vezes, no ser encontrado. Nestes casos, o pesquisador tem a opo de abandonar o modelo ou modificar as hipteses em que ele baseado. A primeira opo a mais drstica e a menos usual. A segunda costuma ser mais utilizada, e quando a tcnica SEM adquire uma tendncia um tanto quanto exploratria, na medida em que modelos revisados so testados no mesmo conjunto de dados empricos. Joreskog e Sorbom (1993) formalizaram essas idias, distinguindo trs possveis aplicaes de SEM: 1) estritamente confirmatria; 2) utilizao de modelos alternativos e 3) gerao de modelos. Na primeira aplicao, o pesquisador tem um nico modelo que aceito ou rejeitado, baseado em sua correspondncia ou no com os dados. O segundo caso um pouco mais freqente que o primeiro, mas ainda restrito a situaes em que h mais de um modelo apriorstico. A terceira situao parece ser a mais comum, e ocorre quando o modelo inicial no se ajusta aos dados. Nestes casos, o modelo modificado pelo pesquisador e novamente analisado com os mesmos dados, com o objetivo de descobrir um modelo que tenha sentido em termos tericos e que apresente correspondncia estatstica razovel com os dados coletados. A estatstica bsica utilizada para a aplicao de SEM a matriz de covarincia; sendo ainda possvel a utilizao da matriz de correlaes. A vantagem da utilizao da covarincia como estatstica bsica que ela traz mais informao do que um dado padronizado, como a correlao. Em outras palavras, os dois objetivos das anlises so entender padres de correlaes entre os conjuntos de variveis, e explicar a maior parte da varincia possvel, atravs do modelo especificado pelo pesquisador. Em termos de utilizao, SEM pode ser aplicada para dados no experimentais (correlacionais), experimentais, ou at mesmo uma mistura de ambos. Importante ressaltar que diversos procedimentos estatsticos como regresso mltipla, correlao cannica, anlise fatorial, ANOVA e MANOVA podem ser vistos como casos especiais de SEM. Em outras palavras, a famlia SEM abarca diversas tcnicas que tm como caracterstica em comum um modelo linear geral de relacionamento entre variveis. Essa caracterstica explica a crescente popularidade, robustez e flexibilidade de SEM, na medida em que pode ser vista como um conjunto de tcnicas ou procedimentos estatsticos.
134
Usualmente, SEM requer amostras relativamente grandes, em funo dos diversos pr-requisitos inerentes aos tipos de tcnicas de anlise e procedimentos estatsticos geralmente empregados. Regras empricas geralmente citam que este nmero deve variar entre 5 e 10 casos por parmetro estimado (Bentler & Chou, 1987). Por ltimo, possvel testar muitos tipos de significncia estatstica em SEM, mas o papel desses testes, na anlise como um todo, menos importante do que em tcnicas mais comuns, como na ANOVA. A razo dessa menor importncia que, em SEM, a avaliao de modelos se d numa perspectiva em nvel macro, e no micro. Alm disso, testes de significncia podem ser influenciados pelo tamanho da amostra, e como anteriormente descrito, SEM costuma requerer amostras relativamente grandes. Assim, alguns desses testes estatsticos podem apresentar significncia estatstica em funo do tamanho da amostra, o que no ocorreria se a mesma fosse relativamente pequena. Todas as caractersticas acima descritas servem como pano de fundo para a aplicao de SEM, o que usualmente deve ser feita em diversos estgios (ou etapas) seqenciais. A seo a seguir apresenta os elementos fundamentais de cada um.
135
A visualizao grfica dessas relaes o que se denomina diagrama de caminhos, utilizado no apenas para a identificao de relaes de causa e efeito entre os construtos (relacionamentos entre variveis dependentes e independentes), mas tambm para relacionamentos derivados (correlaes) entre construtos e at mesmo indicadores. Portanto os elementos bsicos de um diagrama de caminhos so o construto e setas: uma seta reta representa relao causal direta de um construto em relao a outro, enquanto uma seta curva entre quaisquer variveis indica uma correlao entre elas. As variveis independentes do modelo so chamadas exgenas, pois no so causadas ou preditas por nenhuma outra varivel no modelo (uma indicao clara de que uma varivel exgena a ausncia de setas apontadas para ela). Por fim, as variveis endgenas ou dependentes so preditas por outros construtos exgenos (vide Figura 1). Etapa 3 Converso do Diagrama de Caminhos para um conjunto de Modelos de Mensurao e Estrutural. Seguindo as orientaes de Hair et al. (1998) e de Anderson e Gerbin (1988), o pesquisador deve usar SEM em dois passos distintos, quando quer obter uma representao acurada da confiabilidade dos indicadores utilizados. Assim, primeiramente estima-se o modelo de mensurao e, posteriormente, estima-se o modelo estrutural. A finalidade principal do modelo de mensurao verificar se os itens operacionais utilizados para medir os construtos so significativos e realmente medem aquilo que se esperava que medissem (isto , verificao da validade de construto). Assim, ele permite avaliar se cada construto tem confiabilidade satisfatria para se estimarem as relaes causais em etapas posteriores de teste do modelo. Nesta etapa do desenvolvimento da modelagem, essencial que o pesquisador analise as caractersticas do fenmeno em estudo, e decida se o modelo apresenta caractersticas formativas ou reflexivas. Num modelo reflexivo, a direo de causalidade vai do construto para seus indicadores. Em outras palavras, neste tipo de modelo, mudanas no construto causam mudanas nos itens. J num modelo formativo, esperado que variaes nos itens causem mudanas no construto ao qual eles esto vinculados (vide Figura 1). As implicaes de erros de enquadramento so severas: tratar um modelo formativo como reflexivo implica analisar os antecedentes de um construto como se fossem seus itens, o que compromete a robustez do modelo e das concluses obtidas a partir dele (Jarvis et al., 2003).
136
Para testar se os itens operacionais utilizados para medir os construtos atingiram nveis aceitveis de confiabilidade e de validade lgica, de estrutura interna e nomolgica, podem ser realizadas Anlises Fatoriais Confirmatrias (AFC) (Byrne, 1994). A AFC pode ser vista como uma das possveis utilizaes da Modelagem em Equaes Estruturais (Pedahzur & Schmelkin, 1991), e desenvolvida atravs da especificao de modelos com vrias finalidades como, por exemplo, desenhos para validao de construtos, refinamento de escalas e mensurao de invarincia (MacCallum & Austin, 2000). Mais especificamente, o desenvolvimento de medidas para construto, usando a AFC, pode dar-se atravs do teste em um modelo de mensurao das supostas relaes entre os indicadores (variveis observveis) e seus fatores/construtos (variveis latentes), bem como das relaes entre estes ltimos (Pedahzur & Schmelkin, 1991). Depois de definido o modelo de mensurao, estima-se o modelo estrutural atravs dos parmetros ou coeficientes do diagrama de caminhos. Esta estimao resultado da converso desse diagrama em um conjunto ou sistema de equaes, que representam matematicamente a relao grfica (ou estrutural) entre as variveis. Etapa 4 - Escolha do Tipo de Matriz para Entrada de Dados e Estimao do Modelo Estrutural. A tcnica SEM difere de outras tcnicas multivariadas, pois utiliza apenas matrizes de varincia/covarincia ou correlao como entrada de dados. Mesmo que observaes individuais sejam inseridas, elas so convertidas em um desses dois tipos de matrizes. Isto ocorre porque o foco de SEM no em observaes
RAC, v. 10, n. 4, Out./Dez. 2006
137
individuais, mas sim no padro de relacionamentos obtido a partir das respostas dos indivduos (Hair et al., 1998). Conforme explicado anteriormente, a matriz de covarincia traz mais informao do que um dado padronizado, como a correlao. Esta etapa tambm prev a escolha de qual a tcnica de estimao dever ser usada no clculo do modelo estrutural. Em marketing, observa-se que se costuma utilizar a Maximum Likelihood (ML) - padro na maioria dos programas a qual gera parmetros mais robustos, quando o pressuposto de normalidade dos dados respeitado. Caso haja problemas de normalidade, outros mtodos podem ser cogitados, como, por exemplo, o Mnimos Quadrados (Gujarati, 2000) ou o Elliptical Reweighted Least Squares (ERLS). Etapa 5 Verificao da Identificao do Modelo Estrutural. Em termos simples, um problema de identificao a inabilidade do modelo proposto em gerar estatsticas nicas, isto , significativas e lgicas (Hair et al., 1998). Uma regra trivial, porm eficaz, que se deve ter mais parmetros conhecidos do que parmetros livres, o que gera o chamado modelo sobreidentificado (overidentified model). Etapa 6 Avaliao de Critrios de Ajuste do Modelo. Existem trs grandes grupos de medidas de ajuste: as absolutas, as incrementais e as de parcimnia. As medidas de adequao absolutas determinam o grau em que o modelo geral (tanto o estrutural, quanto o de mensurao) prediz a matriz de covarincia ou de correlao. As medidas de ajuste incrementais comparam o modelo proposto a algum modelo bsico, chamado de modelo nulo, aquele em que um nico construto, com seus indicadores, mede perfeitamente o referido construto. Em outras palavras, representa o valor da estatstica qui-quadrado associado varincia total em um grupo de correlaes e de covarincias (Hair et al., 1998, p. 657). As medidas de ajuste de parcimnia relacionam o ajuste do modelo ao nmero de coeficientes estimados requeridos para atingir o nvel de adequao obtido. O objetivo bsico diagnosticar se o ajuste do modelo foi atingido pelo sobreajuste (overfitting) dos dados com o uso de muitos coeficientes. Etapa 7 Interpretao e Modificao do Modelo. Uma vez considerados adequados em termos de ajuste, os resultados obtidos devem ser confrontados com a teoria proposta, para que algumas perguntas possam ser respondidas (Hair et al., 1998): Os relacionamentos da teoria foram comprovados estatisticamente e substancialmente? Os modelos concorrentes ensejam a formulao de hipteses alternativas? Os relacionamentos entre as variveis ocorreram na direo proposta pelas hipteses? Alm disso, outro aspecto a ser levado aqui em considerao o uso de solues padronizadas ou no padronizadas. Solues padronizadas variam de 0 a 1 e suas concluses so especficas para a amostra em questo, uma vez que no mantm as propriedades da escala utilizada. Entretanto so de fcil entendimento.
138
Uma ltima questo importante com relao reespecificao do modelo. Do ponto de vista operacional, ela poderia ser feita continuamente, dado que os programas usados sugerem insero ou cancelamento de variveis que melhorariam os ndices de ajuste do modelo. Ainda assim, toda e qualquer modificao no modelo s deve ser feita com base na teoria, a no ser que alguma concluso emprica suporte, fortemente, o levantamento de novas hipteses que questionem a teoria existente (Byrne, 1994). Descritas as funes, as caractersticas e os estgios de aplicao de SEM, sero apresentados, a seguir, os critrios de anlise utilizados nesta pesquisa, alm do resultado da avaliao dos artigos.
A PLICAES
DE
SEM
EM
M ARKETING
NO
B RASIL
Do ano 1994 at 2003, foram identificados 36 artigos que utilizaram SEM, que so a base para as anlises descritas abaixo. Deste grupo, seis foram publicados nos peridicos RAE, RAUSP ou RAC, e 30 foram apresentados e publicados no ENANPAD (a lista completa dos artigos analisados pode ser obtida mediante contato com os autores). interessante notar que 64% destes artigos lidam com construtos especficos da subrea de comportamento do consumidor, como: satisfao, lealdade, confiana, e outros. Os artigos restantes (36%) ficaram espalhados em orientao para mercado, marketing de relacionamento, servios e outros. Tal fenmeno pode ser considerado como um resultado no surpreendente, j que as razes do uso de SEM remontam justamente rea de psicologia, como uma tcnica para mensurao psicomtrica.
Critrios de Avaliao
Os trabalhos foram analisados a partir dos critrios sugeridos por Bagozzi e Baumgartner (1994), e utilizados em Baumgartner e Homburg (1996) para a reviso da aplicao de SEM nos principais peridicos internacionais de marketing, entre 1977 e 1994. Alm deste trabalho na rea de marketing, tambm foram utilizados os elementos apontados na reviso de MacCallum e Austin (2000), na rea de psicologia, e o artigo de Jarvis et al. (2003) sobre uso de modelagem em pesquisas de marketing e de comportamento do consumidor. Os critrios dividemse em dois blocos: os ligados especificao do modelo terico e design da pesquisa, e os ligados estimao e teste dos modelos. Ambos so detalhados a seguir. Com relao especificao dos modelos e do design de pesquisa, o
RAC, v. 10, n. 4, Out./Dez. 2006
139
primeiro critrio o tipo de modelo, que foi categorizado em 1, 2 ou 3, correspondendo, respectivamente, aos modelos de mensurao confirmatrio, aos modelos estruturais com um nico indicador e aos modelos integrados de mensurao e estruturais. O segundo critrio avaliou se os modelos utilizados pelos artigos foram adequadamente classificados e analisados como formativos ou reflexivos, luz do trabalho de Jarvis et al. (2003), discutido anteriormente. Utilizou-se, tambm, um grupo de critrios para avaliar a dimensionalidade e robustez dos construtos: a quantidade de variveis observadas e latentes, a presena de construtos com apenas um indicador, a presena de erros correlacionados, e a existncia ou no de justificativa para os casos em que houve tais correlaes. Alm disso, foi utilizado um grupo de indicadores para avaliar a relao entre o tamanho da amostra e a quantidade de parmetros a serem analisados, bem como o atendimento aos valores crticos de nmero de casos por parmetro sugerido pela literatura (5 e 10). Por fim, o ltimo grupo de indicadores desse bloco avaliou se os artigos reportaram a identificao de modelos, e a quantidade de graus de liberdade. A avaliao dos aspectos ligados estimao e teste dos modelos em dados empricos incluiu indicadores sobre a tcnica de estimao utilizada (por exemplo, verossimilhana, mnimos quadrados ou outras) e problemas encontrados na estimao, como os decorrentes de no convergncia e valores impossveis (como varincia negativa, por exemplo). Alm disso, foram utilizados indicadores para avaliar a freqncia e a magnitude mdia de ndices de ajuste absolutos, incrementais e de parcimnia. Foram tambm utilizados indicadores para mapear o fornecimento de informaes sobre a confiabilidade e o poder explicativo dos modelos utilizados nos artigos. Por fim, analisou-se o grau em que os artigos documentaram e fundamentaram reespecificaes do modelo original e dos modelos rivais. Com relao aos indicadores utilizados e relatados em artigos, necessrio citar uma ressalva importante: neste trabalho foram analisados apenas os artigos publicados em revistas ou os apresentados no ENANPAD, e no as teses ou as dissertaes que, eventualmente, tenham dado origem a vrios desses textos. Considerando o limitado espao disponvel em um artigo (em torno de 16 pginas), razovel supor que, eventualmente, alguns autores tenham utilizado indicadores adicionais para suas anlises, os quais podem ter sido reportados apenas nas teses e dissertaes, e no nos artigos. Entretanto, como esta limitao tambm precisa ser considerada na anlise do estudo de Baumgartner e Homburg (1996), razovel esperar que a comparao entre os resultados deste trabalho e do estudo de Baumgartner e Homburg no tenha ficado prejudicada. Assim, esses indicadores formam uma grade de anlise que permite avaliar os
140
artigos luz de todos os estgios de aplicao de SEM, descritos por Hair et al. (1998). Alm disso, ela tambm permite comparar a situao do uso de SEM no Brasil com os resultados encontrados no trabalho de Baumgartner e Homburg (1996) sobre o uso de SEM no exterior, a ser apresentado ao longo da prxima seo.
R ESULTADOS
D ISCUSSO
No perodo de dez anos de publicaes e ENANPADs, foram encontrados 36 trabalhos envolvendo modelagem em equaes estruturais, sendo que um foi publicado em 1998, quatro em 1999, dois em 2000, seis em 2001, nove em 2002 e catorze em 2003. Os resultados desta anlise esto na segunda coluna da tabela a seguir. Para efeito de comparao, a terceira coluna da tabela apresenta os resultados obtidos por Baumgartner e Homburg (1996), no estudo sobre artigos publicados nos seguintes peridicos, entre 1977 e 1994: Journal of Marketing, Journal of Marketing Research, Journal of Consumer Behavior e International Journal of Research in Marketing (Baumgartner & Homburg, 1996). Tabela 1: Aplicaes de SEM em Marketing no Brasil e no Exterior Classificao por Critrio de Avaliao
141
(continuao) Tabela 1: Aplicaes de SEM em Marketing no Brasil e no Exterior Classificao por Critrio de Avaliao
Fonte: Anais do ENANPAD, RAE e RAUSP (1994-2003), RAC (1997-2003) e adaptao de Baumgartner e Homburg (1996). Notas: NI = No Informado. NA = No Aplicvel. 1 Nos casos onde h definio de critrios/parmetros usualmente aceitos na literatura, os mesmos foram includos. Fontes: Baugartner e Homburg (1996), Bentler e Chou (1987), Bolen (1989) e DeVellis (1991). 2 Nos vrios casos em que os autores no informaram adequadamente o nmero de parmetros estimados, decidiu-se estimar o valor mnimo de parmetros estimveis de acordo com o seguinte procedimento: dois parmetros por item (referentes carga fatorial ou coeficiente de regresso e o erro) mais o nmero de variveis latentes.
142
143
inexistentes. Alm disso, a existncia de correlao entre erros pode estar indicando que h construtos que no foram includos no modelo, mas que podem estar influenciando o comportamento do fenmeno estudado e, portanto, mereceriam investigao terica adicional. O tamanho da amostra um dos fatores mais relevantes, quando se utiliza SEM, dado que anlises realizadas em pequenas amostras freqentemente so problemticas (MacCallum & Austin, 2000, p. 216). No h uniformidade na literatura em relao ao nmero absoluto do que pode ser considerada uma amostra pequena (podem ser encontrados valores entre 100 e 200 casos). Entretanto h muito mais acordo no que diz respeito razo entre tamanho da amostra/nmero de parmetros estimados no modelo. Bentler e Chou (1987) defendem que esta razo deve ser de pelo menos 5:1, para que se consigam estimativas consistentes de parmetros. Alm disso, segundo esses autores, esta relao deve ser ainda maior (pelo menos 10:1), para que se obtenham testes de significncia estatstica apropriados. A anlise comparativa, tanto em relao ao tamanho mdio da amostra (BR=801; INTL=178) como razo entre tamanho da amostra/nmero de parmetros (BR=13; INTL=6,4) foram mais positivas no Brasil do que no exterior. Ainda que o tamanho mdio de amostra no Brasil tenha sido muito influenciado por um dos trabalhos (cuja amostra foi de 10935 casos), a sua eliminao reduz o tamanho mdio de amostra para 449 casos, o qual ainda mais de 2,5 vezes maior que a mdia internacional. A eliminao de outliers foi realizada apenas no critrio tamanho mdio da amostra, porque, no Brasil, foi encontrado apenas um trabalho com tamanho de amostra extremamente influenciador da mdia, o que no ocorreu no caso das outras medidas. Como no estudo internacional no houve eliminao de outliers, decidiu-se seguir o mesmo critrio para evitar vis nos resultados comparativos. No caso brasileiro, cabem ainda duas ressalvas. A primeira positiva: a mdia de 13 casos por parmetro estimado ficou acima do patamar sugerido na literatura. A ressalva negativa diz respeito falta de informaes nos artigos nacionais em relao ao nmero de parmetros estimados (cerca de metade dos trabalhos do ENANPAD no trouxeram esta informao), o que dificulta substancialmente a avaliao da aplicao de SEM. Em nmeros absolutos, os graus de liberdade nos trabalhos brasileiros foram quase 5 vezes maiores que no exterior (BR=142; INTL=32). Entretanto uma razo bastante diferente foi identificada, quando se analisam os parmetros estimados, os geradores dos graus de liberdade (BR=64 contra INTL=29). Esta diferena pode ser um indicativo de que os graus de liberdade (ou os parmetros estimados) estejam sendo informados de maneira incorreta em muitos estudos nacionais. A possvel razo para esse erro ocorre, quando a matriz de correlao usada como entrada de dados, e pelo ao menos um construto exgeno mensurado por um nico indicador. A carga fatorial desse indicador nico em
144
relao ao seu construto constrita a um e, ao mesmo tempo, a varincia do indicador nico assumida como sabida e fixa em um. O resultado disso que ocorre uma inflao de graus de liberdade e valores-p exagerados para a estatstica qui-quadrado. Nesses casos, o recomendado que a escala de uma varivel latente deve ser fixa, mantendo a carga fatorial do indicador ou a varincia do fator (construto) igual a um, mas nunca os dois simultaneamente (Baumgartner & Homburg, 1996, p. 147).
Anlise dos Assuntos Relacionados Estimao e Teste dos Modelos Tericos em Dados Empricos
Uma dos principais pressupostos de SEM a normalidade dos dados. Sendo identificada essa normalidade, a utilizao do procedimento de estimao de parmetros Mxima Verossimilhana (Maximum Likelihood ML) pode ser feita sem problemas. Caso contrrio, outros mtodos devem ser considerados. ML o padro da maioria das implementaes SEM em software, o que possivelmente a explicao para o elevado percentual de utilizao no exterior (95%), segundo Baugartner e Homburg (1996). Nas pesquisas brasileiras, menos trabalhos utilizaram o ML como procedimento de estimao (61%); a grande maioria dos que no o utilizaram justificaram a deciso em funo de caractersticas relacionadas no normalidade dos dados, tanto em relao curtose, quanto assimetria. De forma no surpreendente, nenhum problema de convergncia e de solues inadequadas (valores impossveis, como varincias negativas) foi relatado no Brasil, contra apenas um e cinco por cento, respectivamente, no exterior. Talvez isto possa ser explicado pela suposio de que os modelos que no apresentaram convergncia ou que resultaram em solues inadequadas provavelmente no foram submetidos publicao e, caso tivessem sido, provavelmente encontrariam dificuldades para serem aceitos pelos revisores. A no aceitao seria esperada, no por conta da inadequao terica dos modelos, mas em funo da no convergncia decorrente de problemas de especificao dos modelos, das equaes ou de problemas diversos relativos coleta de dados, ao tratamento de outliers, aos missing values ou, ainda, entrada de dados. Em relao avaliao do ajuste geral do modelo, o ndice mais utilizado no Brasil e no exterior tem sido a estatstica qui-quadrado (2) de forma absoluta (BR=92%; INTL=90%). O tamanho mdio da razo 2 dividido pelos graus de liberdade (medida de ajuste de parcimnia) foi de 6,81 (BR) e 1,62 (INTL). Regras prticas indicam que relaes at 5 so consideradas satisfatrias (Baugartner & Homburg, 1996). Neste ltimo caso, os valores brasileiros ficaram substancialmente piores do que os internacionais, um pouco acima, at mesmo do padro considerado satisfatrio. Este um indicativo de que boa parte dos modelos no atingiu ndices de ajustes satisfatrios. Entretanto, como o teste qui-quadrado
RAC, v. 10, n. 4, Out./Dez. 2006
145
, s vezes, limitado em decorrncia de violaes da normalidade, e bastante influenciado pelo tamanho da amostra (Bentler, 1990), h a necessidade de se verificarem alguns outros ndices, para que se possa ter uma avaliao mais adequada dos modelos testados. Alm da medida de ajuste de parcimnia anteriormente citada (2/gl) a medida de adequao absoluta mais utilizada o GFI, com magnitude mdia pior no Brasil (GFI: BR=0,88; INTL=0,95). Dentre medidas de ajuste incrementais, o ndice mais utilizado foi o CFI (69% dos trabalhos no Brasil, contra 13% no exterior), com valores de 0,92 no Brasil e 0,95 no exterior. interessante notar que o indicador BBI foi utilizado em 23% dos trabalhos no exterior, e em nenhum trabalho no Brasil. Um destaque negativo nos trabalhos brasileiros pode ser feito em relao s medidas de confiabilidade dos construtos: 25% dos artigos avaliados no apresentaram nenhuma forma de medida de confiabilidade (como Alpha de Cronbach, confiabilidade composta ou outra), contra 22% no exterior. Uma situao mais aguda foi identificada em relao ao coeficiente de determinao (R2), o qual foi reportado apenas em 33% dos casos no Brasil. Esta situao foi ainda pior no exterior, com apenas 23% de citaes dessa medida. Um dos mais importantes (e tambm negligenciados) assuntos diz respeito discusso sobre especificaes e reespecificaes de modelo. Conforme citam Baungartner e Homburg (1996, p. 155), pouco provvel que um modelo inicialmente especificado seja uma representao plausvel dos dados. Ou seja, a reespecificao freqentemente ocorre. Entretanto ela jamais deve ser feita apenas com base nos dados, mas sim atravs da anlise da viabilidade terica da citada reespecificao. Em outras palavras, qualquer reespecificao deve ser baseada na teoria e no nos dados (Kline, 1998). Obviamente, para que uma reespecificao seja justificada teoricamente, deve haver uma discusso no relato da pesquisa, o que foi feito em apenas 36% dos casos no Brasil, contra 54% no exterior. Por outro lado, a recomendada prtica de comparao de modelos rivais pouco encontrada nos artigos: 36% Brasil, e 31% no exterior. Entretanto, temse verificado que, quando h modelos rivais, eles normalmente apresentam sustentao terica, uma vez que em 31% de todos os artigos analisados no Brasil foram encontradas evidncias de fundamentao terica de modelos rivais. A partir da anlise comparativa entre os trabalhos publicados no ENANPAD e nos principais peridicos internacionais de marketing que utilizaram SEM, podese fazer algumas recomendaes sobre a sua utilizao em trabalhos futuros (vide Tabela 2). Estas recomendaes so baseadas em problemas encontrados nas diversas etapas da aplicao de SEM, utilizando-se categorias semelhantes s analisadas por Baungartner e Homburg (1996).
146
147
148
R EFERNCIAS B IBLIOGRFICAS
Anderson, J. C., Gerbing, D. W. (1988, May). Structural equation modeling in
RAC, v. 10, n. 4, Out./Dez. 2006
practice: A review and recommended two-step approach. Psychological Bulletin, 103(3), 99-111.
149
Bagozzi, R. P. (1980). Causal models in marketing. New York: Wiley. Bagozzi, R. P., & Baumgartner, H. (1994). The evaluation of structural equation models and hypothesis testing. In R. Bagozzi Principles of marketing research. Cambridge: Blackwell. Baumgartner, H., & Homburg, C. (1996, April). Applications of structural equation modeling in marketing and consumer research: a review. International Journal of Research in Marketing, 13(2), 139-161. Bentler, P. (1980). Multivariate analysis with latent variables: causal modeling. Annual Review of Psychology, 31, 419-456. Bentler, P., & Chou, C. (1987). Practical issues in structural equation modeling. Sociological Methods and Research, 16, 78-117. Bentler, P. (1990, March). Comparative fit indexes in structural models. Psychological Bulletin, 107(2), 238-246. Bollen, K. (1989). Structural equation modeling with latent variables. New York: Wiley. Byrne, B. (1994). Structural equation modeling with EQS and EQS/Windows: basic concepts, applications and programming. Thousand Oaks: Sage.
DeVellis, R. F. (1991). Scale Development (Applied Social Research Methods Series). Newbury Park: Sage Publications. Gujarati, D. (2000). Econometria bsica . So Paulo: Makron. Hair, J., Anderson, R., Tatham, R., & Black, W. (1998). Multivariate data analysis (5th ed.). Upper Saddle River: Prentice-Hall. Hulland, J., Chow, Y., & Lam, S. (1996, April). Use of causal models in marketing research: a review. International Journal of Research in Marketing, 13(2), 181-197. Jarvis, C. B., Mackenzie, S., & Podsakoff, P. (2003, September). A critical review of construct indicators and measurement model misspecification in marketing and consumer research. Journal of Consumer Research, 30(2), 199-218. Joreskog, K.G., & Sorbom, D. (1993). LISREL 8: structural equation modeling with the simplis command language . Chicago: Scientific Software International. Kline, R. B. (1998). Principles and practice of structural equation modeling. New York: The Guilford Press.
150
L. R. James, & L.A. James (1989). Causal modeling in organizational research. In C. Cooper, I. Robertson (Eds.). International Review of Industrial and Organizational Psychology. New York: Wiley. Maccallum, R., & Austin, J. (2000). Applications of structural equation modeling. Psychological Research, 51(1), 201-226. Medsker, G., Williams, L., & Holohan, L. (1994, Summer). A review of current practices for evaluating causal models in
organizational behavior and human resources management research. Journal of Management, 20(2), 439464. Pedhazur, E., & Schmelkin, L. (1991). Measurement, design, and analysis: an integrated approach. Hillsdale, New Jersey: Lawrence Erlbaum Associates. Steenkamp, J., & Trijp, H. (1991, November). The use of LISREL in validating marketing constructs. International Journal of Research in Marketing, 8(4), 283-299.
151