You are on page 1of 26
CAPITULO 7 TESTE BIVARIADO DE HIPOTESE RESUMO: ‘Uma vez que tenhamos preparado o teste de hipdtese e coletado os dados, como avaliamos o que encontramos? Neste capitulo, discutimos as técnicas basicas utilizadas para fazer inferéncias estatisticas sobre a relagdo entre duas varidveis. Lidamos com © tépico frequentemente mal compreendido da “significancia estatistica” ~ focando tanto o que ela € como o que ela nao é - € com a natureza da incerteza estatistica. Apresentamos trés estratégias utilizadas para examinar @ relagio entre duas varidveis anilise tabular, testes de médias e coeficientes de correlagao. (Apresenta uma quarta técnica, andlise de regressao bivariada, no capitulo 8.) 7.1 TESTE BIVARIADO DE HIPOTESE E O ESTABELECIMENTO DE RELAGGES CAUSAIS Nos capitulos anteriores, introduzimos os conceitos fundamentais do teste de hi- potese, Neste capitulo, discutiremos as téenicas basicas do teste de hipétese a partir de trés exemplos de testes bivariados. E importante notar que, embora esses tipos de anilise tenham sido utilizados como as principais formas de testar hipéteses em re- sao raramente utilizados como os principais vistas académicas até os anos 1970, el => bee 168 Fundamentos da Pesquisa em Ciencia Politica meios para testar hipéteses nas revistas acacémicas hoje em dia’. Isso acontece porque cessas técnicas sio boas apenas para nos ajudar a observar o primeiro principio do estabelecimento de relagdes causais, Nominalmente, os testes bivariados de hipétese nos ajudam a responder a pergunta: “X ¢ relacionado a ¥?" Por definigao ~ “bivaria- do” significa “duas variéveis” -, esses testes ndo podem nos ajudar com a importante pergunta “Controlamos por todas as variaveis colineares Z que podem fazer com que a relagio observada entre Xe Y seja espiiria?” Apesar das limitagdes, as téenicas descritas neste capitulo so importantes pontos de partida para entender a logica subjacente ao teste estatistico de hipstese. Nas segdes seguintes, discutiremos como escolher qual teste bivariado realizar ¢, entdo, apresen- taremos uma discussdo detalhada dos trés tipos. Ao longo deste capitulo, tente manter ‘em mente o principal propésito deste exercicio: estamos tentando aplicar as igGes dos capitulos anteriores aos dados do mundo real, A seguir utilizaremos ferramentas mais apropriadas e sofisticadas, mas as lies aprendidas neste capitulo serdo cruciais para © entendimento de métodos mais avangados. Colocando de modo simples, estamos tentando iniciar nossa caminhada no complicado mundo do teste de hipdtese com dados do mundo real. Uma vez que tenhamos aprendido a caminhar, comegaremos a trabalhar em entender como correr. 7.2 ESCOLHENDO O TESTE BIVARIADO DE HIPOTESE MAIS ADEQUADO Como discutimos nos capitulos anteriores, especialmente nos capitulos 5 ¢ 6, pes- quisadores tomam algumas importantes decisdes antes de testar suas hipéteses. Uma ver que tenham coletado os dados e decidido conduzic um teste bivariado de hipotese, cles precisam considerar a natureza das suas variiveis dependente ¢ independente do modelo, Come discutido no capitulo 5, podemos classificar varidveis em termos dos tipos de valores que elas assumem. A Tabela 7.1 apresenta quatro diferentes cenérios para o teste de hipétese bivariado; cada um é mais apropriado dependendo do tipo de varidvel dependente e de variavel independente. Para cada caso, listamos um ou mais tipos de teste bivariado de hipétese. Nos casos em que descrevemos as variaveis de- pendente e independente como categéricas, usamos uma forma de andlise conhecida como anilise tabular para testar nossas hipdteses. Quando nossa variavel dependente & continua e a variével independente é categotica, usamos 0 teste de diferenga de mé- ‘dias, Quando a variivel independente é continua e a varivel dependente é categérica, analistas tipicamente utilizam modelos probit ou logit (esses tipos de modelos esta- Tor definigho, os pesquisadores, a concurirem testes bivariados de hipétese,fazem um de dois pressupostos sobre o mundo, Ou assumem que nfo existe varkves causalmente relacionadas com a vardvel dependente tan questo além da varivel expitiva send utlzada ow que, sexier varies omits, as no 0 Telacionadas a vaiévelindependente do modelo. Falaernos muito mais sobre variéveisindependentes or tides em modelos cassis no capo 9, Por agora tena em mente que, como temos disutido nos captulos anterior, exes pressuposts So rramenteadotados quando estamos desrevendo o mundo politico, a ‘este bivariado de hipétese 169 tisticos sto discutidos no capitulo 11). Finalmente, quando as varidveis dependente f independente s4o continuas, usamos neste capitulo coeficiente de correlagdo ‘como discutiremos no capitulo 8, o modelo de regressio bivariado. “Tabet 7.1 ~ Ties de vores ses bivrods de hintse mes edouads ‘Andlise tabular | Probit/Logit (ap. 11) iferenca de médias | Coeficiente de correlacdo: modelo bivariado ce regressdo (cap. 8) Tipo da varlével dependente THota: os testes em itlico s20 discutidos neste capitulo. 7.3 TODOS OS CAMINHOS LEVAM AO P Um elemento comum no amplo leque de testes estatisticos de hipdtese é 0 valor- -p (0 p significa “probabilidade”). Esse valor, que varia entre 0 e 1, & a coisa mais préxima do limite final que temos em estatistica. Mas ele € mal compreendido ¢ mal ttilizado, Nesta seco, discutiremos a légica bisica do valor-p ¢ o relacionaremos 4 ddiscussio do capitulo 6 sobre o uso de dados amostrais para fazer inferéncias sobre ‘uma populagao subjacente. 7.3.1 ALOGICA DOS VALORES-P Se pensarmos novamente nos quatro principios para o estabelecimento de rela- bes causais que discutimos no capitulo 3, terceiro obstaculo era dado pela pergunta “Existe covariagéo entre X ¢ Y?". Para responder a essa pergunta, precisamos aplicar critérios aos dados do mundo real para determinar se é possivel existir uma relagio entre nossas duas variaveis, a varidvel independente X e a variével dependente Y. Os testes listados na Tabela 7.1 sao comumente aceitos como possiveis testes para cada uma das combinagdes dos tipos de variiveis que temos. Em cada um desses testes, seguimos uma mesma légica: comparamos a real relacio entre X ¢ Y nos nossos da dos amostrais com 0 que esperariamos encontrar se X e Y ndo fossem relacionados na populacio subjacente. Quanto mais diferente a relagio empitica observada for do que esperariamos encontrar se nda houvesse uma relagio, mais confiantes ficamos em que Xe ¥ esto relacionados na populagao. A légica dessa inferéncia para a populagao a partir da amostra é a mesma que usamos no capitulo 6 para fazer inferéncias sobre a média da populacéo a partir dos dados da amostra. ‘A estatistica que & comumente associada a esse tipo de exercicio légico ¢ 0 valor-p. © valor-p, que varia entre 0 1, éa probabilidade de observarmos a relagao que veri ficamos nos dados amostrais por acaso. Em outras palavras, 0 valor-p nos diz a proba —————— 170 Fundamentos da Pesquisa em Cidncia Politica bilidade de encontrarmos a relagao observada entre duas varidveis em nossa amostra se ndo existisse relagao entre elas na populagio nao observada. Assim, quanto menor 6 valor-p, maior & a confianca-que temos que existe uma relagao sistematica entre as duas varidveis para as quais estimamos 0 valor-p. ‘Uma caracteristica comum entre a maioria das técnicas estatisticas € que, para uma determinada relagio, quanto maior a base de dados que utilizamos para mensurar a re- lacio, menor ser nosso valor-p. Isso & consistente com as ligBes do capitulo 6 sobre 0 tamanho da amostra: quanto maior o tamanho da amostra, mais confianga podemos ter ‘em que nossa amostra representaré mais acuradamente a populagao® (ver segao 64.2). 7.3.2. AS LIMITAGOES DO VALOR-P Embora os valores-p sejam indicadores poderosos de se duas varidveis sio ou nio relacionadas, cles também sao limitados. Nesta secao revisamos algumas dessas limi- tages. Adicionalmente, é importante que vocé entenda 0 que um valor-p nao é a16- gica do valor-p nao é reversiva, Em outras palavras, p= 0,001 nao significa que existe 0,999 de chance de que algo ocorra sistematicamente, Também € importante que voce entenda que, embora o valor-p nos diga algo sobre a confianga que podemos ter na relagdo entre duas varidveis, ele ndo nos diz se a relagao € causal. ‘Adicionalmente, pode parecer tentador assumir que, quando um valor-p é proximo de zero, cle indica que a relacio entre X e Y é muito forte, Isso ndo € necessariamente vverdade (embora possa ser). Como notamos previamente, valores-p representam nos- so grau de confianga na existéncia da relagio que detectamos na populagao subjacen- te, Entéo devemos naturalmente esperar com 0 aumento da nossa amostra valores-p ‘menores. Mas amostras grandes sozinhas nfo tornam o relacionamento magicamente forte; elas awmentam nossa confianga de que a relagio observada em nossa amostra acuradamente representa a populagao subjacente. Vimos um tipo de relagio similar no capitulo 6 quando calculamos os erros-padrao. Porque o mimero de casos ¢ 0 de- nominador da formula de erro-padrao, um aumento no niimero de casos leva a um erro-padrio menor € a um intervalo de confianga mais estreito para nossa inferéncia sobre a populagio, Outra limitagdo dos valores-p é que eles no refletem diretamente a qualidade do proceso de mensuragio das nossas variveis. Assim, se estamos mais confiantes em nossa mensuracao, devemos estar mais confiantes no nosso valor-p. O outro lado disso é que, se nao estamos tao confiantes no processo ce mensuragio de uma ou das nossas dias variveis, devemos ter menos confianga em nosso valor-p. Finalmente, devemos ter em mente que os valores-p sio sempre baseados no pres- suposto de que selecionamas aleatoriamente nossa amostra da populagio. Matemati- camente, sso & expresso por 7 Adicionalmente, quanto menor o tamanko da. amostra, mais provivel € que tenhamos resultados que nio sio representativos da populagio. Teste bivariado de hipstese rat p=Pvi Isto se traduz em “a probabilidade de um caso individual de nossa populagio per- fencer a nossa amostra, p, é igual a P para todos os casos i’. Se esse pressuposto for valido, teremos uma verdadeira amostra aleatéria, Como essa é uma exigéncia que quase nunca é alcangada, devemos considerar esse fato em nossa avaliagio do valor-p. Quanto mais distantes estivermos de uma verdadeira amostra aleatéria, menos con- fianca devemos ter em nosso valor-p. 7.3.3, DOS VALORES-P A SIGNIFICANCIA ESTATISTICA Como sublinhamos na segao anterior, valores-p mais baixos aumentam nossa con. fianga de que de fato exista uma relacdo entre duas varidveis. Um modo comum de se referir a tal situagdo € afirmar que a relagao entre as duas varidveis é uma relagio estatisticamente significante, Embora esse tipo de afirmagao soe como uma afirma- 40 autorizada, ela é sempre uma afirmagao que deve ser colocada em perspectiva, E outras palavras, uma declaragao de significancia estatistica depende de outros tantos fatores. Um desses fatores & 0 conjunto de pressupostos da seco anterior. A “signifi cAncia estatistica” ¢ aleangada somente na medida em que os pressupostos subjacentes ao calculo do valor-p sejam mantidos. Adicionalmente, existe uma variedade de di- ferentes padrdes para definir qual é um valor-p estatisticamente significante, Muitos cientistas sociais usam como padrao 0 valor-p de 0,05. Se p € menor que 0,05, eles consideram uma relagio estatisticamente significante. Outros usam um padrao mais, restrito de 0,01 ou um padréo mais relaxado de 0,1", Nunca é demais enfatizar que encontrar que X e ¥ tém uma relacio estatisticamente significante ndo significa necessariamente que a relagao entre X e Y € forte ou, principal- mente, que relagao é causal. Para avaliar se uma relagao é forte ou nao, precisamos utili- zar nosso conhecimento substantivo sobre o que significa uma quantidade determinada de mudanga no valor de ¥. Discutiremos a avaliagao da forea das relagoes em detalhe no lo 9. Para avaliar se uma relacao ¢ causal, precisamos examinar quio bem nossa ‘se sai em termos de superar os quatro obsticulos causais do capitulo 3. 7.3.4 AHIPOTESE NULA E OS VALORES-P No capitulo 1, introduzimos o conceito de hip6tese nula, Nossa definigao foi “uma hipdtese nula é também uma afirmacdo baseada na teoria, mas sobre o que espera- riamos observar se nossa teoria for incorreta’, Assim, seguindo a légica previamente sublinhada, se nossa hipdtese derivada da teoria € que existe covariagao entre X e Y, entdo a hipétese nula correspondente & que nao existe covariagao entre X e ¥. Nesse Mais recentemente, em ocorrido uma tendencia de reportar 0 valor-p estimado e deixar os eitores fazerem suas préprias avalingSes sobre a signfiincia estatisic, PP ———__— 172 Fundamentos da Pesquisa em Citncia Politica contexto, outra interpretacao do valor-p € que ele transmite o nivel de confianga com co qual podemos rejeitar a hipétese nula. 7.4. TRES TESTES BIVARIADOS DE HIPOTESE ‘Agora passaremos a apresentagao de trés exemplos especificos de testes bivariados de hipdteses. Em cada um dos casos, testamos se existe uma relagdo entre X e Y. Faze- ‘mos isso com dados amostrais e, entao, baseando-nos no que achamos, produzimos inferéncias sobre a populacdo subjacente. 7.4.1 EXEMPLO 1: ANALISE TABULAR A apresentagao tabular de dados para duas variaveis ainda é amplamente utilizada. Na literatura de ciéncia politica mais recente, estudiosos a tém utilizado como uma primeira etapa antes de fazer uma andlise mais aprofundada com uma anélise multi- variada, Vale notar neste ponto que, nas tabelas, na maioria das vezes a varidvel depen- dente ¢ exposta nas linhas, enquanto a varidvel independente ¢ exposta nas colunas. Todas as vezes que voce observar uma tabela, é muito importante gastar algum tempo para garantir que vocé entendeu 0 que ela quer transmitir. Podemos dividir esse pro- cesso em trés partes: 1. Descubra qual varidvel esta definida nas linhas e nas colunas da tabela. 2, Descubra o que as células individuais representam. Algumas vezes elas sero ‘6 numero de casos que acontecem em uma determina linha ¢ coluna; outras, vveres os valores das células sero proporgdes (variando de 0a 1) ou percentuais (variando de 0 a 100). Se esse for o caso, € critico que voce descubra se 0 pes- quisador calculou os percentuais ou proporgdes para a tabela ou para cada linha ou coluna, 3, Descubra quais padrdes gerais (se existirem) vocé observa na tabela, abel 7.2 ~ Rsdencias com ig sale oon elo presdenil americana de 208 ‘Nota: todos os dados representam o percentual das colunas. ‘A Tabela 7.2 nos proporciona uma boa oportunidade para exemplificar esses trés pontos. Nessa tabela estamos testando a teoria de que ser fiiado a um sindicato faz _ ste bivariado de hipétese 173 com que as pessoas estejam mais favordveis a apoiar candidatos da esquerdat. Pode- ‘mos dizer, a partir do titulo da tabela e dos cabecalhos das colunas e das linhas, que essa tabela compara os votos de pessoas de uma residéncia com filiagao sindical com ‘os de pessoas de residéncias sem filiacao sindical na eleicdo presidencial americana de 7008. Podemos usar a informacio da tabela para testar a hip6tese de que eleitores de residéncias sindicais estao mais favordveis a apoiar Barack Obama, o candidato pre- sidencial do partido democrata®. Como primeiro passo na leitura dessa tabela, deter- ‘minamos qule as colunas indicam os valores da variavel independente (se 0 individuo € ot! nfo de uma residéncia sindicalista) e que as linhas indicam valores da variavel dependente (voto presidencial). © segundo passo é bastante direto; a tabela contém uma nota de rodapé que nos diz. que as “células informam os percentuais das colunas” sse €0 formato mais ficil para prosseguir ao passo 3, porque o percentual das colunas corresponde & comparagao que queremos fazer. Queremos comparar o voto presiden- cial das pessoas oriundas de uma residéncia sindicalista com o das pessoas que ndo sio oriundas de residéncias sindicalistas. O padrao € bastante claro: pessoas de resi- déncias sindicalistas apoiam esmagadoramente Obama (66,6 para Obama e 33,4 para McCain), enquanto pessoas de familias nao sindicalistas so marginalmente favoraveis, a Obama (52,9 para Obama e 47,1 para McCain). Se pensarmos em termos de vari veis independente (X) e dependente (¥), a comparagao que temos que fazer ¢ entre a distribuicao da variavel dependente (¥ = voto presidencial) e os valores da variavel independente (X = tipo de residéncia). Tabela 7.3 ~ Gineoe voto na ela presence emercana de 208: cent hiptti, Mccain 45,0 obama 550 ‘Total da coluna 1000 ‘Noto: todos os dados representam o percentual das colunas. Na Tabela 7.2, seguimos a convengao de colocar os valores da varidvel independen- te nas colunas ¢ da varidvel dependente nas linhas. Entao, tornamos a comparagao en- treas colunas simples ao colocar como valor das células o percentual da coluna, Aderir @ essas normas é uma atitude sdbia, porque elas facilitam a comparagio que queremos fazer e porque esse é um modo como muitos leitores esperam encontrar a informacao. “Gaste um tempo para avaliar ess teoria nos termos dos dois primeiros obsticulos causa que disc timos no capitulo 3. © mecanismo causal é que candidatos de esquerda tendem a apoiar politcas que Sejam valorizadas pelos sindiatos, He &crvel?E quanto a0 segundo obsticulo? Podemos eliminar a possbilidade de que apoiar um candidato de esquerda tna mais provivel que alguém sea liado a tum sindiatot © que voct pense sobre a operacionalizagio dessas duas vardveis? Quo bem isso se sai diante do contetidodiscutido no capitulo 5? — 174 undamentos da Pesguisa em Ciéncia Politica Em nosso préximo exemplo acompanharemos passo a passo o teste da hipdtese de que 0 género (X) esté relacionado ao voto (¥) nas eleigdes presidenciais americanas. Para testar a hipétese sobre género e voto presidencial, utilizamos os dados do Natio. nal Annenberg Election Survey (NAES) conduzido em 2008. Este é um conjunto de dados apropriado para o teste desta hipdtese porque é proveniente de uma amostra se- ecionada aleatoriamente da populacao subjacente de interesse (americanos adultos), ‘Antes de observarmos os resultados obtidos a partir dos dados, pense brevemente so- bre a mensuracdo das varidveis de interesse e o que esperariamos achar se nao existisse ‘uma relacio entre as duas varidveis. ‘A Tabela 7.3 apresenta informagdes parciais sobre um exemplo hipotético em que sabemos que 45% da nossa amostra de entrevistados disse ter votado em John McCain ¢ 555% dos entrevistados disseram ter votado em Barack Obama. Mas, como os pontos de interrogagio nessa tabela indicam, nao conhecemos a divisio de votos entre os generos. Considere 0 que esperarfamos observar, caso nao exista uma relagao entre género e voto presidencial em 2008, dado o que sabemos a partir da Tabela 7.3. Em outras palavras, {quais valores devem substituir os pontos de interrogacio na Tabela 7.3, caso nao exista uma relagio entre nossas variaveis independente (X) ¢ dependente (¥)? ‘abela 7.4 ~ Ginero «vot na clei preside americana de 2008: expecta par cenit ipo cso no ures rel etre gine prlerénn, ‘Mecain obama 450 Total da coluna ‘Nota: todos os dados representam o percentual das colunas, ‘Se nao existe uma relagéo entre género e voto presidencial, entdo devemos esperar nao observar nenhuma grande diferenga no modo em que homens e mulheres votaram por John McCain e Barack Obama. Como sabemos que 45% dos nossos casos votaram em McCain ¢ 559% em Obama, 0 que podemos esperar observar para homens € mulheres? Devemos esperar observar a mesma proporgéo ce homens ¢ de mulheres votando por cada candidato, Em outras palavras, devemos esperar que os pontos de interrogacio fos- ‘em substituidos com os valores da Tabela 7.4, Essa tabela expde os valores esperados para as células para a hip6tese nua de que nio existe relagio entre genero e voto presidencial Tobe 7.5 ~ Ginto «voto na lego presdenl americana de 2008 ‘Mecain| obama 1434 ‘otal da coluna Tota: os dados representar o nimero de respondentes 175 ‘este bivariado de hipétese ‘A Tabela 7.5 mostra 0 ntimero total de respondentes que se encaixam em cada uma as colunas e linhas. Se fizermos 0s calculos, podemos observar que o miimero na colu- nna A extrema direita da Tabela 7.5 ¢ equivalente ao percentual da Tabela 7.3. Podemos agora combinar a informagio da Tabela 7.5 com nossas expectativas da Tabela7.4 para calcular 0 mimero de respondentes que esperamos observar em cada uma das células se genero e voto presidencial nio forem relacionados. Mostramos esses célculos na ‘Tabela 76, Na Tabela 7.7, observamos 0 niimero real de respondentes de cada uma das quatro células. Finalmente, na Tabela 7.8, comparamos o niimero de casos observados (0) com 0 riimero de casos que esperariamos observar (B) se ndo existisse relacio entre nossas vvaridveis dependente e independente, Tela 7.6 ~ Gata e voor eli presdenlamerana de 2008 cclclndo os lores sper ds cals cas baa rela ert gna e rfréad, Mecain | (45% de-1379) = 0,45 x 1379 = 620,55 obama | (55% de 1379) =0,55 «1379 = 758,45 orem relacionadas. ‘Noto: 0s dados representam o valor esperado se essas duas variavels Tobe 7.7 ~ Ginero evo na ele psec! aneriana de 2008. McCain 1034 obama Total da coluna "Nota: os dados representam o numero de respondentes. .8~ Ginero¢ voto aig presen marion 7008, 0752; £=8145 0 = 1058; £=995,5 ‘Nota: dados representam o numero observado (0); o nlimero esperado se n8o existisse relacio (E). >, ————= 176 Fundamentos da Pesquisa em Ciéncia Politica Podemos observar um padrio, Entre os homens, a proporgio observada de votos para Obama é menor do que a que esperariamos se ndo existisse relacao entre as duas varidveis, Também, entre os homens, a proporgao de votos para McCain é maior do que a que esperariamos se nio existisse relagio. Para as mulheres o padrao ¢ invertido = a proporgio de votos para Obama (McCain) é maior (menor) do que a que espera- ‘amos se nao existisse relagao entre genero e voto na eleicao presidencial dos Estados Unidos, © padrio dessas diferencas segue a linha da teoria de que mulheres apoiam mais os candidatos do partido democrata do que os homens. Embora essas diferengas estejam presentes, ainda néo determinanos se elas so suficientes para que tenhamos maior confianga em nossa teoria. Em outras palavras, queremos saber se essas diferen- as sio ou nao estatisticamente significantes. Para responder a essa pergunta, usamos o teste qui-quadrado (x’) de associagao, Karl Pearson originalmente desenvolveu esse teste quando estava testando teorias so- brea influéncia da hereditariedade e dos estimulos comportamentais no desenvolvi- mento humano no comeco do século XX. A formula do qui-quadrado é dada por (0-8 z x O sinal de soma na férmula significa que somamos cada uma das células da tabela; entao, para uma tabela 2x2, somamos as quatro células. Se pensarmos sobre a contr buicdo individual de uma célula nessa frmula, podemos observar a légica subjacente a0 teste x2, Se 0 valor observado, O, é exatamente igual ao valor esperado, E, entio nao existe relagio entre as varidveis e a contribuigao dessa célula sera igual a zero (Porque (0 ~ E seria igual a zero), Assim, se todos os valores observados fossem exatamente iguais aos valores esperados, portanto, se ndo existisse relagio entre as das variéveis, entio x = 0, Quanto mais os valores de O diferem dos valores de E, maior ¢ 0 valor de 12. Porque o numerador do lado direito da formula do x? (O~ E)é elevado ao quadrado, qualquer diferenca entre O e E contribuiré positivamente para o valor geral x. Abaixo podemos observar os célculos do x’ para os valores da Tabela 7.8: »_y rE SSL Ee (682—620,55)"_, (752—814,5)' , (697~758,45)" , (1.058-999,5)" 620,55 758,45 99,5 3.77641 , 3:906,25 , 3.7611 , 3.906,25 620,55 758,45 999,5 09+ 4,8+4,98-+3,92= 19,79. Entio 0 valor do nosso x para nossos dados € 19,79, O que fazemos com isso? Comparamos o valor da nossa estatistica, 19,79, com algum valor-padrao predetermi- nado, chamado valor eritico, de 2. Se nosso valor é maior do que o valor critico, entéo reste bivariado de hipétese concluimos que existe relagio entre as duas vari aque o valor critico, ndo podemos chegar a essa conclusio. Como obtemos esse valor critico? Primeito, precisamos de uma informe nnhecida como graus de 177 fiveis; e, se o valor calculado é menor c0 co- erdade (gl) para 0 nosso teste’, Nesse caso, 0 céleulo dos graus de liberdade é bastante simples: gl-(r—1)(¢1), em que r é 0 niimero de linhas i tabela eco ndimero de colunas da tabela, No nosso exemplo da Tabela 7.8, existem duas Jinhas e duas colunas, entio (2-2-1) Voc’ pode encontrar uma tabela com 0s valores criticos de x° no Apéndice A. be adotarmos o valor-p padrio de 0,05, observamos que o valor crtico do x’ para gh=1 € 3,841. Portanto, um 22 com valor calculado de 19,79 est muito acima do valor mini- no requerido para obter um valor-p de 0,05. De fato, observando a tabela dos valores qriticos, podemos ver que nossa estatistica excede o valor critico necessirio para um valor-p de 0,001 Até este momento, conseguimos estabelecer que a relagdo entre nossas duas varia veis atende aos padrdes de significdncia estatistica convencionalmente aceits (isto é, p< 0905). Embora esse resultado seja favoravel & nossa hip6tese, ainda nfo estabele- eemos uma relagio causal entre genero e volo presidencial, Para observar isso, pense hovamente nos quatro obstaculos para estabelecer uma relagao causal que discutimos ho capitulo 3. Até agora, claramente superamos 0 terceiro obstéculo, por meio da de Jmonstragao de que X (género) e ¥ (voto) covariam. A partir do que sabemos sobre politica, podemos facilmente superar o primeiro obsticulo, “Existe um mecanismo Erivel que conecta X a YP. Pode ser mais posivel que mulheres votem em candidatos como Obama, porque, entre outras coisas, elas dependem mais da rede de seguranga Social do Estado de bem-estar social do que os homens. Se examinarmos o segu- do obsticulo, “Podemos eliminar a possibilidade de Y ser a causa de X?, podemos facilmente observar que superamos esse obsticulo a partir da légica. Sabemos com onfianga que uma mudanga na preferéncia de voto nao leva a mudanga do género da pessoa. Encontramos o percalgo mais sério na rota do estabelecimento da causalidade {quando encontramos 0 quarto obstéculo, “Controlamos por todas as varidveis colines- tes Z que podem tornar a associagao entre Xe ¥ espiria?” Infelizmente, nossa resposta aqui é que nao sabemos ainda. De fato, com anilises bivariadas, nfo podemos saber se alguma variavel Z 6 relevante, porque, por definigio,existem apenas das vardveis na anilise. Entio, até que tenhamos evidéncias de que as varidveis Z foram controladas, ‘nosso scoreboard dos obstaculos causais é [s ss]. 7.4.2. EXEMPLO 2: DIFERENCA DE MEDIAS ‘No nosso segundo exemplo, examinamos uma situacio na qual temos uma varivel dependente continua e uma varidvel independente categorica. Nesse tipo de teste Bt Variado de hipdtese, observamos se as médias sio diferentes para os diferentes v Definimos graus de iberdade na proxima seeio. 8 aa lores 178 andamentos da Pesquisa em Citncia Politica da varidvel independente. Seguimos a légica basica do teste de hip6tese: comparamos nossos dados do mundo real com o que esperariamos encontrar se nao existisse rela- ‘so entre nossas varidveis dependente e independente. Usamos médias das amostras ¢ 6s desvios-padrio para fazer inferéncias sobre a populagao nao observada. A teoria que utilizamos como exemplo nesta se¢io vem dos estudos sobre gover- nos parlamentaristas. Quando cientistas politicos estudam fenOmenos entre diferentes formas de governo, uma distin2o fundamental que eles fazem entre os tipos de de- mocracias é se 0 regime é parlamentarista ou nao. Um regime democratico é chamado de “parlamentarista” quando a cimara baixa do Legislativo é 0 ramo mais poderoso no governo e seleciona diretamente o chefe do governo”. Uma das caracteristicas mais interessantes da maioria dos regimes parlamentaristas ¢ que a cAmara baixa pode re- mover 0 governo do poder por meio do voto de confianga. Como resultado, cientistas politicos tém tido muito interesse nos determinantes de quio longo so os governos parlamentaristas quando existe a possibilidade do voto de confianca. Um fator importante que diferencia as democracias parlamentaristas € se o partido ‘ou 0s partidos que estéo no governo ocupam a maioria dos assentos no Legislaivo". Por definicéo, a oposigio pode derrotar um governo minoritério e retird-1o do poder por ele nao controlar a maioria das cadeiras no Legislativo, Assim, uma teoria bastante razoavel sobre a duragdo dos governos em parlamentarismos é que governos de maio- ria durardio mais do que governos de minoria. Podemos passar da teoria para um teste de hipétese utilizando 0 banco de dados produzido por Michael D. McDonald e Silvia M. Mendes intitulado Governments, 11950-1995. Os dados dos autores cobrem governos de 21 paises ocidentais. A fim de tornar os dados compariveis, limitaremos a amostra aos governos formados apés ‘uma eleigio’. Nossa variavel independente, “tipo de governo’, assume dois valores ‘Una parte importante do desenho de pesquisa ¢ determinar quais casos sio eobertos pela nossa teoris. [Neste eas, nossa teora, que apresentaremos brevemente, se aplicaré apenas a democracias parlamen taristas. Como exemplo, consdere se os Estados Unidas e o Reino Unido se adequam a essa desc ‘inicio de 2007. Em 2007, o chefe de governo nos Estados Unidos era o presidente George W. Bush, {que foi eleito por meio da eleigdo presidencial, e no pela cAmara baixa, Portant, os Estados Unidos fem 2007 nio se adequam a nossa teoria. Para o Reino Unido, pode se tentador em um primeiro mo mento apontar a rainha Elizabeth If como a chefe de governo, Mas, se consierarmos que reise rainss ingless tém tido um papel praticamente cerimonial na politica do Reino Unido, devemos considerar como chefe de governo o primeiro-ministro, Tony Bl, que foi eleito pela cimara baixa do Legisltivo, 4 House of Commons. Se, adicionalmente, considerarmos os poderes da Camara dos Comuns com- parados relativamente com 08 dos demas ramos do governo no inicio de 2007, veremos que 0 Reino ‘Unido se adequa a0 nosso critéio de governo parlamentarista Pesquisadores geralmente definem um partido como pertencente ao governo se a0 menos umn dos seus membros ocupa tum posto no gabinete (ministérios). Por sua ver, partidos que ni estto no governo so da oposigio. “Também temos que limitar nossa anslise aos casos em que os governos possuem um Ti legal mi imo de quatro anos para permenecer no poder antes de convocar novas eleiges. Essa limita sig nice que, etritamentefalando, s6 somos capazes de fzerinferéncias sobre a populagio de casos que se adequam a esse citerio pp 179 reste bivariado de hipétese sgoverno de maiora” ou "governo de minoria. Nossa varivel dependente, “duragdo Je governa? uma varivel continua que mensura o nimero de dias que cada governo ‘jesou, Embora essa varidvel tenha uma variagio hipotética de um dia a 1.461 dias, os ‘jados reais variam de 31 em 1953 para o governo italiano a 1.749 dias para o governo hpolandés entre o final da década de 1980 e o comego da de 1990. 4 = Majoritario Minoritario 2,000 1,500 5 | | Duragao do governo em dias 500 ° 7.1 = Bacplt pra droge de grea moors eins. Para termos uma ideia melhor dos dados que estamos comparando, podemos utilizar dois gréficos que introduzimos no capitulo 5 para visualizar a distribuigao Ue variaveis continuas. A Figura 7.1 apresenta 0 grafico box-plot para a duragao de fgovernos majoritirios eminoritérios ea Figura 7.2 apresenta o grafico de densidade Kernel para a duracdo de governos majoritarios e minoritérios. Observamos nesses dois grficos que governos de maioria parecem durar muito mais do que governos de minoria. Para definir se as diferencas observadas nesses dois gréficos sio estatisticamente sighificantes, podemos utilizar o teste de diferenga cle médias. Nesse teste comparamos { que observamos nos dois grficos com o que esperariamos encontrar se nso existisse chee entre o tipo de governo e a duragao do governo. Se ndo existisse nenhuma relagio entre as duas varldveis, entdo a duragio dos dois tipos de governo setia provs- se cate da mesma distribuigao subjacente. Se esse fosse 0 caso, a média ¢ 0 valor mécio da duragio do governo seriam iguais para governos de minoria e de maioris: para testar a hipétese de que essas médias so provententes da mesma distribuicto subjacente,utlizamos outro teste desenvalvido por Karl Pearson para esse Proposito. a SSS Di 180 Pundarmentos da Pesquisa em Citncia Polticg kdensity govtime 0,006 0.0004 0.0002 0 00 1.000 1.500 2.000 Duragao do governo em dias + Minoitério Majoritario Figura 7.2 ~ Gf d denied kernel pra drei de goveras moors eminrisis. Fase teste estatistico é conhecido como teste-t porque utiliza a distribuigo f. A formu- Ta para este teste em particular sel -¥)" em que ¥, éa média da nossa variavel dependente para o primeiro valor da varié- vel independente ef, & a média da variavel dependente para o segundo valor da variivel independente. Podemos observar a partir dessa formula que quanto maior a diferenca entre o valor da média da variével dependente entre os dois valores da variavel independente, maior seré o valor de t. No capitulo 6, introduzimos a nogao de erro-padrio, que consiste em uma medida de incerteza sobre uma estimagio estatistca. A logica basica é que quanto maior for 0 erro-padrio, mais incerteza (ou menos confianga) teremos na nossa habilidade de fazer afirmagdes precisas. Similarmente, quanto menor for o erro-padrio, maior é a ‘nossa confianga sobre nossa habilidade de fazer afirmagdes precisas. Para melhor entender a contribuicao das partes de cima e de baixo do cilculo de t para a diferenga de médias, observe novamente as Figuras 7.1 e 7.2. Quanto mais distantes forem as duas médias ¢ menos dispersas as distribuigdes (mensuradas pelo desvio-padrao s, es,), maior nossa confianga de que Y, e Y, sao diferentes entee si. Teste bivarado de hiptese 181 Tabla 7.9 ~ Tio do gorero «durex do goer, Maioria 466.3 Minoria Combinado ‘A Tabela 7.9 apresenta as estatisticas descritivas para a duragio do governo por tipo de governo. A partir dos valores expostos na tabela, podemos calcular a estatistica do teste-t para nosso teste de hipétese. O erro-padrao das diferengas entre as duas médias (W,e¥,), se(¥, -¥,), € calculado com a seguinte formul nde sin—Ds). ft @aVsit—De), [1 1) 2 m em que 7, 7, sio 0 tamanho das amostras e s? € s} séo a variancia das amostras. Se ‘nomearmos o numero de dias no governo para governos majoritirios Y, eo nimero de dias no governd para governos minoritarios Y,, entio podemos calcular o erro- -padrao como selTi-¥s) = (os Haeere—DULA), (2-3) 1244+77-2 124 53, se(¥i-Y2) = 74,39. Agora que temos 0 erro-padrao, podemos calcular a estatistica-t: 7 +m, = 256.1 = 344, 74,39 74,39 ‘Uma vez calculada a estatistica-t, precisamos de mais uma informagio antes de obter ‘nosso valor-p. No caso, precisamos dos graus de liberdade (gl). Os graus de liberdade re- fletem a ideia bisica de que ganharemos confianga no padrao observado & medida que a quantidade de dados em que esse padrao é baseado cresce. Em outras palavras, a medida que 0 tamanho da nossa amostra aumenta, nos tornamos mais confiantes sobre nossa habilidade de afirmar coisas sobre a populagio subjacente. Se formos ao Apéndice B, no qual temos os valores criticos para a estatistica-t, podemos observar essa l6gica. Essa tabela também segue a mesma logica basica da tabela do 2°. Nas colunas da tabela esto definidos os valores-p que queremos obter, ¢, para conseguir tal valor-p, necessitamos obter um valor t determinado, Aslinhas da tabela-t indicam os graus de liberdade. A me dida que os graus de liberdade aumentam, a estatistica-t necesséria diminui. Calculamos 1s graus de liberdade para uma estatistica-t de diferenga de médias baseada na soma da amostra total menos dois. Assim, nosso grau de liberdade & +n, ~2=124453-2=175. > 182 undamentos da Pesquisa em Ciéncia Polltica Desde o valor-p, podemos observar nas linhas onde gl=100 e verificar 0 valor-t mi- inimo necessério para alcangar cada um dos valores p®. Na segunda coluna da tabela-t, podemos observar que, para ter um valor-p de 0,10 (que existe 10%, ou 1 em 10, de chance de observarmos essa relagao na nossa amostra de modo aleatério, se nao exis- tir relagao entre X e ¥ na populacao subjacente), devemos ter uma estatistica-t maior ou igual a 1,29. Dado que 3,44>1,29, podemos proceder para a préxima coluna de p=0,05 e ver que 3,44 também € maior que 1,66. De fato, se formos até o final da linha para gl=100, podemos observar que nossa estatistica-t ¢ maior que 3,174, que € 0 valor-t necessério para ter p=0,001 (que significa que existe 0,1%, ou 1 em 1000, de chance de observamos essa relagio na nossa amostra aleatoriamente, caso no exista relagio entre X e Y na populacdo subjacente). Isso indica que temos bastante confianga de que superamos o terceiro obsticulo causal na nossa avaliagao da teoria de que existe uma relacdo entre governos de maioria e a durasao do governo, 7.4.3. EXEMPLO 3: COEFICIENTE DE CORRELAGAO No nosso tiltimo exemplo de teste bivariado de hipétese, observamos a situagao em que nossas variaveis independente e dependente sao continuas. Testamos a hipdtese de que existe uma relacao positiva entre o crescimento da economia e o desempenho do partido do presidente em exercicio nas eleigdes presidenciais americanas. ‘No capitulo 5, discutimos a variagdo (ou variancia) de uma tinica variavel e, no ca- pitulo 1, introduzimos o conceito de covariagao. Nos trés exemplos que apresentamos até agora, encontramos que existe covariagao entre pertencer a uma residéncia sindi- calista e 0 voto presidencial, género e voto presidencial e tipo de governo e duragao do governo. Todos esses exemplos utilizaram ao menos uma varidvel categérica. Quando is independente e dependente sio continuas, podemos facilmente per- ceber a covariagdo por meio da andlise visual utilizando graficos. Considere a Figura 7.3, que expe um gréfico de dispersio do voto no partido do incumbente e o cres- cimento econdmico. Graficos de dispersio sdo titeis para uma visualizagao inicial da relagaio entre duas variveis continuas. Sempre que examinar um grafico de dispersio, voce deve descobrir o que sio os eixos e, ento, 0 que cada um dos pontos representa. Nesses grificos, a variavel dependente (neste caso, o voto no partido do presidente em exercicio) deve ser exposta no eixo vertical, enquanto a variével independente (neste caso, 0 crescimento econdmico) deve ser exposta no eixo horizontal. Cada ponto no grafico de dispersao representa o valor para duas variaveis para um determinado caso. Entao, na Figura 7.3, estamos olhando para os valores do voto no partido do incum- bente e do crescimento econémico para cada um dos anos em que houve uma cleigao presidencial nos Estados Unidos e em que os dados esto disponiveis para as duas variaveis. " Embora nosso grau de liberdade soja igual a 175, utilizamos a linha de gl=100 para ter uma ideia gros- seira do valor-p. Com um sofware estatstco, podemos caleular 0 valor exato de p. i + ‘Teste bivariado de hipStese 183 oS 5860 se of ee Percentual de votos recebidos pelo partido do incumbente 40 35 15 10 5 ° 5 10 ‘Mudanga percentual no PIB real per capita, Figura 7.3 ~ Gri de disperse do mud oP oon pti do incmbene Quando observamos esse grafico, queremos avaliar se existe ou ndo um padrao. Como nossa teoria & que nossa varisvel independente causa a variével dependente, deve- ‘mos nos mover da esquerda para a direita no eixo horizontal (que representa o aumento nos valores da varidvel independente) e ver se existe um aumento ou um decréscimo correspondente nos valores da varidvel dependente, No caso da Figura 7.3, a0 nos mo- vvermos da esquerda para a direita, de maneira geral observamos um padrao de aumento dos valores no eixo vertical. Isso indica que, como esperado pela nossa hipétese, quando a economia vai bem (valores mais a direita no eixo horizontal), também hé uma chance maior de observar um aumento no percentual de votos para 0 partido do incumbente nas eleigdes presidenciais americanas (valores maiores no eixo vertical) ‘A covariincia ¢ um modo estatistico de resumir um padrio de associagao geral (ou a falta dele) entre duas variaveis continuas. A formula da covariancia para duas varidveis Xe YE _ EX ¥),-¥) Para entender melhor a intuicio por detrés da formula da covariancia, € itil pensar em termos de valores relativos dos casos individuais em relagao & média de X(X) ea ‘média de Y(¥). Se um caso individual tiver valor para a varidvel independente maior do que a média de X(X, - X >0) eo valor para a varidvel dependente maior que a mé- dia deY(Y, -¥ > 0),acontribuigdo desse caso ao numerador da equacio da covariancia ser positiva, Se um caso individual tiver um valor para a varidvel independente menor eS 184 undamentos da Pesquisa em Ciencia Politica do que a média de X(X,-X <0) e um valor para a variivel dependente menor que a média de Y(¥, -¥ <0),a contribuigio desse caso ao numerador da equagdo da covarian- cia também sera positiva, porque a multiplicagio de dois niimeros negativos gera um produto positivo. Se um caso tem uma combinagio de um valor maior do que a média ¢ outro menor do que a média, sua contribuicao ao numerador na formula da covaridncia serd negativa, porque a multiplicagao de um nuimero positive por um mimero negative gera um produto negativo. A Figura 7.4 ilustra isso; observamos o mesmo gréfico para as variaveis “crescimento econdmico” versus “voto no candidato do partido do incum- bente’, mas adicionamos linhas que mostram o valor médio de cada varidvel. Em cada tum desses quadrantes, podemos observar a contribuigdo dos casos ao numerador. Se um gréfico contém @ maioria dos casos nos quadrantes superior direito e inferior esquerdo, a covariancia tende a ser positiva. Por outro lado, se um gréfico contém a maioria dos casos nos quadrantes superior esquerdo ¢ inferior direito, a covariancia tende a ser ne- gativa. Se um grafico contém um ndmero balanceado de casos nos quatro quadrantes, a covariincia ser préxima de zero, porque os valores positivos e negativos cancelario uns aos outros. Quando a covarincia entre as duas vativeis & positiva, descrevemos a situagao como relacao positiva entre as varidveis, ¢ quando a covariagio entre as duas variaveis 6 negativa, descrevemos a situagao como uma relagao negativa re (ne . 338 . Be : 889 . gs . 83 - [4 gat . , 83 elle g 18 10 5 9 5 10 ‘Mudanga percentual no PIB real per capita Figure 74 ~ rcs de dspersio da nada no Pe voto no pride do number com quedrontes de mii eta ‘A Tabela 7.10 apresenta o célculo para cada ano na formula da covarincia para os dados que apresentamos na Figura 7.4. Para cada ano, comecamos com o célculo da diferenca entre cada Xe X ea diferenga de cada Ye ¥. Se comegarmos com o ano de 1876, podemos observar que o valor pata crescimento (Xjy,) foi 5,11 € 0 valor _ ‘este bivariado de hipétese 185 pata voto (Vjgq) i 48,516. O valor para crescimento é maior do que a’ média € 0 falor para votos é menor do que a média, Xiyq—X =5,11—0,7025294 = 4,407471 © Yugg “Y= 48,516~51,94718 = ~3,431181. Na Figura 7.4, 0 ponto que representa 1876 esta no quadrante inferior direito. Quando multiplicamos esses dois desvios da imédia, temos (Xiang ~ X)(Vigng -¥) = 15,12283 Tela 7.10 ~ Contigo india! decode on ltr ocd oer 1876 sat 48.516 43138 15,1228 1980 3879 5022 376471, 72718 548633, 84 1,589 49,846 og6a7i -2,10118 186263 sepa | -5,553 50,414 6.25553, 4153318, 9590831 3892 2,763 48,268 2.060471, 367918, 7.58083 1a96 | -10,024 47,78 ~10,7265 418718 44,91387 x90] -1,425 53,171 22783 1223824 2.60372 sgoa] 2.421 60,006 3.12353, 8.058824 25,172 rg} 6,281 54483 5.98353 2.535824 17,708 3932 4,64 54,708 3agua7t 2.760824 9.556509, 1916 2.229 51,682 126471 0.26518 040878 iso} 11,463, 36,48 12,1685 15,7992 192.2083 ssa] 3,872 58,263 4.57453 6.315824 28,8919 1928 4,623 58,756 3.920871, 6.808824 26,69379 ssa] 14,586 40,852 15,2885 11,0962 69,6402 ras} 11,836 62,226 1113307, 1027882 114,439 1940 3.901 54,983 3198471, 3.035824 9.709982 aaa 4,233, 53,778 3530071, 1830824 6.463669, 1948 3,638 52,319 2.935471 71824 09147 1952 076 447 0.023471, 123718 ~0,169865 aose | -1,451 57,098 2.15353 546824 11,0838 11960 0.455, 49,913 0.24753, 2903818 0503519 1964 5,087 61,203 438071 9.255824 40)58189, 1968 5,039 49,425 4346471, 2.52218 10,9625, wn 5,949 61,791 5246471, 9843828 51,64533 1976 3,806 43,951 3.203471 2.99618 9.29885 reo} 3,659 4a.802 4.36153 7.10518 30.98984 1984 5424 59,123 arent 7.475824 33,2008 988. 2,28 53,832 4507472 4884824 2.841316 1992 2949 46379 2.246471 556818 ~12,5087 1996 3,258 54737 2.555471, 2,789824 729312 2000 2014 50,262 43n471 1.68518 2.21006 2004 1,989 51,233 1.286471 0.71838 -0 9187 a 186 -Fundamentos da Pesquisa em Ciencia Politica Repetimos ese mesmo céleuo para todos 0s casos (ada ano de leigio presidencial). Cada caso neyativo como ese contribu para que arelagao geraentre Xe ¥ Sls ne” | ‘ian enquanto cada resitado postivo contribui para que a relagho geal ens xXeY | seja positiva, A soma para todos 0s 34 anos em que dcorreram Eee na Tabela 7.10 € 616.9088, indicando que os valores positivos superam os valores negate, ‘Quando di- os ese valor por 34, emos.acovariancia da amostra, qe € igual a 18,6846. Is0 10s Jhforma que temas uma rlaglo positiva, mas nao nos informa e quanto podemos confiar que essa rao no € diferente de uma que observariamos se nosis VAthne indepen- Mente e dependente no fssem relacionadas na nossa populagio subjacente de interesse. Pana sabermnos 50, uilizamos um terceiro teste desenvolvido por Karl Pearson, 8 coefi- rani correlagio de Pearson. Tamibém conkaeido como r de Pearson, cle dado por ‘A Tabela 7.11 € uma tabela de covariancia, Em uma tabela. de covariancia, as células dda diagonal principal (do canto superior esquerdo para 0 canto inferior direto) sio as ialoe para a quais as colunas eas Linas se referem & mesma varidvel, ess eos a célula é a variancia para a referida varidvel. Cada uma das células fora da diagonal | principal expde a covaridncia de um par de variiveis. Em tabelas de covariancia, as ‘télulas acima da diagonal principal so frequentemente deixadas em branco, porque | ‘os valores dessas células espelham os valores das células correspondentes abaixo da | dliagonal principal. Por exemplo, na Tabela7.11+ a covariincia entre crescimento € voto | 4a mesma quea covariancia entre voto ¢ crescimento, ‘entao a célula no canto superior direito dessa tabela ¢ deixada em branco. rela 7.11 ~Corna ora ces ei oop onl darn, 704 Voto Creseimento 29,8897 Utlzando os dados da Tabela 7.11, podemos caleular 0 coeficiente de correlagio COV yy r Joan, van, "18,6846 “Ja 804 29,8997 18,6846 Yi060,853316" 18,6846 r = 532,57074325 7366207. Teste bvariado de hipétese 187 Existem alguns pontos que merecem ser destacados a respeito do coeficiente de correlacao. Se todos os pontos de um grafico se alinharem perfeitamente com uma inclinagdo positiva, o coeficiente de correlagao sera igual a 1. Se todos os pontos esti- vyerem perfeitamente alinhados com uma inclinagio negativa, o coeficiente serd igual a -1. Em qualquer outro caso, 0 valor do coeficiente ficara entre +1 € ~1. Essa pa- dronizacio do coeficiente de correlagdo é um itil aperfeigoamento em relagao & co- variancia, Adicionalmente, podemos calcular a estatistica-t para um coeficiente de correlagao por: com n=2 graus de liberdade, onde m é 0 mimero de casos. Temos, nesse caso, que nosso grau de liberdade ¢ igual a 34~-2=32 Para o nosso exemplo, t fi=(0,57366207)"* 0,57366207 x5,656854249 f—(0,329088171) 1 = 3245122719 * f0,670911829" 245122719 0,819092076" 3, 961853391. Com o gl igual a 34 (n=34) menos dois, ou 32, podemos consultar a tabela-t no Apéndice B. Observando a linha para gl=30, podemos observar que nossa estatis- tica-t de 3,96 € maior até mesmo que o valor critico para valor-p igual a 0,001 (que & 3,385). Isso nos informa que a probabilidade de essa relagio ocorrer devido ao acaso menor que 0,001, ou 1 em 1.000. Quando estimamos nosso coeficiente de correlagio com um software estatistico, temos um valor-p mais preciso de 0,0004. Assim, pode- ‘mos ter bastante confianga em que a covariagio entre crescimento econdmico ¢ voto no candidato do partido do presidente em exercicio existe ¢ que nossa teoria supera com sucesso 0 nosso terceiro obstéculo causal” (0 primeizo obsticulo causal & facilmente superado se vollarmas a discussdo sobre a teori do voto «econdmsico dos capitulos anteriores, O segunda obsticulo causal também ¢ superado com facilidade a partir da logica, pensando sobre o momento em que cada varidvel é mensurada, Como o crescimento econdmico ¢ mensurado antes da eleigéo,é dif imaginar que Y causa X >. — 188 Pundamentos da Pesquisa em Citncla Politics 7.5 CONCLUSAO Introduzimos trés métodos para conduzr testes bivariados de hip6tese ~ a analise tabular. o teste de diferenca de médias eo coeficiente de correlago, Cada um dos testes ¢ mais apropriado para uma dada situaglo, dependendo da métrica ce mensuragdo ddas nossas varidveis dependente e independente. A Tabela 7.1 deve servir como uma referéncia util para voce nesse sentido, |Ainda nao introduzimos o illtimo método de conduzir testes bivariados de hip tese considerados neste livro, nominalmente a anélise de regressto bivariada. Esse é 0 tépico do nosso préximo capitulo serviré como o ponto de partida para ® regressio ltipla (que discutiremos no capitulo 9). CONCEITOS INTRODUZIDOS NESTE CAPITULO «| Anilise tabular ~ tipo de teste bivariado de hipdtese que € apropriado para dias variaveis categoricas «Coeficiente de correlacio ~ medida de associagio linear entre duas varidveis continuas. « Covarkincia ~ medida estatistica nao padronizada que sumariza 0 padrao geral de associagao (ow a falta dela) entre duas varidveis “s Graus de liberdade ~ mimero de informagdes que temos além do minimo ne cessirio para se fazer uma inferéncia em um caso especifico. «de Pearson ~ coeficiente de correlagao normalmente empregado, + Relagio estatisticamente significante ~ resultado, com base nos dados observa- dios, de que a relagdo entre duas variveis nfo ocorre aleatoriamente€,portanto, de que ela existe na populagao mais ampla. |. Teste de diferenga de médias ~ método de teste bivariado de hipdtese que ¢ apropriado para uma variavel independente categorica ¢ uma varivel depen dente continua. 4 Teste qui-quadrado (y2) de associagio ~ teste estatistico para uma relagio entre duas varidveis categoricas. «Valor aritico ~ padrdo predeterminado para um teste estatistico com 0 qual comparamos nosso valor calculado. Se @ valor calculado & maior que o valor sritieo, entao conclnimos que existe uma relacio entre as duas variéveiss s¢ 0 valor calculado & menor do que o valor critico, ni podemos tirar tal conclusio. + Valor-p~aprobabilidade de observarmosumarelagao que ocorrealeatoriamente al ‘peste bivariado de hipstese 189 EXERCICIOS 1. Indique a forma de teste bivariado apropriada para as seguintes perguntas de pesquisa: a) Vocé desejatestar a teoria de que ser mulher acarreta menores salétios. b) Voce deseja testar a teoria de que o percentual de graduados na faculdade & positivamente relacionado com 0 comparecimento as urnas. ©) Vocé deseja testar a teoria de que individuos com renda alta tém maior pro- babilidade de votar. 2, Explique por que cada uma das seguintes afirmagdes é verdadeira ou falsa a) Um software de computador deu um valor-p de 0,000, entéo sei que minha teoria foi verificada. b) Um software de computador deu um valor-p de 0,01, entio sei que encontrei uma relago bastante forte. ©) Um software de computador deu um valor-p de 0,07, entdo set que tal relago ocorre em razio do acaso. 4) Um software de computador deu um valor-p de 0,50, entdo sei que existe somente 50% de chance de essa relacao ser sistemtica, ee es vreer a Nunca Sempre legal: creito absoluto de escotha 749% ( 190 undamentos da Pesquisa em Citmcia Politica ‘Quase sempre legal: algumas a% restrigdes Qusse sempre ilegal somente em circunstancias ‘excepcionais 27% sempre ilegal (O casamento deve ser 7% legalizado ‘Avni civ deveser legalizada, 48% mas noo casamento Nunca reconhecer legalmente 30% ‘asals do mesmo sexo Fa pox i i, ora ene Tie os 57 a al ein Figura 7.5 ~ 0 qu bi dorado com es bel? 3, Observe a Figura 7.5. Qual é a variavel dependente? Qual é a variavel indepen- dente? O que essa tabela nos diz sobre politica? 4, O que torna a Figura 7.5 tio confusa? 5, Conduza uma anilise tabular a partir da informagio apresentada na seguin- i} te discussio sobre um resultado de uma pesquisa hipotética: “Realizamos um survey com oitocentos entrevistados que tinham maior probabilidade de seresn leitores do partido democrata em seu estado. Entre esses entrevistados, 45% tram favoriveis a Obama, enquanto 55%, a Clinton, Quando dividimos os en trevistados a partir da mediana da idade (40 anos), encontramos algumas nitidas diferengaw entre a metade mais nova da amostra, encontramos que 72.2% eram favoraveis a Obama ser nomeado candidato do partido democrata e, entre a me- | tade mais velha dos entrevstades, encontramos um apoto de 68,2% a Clinton el ‘Tete bivariado de hipdtese 191 6. Para o exemplo do exercicio 5, teste a teoria de que a idade esta relacionada & preferéncia sobre qual candidato democrata deve ser indicado. 7. Muitas pessoas nos Estados Unidos pensam que o escindalo do Watergate em 1972 causou uma grande mudanga na forma como os cidadaos americanos vem politicos incumbentes. Use os dados da Tabela 7.12 para produzir um teste de diferenca de médias da hipétese nula de que o indice de reeleigao média é igual para o periodo antes e o periodo depois do escindalo do Watergate, Em. razio do momento no tempo em que as eleigdes e o escindalo aconteceram, a eleigao de 1972 deve ser codificada como pré-escindalo, Faga esse teste para a Camara e para o Senado, Mostre todos os célculos. Tabla 7.12 ~ Tos de eleigo dosincmberts nos legs pao o Congress nos Estados Unies, 1964-2006, | 8. Utilizando 0 banco de dados “BES2005 Subset’, produza uma tabela que mostre a combinagio dos valores para as variaveis “LabourVote” (Y) e “IraqWarAp- provalDich’ (X), Leia a descrigo dessas duas varidveis ¢ escreva o que essa tabe- ee “ 9, Utili 192 Fundamentos da Pesquisa em Ciencia Politi a nos diz sobre a politica no Reino Unido em 2005, Calcule o teste de hipotese x? para essas duas variiveis, Escreva 0 que essa andlise diz. sobre a politica no Reino Unido em 2005. indo 0 banco de dados “BES2005 Subset’ teste a hipdtese de que os valo- res para a variavel “BlairFeelings” (¥) sao diferentes entre os valores da variavel “[raqWarApprovalDich” (X). Leia a descrigdo dessas duas variaveis e escreva o {que essa tabela nos diz sobre a politica no Reino Unido em 2005. 10. Utilizando o banco de dados “BES2005 Subset’, produza um grafico de disper. so para os valores das variaveis “BlaitFeelings” (Y) ¢ “SelfLR" (X). Calcule o coeficiente de correlagio e 0 valor-p para a hipotese de que essas duas variaveis estio relacionadas. Leia a descrigio dessas duas varidveis e escreva 0 que essa tabela nos diz sobre a politica no Reino Unido em 2005.

You might also like