You are on page 1of 8

Prof.

Eduardo Ramires Estatstica TEXTO DE APOIO - 2009 Estatstica Prtica


de Geraldo Maia Campos

19. Filosofia de alguns testes estatsticos


A. Testes paramtricos, para duas amostras (independentes ou vinculadas). 1. Filosofia do teste t de Student. Uma populao definida por dois parmetros: a mdia e o desvio-padro, que so nicos para essa populao como um todo. Entretanto, a Estatstica no lida com populaes inteiras, mas utiliza subconjuntos dessas populaes, aos quais chama amostras. Como as amostras envolvem um nmero reduzido de elementos representativos da populao da qual fazem parte, natural que a sua mdia e o seu desvio-padro difiram alguma coisa em relao aos parmetros da populao considerada em seu todo. Os mtodos estatsticos visam a possibilitar que se possam tirar concluses sobre os parmetros populacionais, partindo de informaes obtidas a partir de amostras dela retiradas. Como a mdia e o desvio-padro das amostras, mesmo pertencendo estas mesma populao, sempre divergem alguma coisa em relao aos parmetros reais da populao, compreensvel que, se forem traados os grficos das distribuies amostrais e da populao original, por certo haver alguma discrepncia entre todos eles. Como as amostras pertencem todas mesma populao, e mesmo assim h diferenas, natural que a variao decorrente da prpria variabilidade casual da amostragem deva ser considerada, ao se avaliar a igualdade entre os parmetros da amostra e os da populao original, ou mesmo entre os de duas amostras entre si. Em resumo: preciso respeitar uma certa faixa de variao, dentro da qual as amostras so consideradas como provindas de uma mesma populao, ou como iguais entre si. Os testes estatsticos em geral, e entre eles o teste t, visam a estabelecer precisamente os limites alm dos quais duas amostras j no devam ser consideradas como retiradas de uma mesma populao, e sim como pertencentes a populaes diferentes. Quando as amostras comparadas so independentes, o teste t destina-se a verificar se mesmo assim pertencem mesma populao, apenas com variaes casuais de amostragem. Quando so vinculadas, visam a verificar se algum tratamento realizado teve o dom de modificar os parmetros amostrais, fazendo nascer assim uma nova populao, com parmetros tpicos diferentes da inicial.

B. Testes paramtricos, comparaes mltiplas. 2. Filosofia da anlise de varincia (fatores de variao independentes). Para entender a anlise de varincia, preciso distinguir dois conceitos fundamentais: a) varivel e b) fator de variao. Varivel: a medida pela qual alguma coisa avaliada, tal como o peso, a altura, a rea, o volume, o teor de alguma substncia, etc. Fator de variao: tudo aquilo que faz a varivel realmente variar. Por exemplo, um tratamento que faa variar o peso, a altura, o volume, o teor de glicose no sangue, etc. A varivel sempre uma s, mas o fator de variao pode ser mltiplo. De fato, fatores diversos podem atuar ao mesmo tempo, influindo todos sobre uma caracterstica qualquer da amostra. A filosofia do teste admite que o efeito final dos mltiplos fatores de variao que atuam ao mesmo tempo sobre uma varivel pode ser decomposto e analisado por partes (da o termo anlise aplicada ao teste). Esses efeitos parciais referem-se a trs tipos de variao: a) a variao causada pelos fatores intencionalmente introduzidos no experimento, at certo ponto controlada pelo pesquisador; b) a variao determinada pelas possveis interaes entre alguns ou entre todos esses fatores experimentais controlados; e c) a variao ocasional, no-controlada, decorrente de causas estranhas, muitas vezes desconhecidas, que em conjunto constituem o erro experimental, presente em qualquer ensaio. O erro experimental chamado de variao residual, ou simplesmente resduo importantssimo, porque por ele que se mede a significncia estatstica de um experimento. A significncia estatstica no mais do que uma comparao entre a variao experimental controlada e a variao no-controlada (erro). A filosofia geral do teste muito simples: ela admite que, se um fator de variao realmente ativo num experimento, os seus efeitos aparecem e podem ser isolados, mesmo quando diversos fatores atuam simultaneamente. A varincia final do experimento seria, assim, uma adio de trs varincias separveis: a dos fatores principais, a de suas interaes, e a do erro. Na anlise de varincia com mltiplos fatores, chamados estes de critrios de variao, ou de classificao, cada fator (ou interao) analisado separadamente, ignorando-se os demais, considerados estes, para todos os efeitos, como simples repeties. Por exemplo: se forem estudadas duas drogas (A e B), administradas em duas circunstncias diferentes (C e D), ao se analisarem os efeitos das drogas A e B, o dados de C e D so classificados apenas em relao a A ou a B. O efeito conjugado droga/circunstncia seria analisado tambm, claro, mas como um fator secundrio denominado interao. O nmero de fatores de variao estudados deve limitar-se a 3 no mximo, porque o nmero de interaes possveis aumenta consideravelmente com nmeros maiores, uma vez que a quantidade de varincias a serem analisadas dada pela equao: N = 2n - 1, onde N o nmero de varincias, e n o nmero de fatores de variao. Um excesso de varincias (principalmente de interaes) leva a um emaranhado de interligaes, quase

sempre de difcil interpretao. Num ensaio com 5 variveis, por exemplo, o nmero de varincias a serem estudadas seria: 25 - 1, ou seja, 32 - 1 = 31 varincias! 4. Filosofia da anlise de varincia (1 fator de variao com repeties). A anlise de varincia geralmente envolve uma amostra populacional equilibrada, na qual os grupos estudados tm um nmero igual de repeties, principalmente quando h diversos fatores de variao (ou critrios de classificao dos dados) envolvidos. Todavia, quando h apenas um fator de variao, ou seja, quando o conjunto de dados consiste de vrios grupos que devem ser comparados entre si, possvel realizar uma anlise de varincia desse conjunto de dados, mesmo que cada um dos grupos tenha um nmero diferente de repeties, o que ocorre freqentemente. Esses grupos poderiam ser comparados dois a dois, pelo teste t de Student, por exemplo, mas isso s vezes envolve a realizao de um grande nmero de testes, dependendo do nmero de grupos a serem comparados. A anlise de varincia tem a vantagem de comparar todos os grupos com um nico teste. Quando uma pesquisa envolve mais de um fator de variao, ainda que a anlise de varincia no seja de todo impossvel, ela seria muito complicada. Mais prtico ser ento usar amostras equilibradas, onde todos os grupos tenham o mesmo nmero de repeties. Testes no-paramtricos, amostras independentes (uma s varivel, duas amostras comparadas). 5. Filosofia do teste de Mann-Whitney. Se duas amostras forem retiradas ao acaso de uma mesma populao, a ordenao crescente e conjunta dos dados das duas amostras tende a mistur-los uniformemente. Isso faz com que os dados se encaixem de maneira eqitativa, tal como se intercalam os nmeros pares e mpares na seqncia natural dos nmeros reais. medida em que os valores ordenados das duas amostras se separam e se afastam, a probabilidade de elas pertencerem mesma populao vai se tornando cada vez mais remota. Os valores de U calculados pelo teste avaliam o grau de entrelaamento dos dois conjuntos de valores numricos confrontados. O caso extremo ocorre quando as duas amostras j no se intercalam isto , so disjuntas o que indica tratar-se de amostras provindas de populaes diferentes. A disjuno dos dados traduz a significncia estatstica mxima do teste, e ocorre quando o U menor igual a 0 (zero). 6. Filosofia do teste da mediana (para 2 amostras). O teste da mediana visa a verificar se duas amostras diferem em relao s suas tendncias centrais, uma vez que a mediana e o valor que marca o centro da distribuio amostral. Assim, o teste exige que as amostras possam ser pelo menos passveis de uma ordenao por valores ascendentes dos dados, para que se possa calcular o valor que divide o conjunto de dados das amostras reunidas exatamente ao meio, ou seja, com 50% dos dados acima e 50% abaixo desse valor. Esse valor a mediana. A filosofia do teste admite que, se duas amostras provm de uma mesma populao (isto , se so estatisticamente iguais), a mediana do conjunto de dados reunidos no

difere significantemente da mediana de cada uma delas considerada isoladamente. O teste , no final, um teste de (qui-quadrado) em que as freqncias comparadas se referem ao nmero de dados em cada uma das amostras comparadas que se encontram acima ou abaixo da mediana comum, calculada para o conjunto das amostras reunidas. 7. Filosofia do teste do 2 (qui-quadrado), 2 x 2. O teste do 2 (qui-quadrado) um teste que compara freqncias obtidas experimentalmente com freqncias tericas, calculadas matematicamente para o mesmo nmero de dados da amostra. Os dados devem portanto ser grandezas discretas, isto , alguma coisa que possa ser contada e reduzida a uma tabela de freqncias, tabela essa denominada tabela de contingncia. A tabela de contingncia formada de duas linhas e duas colunas. O grau de liberdade dado pelo produto de (2-1) x (2-1) = 1 x 1 = 1. O teste calcula a relao: quadrado da diferena entre as freqncias obtida e esperada em cada uma das quatro clulas da tabela de contingncia, dividido pela freqncia esperada, e soma esses quadrados. O teste considerado significante quando essa soma ultrapassa determinados valores, relacionados em tabelas apropriadas, valores esses que dependem do grau de liberdade da amostra. Os testes no so exatamente iguais para tabelas com apenas 1 ou mais de 1 grau de liberdade, e por isso essas duas possibilidades so focalizadas separadamente neste programa estatstico (para 2 x 2 ou para m x n freqncias). Alm disso, h uma srie de restries: A. Para 1 grau de liberdade: a) pode ser aplicado para n maior que 40 (n = nmero total de dados); b) para n entre 20 e 40, o teste s pode ser aplicado se todas as freqncias esperadas forem maiores ou iguais a 5; c) se a menor freqncia for menor que 5, ou se n for menor que 20, ser prefervel usar o teste exato de Fisher. B. Para mais de 1 grau de liberdade: a) nenhuma casela pode ter valor menor que 1; b) o nmero de caselas com valores esperados menores do que 5 no pode ultrapassar 20 % do nmero total de caselas; e c) se isso ocorrer, reformule a tabela (somando caselas vizinhas). 8. Filosofia do teste de igualdade entre propores. Esse teste praticamente igual ao teste do (qui-quadrado), com a diferena de que as freqncias so transformadas em propores, dividindo-se as freqncias obtidas em cada uma de duas amostras pelo respectivo nmero total de dados dessa amostra. A finalidade do teste verificar se duas propores podem ser consideradas iguais, quando resultantes de amostragens com nmeros diferentes de dados. Por exemplo: ser que as propores de 34 dados numa amostra com 147 dados, e de 167 dados em outra com 985 dados, seriam iguais? As duas propores so respectivamente 0,23129 e 0,16954. Seriam elas estatisticamente eqivalentes?

Nesse caso, a resposta poderia ser dada tanto por este teste como por um simples teste de . numa tabela 2 x 2. Pode ocorrer, entretanto, que numa ou outra circunstncia no se possa usar o teste do . Nesse caso, o teste da diferena entre duas propores poderia ser utilizado, como uma alternativa para o teste do . Este teste, todavia, tem tambm as suas restries, tal como as tem o prprio teste do . Assim, como ocorre no , convm que as amostras sejam grandes, de tal modo que as freqncias obtidas (Fn), ou os seus complementos (NFn), sejam todas maiores que 5. O teste do tambm faz o mesmo tipo de exigncia. A nica diferena que o teste entre propores no tem a correo de Yates. Diante disso, toda vez em que for possvel, prefervel usar o teste do ou, se as freqncias forem muito pequenas, o teste exato de Fisher. Outra opo usar a distribuio de Poisson (para eventos raros). Um evento considerado raro quando sua probabilidade de ocorrncia est prxima de 0 (zero). Praticamente, considera-se raro o evento cuja ocorrncia de 5 vezes (ou menos) em 50 (ou mais) tentativas (p 0,1). Isto , quando a probabilidade de 1 evento x o nmero de tentativas (n) igual a 5, ou menor que 5 (p.n 5). 9. Filosofia do teste de Fisher. O teste exato de Fisher testa diferenas entre dois grupos independentes (G1 e G2), em relao a uma varivel qualquer que s admita duas alternativas como resposta: Sim/ No, Positivo/Negativo, ou +/. Isso leva construo de uma tabela de contingncia 2 x 2. O teste basicamente um (qui-quadrado), porm o teste de Fisher particularmente adequado para pequenas amostras (com 20 dados ou menos), caso em que o teste do estaria contra-indicado. Em compensao quando o nmero de dados da amostra grande, o teste de Fisher que no deve ser usado, porque envolve o clculo de fatoriais, o que pode conduzir a nmeros excessivamente elevados. Nesses casos, a opo deve ser pelo teste do . Testes no-paramtricos, amostras vinculadas (uma s varivel, duas amostras comparadas). 14. Filosofia do teste de Kruskal-Wallis. O teste de Kruskal-Wallis uma espcie de anlise de varincia a um critrio de variao, para dados amostrais independentes. Por exemplo: a superfcie de n corpos-de-prova construdos com k marcas comerciais de gesso para modelos seria igualmente lisa? A varivel testada, nesse caso, o grau de lisura da superfcie dos corpos-de-prova, e o nico fator que faz essa varivel alterar os seus valores a marca comercial dos gessos. O erro experimental dado pela variao casual determinada por diferenas eventuais ocorridas durante a confeco dos diversos corpos-de-prova (repeties) que constituem a amostra referente a cada um dos materiais envolvidos. A filosofia do teste considera que, se os materiais forem todos igualmente lisos, a

nica variao ser aquela decorrente dessa variabilidade natural, que sempre existe, mesmo entre elementos de uma mesma populao. O teste no utiliza os valores numricos diretamente, mas sim os postos que eles ocupam numa srie de dados ordenados por valores crescentes, srie essa que rene num s conjunto os dados de todas as amostras que vo ser comparadas. Os dados so introduzidos amostra aps amostra. Ainda segundo a filosofia do teste, se as k amostras comparadas provierem da mesma populao (amostras iguais), a mdia dos postos correspondentes a cada amostra ser aproximadamente igual. Se isso no ocorrer, as amostras pertencero provavelmente a populaes diferentes * ou seja, sero diferentes entre si. Embora o teste tenha sido idealizado para testar um nico fator de variao, parece vivel utiliz-lo tambm em casos de mais de um critrio de variao, desde que se faa a anlise de um deles de cada vez, reunindo em grupos todos os dados que tenham em comum esse fator, considerando os demais como simples repeties. 15. Filosofia do teste da mediana (para k amostras). O teste da mediana visa a verificar se duas ou mais (k) amostras diferem em relao s suas tendncias centrais, uma vez que a mediana e o valor que marca o centro da distribuio amostral. Assim, o teste exige que as amostras possam ser pelo menos passveis de uma ordenao por valores ascendentes dos dados, para que se possa calcular o valor que divide o conjunto de dados das amostras reunidas exatamente ao meio, ou seja, com 50 % dos dados acima e 50 % abaixo desse valor. Esse valor a mediana. A filosofia do teste admite que, se duas ou mais amostras provm de uma mesma populao (isto , se so estatisticamente iguais), a mediana do conjunto de dados reunidos no difere significantemente da mediana de cada uma delas considerada isoladamente. O teste , no final, um teste de (qui-quadrado) em que as freqncias comparadas se referem ao nmero de dados em cada uma das amostras comparadas que se encontram acima ou abaixo da mediana comum, calculada para o conjunto das amostras reunidas. 26. Filosofia dos testes de regresso e correlao. O teste de regresso linear e seu complemento natural, que o teste de correlao so testes estatsticos extremamente teis porque permitem estudar o comportamento de duas (ou mais) variveis ao mesmo tempo, buscando detectar uma possvel relao proporcional coerente entre a variao de uma em funo da variao da outra (ou das outras, quando mais de duas). As variveis podem ser as mais heterogneas, ao contrrio de outros testes que, para que duas ou mais amostras possam ser comparadas, exigem que a varivel seja nica. Assim, esse teste de regresso e correlao pode reunir variveis to heterogneas quanto o tamanho das melancias de uma plantao e o teor de clcio ou de potssio do adubo utilizado para fertilizar a terra onde elas crescem. O teste tambm particularmente til quando se deseja avaliar ou comparar tendncias, tais como o comportamento da inflao ao longo do ano, ou a tendncia da queda ou do aumento da inflao num determinado ano, em relao ao de outro ano qualquer.

A regresso linear refere-se sempre linha reta. Contudo, nem sempre a equao matemtica que traduz um fenmeno cientfico se traduz por uma linha reta. Porm muitas delas podem ser reduzidas a uma reta, por meio de transformaes algbricas adequadas. Por exemplo: um determinado fenmeno natural pode ser representado por uma hiprbole, cuja equao matemtica y = 1 / a + bx. Caso se faa a inverso dos termos (y) e (a + bx), obter-se- uma nova expresso algbrica para a mesma igualdade: 1 / y = a + bx. Chamando y' ao termo 1 / y, tem-se: y' = a + bx, que a expresso algbrica da linha reta. Assim, a transformao y' = 1 / y tende a retificar uma linha originalmente curva, como o caso da hiprbole. Essas transformaes, que tornam possvel a regresso linear de algumas curvas comumente encontradas em pesquisa cientfica, o objeto do presente teste. A correlao entre duas variveis expressa por r, cujo valor varia de +1 (correlao direta) a -1 (correlao inversa). O valor r = 0 indica ausncia de correlao. Notas do Ramires: Valor mximo de P, ou significncia estatstica, admitido geralmente: P=0,05 (5%). O valor mximo de P 1 (100%). Quanto menor o valor de P ( ou erro tipo I), menor a chance de erro ao rejeitarmos a hiptese nula (H0), ficando portanto com a hiptese alternativa (H1). A Hiptese nula (H0) a hiptese da igualdade, que afirma no haver uma diferena significativa ou relao significativa entre os grupos comparados. A Hiptese alternativa (H1), afirma o oposto, ou seja, h uma diferena significativa ou relao significativa entre os grupos comparados. Assim, quando aceitamos H1, rejeitamos H0 e vice-versa. O valor crtico de um teste reflete o valor, obtido numa tabela estatstica, de obtermos aleatoriamente um determinado valor (resultado) no teste estatstico. O valor obtido pode ser comparado ao crtico, para escolha de hipteses a serem consideradas. O critrio de escolha de hipteses estatsticas o seguinte, para qualquer teste considerado: Se o P obtido no teste for menor que o nvel de significncia estatstica escolhido (ex: P=0,05; 0,01 ou 0,001, respectivamente 5%, 1% e 0,1% - os mais comuns), aceitamos H1 e rejeitamos H0. Caso contrrio, no rejeitamos H0. Valor P obtido MENOR: Aceita-se a HIPTESE ALTERNATIVA Valor de referncia Valor Pobtido MAIOR: Aceita-se a HIPTESE NULA

P, , erro tipo I

You might also like