You are on page 1of 6
Andlise de Variancia Simples (One-Way ANOVA) Pretende-se testar se determinado factor, quando aplicado a varias populacdes, tem um feito significative sobre determinada varidvel dependente, ou seja, se faz com que as médias populacionais da vatiével dependente sejam diferentes para os diferentes niveis do factor independente Considetemos k amostras independentes das populagdes Xi, Xo, , Xz (ou grupos de uma mesma populagao): Amostra 1 Amostra 2 Amostra ke Mu m2 Xk Xt X22 Xk ut Ya? Tak Sendo xy — valor observado no i-ésimo elemento (i= 1, ..., 4) da j-ésima amostra (j= 1, .. , 4) 7) —n° de elementos no grupo ou amostra j Admitamos que as populagdes de onde se retiratam as amostras seguem distribui¢ao normal com variancias desconhecidas mas iguais, ie, X, 0 N(w,,.0) comf=1,..4k A Anilise de Varidncia é um método estatistico que permite testar se existem diferengas entre 2 ou mais grupos de uma mesma populagdo ou de populagdes diferentes. Assim, as hipéteses a testar so: HO: y= fy =o. My Hi: y, # m4, para algum par (7, ), 7 #7 (%,7=1, .. , A), isto 6, existe pelo menos 2 grupos cujas médias sejam diferentes entre si ara rejeitar HO basta que apenas 2 médias sejam diferentes. Catarina Marques ISCTE A Anilise de Varidncia envolve alguns pressupostes, pelo que sé pode ser aplicada quando se verificam os seguintes requisitos: a) As k populacdes tém distribuigdo normal; b) As k populagdes tém a mesma varidncia; ©) As k amostras recolhidas so aleatérias ¢ independentes Embora o nome do método seja Andlise de Varidncia, as hipoteses a testar, como vimos, respeitam 4s médias dos k grupos e nao as variancias Estas iltimas sfo utilizadas para definir a estatistica de teste. Para se encontrar esta estatistica ¢ necessério comecar por decompor a variancia total ou a vatiagdo total (soma total de quadrados) numa soma de 2 parcelas: a variagiio explicada pelo factor independente e a variagao nfo explicada por esse factor (que & devida ao eno). Pretende-se, assim, avaliar a importincia de cada componente na varingdo total ¢ verificar se as diferengas encontradas entre as médias de cada grupo de observagdes sdo diferencas reais devidas a fontes controlaveis de variacao (factor independente) ou se se devem a fontes alcatérias e devem ser desprezadas. Média amostial de cada giupo j Média global — média de todos os valores observados no considerando a divisao por grupos MF +X, tt ME m+n, + +n, Indicador da variabilidade dentro dos grupos (devido ao eto) my ss -3. $o,-2 iat fe ‘Sion of squares within groups (soma dos quadrados dentro dos grupos) A $ Ee-x) n-k Mean sum of squares within groups (média quadtitica dentro dos grupos) MSSW = Catarina Marques ISCTE Indicador da variabilidade entre os grupos (devido ao factor independente) x}n, +. +(3,-3) a, “26 -x)n, ‘Sum of squares between groups (soma dos quadtados entre grupos) MSSB k-1 Se —sha, Mean sum of squares between groups (médi quairitica entre grupos) Estatistica de Teste paket, MSS n-k nk, MSSW ‘ete k) Para um dado @, rejeita-se HO pata valores da estatistica de teste superiores ou igual ao quantil de probabilidade (1- @) da distribuicdo Fy.4.2)- Isto porque s6 faz sentido rejeitar a hipétese de igualdade das k médias populacionais para valores elevados de 7, valores esses que ocomem quando a variaglo entre grupos (devido ao factor independente) for relativamente elevada quando compatada com a variagdo dentro dos ‘grupos (devido ao erro) E comum organizar os dados de uma Anilise de Variancia num quadio onde se apresenta as somas dos quadrados, o n° de graus de liberdade a elas associado e as médias quadraticas comespondentes a cada fonte de variagdo: Fontes de | Somados | Graus de Médias | Estatistica de Teste Variagio | quadrados | Liberdade | quadriticas En : mine SSB ei use 5 |p SB (explo po 1 ssw fern) Dentro SSW “E i ssw - 5 Cawdor ao aig Total T= ml SSB+tSSW Catarina Marques ISCTE Como representa —Vaisbilidade entre os grupos vatiabilid ade dentro dos grupos’ © Quanto maior for T, com maior probabilidade as médias sio diferentes; © Quanto menor for T, com maior probabilidade as médias so iguais; © Quando as médias da populagdo forem iguais, 7 tende para zero. Se 0 valor do teste for grande, suspeita-se da veracidade de HO, porque é mais provavel que para grandes valores do teste H0 seja falsa Catarina Marques ISCTE Consideremos trés amostras, cujas distribuigées esto representadas a vermelho, a azul ea verde, A média de cada amostra esta identificada pela linha vertical eo ‘Sw respectivo pela linha horizontal. Consideremos as trés amostras em conjunto, a média geral e a respectiva medida de disperséo SB (representadas a cinzento). Analisemos alguns cenérios: I - Caso a disperséo dentro dos grupos (SW:t) se mantenha mas as médias de cada amostra estejam mais afastadas entre si, aumenta a dispersio entre os grupos (SB). variabilidade entre as médias dos grupos idade dentro dos grupos F aumenta, logo é maior a probabilidade de rejeitar Ho, isto é, de as médias serem diferentes. Catarina Marques ISCTE TI - Mantendo @ média das amostras e diminuindo a dispersdo dentro dos grupos (swe), Fig variabilidade entre as médias dos grupos variabilidade dentro dos grupos F aumenta, logo € maior a probabilidade de rejeitar Ho, isto é, de as médias serem diferentes. ur- Fig4 ‘Comparemos as figuras 2, 3 ¢ 4. O valor de F sera maior nesta ultima? Quanto menor a “sobreposig&0” entre as amostras, maior serd o valor de F, logo mais provavelmente o teste indicaré significancia estatistica Catarina Marques ISCTE

You might also like