You are on page 1of 9
4 Distribuigdo normal ou de Gauss NN distribuicdes de freqiiéncias podem apresentar formas variadas. A varidvel ““niimero de irmaos” tem uma distribuigio descontinua e assimétrica (Figura. 1.3); 0 peso tem uma distribuigdo também assimétrica, mas continua (Figura 1.1); j4 a sensibilidade & feniltiocarbamida apresenta distribuicao assimétrica e bimo- dal (Figura 2.2). Muitas varidveis biolégicas apresentam uma distribuicao equilibrada, em que 0 valores centrais sao mais freqiientes e os extremos, mais raros, sendo os valores muito baixos tao pouco freqiientes quanto os muito altos. Este é 0 caso da taxa de hemoglobina; um exemplo de dados deste tipo (em g/100 mL) est apresentado na Tabela 4.1 e no histograma da Figura 4.1. Quando se elabora um histograma, o tamanho dos “degraus” determinados pelas colunas € dado pela amplitude do intervalo de classe (h), a qual é influen- ciada pelo tamanho da amostra e pela preciso com que a medida foi feita. Assim, se a técnica de laboratério permitir determinar a taxa de hemoglobina com maior precisao (por exemplo, em mg/100 ml. em vez de g/100 mL), pode-se diminuir a amplitude escolhida para os intervalos de classe, com um conseqtiente aumento no niimero de intervalos. Aumentando-se o ntimero de intervalos, os ret”ngulos originais do histograma deverdo ser divididos em retangulos mais estreitos. A forma geral do histograma, porém, ndo se altera com tal procedimento, pois os retangulos tenderdo a ser mais altos A medida que se aproximam do centro da distribuic&o e mais baixos, se préximos dos extremos. Pode-se seguir diminuindo h e obtendo maior ntimero de intervalos de classe até se chegar & situacdo em que ha um nimero infinitamente grande de intervalos TABELA 4.1 Taxa de hemoglobina em 560 homens normais Hemoglobina (g/100 mL) fr 1251-135 0.01 1351-145 0,06 1451-155 0.24 15,5} 16,5 0,38 1651-175 0,23 17,5} 185 0.07 1851-195 0,01 Bioestatistica 39 04 = 03 hr 02 o1 4 Y}) FIGURA 4.1 Taxa de he- 0 LLY LLL moglobina (g/100 mL) em 314 15 16 «17 «1819 560 homens normais. Hemoglobina (g/100 mL) infinitamente pequenos. E claro que esta condicao sé pode ser imaginada teorica- mente € para um ntimero muito grande de individuos. No histograma, agora, a sucesso ascendente e descendente de pequenos “degraus” transforma-se em uma linha continua, com a forma aproximada de um sino. O nome desta linha teérica €curva de distribuigdo normal ou curva de Gauss!. O termo “normal” foi consagra- do pelo uso, embora, muitas vezes, cause alguma confusio ao sugerir que a distri- buicdo normal ocorre apenas em organismos “sadios”, o que nao € verdade. Po- dem-se observar caracteristicas que tém distribuigo normal também em organis- mos doentes. UTILIDADES DA CURVA NORMAL Voltando ao exemplo dos niveis de hemoglobina, para se saber qual a probabilida- de de um individuo do sexo masculino apresentar um valor entre 14,5 e 15,5, basta consultar diretamente a Tabela 4.1 (ou, com menor precisio, a Figura 4.1). O valor obtido € 0,24. Entretanto, se o interesse, agora, é saber a probabilidade de ocorrer um nivel de hemoglobina entre 14,5 e 15,0, € necessério refazer a tabela a partir dos dados originais. Nao € correto tomar a metade de 0,24 (ou a metade da coluna), pois, pela forma do histograma, nota-se que dividindo esse intervalo ao meio, devem resultar duas colunas de alturas diferentes, sendo a da direita mais alta. A situagao complica-se ainda mais quando se deseja determinar a pro- babilidade de que ocorra uma taxa de hemoglobina menor do que 14,3. Uma técnica simples para resolver este tipo de problema baseia-se na curva descoberta por De Moivre, Laplace e Gauss. Para aplicd-la, utiliza-se uma tabela padronizada de dreas situadas debaixo dessa curva. Antes, porém, de usar essa tabela é necessdrio conhecer melhor as principais caracteristicas da curva normal. * Nome em homenagem a Johan K.F. Gauss (1777-1855), que discutiu esta distribuigdio em 1809. No entanto, Pierre-Simon de Laplace (1749-1827), que era astronomo matematico como Gauss, j& a tinha estudado em 1774 e, antes disso, A. de Moivre (1667-1754) apresentou a equagdo dessa curva em 1773, em um trabalho que ficou por muito tempo desconhecido. Para resolver a questéo da prioridade cientifica, Karl Pearson recomendou, que se utilizasse o termo “curva normal”, usado pela primeira vez por Sir Francis Galton. 40 Sidia M. Callegari-Jacques PROPRIEDADES OU CARACTERISTICAS DA CURVA NORMAL (2) Acurva normal? tem a forma de um sino, com caudas assintéticas ao eixo x. Isto significa que, teoricamente, os valores de x podem variar desde - até +00; a curva jamais toca 0 eixo x e, portanto, determina uma figura aberta nas caudas. Na pratica, no entanto, utiliza-se a curva normal com limites finitos; mais adiante ver-se-4 como estes limites sao estabelecidos. (2) Acurva é simétrica em relagao a perpendicular que passa pela média (w). (3) A média, a mediana e a moda sao coincidentes. (4) Acurva tem dois pontos de inflexao, que correspondem a valores de x situa- dos, respectivamente, a distancia de um desvio padrao (0) acima e abaixo da média (Figura 4.2). (5) Adrea sob a curva totaliza 1 ou 100%. (6) Aproximadamente 68% (=2/3) dos valores de x situam-se entre os pontos (u/- 0) e (+ 0). A dtea correspondente a essa fracéo estd hachurada na Figura 4.2. (7) Aproximadamente 95% dos valores de x esto entre (20) € (u+20). (8) Aproximadamente 99,7% dos valores de x esto entre (30) € (w+30). ponto de inflexéo FIGURA 4.2 Curva normal. A area ha- churada esta compreendida entre sce Sg eee eee yste e corresponde a aproximadamente ont os 68% da Area total que fica abaixo da cur- oof & SR 8 va normal. Note que uma drea “A” qualquer sob essa curva representa uma fracio da rea total, correspondente a todos os individuos estudados. Portanto, ‘A’ repre- senta uma porcentagem em relacio ao total de individuos estudados e também a probabilidade de ocorréncia dos valores de x a que se refere. © conhecimento das propriedades de curva normal é muito ttil. Assim, se uma varidvel tem distribuicao normal e se sua média e seu desvio padrao forem conhecidos, nao é mais necessério representar os dados sob a forma de tabelas ou grAficos para se conhecer a probabilidade de ocorréncia de valores de interesse. Além disso, sabe-se imediatamente quais os valores mais fireqiientes e quais os valores extremos esperados. Admita, por exemplo, que a glicemia (nivel de glicose no plasma, em jejum) tem distribuigdo gaussiana, com média igual a 90 mg e desvio padrao 5 mg na populacao de pessoas sadias®. Pode-se, nto, concluir que: ? A curva normal é definida matematicamente pela seguinte equacao: f(x) = oiiz 5 Diciondrio de Especialidades Farmacéuticas, 1997, p.1040, Bioestatistica 41 (1) Aproximadamente 2/3 (68%) da populagio de individuos normais possuem valores de glicemia entre (w—c) = 90-5 = 85 mge (u+o) = 90+5 =95 mg. (2). Grande parte (95%) das pessoas sadias tem glicemia entre (20) = 90- 2(5) = 80 e (u+20) = 90+2(5) = 100 mg. (3) Praticamente todos (+99,7%) os individuos da populagdo tém valores entre (#30) = 75 e (u+30) = 105 mg. (4) Aprobabilidade de que uma pessoa saudavel tenha um valor de glicemia em jejum entre 90 (4) e 95 (+0) é de aproximadamente 0,34. As caracteristicas do modelo de distribuico normal fazem com que ele te- nha ampla aplicacao pratica. E necessdrio, porém, assegurar-se de que a distribui- ao empirica (observada) da varidvel seja normal ou aproximadamente normal. Nao se pode obter conclusdes como as mencionadas acima com dados cujas distri- buigdes sejam diferentes do modelo gaussiano, como o ntimero de irmaos, que apresenta uma distribuigao assimétrica e descontinua. CURVA NORMAL PADRONIZADA OU CURVA NORMAL REDUZIDA As propriedades referentes a areas sob a curva de Gauss foram obtidas de uma curva especial, que tem média s =0 e desvio padrio o =1. Essa curva chama-se curva normal padronizada ou curva normal reduzida, As Areas situadas abaixo desta curva esto tabeladas (Apéndice, Tabela A1). Para evitar confusio, a varid- vel tabelada é denominada s, reservando-se a letra x para representar as varidveis do mundo real. A Tabela A.1 informa dreas entre a média (zero) e um valor de z qualquer. Quando z for 1 (isto é, igual ao), a drea compreendida entre esse valor e a média é 0,3413 ou 34,13%. A drea entre z = -1 e z = +1 é 0,6826, como mencionado na 68 propriedade da curva normal. Para a obtengdo de dreas que no esto entre 0 e z, devem ser realizadas operagées simples de subtragao ou de soma com as areas. Exemplo 1. Qual a drea correspondente a valores de z acima de 2,3? — A curva toda tem drea = 1, portanto a érea a direi- ta de zero é 0,5. 4009 — Na tabela da curva normal, verifica-se que a drea entre s = 0 es = 2,3 € 0,4893. ~ Aarea a direita de 2,3, portanto, é 0,5 — 0,4893 = Lm 0,0107. Exemplo 2. Qual a 4rea compreendida entre z = -1,5 ez =1? noe — Segundo a tabela da curva normal, a drea entre = ose Oez=-1,5 é 0,4332. — A area entre z = Oez = 1 €0,3413, —Portanto, a Area desejada ¢ 0,4332 + 0,3413 = 0,7745. 42. Sidia M. Callegari-Jacques Com auxilio da tabela de areas da curva padronizada, pode-se também de- terminar quais valores de z limitam Areas (percentagens) de interesse pratico. Exemplo 3. Considere-se uma drea B localizada na extremidade direita de uma curva normal e compreendendo 20% da drea total. Que valores de z limitam essa regido? —A tabela da curva normal padronizada apresenta informagGes sobre dreas adjacentes a zero (érea A). Ora, B = 0,20, entdo, A = 0,50 - 0,20 = 0,30. 20 ~ A area tabelada mais semelhante a 0,30 é 0,296, correspondendo area entre 0 e 0,84. Logo, 0 va- lor = 0,84 limita as areas A e B. 77 — Conclui-se ent&o que os valores limitam a Area B. 0,84e%= +0. PARAMETROS DA CURVA NORMAL. A média (4) € 0 desvio padrao (0) sao os pardimetros de uma curva normal, uma vez que sdo suficientes para defini-la completamente. A média é o parametro de tendéncia central ou de posigao, indicando em que ponto da reta real a curva esté centrada; ¢, 0 parametro de dispersao ou variabilidade, informa sobre a forma, se mais larga ou mais estreita, da distribuicio. A Figura 4.3 apresenta trés curvas que auxiliam a esclarecer essas denomina- Bes. As curvas A e B diferem apenas pelas posicdes (definidas pelas médias) em que se encontram na reta real. Jé as curvas B e C tém a mesma média, diferindo pela dispersao dos valores: note que a curva C, com desvio padrao menor, é mais estreita que a B. DISTRIBUIGOES DAS VARIAVEIS NA PRATICA A distribuigéo normal, como uma linha suave, existe apenas teoricamente. Na pratica, o que se observam so histogramas que se aproximam, em maior ou me- nor grau, de uma curva normal. Se o histograma lembra uma distribuicdo normal € se a amostra é relativamente grande, as probabilidades fornecidas pela curva e fr 08 08 04 FIGURA 4.3 Desenhos de tres curvas normais (A, B e ©) que diferem quanto & mé- dia ou ao desvio padrao. Cur vas A: 1-4, 0-1; B: 8, 0-1; C: 4=8, o=0,5 (Fonte: Sokal e Rohif, 1981; p.101). 02 ae a Dear Bioestatistica 43 as freqiiéncias relativas observadas no histograma sao bastante préximas, Por isso, para um grande niimero de varidveis a curva normal constitui uma ferramenta Util, dispensando a elaboracao de tabelas de freqiiéncias para a descri¢ao e 0 céleulo da probabilidade de ocorréncia de valores de interesse. No entanto, existem variaveis de distribuicdo descontinua ou assimétrica (ntimero de irmaos, saldrios, sensibilidade a feniltiocarbamida) para as quais se- ria ingenuidade utilizar 0 modelo de curva normal e esperar conclusdes confid- veis. Para essas varidveis, deve-se procurar outro modelo que se adapte melhor aos dados observados ou tentar transformagées que tornem suas distribuicdes mais proximas de uma normal. Algumas das transformac6es mais usadas so: @ x = x (logaritmo a base 10 de x) ou x’ = In x (logaritmo a base e de x) ae (2) G3) X= x @ vax. As trés primeiras so indicadas para distribuicées com assimetria A direita (isto é, com a cauda da direita mais longa); a tiltima é indicada para corrigir uma assimetria & esquerda. A Figura 4.4 ilustra o efeito de uma transformagio logarit- mica em dados assimétricos. ‘TRANSFORMACAO DE UMA VARIAVEL X EM Z As varidveis observadas na pratica (x) apresentam valores cujas areas nao esto tabeladas. Por meio de uma operagio simples, no entanto, os valores de.x podem ser transformados na varidvel e entdo as areas desejadas podem ser obtidas da tabela da curva normal. 140+ 70 | 9 50: w 2 30, HA 20. vy a) CLM Mn 51 256 46,0 665 869 107.4 189" 2883.77 4'65 CMINP (Coef. de mortalidade neonatal precoce) Ln(CMNP) SN SSX XX 7 Numero de municipios Numero de municipios SSCS FIGURA 4.4 Efeito da transformagao logaritmica. Histogramas do coeficiente de mortalidade neo- natal precoce (CMINP: numero de ébitos na primeira semana de vida/1000 nascidos vivos) e do logaritmo do CMNP, em 240 municipios com CMINP maior do que zero. (Fonte: Coordenadoria de Informagées em Saude, Secretaria Estadual da Satide, Governo do Estado do Rio Grande do Sul; dados de 2000.) 44 Sidia M. Callegari-Jacques A maneira de transformar x em z é: onde se c'sio a média e 0 desvio padrao populacionais para a variavel x. Obtengao de uma area compreendida entre dois valores de x Exemplo 4. Um treinador deseja selecionar, dentre os jovens que esto prestan- do servico militar no quartel Q, aqueles com uma estatura de no minimo 180 cm, para formar um time de basquete. Que percentagem é esperada de jogadores em potencial, sabendo-se que a estatura tem distribuicio normal e, nesses jovens, a média 6 175 cm e o desvio padrao, 6 cm? Para melhor visualizar o problema, inicia-se desenhando a curva normal cor respondente & estatura, localizando a média e o valor 180 cm, e hachurando-se a rea de interesse, que fica A direita de 180 (Figura 4.5). A seguir, transforma-se a varidvel estatura (x) na varidvel padronizada z, que est indicada na linha inferior a x. : (estatura) 175 180 om $$ (variivel padronizaca) 0 083 z FIGURA 4.6 Representagao, em curva normal, das estaturas de recrutas do quartel Q. Para x = 175, = (175 -175)/6 = 0. Para x = 180, = 0,83. A area entre z = 0 e z = 0,83 é 0,2967 e a drea além de 0,83 é (0,5 - 0,2967) = 0,2033. Portanto, 20,33% dessa populaco sao constitufdos de individuos com esta- tura igual ou superior a 180 cm. Se 140 jovens estio prestando servico militar no quartel Q, o niimero esperado de rapazes que pode ser convidado para participar do time de basquete é 20,33% de 140: 0,2033 x 140 = 28,46, isto é, 28 jovens. Bivestatistica 45 10% (precoces) FIGURA 4.6 Representacao ‘esquematica dos tempos de x(horas) — emergéncia em Drosophila as z melanogaster. 1,28 0 ‘Obtencao dos valores de x que limitam uma aréa conhecida No estudo da genética do desenvolvimento da mosca-das-frutas Drosophila mela- nogaster, um procedimento importante consiste em criar uma populacao de indi- viduos precoces para o desenvolvimento, isto é, aqueles que emergem antes dos demais. 0 tempo decorrido entre a ovoposicao e a emergéncia do adulto, na se- giténcia ovo-larva-pupa-adulto, é de 273 horas em média, com desvio padrao de 20 horas (Nascimento, 1992). Suponha que um geneticista deseje selecionar 10% da populagio, correspondendo aos individuos que emergem por primeiro, para desenvolver uma populagdo “precoce” (Figura 4.6). Qual o tempo-limite a partir do qual os individuos que nascem nao interessam mais ao pesquisador? A tabela da distribuicao mostra que s = -1,28 € 0 valor que separa, na curva normal, uma érea caudal correspondente a 0,10 unidades de drea e outra, adjacente 4 média, de 0,40. Transformando z em x, obter-se-d 0 tempo de desen- volvimento que limita uma rea caudal de 10% a esquerda da curva de tempos de emergéncia, conforme desejado. Da formula de transformagio (z = (x-)/o), obtém-se que 1,28 20 -25,6 = x-273 logo, x 25,6 + 273 = 247,4 = 247 h. Portanto, os individuos que levarem mais de 247 horas para se tornarem adultos serio descartados, e 0 pesquisador usard as moscas cujo tempo de emergéncia é 247 horas ou menos para desenvolver a populacio considerada “precoce”. INTERPRETAGAO DE z No quartel Q, um recruta com 181 cm de altura tem uma estatura situada a um desvio padrao (6 cm) acima da média (175 cm), enquanto uma estatura igual a 169 cm estd a um desvio padrao abaixo da média, 0 que pode ser facilmente visto usando-se a formula de transformagao de x em s: z(para 181) = (181-175)/6=1 e z(para 169) = (169 -175)/6 = -1. Portanto, z pode ser interpretado como o miimero de desvios padrao envolvi- dos no afastamento de um determinado valor de x em relagao d média. Em outras 46 Sidia M. Callegari-Jacques palavras, s é a diferenca, em unidades de desvios padrao, entre um valor dex e a média. Assim, 163 cm é um valor de estatura que est dois desvios padrio abaixo da média e 178 cm esta meio desvio padrao acima da média, na populacao de recru- tas desse quartel. Osservacdo: 2 é também conhecido como o valor de x padronizado. APLICAGGES PRATICAS Aplicagao 1. Nos vestibulares da Universidade Federal do Rio Grande do Sul, calcula-se, para cada candidato (e para cada prova), um escore padronizado (E) do seguinte modo: E =z (100) + 500. Ovalor de z é multiplicado por 100 para evitar valores muito pequenos, que dificultam a classificacéio, e a constante 500 é somada para evitar valores negativos. Suponha que um candidato acertou 6 questdes a mais do que a média em duas matérias: matemitica e biologia. Em matematica, a média geral dos candi- datos foi 9 questdes corretas e 0 desvio padrao foi 4. Na prova de biologia, a média de acertos foi 11 e o desvio padrao, 5. Em que prova o aluno teve melhor desempenho relative? Em matematica, 0 candidato acertou 15 questées, entio yar = (15 - 9)/4 = 1,5, logo, Eyar = 1,5 (100) + 500 = 650. Em biologia, 0 candidato acertou 17 questées, entdo 4510 = (17 - 11)/5 = 1,2, logo, Eng = 1,2 (100) + 500 = 620. Conclui-se que esse aluno, quando comparado com os demais candidatos, teve melhor desempenho na prova de matematica. Aplicagao 2. Com o aumento da idade, especialmente apés a menopausa, as mulheres apresentam uma progressiva perda de massa 6ssea, que favorece a ocorréncia de fraturas na coluna lombar e no colo de fémur, Em vista disso, mui- tos ginecologistas costumam pedir as pacientes com idade superior a 50 anos que realizem um teste de densitometria éssea, com 0 objetivo de avaliar a perda de massa éssea, Os resultados apresentados pelo densitémetro sao valores de 2, isto 6, des- vios padronizados em relagao & média para mulheres de mesma idade que a p2- ciente. Valores de z negativos indicam que a paciente apresenta uma massa éssea abaixo da média para sua idade. Um diagnéstico de osteoporose ¢ feito se 0 valor de densidade mineral éssea estiver a mais do que 2,5 desvios padrao abaixo da média para uma mulher adulta jovem (ver, por exemplo, Krahe, 1995).

You might also like