You are on page 1of 13
O uso de escalas de avaliagao de sintomas psiquiatricos CLARICE GORENSTEIN YUAN-PANG WANG Aavaliagao clinica em satide mental é influenciada pela subjetividade do avaliador ou do autorrelato dos pacientes, 0 que resulta em falta de fidedignidade entre os testes. No fim do século XIX e inicio do século XX, trabalhos de psicologia experimental inauguraram a psicometria ¢ suas aplicaées como um ramo cientifico. Os primeiros trabalhos propunham-se a medir a inteligéncia. Acreditava- se, A época, que a capacidade intelectual seria resultado de um conjunto de caracteristicas simples, como o diémetro da cabega, a velocidade dos reflexos, a acuidade visual, etc. A discriminagao sensorial seria a base do desempenho intelectual (Erthal, 1987). Varios psicometristas contribuiram significativamente com a teoria e a aplicagao de modelos matematicos 4 mensuraco de personalidade, atitudes, crengas ¢ desempenho académico. A introdugdo de psicofarmacos para tratar transtornos mentais, na década de 1960, impulsionou o desenvolvimento de medidas confidveis, validas ¢ livres de erros para documentar os efeitos dos medicamentos sobre eventos psiquicos. Escalas amplamente adotadas até hoje, como a Escala de Avaliag&io de Depressiio de Hamilton (HAM-D) ¢ 0 Inventério de Depressiio de Beck (BDI), por exemplo, foram construidas nessa época. A psicometria estuda a construgdo tedrica e técnica de mensuragiio educacional ¢ psicolégica, objetivando: a. aconstrucdo de instrumentos e procedimentos de mensuracdo b. 0 desenvolvimento e o refinamento de abordagens tedricas de mensuragdo ‘As principais evidéncias da aplicabilidade das escalas de avaliagdo baseiam-se na confiabilidade e na validade (Pasquali, 2003). Diante da expansio da neuropsicologia na pratica clinica, cada vez mais os neuropsicélogos esto recorrendo a testes psicométricos para prever o fimcionamento comportamental, localizar correlatos anatémicos, bem como distinguir o funcionamento cognitive normal do patolégico. Este capitulo introduz os principais aspectos tedricos e praticos do uso de escalas de avaliagio de sintomas psiquidtricos a partir da psicometria. CONCEITO DE ESCALAS DE AVALIACAO De forma semelhante ao conceito usado para definir uma medida em epidemiologia — atribuigaio de mimeros a objetos ou eventos de acordo com alguma regra -, uma escala de avaliagdo é um instrumento de medida composto por um conjunto de simbolos ou nimeros que podem ser aplicados de acordo com regras preestabelecidas, para quantificar e operacionalizar determinadas caracteristicas (Stevens, 1946). Em psiquiatria ¢ psicologia, a operacionalizagaio de um construto (comportamento, habilidade, capacidade) depende de sua finalidade. Para fins de diagnéstico, dispde-se de entrevistas que auxiliam 0 clinico a formular uma hipétese com base no conhecimento da constelagao de sinais ¢ sintomas do quadro clinico. Algumas escalas, construidas considerando os critérios diagnésticos de um determinado transtorno mental, permitem avaliar a probabilidade de sua presenga, no entanto, sempre ha necessidade de julgamento clinico para definir 0 diagnéstico. Instrumentos mais especificos, tais como exames laboratoriais ou de imagem, ou testes neuropsicolégicos que mensuram determinado dominio de interesse (p. ex., alteragao de meméria, atengao em quadros de declinio cognitivo), podem confirmar a alteragao suspeita, TIPOS DE ESCALAS DE AVALIACAO ‘As escalas de avaliagdo podem ser classificadas de acordo com diferentes critérios. Em relagao a quantificagao numérica, podem ser de quatro tipos, os quais apresentam uma hierarquia relativa a sua capacidade de representagao (Stevens, 1946). A mais simples ¢ limitada ¢ a escala nominal, que permite identificar apenas as categorias. A seguinte é a escala ordinal, que permite diferenciar patamares. A escala intervalar possibilita 0 posicionamento de valores em relago a um ponto arbitrério. A escala proporcional, por fim, & a que tem mais atributos, de modo que permite a comparagaio de valores em termos absolutos (‘Tab. 5.1). ‘TABELAS.1 * Caracteristicas das escalas numericas de medida Escala Origem —_Intervalo_Axiomas _Tnvarliincias Liberdades Trans formagies permitidas Es 8 apropriadas Nominal Nao natural Desigual _ Identidade ‘Ordem Permutagao Frequéncias Intervalo Origem Unidade Ordinal “Natural —“Desigual-—Adentidade—Ordem Intervalo Monot6nicacrescente Nao paramétricas Ordem Origem Unidade Tntervalar Nao natural Equivalent Identidade — Ordem Origem Linear do tipo Paramétricas Ordem Intervalo —Unidade sy =at bx Aditividade Prosporcional Natural Bquivalente Identidade —Ordem Unidade Linear do tipo Média geométrica, Ordem Intervalo y=br cocticiente de variaga0, Aditividede _Origem logaritmos Em relag&io a metodologia da aplicagao das escalas, a técnica de coleta de dados ainda mais utilizada é a de papel e ldpis (PAPI, paper and pencil interview), mais comum na avaliagao de atitudes por envolver apenas algumas folhas impressas da escala. A coleta de dados por meio de computador (CAPI, computer-assisted personal interviews) ou telefone (CATI, computer-assisted telephone interviews) esti cada vez mais difundida, sendo adotada em pesquisas que envolvem grande nimero de sujeitos De acordo com o respondedor, as escalas podem ser de autoavaliagaio ou de autopreenchimento, quando sao preenchidas pelo préprio sujeito; ou de observador, quando o aplicador deve pontuar a existéncia e/ou intensidade dos sintomas. Nesse caso, os avaliadores devem ter experiéncia no fenémeno observado, conhecer conceitos tedricos dos construtos subjacentes aos instrumentos e bom treino no seu uso, para que os dados obtidos sejam compardveis entre diferentes aplicadores. As escalas de autoavaliagdéo tém uma série de vantagens: sdo simples de administrar, econémicas, nao necessitam de entrevistador habilitado nem de programas de treinamento ou estudos de confiabilidade entre os aplicadores, além de sofrerem pouca interferéncia da expectativa do entrevistador (viés) na avaliagdo. Elas complementam a avaliagio do observador pela ética do respondente. Entre suas desvantagens, esto a possibilidade de falseamento de resultados (omisséo ou exagero, intencional ou nao), a necessidade de cooperagao do respondente e a dependéncia de seu nivel de escolaridade. A capacidade de compreensao é essencial para o preenchimento adequado das escalas de autoavaliacao. De acordo com natureza da resposta, as escalas podem ser classificadas em discretas ou analégicas. Nas discretas, as respostas sdo representadas por categorias intervalares para avaliar determinado estado. Nas escalas analdgicas, o sintoma é avaliado em uma linha reta continua. Quando representa toda a gama de um tinico fenémeno, ¢ denominada unipolar (p. ex., intensidade de dor, expressa como de nenhuma a muita dor). As escalas analdgicas visuais sao bipolares quando nos extremos da linha de 100 mm estio dois adjetivos opostos (p. ex., alegre e triste, tranquilo e preocupado). As escalas analégicas podem ser construidas de acordo com os objetivos do avaliador, mas dependem de seu treinamento para preencher as escalas. Esse tipo ¢ apropriado para avaliar diferentes estados subjetivos, como humor e ansiedade. MODELOS DE ESCALAS DE AVALIACAO Entre os modelos mais comuns de escalas de mensuragao de atitude estao a Escala Aditiva de Likert, a Escala Cumulativa de Guttman e a Escala de Diferencial Semantico de Osgood. Escala de Likert A Escala de Likert (Likert, 1932) é usada em pesquisas de opiniao, nas quais os respondentes apontam seu nivel de concordancia com uma afirmagdo. Os itens contém respostas gradativas, baseadas em critérios, tais como frequéncia ou ocorréncia (sempre, geralmente, as vezes, raramente, nunca), concordancia ou opiniéo (concordo totalmente, concordo parcialmente, no concordo/nem discordo, discordo parcialmente ¢ discordo totalmente), grau de satisfagao (totalmente satisfatério, parcialmente satisfatorio, indiferente, parcialmente insatisfatério, totalmente insatisfatério) e avaliagdo ou apreciag&o (timo, bom, regular, ruim, péssimo). Normalmente, sao usados cinco niveis de respostas, apesar de alguns pesquisadores optarem por usar sete ou nove niveis. A Escala de Likert representa a somatoria das respostas dadas a cada item. As vezes, os itens sio acompanhados por uma escala visual analdgica de marcagao. Apesar de a Escala de Likert ser de facil aplicagdo, esta sujeita a alguns tipos de viés. Quando os sujeitos evitam escolher respostas extremas, “concordo totalmente” ou “discordo totalmente”, ocorre 0 viés de tendéncia central. O viés de aceitagdo ou aquiescéncia pode ser observado em respondentes com tendéncia a concordar com as afirmagées apresentadas. Por fim, 0 viés de desejabilidade social é a tendéncia a responder de acordo com alguma pressao de grupo (p. ex., opiniao sobre 0 uso de drogas ilicitas) ou buscando fornecer uma resposta mais agradavel ao avaliador (p. ex., minimizar ou omitir o beneficio de um tratamento). FE desejavel que uma Escala de Likert contenha itens negativos e positivos, para evitar concordancia/discordancia sistematica com as afirmagées. Escala de Guttman A Escala Cumulativa de Guttman (Guttman, 1950) ¢ composta por itens dispostos em uma série ordenada, de modo que, quando 0 individuo concorda com um determinado item, também concorda com os itens de ordenagao mais baixa. O conceito da Escala de Guttman se aplica também a testes de desempenho que tém desfechos binarios (sim ou nio, certo ou errado). Por exemplo, um teste de habilidade matematica poderia ordenar as perguntas em relago a sua dificuldade. O pressuposto ¢ 0 de que 0 acerto de determinada dificuldade implicaria respostas corretas 4s perguntas anteriores com um nivel de dificuldade menor. Uma Escala de Guttman perfeita consiste em uma série unidimensional de itens que sao clasificados pela ordem de dificuldade, da posicdo menos extrema para a mais extrema. Por exemplo, uma pessoa com escore igual a 7 em uma Escala de Guttman de 10 itens esta concordando com os itens de 1 a 7 e discordando dos itens 8, 9 e 10. Escala de Diferencial Semantico ‘A Escala de Diferencial Semantico caracteriza-se pelo uso de adjetivos para medir o significado conotativo de objetos, eventos e conceitos. Nessa escala, os respondentes devem marcar sua posigao em relagio a dois adjetivos opostos (p. ex., adequado e inadequado, bom e ruim, agradavel e desagradavel). As palavras e frases dessas escalas podem ser dividas em trés grupos: avaliagdo, poténcia e atividade. O fator avaliagdo apresentou maior carga no par de adjetivos bom-ruim; o par forte-fraco indicou 0 fator poténcia; ¢ © par ativo-passivo defini o fator atividade. Esses trés fatores sao dimensées afetivas transculturalmente constantes. Esse tipo de escala pode se relacionar com a atitude dos respondentes. QUALIDADES DA ESCALA As propriedades psicométricas confiabilidade ¢ validade determinam a qualidade de uma escala de avaliagdo. A validade significa 0 quanto o instrumento mede o que se propde a medir. A confiabilidade corresponde & medida da reprodutibilidade, ou seja, medidas repetidas devem ser consistentes em diferentes condigdes, aplicadas por diferentes entrevistadores treinados. Confiabilidade Alguns autores usam 0 conceito de confiabilidade no sentido de concordancia, preciso, fidedignidade, constincia, consisténcia interna, estabilidade e homogeneidade. Em geral, a confiabilidade refere-se 4 capacidade de uma medida para detectar o escore verdadeiro em relagao ao erro causado pela impreciséo na medida. Na Figura 5.1, a confiabilidade é representada pela capacidade de acertar 0 mesmo ponto no alvo (avaliagao dos erros de repetigao). AlvoA AlvoB AlvoC Confiabilidade baixa Confiabilidade alta Confiabilidade alta Validade média Validade alta Validade baixa Figura 5.1 Confiabilidade e validade de um construto aferido por uma escala de avaliagdo. Fonte: Babbie (2002), Erros de medida ocorrem em qualquer tipo de instrumentalizagao, por mais objetiva que seja. Por exemplo, a medida da pressao arterial pode ser alterada por fatores ligados ao paciente, a calibragao do equipamento, ao local ou ambiente, a técnica de medida, entre outros. Um instrumento é mais confidvel quanto menor forem os erros sistematicos (viés) e aleatérios (acaso ou chance), ou seja, quanto menos a medida for influenciada por fatores do observador, do paciente ou do ambiente. Por exemplo, o respondente pode fornecer informagées incorretas intencionalmente, por falta de atengdio ou por no compreender as perguntas. O entrevistador, por sua vez, pode errar no registro das respostas. Em relag&io ao fenémeno clinico em avaliagao, podem ocorrer mudangas de acordo com a situago (avaliagdo em grupo vs. avaliagdo individual). Além disso, a avaliagao pode depender dos conceitos adotados por diferentes profissionais. Potencialmente, a confiabilidade pode ser afetada por erros sistematicos: brandura — resisténcia em escolher pontuagées que indiquem maior gravidade efeito halo — tendéncia de avaliar um item em fungao do todo erro légico — escores semelhantes sao atribuidos a itens relacionados erro de proximidade — tendéncia de selecionar escores semelhantes para itens proximamente posicionados 5. erro de tendéncia central — preferéncia por escores intermediarios ou neutros em casos de diivida 6. erro de contraste — atribuig&o de escores diferentes por comparagao a aplicagao prévia (p. ex., pela expectativa de efeito terapéutico) 7. erro de constancia — tendéncia a manter os mesmos escores eepr Na pratica, a confiabilidade pode ser testada empiricamente de diferentes maneiras. Quando um resultado € obtido apenas em uma ocasido, pode-se verificar a homogeneidade dos itens da escala utilizados para avaliar o construto-alvo. Esse tipo de confiabilidade ¢ conhecido como consisténcia interna. As técnicas mais utilizadas sao: a. alfa de Cronbach — 0 coeficiente avalia se todos os itens variam do mesmo modo b. técnica de Kuder-Richardson (KR-20) — andlise de cada item individual quando a resposta é dicotémica c. duas-metades (split-half) — avalia o grau de correlagao entre as metades de um instrumento (itens pares vs. itens impares) O outro tipo de confiabilidade se refere ao grau de concordancia obtido em medidas repetidas, ou seja, a reprodutibilidade da medida. Por exemplo, uma entrevista pode ser observada por um avaliador passivo que apresenta sua pontuagdio independente no fim — também chamado de método de observador ou confiabilidade interjuizes. Pode-se aumentar a confiabilidade entre diferentes avaliadores pelo treinamento na aplicagao do instrumento. No método de reentrevista ou teste-reteste, um segundo entrevistador conduz uma entrevista independente com o paciente algumas horas ou dias apés a primeira. Os mesmos sujeitos séo reavaliados com os mesmos instrumentos em tempos diferentes (para condigées que se mantém constantes no intervalo de tempo entre as testagens). O teste-reteste pode ser aplicado também para medidas de autoavaliacao. A correlagdo entre as pontuagées em duas circunstancias pode variar entre 0 (nenhuma ou 0%) e 1 (perfeita ou 100% de concordancia). Uma correlagdo em torno de 0,70 ainda expressaria uma confiabilidade substancial, entretanto, a variancia comum ja estaria afetada pela variabilidade provocada pelo erro, demonstrando resultados menos fidedignos. Dependendo da técnica utilizada para demonstrar esse tipo de confiabilidade, ela pode se expressar pelo coeficiente kappa (k) de Cohen ou por correlagdo intraclasse (CIC). O kappa € utilizado quando o instrumento produz medidas categ6ricas, como diagnésticos segundo um critério determinado ou uma medida binaria (p. ex., provavel caso ou no caso). Se o instrumento avalia categorias ordenadas (p. ex., excelente, bom, regular, ruim ou péssimo), 0 kappa ponderado fornece uma estimativa adequada do coeficiente de confiabilidade. Quando o instrumento produz valores numéricos discretos ou continuos, utiliza-se o CIC como medida de confiabilidade. Os coeficientes de confiabilidade obtidos pelos métodos do observador e de teste-reteste podem ser diferentes. No primeiro caso, a confiabilidade tende a ser maior porque tanto o entrevistador como o observador pontuam em relagdo 4 mesma entrevista. Jé no método de reteste, o estado clinico do individuo pode mudar durante o intervalo entre as duas avaliagées, ou a reagdo 4 segunda entrevista pode ser diferente simplesmente porque ela é uma repeti¢do da primeira (efeito de reteste). Validade A validade é definida como a real capacidade de um instrumento para medir aquilo a que se propée. Esse conceito é representado na Figura 5.1 pela capacidade de atingir 0 centro do alvo (a adequagio do instrumento em medir 0 construto pretendido). ‘A validade apresenta dois componentes principais em relagdo ao construto: 0 conceitual e o operacional. A validade conceitual representa um julgamento subjetivo sobre a cobertura conceitual de um instrumento a respeito de determinado construto. Esse tipo de validade, também chamado de validade de face, nao se refere ao que 0 teste realmente mede, e sim ao que ele superficialmente aparenta medir, 0 que difere da validade de contetido. O componente operacional pode ser verificado por meio da validade de contetido, de critério e de construto. A validade de contetido refere-se a abrangéncia, isto é, a0 quanto o instrumento realmente cobre os diferentes aspectos do fenémeno a ser estudado e nado contém elementos que possam ser atribuidos a outros fendmenos. Geralmente, a avaliagdo da validade de contetdo é feita por um painel de especialistas familiarizados com o construto em questéo, que responderao para cada item se ele é essencial, titil ou necessrio para o construto. Existem formulas apropriadas para medir 0 desempenho do instrumento de acordo com as respostas dos especialistas. Esse tipo de validade pode ser medido durante o processo de construgao do instrumento. A validade de critério est4 associada ao grau de discriminagdio do instrumento entre sujeitos que diferem em determinadas caracteristicas de acordo com um critério-padrao. Por exemplo, pode-se estabelecer 0 quanto uma escala de autoavaliagdo de depressio concorda com um diagnéstico estabelecido por meio de uma entrevista psiquidtrica, o padrdo-ouro. A validade de critério pode ser concorrente, quando o critério se refere ao estado atual, ou preditiva, quando o construto pretendido é medido primeiramente e usado para prever 0 critério. Do ponto de vista operacional, a validade de critério de um instrumento é estimada estatisticamente e expressa por meio de sua sensibilidade e especificidade. A sensibilidade indica se 0 teste é sensivel para detectar a existéncia de determinado diagnéstico, 0 que é representado pela proporgao, corretamente classificada pelo instrumento de acordo com o critério-padrao, de pessoas com o diagnéstico (i.c., casos positivos identificados corretamente). ‘A especificidade consiste em quanto o instrumento identifica apenas aquele determinado diagnéstico ¢ nado alguma outra condigao, o que € representado pela proporgdo, corretamente classificada pelo instrumento, de pessoas sem um transtorno (ie., casos negativos identificados corretamente). A especificidade corresponde a validade discriminante e pode ser determinada comparando-se os escores dos que tém um transtorno com os escores dos que tém um transtorno diferente. Muitas vezes, um instrumento de avaliagdo é utilizado com a finalidade de triagem e classificagao em categorias — por exemplo, casos saudaveis ou com determinado diagnéstico. Para isso, € necessario estabelecer o limiar ou pontuagdo no teste que melhor separa essas duas categorias, isto é, o ponto de corte. Idealmente, se 0 objetivo é excluir um diagnéstico, escolhe-se um ponto de corte com maior sensibilidade, ao passo que, se 0 objetivo clinico é incluir um caso, 0 ponto de corte deverd ter maior especificidade. Um método muito utilizado para descrever a sensibilidade e a especificidade de um instrumento & tragar a curva ROC (receiver operating characteristics), a curva verdadeiros positivos (sensibilidade) contra os resultados falsos positivos (1 — especificidade) para cada um dos possiveis Pontos de corte do teste. A area sob a curva (AUC) indica a probabilidade de uma pessoa saudavel ser identificada dessa forma por meio do instrumento. Os valores da AUC de 0,5 a 0,7 representam pouca precisao; valores entre 0,7 ¢ 0,9 indicam um teste itil para discriminar os casos; ¢ valores superiores a 0,9 indicam alta precisao. O terceiro tipo de validade, a validade de construto, refere-se 4 demonstragao dos construtos subjacentes que o instrumento permite medir. A validade de construto ndo pode ser observada diretamente pelos itens avaliados, e sim evidenciada por testes estatisticos. Esse tipo de validade pode ser estabelecido por meio de técnicas multivariadas, nas quais a andlise fatorial é a estratégia mais adotada, tal como a andlise exploratéria e confirmatéria. A andlise fatorial possibilita reduzir os itens que compéem uma escala com grande nimero de variaveis correlacionadas, permitindo formar uma estrutura menor. Essa varidvel extraida pela técnica de andlise fatorial também ¢ chamada de fator ou dimensdo. Alguns teéricos da psicometria acreditam que essa estrutura de correlagdo refletiria 0 construto subjacente de uma escala de avaliagao. Por exemplo, a maioria dos pesquisadores consegue extrair duas dimensdes (cognitivo- afetivo e somatico vegetativo) a partir dos 21 itens do Inventario de Depressio de Beck. Essas duas dimensées representam os construtos avaliados pelos itens dessa escala. TRADUCAO E ADAPTACAO DE INSTRUMENTOS DE AVALIACAO Embora o Brasil conte com alguns instrumentos psicométricos originais, na maioria das vezes, os pesquisadores traduzem e validam alguma escala ja existente. No entanto, para que o instrumento permita uma adequada comparabilidade internacional de resultados, é necessario que sejam seguidos 0s passos estabelecidos para 0 processo de adaptagao de uma escala ao nosso meio. A tradugaio e a retrotradugdo, apenas, podem nao ser suficientes por uma série de razdes. As manifestagdes clinicas, a evolugao ¢ 0 prognéstico de muitos transtornos podem softer a influéncia de fatores transculturais. Por exemplo, enquanto na cultura ocidental as perguntas relativas ao estado de humor podem estabelecer a intensidade de um quadro depressivo, na cultura oriental, os sintomas fisicos séo os que mais representam o mesmo quadro. Outro aspecto relevante é 0 contexto dos habitos regionais. Os instrumentos sdo construidos quase sempre com base em conceitos e normas prevalentes em populagdes norte-americanas ¢ europeias; consequentemente, é necessdrio adapta-los para estabelecer suas propriedades quando usados em diferentes grupos culturais e étnicos. Os dados normativos em diferentes culturas permitem comparar os resultados de pesquisas realizadas em diversos contextos. ‘A equivaléncia da versdo traduzida em relagao a original pode ser avaliada quanto 4 semantica (mesmo significado), ao contetido (itens relevantes), a técnica (forma de coleta), ao critério (mesma interpretagdo normativa) ¢ ao conceito (mesmo construto tedrico). Em termos seménticos, expressées regionais (p. ex., butterflies in the stomach) demandam a busca por alternativas aproximadas. Resumidamente, a traducdo de um instrumento de avaliagdo consiste dos seguintes procedimentos: versio independente do instrumento para uma nova lingua por dois profissionais bilingues cientes dos objetivos da tradugado b. retrotradugdo ou versio da tradugdo para o idioma original por um profissional nao familiarizado com a versao original c. andlise das trés versées por um painel composto por especialistas familiarizados com o construto-alvo da escala, os quais devem conciliar inconsisténcias e incongruéncias da versdo na nova lingua d. estudo-piloto da versao de conciliagdo na populagdo-alvo reavaliagdo com base nos dados resultantes do estudo-piloto f. nova retrotradugao dos itens problematicos encontrados para eliminar as dificuldades detectadas na fase piloto © Apés revisar 12 dos principais métodos disponiveis, Wild e colaboradores (2005) agruparam as consisténcias e definiram os principios de boas praticas para o processo de tradugdo e adaptagao cultural. USO DE ESCALAS DE AVALIAGAO DE SINTOMAS PSIQUIATRICOS As escalas de avaliagdo utilizadas em psiquiatria permitem determinar a existéncia de um sintoma, bem como estimar intensidade, frequéncia ou evolugéo ao longo do tempo, passando, necessariamente, pela subjetividade do paciente e/ou do avaliador. Elas podem auxiliar no rastreamento dos individuos que necessitam de tratamento, acompanhamento ou intervengdo, mas nado servem para fazer um diagnéstico clinico, 0 que é fungaio das entrevistas diagnésticas. Durante um tratamento, as escalas sensiveis a mudangas ajudam a monitorar a melhora e os efeitos adversos da intervengdo, sendo importantes para determinar 0 prognéstico e definir a decisio de tratamento. Existem escalas de avaliagdo de sintomas para as mais diferentes patologias e finalidades, Em psiquiatria, ha instrumentos disponiveis para avaliar a maioria dos transtornos, ¢ um nimero crescente de escalas tem sido traduzido e validado no Brasil (Gorenstein, Wang, & Hungerbiihler, 2015, no prelo). Em relagdo aos transtornos do humor, por exemplo, as escalas validadas em nosso meio para depressio sdo: Escala de Avaliagéo de Depresséo de Hamilton, Escala de Depressio de Montgomery-Asberg, Inventario de Depressdo de Beck-II ¢ Escala de Depressio do Centro de Estudos Epidemiolégicos. Além destas, ha escalas de depressdo para transtornos ou condicgées especificas, tais como a Escala Calgary de Depressdo para Esquizofrenia, a Escala de Depressao Pés-Parto de Edinburgh, a Escala de Avaliagaéo de Depressdo Infantil e a Escala de Depressao Geriatrica. ‘A exemplo da depressao, existem escalas para: mania, diferentes transtornos de ansiedade, psicoses, transtornos alimentares, transtornos do controle de impulsos, dependéncias, além de instrumentos para diversos transtornos especificos de uso exclusivo em idosos e criangas. Alguns instrumentos podem ser usados independentemente da presenga e do tipo de transtorno psiquidtrico, como, por exemplo, os que avaliam qualidade de vida, bem-estar, adequagao social, funcionamento pessoal e relacionamento familiar. ‘A qualidade de vida abrange um conceito amplo, influenciado por satide fisica, estado psicoldgico, nivel de independéncia, relagées sociais e ambiente, o que depende do contexto cultural e de padrées sociais. O instrumento mais utilizado para avaliar qualidade de vida € 0 WHOQOL- 100, da Organizago Mundial da Satide (OMS), ¢ sua versdo abreviada, o WHOQOL-BREF. O questiondrio genérico de qualidade de vida SF-36 foi desenvolvido especificamente para pesquisas em satide e fornece um perfil funcional de saiide e bem-estar, além de um escore global das satides fisica e mental. A adequagao social avalia a interagdo entre o individuo e o ambiente social. Ela integra fatores que interferem no comportamento do individuo perante situagdes da vida cotidiana. O desempenho do individuo € considerado adequado quando esta de acordo com os padrées de seu grupo de referéncia social, educacional, etario. A Escala de Adequagaio Social mede aspectos do desempenho em sete areas: trabalho, vida social/lazer, relagao familiar, relagao marital, relagaio com filhos, vida doméstica e situagao financeira. O ambiente familiar pode ser avaliado, por exemplo, pela Escala de Avaliagdo Global de Funcionamento nas Relagdes (GARF), que considera a repercussdo de quadros psiquiatricos no funcionamento familiar, e pela Escala do Ambiente Familiar (FES), que estima a percep¢ao que cada membro da familia tem dos dema COMO ESCOLHER UMA ESCALA DE AVALIACAO Diante da disponibilidade de tantos instrumentos construidos para os mais diversos objetivos, nao é simples selecionar a escala mais adequada a um objetivo particular. O pesquisador ¢ 0 usuario devem conhecer profundamente os conceitos envolvidos nos métodos para avaliar as qualidades dos instrumentos de investigagdo a fim de escolher a escala mais apropriada. Além disso, 0 pesquisador deve estar familiarizado com as propriedades, utilidades ¢ limitagdes das escalas que deseja empregar, bem como conhecer as caracteristicas de sua populagaio-alvo. Primeiramente, define-se claramente a finalidade da medida: avaliagéo de sintomas de determinada patologia, avaliagao de bem-estar geral, de satisfagao com cuidados, entre outras. Em seguida, é necessario verificar se o instrumento escolhido preenche seus objetivos e a abrangéncia desejada. Nesse caso, as escalas que estio traduzidas para o portugués e cujas propriedades psicométricas e validagdo ja foram estudadas no nosso meio devem ser as preferidas. Bons indicadores de confiabilidade ¢ validade so, quase sempre, as caracteristicas que qualificam a adequagao de determinado instrumento. Entretanto, é necessdrio considerar algumas questdes de ordem pratica: a. Extensdo do questiondrio — se é curto o suficiente para permitir que seja rapidamente completado (p. ex., para pacientes com problemas de atengdo é muito dificil responder escalas longas). b. Adequagdo 4 populagdo — no caso de autoavaliagao, se os individuos que o preencheriio serao capazes de compreender o significado dos itens, privilegiando clareza e simplicidade. Recomenda-se que as escalas sejam facilmente compreendidas até para o estrato educacional mais baixo da populagdo-alvo. Em geral, as escalas formuladas com frases curtas ¢ diretas, contendo expressdes simples e precisas, sdo facilmente entendidas pelo respondente. Em contrapartida, frases longas ou com afirmagées negativas confundem mais que as positivas, provocando falta de clareza e duvidas no usuario da escala. c. Necessidade de treinamento — escalas analégicas sio de mais dificil entendimento, principalmente para aqueles respondentes de baixo nivel educacional ou pacientes com declinio cognitivo, Na maioria das vezes, os individuos precisam ser treinados ou receber extensa assisténcia do aplicador para produzir resultados fidedignos. A leitura exaustiva dos manuais deve preceder a aplicagao do instrumento. Invariavelmente, esses textos contém uma descrigao detalhada da escala, especificando a populagao para a qual foi desenvolvida, a forma de administragao e de avaliagao, como os escores devem ser interpretados, as revisdes pelas quais passou e as limitagdes de sua utilizagao. Algumas vezes, pode ser mais acertado aplicar mais do que uma medida para uma mesma finalidade, uma vez que dificilmente um tinico instrumento ideal esteja disponivel para 0 objetivo do pesquisador. CONSIDERACOES FINAI Com os recentes progressos de diversas areas nas tltimas décadas, como a psicofarmacologia, a epidemiologia e a psicologia da personalidade, 0 uso de escalas de avaliagéo é uma das reas cientificas que avanga rapidamente na psiquiatria e na psicologia. Quando adequadamente construidos, indicados e aplicados, os instrumentos psicométricos permitem estimar atributos, atitudes © habilidades, aos quais no se costuma ter acesso direto. Este capitulo apresentou alguns aspectos praticos do uso de uma escala de avaliagdio, na medida em que perspectivas cada vez mais sofisticadas da teoria psicométrica e modelos matematicos complexos sdo adicionados a drea. Basicamente, para obter boa validade ¢ confiabilidade das pesquisas, 0 pesquisador deve esforgar- se, experimental ¢ analiticamente, para se aprofundar no tema dos construtos teéricos que espera avaliar. Na maioria das vezes, os pesquisadores brasileiros traduzem e adaptam alguma escala ja existente em outra lingua, pois construir novos instrumentos é um procedimento complexo € moroso. Além da posterior comparabilidade transcultural com as escalas originais, a rapidez e a facilidade desse direcionamento sao suas principais motivagées para adotar essa estratégia. Deve-se, contudo, ressaltar que o desempenho de um instrumento traduzido pode diferir de sua contraparte original, podendo refletir uma diferenga entre duas amostras culturalmente diversas de sujeitos. Consequentemente, 0 processo de validagao do instrumento deve preceder a equiparagdo direta dos dados empiricos brasileiros com os de outros paises. Divergéncias linguisticas (dimensdo seméntica do objeto medido transculturalmente), alteragdes na redagdo e na aplicagdo da escala, amostragem e selegdo de sujeitos sio alguns fatores que influenciam as pontuagées de um instrumento. Esses cuidados devem ser foco de ateng&o durante a andlise e a interpretagdo dos dados, uma vez que constituem potenciais fontes de variabilidade da mensuragao do objeto psicoldgico. Por fim, a importancia do construto a que se propée examinar, a real necessidade de elaborar novas escalas de mensuragéio, bem como o aprimoramento de instrumentos disponiveis, séo temas importantes para os pesquisadores. Em termos de relevancia clinica, talvez nem toda variagao de comportamento humano necessite de uma escala de avaliagao. Para que os resultados obtidos sejam interpretados corretamente e assegurem a validade das investigagdes, recomenda-se que o pesquisador mantenha uma visao critica dos limites dos instrumentos psicométricos, cada vez mais utilizados em situagdes clinicas e do mundo moderno (satisfagao do cliente, pesquisa eleitoral, censo demografico, etc.). REFERENCIAS Babbie, E. (2002). The practice of social research (9th ed.). Belmont: Wadsworth. Erthal, T. C. (1987), Manual de psicometria, Rio de Janeiro: Jorge Zahar. Gorenstein, C., Wang, ¥., & Hungerballer, I. (2015, no prelo). Instrumentos de avaliagdo em satide mental, Porto Alegre: Artmed. Guttman, L. (1950). The basis for sealogram analysis. In S. A. Stouffer, A. A. Lumsdaine, R. M. Willams, Jr, M. B. Smith, LL. Janis, S.A. Star, & L. S. Cottrell J. (Eds.), Measurement and prediction (Vol. 4, The American Soldier). New York: Wiky. Likert, R. (1932). A technique for the measurement of attitudes. Archives of Psychology, 22(140), 1-55. Pasquali, L. (2003). Psicometria: Teoria dos testes na psicologia e na educagao. Petrépolis: Vores. Stevens, S. S. (1946). On the theory of scales of measurement. Science, 103(2684), 677-680, Wild, D., Grove, A., Martin, M., Eremenco, S., McElroy, S., Verjee-Lorenz, A., ... ISPOR Task Force for Translation and Cubural Adaptation (2005). Principles of good practice for the translation and cultural adaptation process for Patient-Reported Outcomes (PRO) measures: Report of the ISPOR Task Force for Translation and Cultural Adaptation. Value Health, 8(2), 94104

You might also like