You are on page 1of 41

Epistemologa, metodologa y tcnicas del anlisis de contenido

Jos Luis Piuel Raigada


Universidad Complutense de Madrid
Departamento de Sociologa IV Facultad de CC. de la Informacin Universidad Complutense de Madrid Ciudad Universitaria, s/n 28040 - Madrid, Spain pinuel@ccinf.ucm.es

Title: Epistemology, methodology and content analysis techniques Abstract


It is exposed, first, an epistemological review of the analysis of content, as scientific practice in social sciences that studies an object (v.g. a singular communication) for whose representation (scientific and refutable therefore) it is used the selection procedure and analysis of communicative products that belong objectively to that communication that are significant to know it from a theoretical perspective, and that they are valid or pertinent to put on approval the conditions, so much general as matters, for those that these communicative products have been elaborated, or that they can be it, in any communication type similar to the one that has produced them. In second place the method is examined (the procedure rules) that aspires to tie in a valid way the succession of performances that concern to the selection of the corpus, to its segmentation in analysis units and to its exam to elaborate, to register and to treat data of diverse logical orders, thanks to which it is elaborated a speeches able to represent scientifically (or in a refutable way) to the study object that is not the own corpus, but the human practice that has engendered the material object of the analysis: the analyzed communicative product. In third place, the last section exposes the technical alternatives that underlie to any analysis procedure, so much if it is carried out in all its steps by the investigators and analysts, as if it is carried out automatically by the available resources of software, and shortly described following the work of Harald Klein. Key words: content analysis, communication theor y, epistemology of knowledge, sociolinguistics, psycholinguistics.

Copyright Estudios de Sociolingstica 3(1), 2002, pp. 1-42

JOS LUIS PIUEL RAIGADA

Resumo
Neste traballo expoemos, en primeiro lugar, unha revisin epistemolxica da anlise de contidos, que constite unha prctica cientfica das ciencias sociais que estudia un obxecto unha comunicacin singular que representamos, de xeito cientfico e refutable, mediante os procedementos de seleccin e anlise de productos comunicativos que pertencen obxectivamente comunicacin, que cmpre coecer desde un punto de vista terico e que son vlidos ou pertinentes para poer a proba as condicins, para os que tales productos comunicativos foron elaborados, en calquera tipo de comunicacin similar que os produciu. En segundo lugar, examinamos a metodoloxa as regras de procedemento coa cal aspiramos a unir, de modo vlido, a sucesin de actuacins que compete seleccin do corpus, sa segmentacin en unidades de anlise e seu exame para elaborarmos, rexistrarmos e tratarmos datos de diversas ordes lxicas. Gracias a iso somos quen de elaborar un relato apto para representar cientificamente ou dun xeito refutable un obxecto de estudio que non o propio corpus, senn a prctica humana que enxendrou o obxecto material da anlise: o producto comunicativo analizado. En terceiro lugar, na derradeira seccin expoemos as alternativas tcnicas que subxacen no procedemento de anlise, tanto se este est sendo conducido polo investigador e analista en tdolos pasos precisos coma se est sendo desevolvido automaticamente mediante o software dispoible, tal como se describe seguindo o traballo de Harald Klein. Palabras clave: anlise de contido, teora da comunicacin, epistemoloxa do coecemento, sociolingstica, psicolingstica.

1. Epistemologa del anlisis de contenido Se suele llamar anlisis de contenido al conjunto de procedimientos interpretativos de productos comunicativos (mensajes, textos o discursos) que proceden de procesos singulares de comunicacin previamente registrados, y que, basados en tcnicas de medida, a veces cuantitativas (estadsticas basadas en el recuento de unidades), a veces cualitativas (lgicas basadas en la combinacin de categoras) tienen por objeto elaborar y procesar datos relevantes sobre las condiciones mismas en que se han producido aquellos textos, o sobre las condiciones que puedan darse para su empleo posterior. El anlisis de contenido, de hecho, se convirti a finales del siglo XX en una de las tcnicas de uso ms frecuente en muchas ciencias sociales, adquiriendo una relevancia desconocida en el pasado a medida que se introdujeron procedimientos informticos en el tratamiento de los datos. Su propia denominacin de anlisis de contenido, lleva a suponer que el contenido est encerrado, guardado e incluso a veces oculto dentro de un continente (el documento fsico, el texto registrado, etc.) y que analizando por dentro ese continente, se puede desvelar su contenido (su significado, o su sentido), de forma que una nueva intepretacin tomando en cuenta los datos del anlisis, permitira un diagnstico, es decir, un nuevo conocimiento (gnoscere conocer) a travs de su penetracin intelectual (dia, en griego es un prefijo que significa a travs de en el sentido de atravesar). Pero una tal suposicin, semejante, de hecho, a la acostum-

EPISTEMOLOGA, METODOLOGA Y TCNICAS DEL ANLISIS DE CONTENIDO

brada cuando los anlisis qumicos y biolgicos exploran componentes de la materia y facilitan diagnsticos, lleva a una visin falsa. El anlisis de contenido, aplicado a continentes materiales, busca fuera, no dentro, pues las dimensiones de los datos extraidos del anlisis slo existen fuera de los continentes, es decir, en la mente de los sujetos productores o usuarios de los mensajes, textos, discursos, o documentos que se analizan, es decir, en la mente de los participantes de los procesos singulares de comunicacin en los que se han producido los documentos analizados. No obstante, varios hitos en la evolucin del anlisis de contenido permiten comprender el desarrollo del anlisis de contenido en el mbito sociolgico; son los siguientes hitos de la investigacin, reproducidos por Lpez Aranguren (y recogidos en Piuel & Gaitn, 1995: 516): 1.- Dcadas de 1920 y 1930. Anlisis sobre el concepto de estereotipo social sugerido por Lippmann (1922) y sobre el concepto de actitud, de reciente aparicin en psicologa. 2.- Segunda Guerra Mundial. Anlisis de Lasswell y colaboradores, sistematizados ms tarde por George (1959): conceptualizacin de objetivos y procesos de comunicacin. 3.- Dcadas de 1950 y 1960. Codificacin manual. Obras de Pool (1959), Lasswell et al (1965) y Holsti (1969). 4.- Aplicacin de la informtica, codificacin electrnica automatizada, a partir de la obra de Stone y colaboradores (1966) sobre el sistema General Inquirer para el anlisis contenido de mensajes por medio de ordenador. (Ver Garca Ferrando, M., Ibez, J. & Alvira, F., 1986). Todos estos hitos revelan que el anlisis de contenido se ha remitido a tcnicas para elaborar, registrar y tratar datos ms all del mbito social y cognitivo concretos en que se recurre a la comunicacin, y dentro de ella, a la produccin de textos. Es como si fuese justificable elaborar, registrar y tratar datos de un texto asirio porque creemos conocer su gramtica, sin tomar en cuenta cul podra ser su interpretacin por parte de quienes generaron y usaron comunicativamente aquel texto. En todos los casos, sin embargo, los textos remiten a un universo de prcticas sociales y cognitivas donde cualquier interaccin comunicativa cobra unos lmites particulares que son mediados y mediadores de aquellas prcticas a las que sirve. Hoy da, cuando ya nadie duda que el anlisis de contenido pueda sustrarse a los supuestos tericos de los que, en cada caso, se parte, conviene adems aprovechar su tradicin para no perder la perspectiva en anlisis de la comunicacin; la tcnica del anlisis de contenido no producir interpretaciones relevantes de los datos si stos mismos no son relevantres para conocer condiciones de comunicacin; y estas condiciones son de naturaleza sociocognitiva.

JOS LUIS PIUEL RAIGADA

2. El significado del texto: contexto comunicativo y sentidos social y cognitivo El anlisis de contenido no debe perseguir otro objetivo que el de lograr la emergencia de aquel sentido latente que procede de las prcticas sociales y cognitivas que instrumentalmente recurren a la comunicacin para facilitar la interaccin que subyace a los actos comunicativos concretos y subtiende la superficie material del texto. Como seala Bardin (citado en Piuel & Gaitn, 1995) el anlisis de contenido se convierte en una empresa de des-ocultacin o re-velacin de la expresin, donde ante todo interesa indagar sobre lo escondido, lo latente, lo no aparente, lo potencial, lo indito (lo no dicho) de todo mensaje. Pero esta nueva perspectiva no slo ampla el campo de estudio del anlisis de contenido hacia la dimensin no manifiesta del texto cuanto que, dada su complejidad, exige introducir nuevas variables en el anlisis a fin de que el texto cobre el sentido requerido para el analista. Esto slo es posible si tal texto se abre tericamente hablando a las condiciones contextuales del producto comunicativo, al proceso de comunicacin en el que se inscribe, y por tanto a las circunstancias psicolgicas, sociales, culturales e histricas de produccin y de recepcin de las expresiones comunicativas con que aparece. Los actores de una interaccin comunicativa nunca se enfrentan normalmente por primera vez a la tarea de comunicarse con otro ser humano. Poseen, en este sentido, un determinado conocimiento acerca de las posibilidades expresivas del cuerpo humano (por ejemplo, si se trata de comunicacin interpersonal cara a cara), acerca de la significatividad de ciertas expresiones y acerca de las pautas de accin y coordinacin de acciones y operaciones que regulan una clase de interacciones comunicativas. El saber hacer acerca de la comunicacin es un patrimonio cognitivo, es decir, es un producto de la prctica comunicativa, que se almacena en la memoria de los sujetos y que se activa cuando estos entran a tomar parte de una interaccin comunicacional en forma de esquemas previos (auto-referencia), que guan la construccin recursiva de nuestras representaciones e inferencias (Piuel & Garca-Lomas, 2001). Los esquemas que poseemos acerca de los dems (esquemas sociales), contienen datos que no slo se refieren a las propiedades identitarias del sujeto (su edad, su sexo, su aspecto fsico, su personalidad, su familiaridad si es conocido o desconocido su nivel de conocimientos, etc.), sino tambin a la posicin que ocupan (estatus) y a la funcin que desempean (rol) dentro de los grupos y organizaciones sociales, es decir, en su calidad de agentes de un sistema social. Esos datos pueden hacer que nos comportemos de una u otra manera1.

1 Por ejemplo, no nos comportamos de la misma manera con un dependiente de un comercio al que aca-

bamos de conocer (del que esperamos que cumpla ciertas funciones y se comporte de acuerdo a su rol), que con un amigo de toda la vida, ni tampoco esperamos que ellos se comporten de la misma manera.

EPISTEMOLOGA, METODOLOGA Y TCNICAS DEL ANLISIS DE CONTENIDO

En otros lugares he desarrollado con muy distintas aplicaciones un modelo terico2 que prefigura estas diferentes dimensiones (comunicativas, cognitivas y sociales) las cuales se encuentran analticamente separadas porque tal operacin formal es epistemolgicamente rentable para encontrar una explicacin cientfica de los cambios histricos de la sociedad, el conocimiento y la cultura. Sin embargo en el funcionamiento normal de nuestro sistema cognitivo, no existen tres procesadores modulares diferentes: los datos de tipo identitario, social y comunicacional, cuando se refieren a nuestros congneres, forman estructuras unitarias de conocimiento que han recibido el nombre en psicologa cognitiva de esquemas sociales. Los esquemas, en tanto que estructuras de conocimiento, son estructuras de categoras o variables de naturaleza difusa, es decir, sin limites exactos y absolutos, cuya relacin estructural impone una cierta covariacin a los valores de cada una de las variables o categoras que constituyen especficamente un esquema determinado, dentro de un amplio y flexible umbral de valores posibles. As, nuestro esquema de hotel, por ejemplo, puede arrojar mltiples representaciones o variantes concretas, pero al variar uno de los constituyentes tienden a covariar los valores restantes. Por ejemplo, un hotel de lujo y una pensin barata tienen en comn ciertas variables como es el hecho de tener habitaciones y tener un precio. Al variar el precio hacia la baja, las calidades de la habitacin tambin bajan. Ciertamente, existir un lmite hacia la baja y otro hacia la alta, pero el umbral es amplio y es histricamente flexible. Lo interesante en este sentido es que existe una tendencia hacia la covariacin, y por tanto es difcil encontrar pensiones baratas con calidades y servicios de lujo, como es difcil encontrar hoteles carsimos con calidades y servicios extraordinariamente bajos. En el centro podemos obtener sin embargo hoteles

2 Se trata del modelo de la MDCS (Mediacin Dialctica de la Comunicacin Social) el cual formula un sistema conceptual especializado en la descripcin, explicacin y prediccin de los cambios que experimentan o pueden experimentar los sistemas de comunicacin propios de nuestras sociedades. Entre sus principales postulados o hiptesis de base se encuentra la idea de que dichos cambios no pueden conocerse si no se establece primero una clara diferenciacin entre los componentes y relaciones que son especficos de los sistemas de comunicacin (SC) y los componentes y relaciones que son especficos de otros sistemas. Una vez efectuada esa diferenciacin, el modelo postula que los cambios de los sistemas de comunicacin (SC) slo pueden explicarse examinando las relaciones de apertura que dicho sistema mantiene con otros dos sistemas generales: el sistema social (SS) y el sistema ecolgico-adaptativo (SE), cuyo especfico inventario de componentes genricos y de relaciones internas (estructurales y funcionales) es igualmente proporcionado por dicho modelo (cfr. Martn Serrano et al., 1981; Martn Serrano, 1989, pero especialmente Piuel, 1989, y Piuel & Gaitn, 1995). La concepcin de los sistemas de comunicacin (SC), de los sistemas sociales (SS) y de los sistemas ecolgicoadaptativos (SE) como sistemas abiertos entre s, nos permite describir la transformacin de cada uno de esos tres sistemas en trminos de una mediacin dialctica intersistmica, es decir, concibiendo la transformacin interna de un determinado sistema como el producto de la influencia externa que ejercen sobre l los sistemas restantes y viceversa.

JOS LUIS PIUEL RAIGADA

relativamente baratos con servicios y calidades buenos, o pensiones relativamente caras con servicios y calidades relativamente bajos, etc. Similarmente podramos razonar para muchos de nuestros esquemas identitarios: el esquema de cataln, o el esquema de vasco, o de espaol, etc. ofrecen mltiples representaciones o variantes concretas (el industrial cataln, vs. el pays cataln; o el industrial vasco vs. el paisano de los caseros; etc.) e imponen una cierta covariacin: al variar uno de los constituyentes tienden a covariar los valores restantes. Las meta-representaciones que construimos especficamente acerca de nuestro interlocutor, en cada proceso comunicativo, se encuentran guiadas por los conocimientos sociales previos, por nuestros esquemas sociales. Los esquemas activados y las meta-representaciones referidas a las intenciones, creencias y estados mentales de nuestro interlocutor (teoras de la mente), juegan un papel fundamental en la regulacin de nuestra propia conducta, pues anticipan una expectativa acerca de los lmites especficos de esa interaccin, o para decirlo con otros trminos: colaboran en la formacin del sentido mismo de la interaccin. Lgicamente si los esquemas sociales que activamos se corresponden a la realidad, es decir, si el sujeto que tenemos enfrente se comporta dentro del margen de variables previstas, entonces las posibilidades de acoplamiento interactivo de nuestras acciones son mayores. Pero para que el acoplamiento interactivo sea completo, tambin la otra persona (alter), debe activar esquemas sociales y meta-representaciones acerca de nosotros mismos y de nuestro comportamiento, que le permitan formar una expectativa que efectivamente se ajuste a la realidad. Ahora bien, tambin es posible falsificar el comportamiento y asumir un esquema social que no se adecua con el que realmente nos corresponde, como es igualmente posible confundirse y atribuir a los dems una identidad social (activar un esquema social inadecuado) que no es el que se ajusta a la realidad. Tanto si se consideran situaciones interpersonales de interaccin, del tipo de encuentros sociales cara a cara para los que siempre podramos encontrar guiones (como por ejemplo el encuentro social entre un vendedor y el cliente en unos almacenes donde dominan patrones sociales o el encuentro sexual donde dominan patrones afectivos y erticos, etc.), que son propios de una perspectiva microsociolgica, como si aumentamos la escala y asumimos una perspectiva macrosociolgica, es evidente que no podemos penetrar con el mismo detalle o granularidad en los esquemas y meta-representaciones individuales, y que tendremos que utilizar algn mtodo que permita describir el patrimonio social y no ya meramente individual de esquemas cognitivos previos o disponibles. Para describir ese patrimonio cognitivo es necesario recurrir, a mi entender, a un nuevo concepto: el concepto de socio-esquema (Piuel & Garca-Lomas, 2001). Este concepto es una sntesis emergente entre el concepto de modelos de representacin y el concepto de esquema cognitivo. Por esta razn, en el concepto sinttico de socio-esquema se salva la idea de modelo en el sentido de que podemos des-

EPISTEMOLOGA, METODOLOGA Y TCNICAS DEL ANLISIS DE CONTENIDO

cubrir los lmites de los esquemas cognitivos disponibles para un grupo social. Y este es un capital sociocognitivo que es previo, tanto para establecer entre los interlocutores acuerdos metacomunicativos capaces de integrar cualquier intercambio de expresiones en la conducta social y cognitiva de los sujetos, como para establecer variables de anlisis de los discursos que el analista aborda sobre relatos de los mass media, por ejemplo. Si el acuerdo que los sujetos construyen deja de ser contingente a cada situacin, y se torna en transcendente (Ibez, 1986), es decir comn al grupo y a una comunidad, es porque las prcticas sociales y cognitivas se reproducen segn patrones de sentido, que son los que estn en la base del discurso social, el cual a su vez no tendra sentido sin grupo, sin comunidad y sin comunicacin social. Por lo dicho, puede ya comprenderse la definicin de anlisis de contenido, ya adelantada: al conjunto de procedimientos interpretativos de productos comunicativos (mensajes, textos o discursos) que proceden de procesos singulares de comunicacin previamente registrados, y que, basados en tcnicas de medida, a veces cuantitativas (estadsticas basadas en el recuento de unidades), a veces cualitativas (lgicas basadas en la combinacin de categoras) tienen por objeto elaborar y procesar datos relevantes sobre las condiciones mismas en que se han producido aquellos textos, o sobre la condiciones que puedan darse para su empleo posterior. Para que aquel conjunto de procedimientos interpretativos puedan sostenerse como estrategias y tcnicas de investigacin cientfica en comunicacin, se suele requerir la elaboracin previa de un repertorio estructurado de categoras derivadas de un marco metodolgico en que se fija como objeto de estudio la comunicacin. De este marco metodolgico derivan las hiptesis y objetivos que sostienen el procedimiento de normalizacin de la diversidad superficial del corpus textual o material de anlisis, con vistas al registro de los datos, a su procesamiento estadstico y/o lgico y a su posterior interpretacin. En cualquier caso, el anlisis de contenido ha de entenderse como un metatexto resultado de la transformacin de un texto primitivo (o conjunto de ellos) sobre el que se ha operado aquella transformacin para modificarlo (controladamente) de acuerdo a unas reglas de procedimiento, de anlisis y de refutacin (metodologa) confiables y vlidas, y que se hayan justificado metodolgicamente.

3. Metodologa del anlisis de contenido De acuerdo con aquellos planteamientos se puede entender que un anlisis de contenido incluira necesariamente los siguientes pasos: a) seleccin de la comunicacin que ser estudiada; b) seleccin de las categoras que se utilizarn; c) seleccin de las unidades de anlisis, y d) seleccin del sistema de recuento o de medida

JOS LUIS PIUEL RAIGADA

Con el objeto de ofrecer un perfil lo ms aproximado posible de esta metodologa, cabe elaborar una reflexin provisional sobre la metodologa del anlisis de contenido segn los procedimientos previos que los caracterizan, aunque sin adentrarse en las combinaciones, intersecciones o mezclas, que se puedan dar entre ellos. 3.1. Anlisis de contenido segn la seleccin de la comunicacin estudiada Es obvio que, por ejemplo, no puede plantearse de la misma forma un anlisis de contenido del discurso producido por un grupo de discusin, cuyos integrantes conversan sobre un tema, que un anlisis de contenido de la correspondencia que mantienen dos enamorados, o que un anlisis de contenido de relatos mediticos. Incluso para los ejemplos citados pueden advertirse formatos y situaciones muy diversas; no se da la misma situacin en la discusin de grupo cuando ste se constituye como tcnica cualitativa de investigacin social, que cuando se trata de un grupo de trabajo; a su vez, los grupos de trabajo adquieren condiciones sociales y cognitivas muy diversas segn los efectos que social o cognitivamente se esperen de la discusin: toma de decisiones socialmente vinculantes (por ejemplo, una reunin formal de departamento universitario sobre distribucin de tareas), o toma de decisiones psicolgicamete vinculantes (por ejemplo, grupo teraputico para dejar de fumar). Tampoco se dan los mismos formatos segn las situaciones; por ejemplo, en los relatos mediticos, los formatos son muy diversos segn se trate, por ejemplo, de publicidad, de espectculos o de informacin de actualidad, hasta el punto de que cualquier individuo adulto de nuestras sociedades dispone de un capital de socioesquemas cognitivos en virtud de los cuales discrimina variables en los flujos mediaticos (v.g. de la TV) que le permiten, con una velocidad vertiginosa cuando zappea con el telemando, poner en juego creencias y teoras de la mente gracias a las cuales atribuye sentidos a lo que aperece en pantalla: quieren que conozca y sienta la necesidad de comprar un producto (caso de la publicidad), o quieren de conozca y valore un acontecimiento ocurrido en mi entorno social (caso de un informativo), o quieren que contemple y sienta alguna emocin al ver lo que son capaces de hacer personajes reales (deportistas, msicos, etc.) de un espectculo, o personajes de ficcin en un escenario construido ad hoc (caso de los programas de entretenimiento), etc. (cfr. Piuel & Garca-Lomas, 2001). Segn los objetivos de la investigacin aplicada a esos formatos y situaciones de comunicacin, pueden tambin diferenciarse anlisis de contenido de carcter exploratorio, descriptivo y verificativo y /o explicativo. Los anlisis exploratorios slo tienen por objeto una aproximacin al diseo definitivo de una investigacin en la que el anlisis de contenido sea una tcnica elegida para elaborar, registrar y tratar datos sobre documentos en el sentido que antes hemos explicado. Estos anlisis exploratorios, denominados pre-test, generalmente se desarrollan para testar por primera vez un material de estudio, de modo que pueda determinarse la eleccin del

EPISTEMOLOGA, METODOLOGA Y TCNICAS DEL ANLISIS DE CONTENIDO

corpus de documentos de que se dispone para plantearse un problema de anlisis en torno a situaciones que han producido aquellos textos, la sealizacin de categoras relevantes para aquel estudio de procesos comunicativos y la prueba de los indicadores de medida y de criterios ms adecuados al corpus, o para la delimitacin muestral de ste. Fundamentalmente estos anlisis se orientan, pues, a resolver los problemas relativos a la elaboracin de las categoras ms pertinentes que han de configurar un protocolo de anlisis y su eventual articulacin (ver infra), de modo que resulten productivas de cara a la explotacin de los datos3. Los anlisis descriptivos tienen por objeto, en un marco de estudio dado, la simple identificacin y catalogacin de la realidad emprica de los textos o documentos, mediante la definicin de categoras o clases de sus elementos. Como uno de los anlisis de contenido descriptivos ms especfico puede citarse el anlisis documental (o de recuperacin de informacin) con muchas variantes. Aparte de la identificacin intra-textual de la estructura que adopta el producto comunicativo, lo ms interesante es partir de los contextos donde se inscribe el material de anlisis, es decir, de su estructura de produccin o de recepcin comunicativa, social y culturalmente integrada: as, por ejemplo, descripcin de las caractersticas de las situaciones, entornos y contextos implicados en su produccin y recepcin (desde los histricos a los personales, desde los pblicos a los privados), o tambin descripcin de la estructura sociolgica y psicolgica que rige la conducta de los individuos, grupos o instituciones emisoras y receptoras en los procesos de comunicacin que dieron origen a esos productos. Finalmente, slo los anlisis verificativos y explicativos pueden dar cuenta de inferencias sobre el origen, naturaleza, funcionamiento y efectos de los productos comunicativos: v.g. extrapolaciones como, al estudiar el contenido, inducir una prediccin (inferencias inductivas), o estudiando un efecto, comprobar un contenido, o, estudiando un producto, comprobar los antecedentes de la comunicacin (inferencias deductivas). A veces algunos anlisis se centran en las inferencias que se realizan a partir del estudio de un tipo de productos comunicativos sobre otros productos comunicativos, o de los resultados de otros estudios sobre el estudio en curso. Pero en este caso hay ya que entrar en la consideracin de los tipos de anlisis de contenido segn la seleccin de las categoras que se utilizan.

Cuando se requiere una clarificacin de estas categoras y no existen datos suficientes para establecerlas a priori, los anlisis exploratorios a veces se confan a grupos que, a travs de otras tcnicas como el delphi, permiten que sean expertos o involucrados en el campo objeto de estudio, los que contribuyan a perfilar o depurar la interpretacin de los documentos y, por ella, la estructura categorial de un protocolo de anlisis que servir propiamente hablando para abordar los anlisis de contenido definitivos.

JOS LUIS PIUEL RAIGADA

3.2. Anlisis de contenido segn la seleccin de las categoras Ya deca Berelson, su padre fundador, que cualquier analisis de contenido se sostiene o se hunde por cules sean sus categoras de analisis. La seleccin de la comunicacin a estudiar permite enmarcar fenomenolgicamente el objeto material de anlisis (y en su virtud, tambin las fuentes del material que haya de configurar el corpus de estudio4), pero la seleccin de categoras construye la mirada del objeto. Las categoras siempre derivan de las miradas, o lo que es ms preciso, de las representaciones que permiten la mirada del objeto de anlisis. La vigencia de estas representaciones en el conocimiento vulgar, comparada con la del conocimiento cientfico, reside en una confianza contingente que va pegada al conocimiento particular de una actividad o acontecer particular, (v.g. cuando llueve y hace sol sale el arco del Seor). La vigencia de sus representaciones en el conocimiento cientfico reside en la transcendencia de su refutabilidad, ms all del propio conocimiento de una actividad o acontecer particular (por ejemplo, cuando un haz luminoso incide en la superficie de separacin de dos medios pticos distintos, parte de l se refleja en tanto que otra parte se propaga a travs del segundo medio ptico, si bien con velocidad distinta de la incidente; los rayos solares, al incidir sobre las gotas de agua en suspensin en la atmsfera, se reflejan en parte sobre la superficie de las mismas y en parte se refractan, dispersndose en el interior de stas segn diferentes longitudes de onda que son los colores del espectro, etc.). Pero en la investigacin bsica la refutabilidad concierne a todo el capital de representaciones cognitivas de que se dispone para extraer, a medio o largo plazo, posibles prcticas (por ejemplo, las leyes matemticas de la refraccin y dispersin de la luz en fsica facilitaron tanto la explicacin del arco iris, como la construccin de prismas y sus apliaciones pticas). Es decir, en la investigacin bsica la refutabilidad concierne a las teoras, mientras que en la investigacin aplicada, la refutabilidad concierne slo a las prcticas. En su virtud, los objetos de estudio, para la refutacin, adquieren singularidad si son representativos, y si no la pierden por su forma de elaboracin. En consecuencia, el anlisis de contenido nunca puede ser independiente, cuando se aplica, de una teora
stas pueden diferenciarse en fuentes primarias, secundarias y terciarias. Como fuentes primarias se pueden haber recabado cartas, diarios, libros, publicaciones peridicas, documentos histricos, discos, y otros registros sonoros, visuales y audiovisuales como cassettes, fotografas, pelculas, vdeos, etc. Pero a partir de estos materiales que constiyen fuentes primarias, otros textos de segundo orden o derivados de los originales (transcripcin, traduccin o interpretacin de las fuentes primarias) pueden constituir tambin fuentes apreciables para la comparacin. Podra tambin darse un tercer tipo de fuentes, las terciarias, o sea, las de aquellos materiales que son el producto de un proceso de experimentacin comunicacional en el que se introducen y/o se obervan variables controladas experimentalmente, con el objeto de constituir discursos a partir de interacciones entre los participantes, (por ejemplo, reuniones de grupo, laboratorios de teatro, y aquellas tcnicas etnogrficas y psicosociolgicas de dinmica de grupos o dramatrgicas, etc., propias de la conocida como Investigacin-Accin-Participativa IAP).
4

10

EPISTEMOLOGA, METODOLOGA Y TCNICAS DEL ANLISIS DE CONTENIDO

sobre la comunicacin que ha originado los textos que se estudian o analizan, ya sea una teora social, comunicativa, o psicolgica, etc. Las unidades para el anlisis adquieren entonces una refutabilidad que procede de la teora en virtud de la cual se han decidido cules sean sus categoras. En anlisis de contenido, concretamente, pueden ser objetos del estudio productos singulares de comunicacin social, ya hayan sido obtenidos de procesos generales de comunicacin (por ejemplo, ejemplares de peridicos impresos y distribudos, o informativos emitidos y grabados en Medios de Comunicacin de Masas MCM), y/o recabados de sistemas particulares de comunicacin (por ejemplo, los comunicados de prensa efectivamente distribuidos y los publicados y/o citados segn los medios, en inters de una organizacin); ahora bien, productos singulares pueden ser objetos del estudio slo si son refutables para el diagnstico etiolgico y/o prospectivo de los procesos comunicativos a que pertenecen. De lo contrario, pierden su refutabilidad. Este hecho est en la base de las operaciones lgicas y estadsticas de seleccin muestral: el objeto de estudio es el que marca cul es el universo del que los productos singulares pueden ser representativos o no serlo. Resumiendo, la naturaleza singular de los datos de investigacin (elaborados siempre, no encontrados en estado puro) y de los procesos que guan su elaboracin, registro y tratamiento posterior, se da en funcin de la previa fijacin de objetivos (fines) de conocimiento y prctica, y de la delimitacin de objetos de estudio adecuados a ellos, significativos o representativos, y pertinentes para su refutabilidad. 3.3. El anlisis de contenido segn el diseo de anlisis del objeto de estudio La pertinencia de acudir a situaciones espontneas y a la elaboracin de datos mediante diseccin (o anlisis) de productos singulares de comunicacin social (por ejemplo, el anlisis de contenido) procede de refutar la adecuacin, significatividad y validez de la singularidad de los productos respecto a aquellas situaciones. No hay que olvidar que en aquellas situaciones de comunicacin que brindan la posibilidad de elaborar, registrar y despus procesar datos a partir del tratamiento de los productos singulares guardados, grabados o conservados (ejemplares de peridicos puestos en circulacin, programas de radio o TV que han sido difundidos, etc.) pertenecientes a aquellas situaciones, requieren una previa diseccin de los productos orientada a su vez a elaborar, registrar y tratar datos extrados de ellos; ahora bien, es obvio que no todos los datos que pueden ser elaborados, registrados y tratados, a partir de la diseccin de productos comunicativos o textos, resultarn adecuados, y sern significativos y suficientes, para representar cientficamente la situacin comunicativa que integra supuestamente el acontecer socialmente previsto en que se recurre a la comunicacin, y que ha de constituir el objeto cientfico de anlisis; por ejemplo, este texto que estamos escribiendo y que en su momento ser impreso en el nmero de la revista que la editorial har circular, para que los lectores puedan compartir con nosotros algu-

11

JOS LUIS PIUEL RAIGADA

nas ideas de metodologa, gracias a la comunicacin escrita y comercialmente difundida en el mercado de libreras, puede ser guardado, diseccionado en sus elementos fsicos, grficos, etc.; y gracias a una operacin de diseccin, (como por ejemplo, separar las palabras que contiene), elaborar como dato, v.g., un nmero de ellas; en funcin de cmo se trate luego este dato, los registros sern diferentes (como veremos ms adelante), pero tambin ser relevante lo que se hace con ese nmero; este nmero puede servir para establecer una cantidad correspondiente de gasto (pagos al corrector tipogrfico, o al de estilo), o puede servir como un total respecto al cual calcular la frecuencia de sustantivos y verbos (palabras llenas) comparndola con la frecuencia de determinantes y partculas (palabras vacas) que contiene, en el supuesto de que esta comparacin representara un ndice de viveza literaria en el estilo y que se supone igualmente propio de cada autor; es obvio que un mismo dato (nmero de palabras) se somete a una operacin por la cual se hacen clculos que permiten extraer nuevos datos que slo sern adecuados, si estn bien hechos, pero que slo sern significativos y suficientes por su relevancia para representar un objeto que ya no es el propio texto, sino el proceso singular de comunicacin del que el texto es su producto material. Evidentemente, el dato de segundo orden referido al gasto editorial en funcin del nmero de palabras, no remite directamente al proceso de comunicacin que facilita la interpretacin cognitiva y social del texto, sino al proceso social de produccin previo a su circulacin comercial, y no a su circulacin comunicativa. En cambio, el dato de segundo orden referido a la proporcin de palabras llenas y palabras vacas se acerca ms al proceso singular de comunicacin como objeto de conocimiento, pues sirve para considerar un aspecto en la forma de expresin de sus autores (emisores); pero no es significativo ni vlido para representar la singularidad del texto respecto a la situacin comunicativa en funcin de la cual se produce, pues resulta demasiado marginal e insuficiente en un producto comunicativo cuyo objetivo primordial no es la expresin literaria o artstica, sino la claridad y el rigor argumentativo de la representacin verbal y escrita de un objeto cientfico de conocimiento: la metodologa de investigacin en anlisis de contenido. En trminos generales, por consiguiente, la pertinencia de la elaboracin de datos mediante diseccin (o anlisis) de productos singulares de comunicacin social (como es el caso del denominado anlisis de contenido) procede de someter a prueba (refutar) que las operaciones de diseccin del texto, y la elaboracin, registro y tratamiento de los datos referidos a ste, resulten adecuados, significativos y suficientes para mostrar su singularidad respecto a la situacin de comunicacin que constituye el campo de estudio para representar, a su vez singularmente, un objeto de conocimiento cientfico: la comunicacin social a la que se recurre en la agenda del acontecer colectivo. Segn el diseo de anlisis del objeto de estudio, es decir, del proceso singular de comunicacin donde tienen su origen los productos comunicativos, pueden diferenciarse tambin anlisis de contenido horizontales, verticales, transversales, longitudinales y triangulares.

12

EPISTEMOLOGA, METODOLOGA Y TCNICAS DEL ANLISIS DE CONTENIDO

Una primera manera de diferenciar los anlisis de contenido segn aquel diseo es considerar los anlisis de contenido que utilizan un corpus de documentos relativamente amplio, o aquellos que eligen corpus muy reducidos, en ocasiones de un solo caso. Aquellos anlisis que se valen de un corpus documental extenso, son los propios de los diseos horizontales o extensivos, tpicos en el anlisis de contenido de carcter cuantitativo, que suelen ser objeto de un tratamiento estadstico a partir de una construccin muestral. Un ejemplo de este anlisis de contenido horizontal, desmesurado por el voluminoso universo textual al que fue referido, es el estudio propuesto por Lasswell (1965) que pretenda probar que se haba puesto en marcha una revolucin mundial a partir del anlisis de los smbolos polticos de los editoriales periodsticos de Francia, Alemania, Gran Bretaa, Rusia y los Estados Unidos y de los que aparecan en los discursos polticos de grandes lderes nacionales en todos estos pases. Se trataba por consiguiente de analizar como objeto de estudio, ms que procesos singulares de comunicacin, toda una categora abstracta de estos procesos, construida por la similaridad de sus productos: los editoriales de prensa, por una parte, y los discursos polticos, por otra. Pero las conclusiones no apuntaban sin embargo al objeto, sino a hiptesis previas supuestamente operativas tanto para los procesos de comunicacin de masas, como para las ceremonias polticas donde se pronuncian discursos, como para cualquier otro proceso de interaccin social donde a su vez seran operativos los valores manifestados a travs de la comunicacin de masas y los propios discursos polticos. El otro tipo de anlisis de contenido que cabe distinguir es el de los diseos verticales o intensivos, como se ha dicho caracterizados por corpus muy reducidos o de un solo caso, cuyo desarrollo, a diferencia del que es propio de diseos horizontales, en ocasiones es mucho ms amplio que el texto analizado. Por lo general, se trata de anlisis no cuantitativos, que no recurren a procedimientos de muestreo, en los que el significado deriva ms de las relaciones, las oposiciones y el contexto, que de medidas cuantitativas. Este tipo de anlisis apenas puede ser replicado y puede adolecer de falta de representatividad en sus hallazgos, pues investigadores diferentes, estudiando el mismo documento o caso, pueden llegar a conclusiones opuestas. Un ejemplo de este anlisis de contenido vertical es el que ofrecen los anlisis estructural-semiolgicos del tipo del realizado por Eco en la Estructura ausente (1968) sobre spots publicitarios, o del realizado por Todorov (1966) sobre una obra literaria como Las relaciones peligrosas, o del realizado por Hall (1973) sobre un gnero cinematogrfico como el Western. El anlisis de contenido con diseo transversal es aquel que consiste en seleccionar muestras de corpus textuales que difieren, por ejemplo, en cuanto a una toma de postura ante un tema, y formar con ellos grupos independientes que se analizan en el mismo momento histrico crucial reflejado en esos corpus. Si son representativos y se igualan las condiciones de esos grupos, las diferencias que se observen habr que atribuirlas a las posiciones diversas, pero siempre parmanecer la duda de

13

JOS LUIS PIUEL RAIGADA

si son debidas tambin a diferentes situaciones de comunicacin que les son propias. En 1965, Holsti, Brody & North (ver Holsti, 1969) analizaron la sucesin de declaraciones pblicas efectuadas durante la crisis de los misiles cubanos en 1962 por importantes funcionarios del gobierno norteamericano y de la Unin Sovitica, evalundolas segn la teora de las actitudes de Osgood, de lo cual extrajeron un modelo de interdependencia dinmica de la guerra fra en situaciones de crisis. Evidentemente, los contextos particulares de las situaciones originarias de la produccin de discursos, no se consideraron relevantes: la hiptesis de base ligaba directamente las declaraciones pblicas a la teora de las actitudes, menospreciando, o no tomando en consideracin, las mediaciones propias de los procesos que daban a conocer tales declaraciones. El anlisis de contenido con diseo longitudinal consiste en analizar corpus en diferentes momentos de su trayectoria, ya sea aplicando medidas repetidas o sirvindose de muestras independientes. Se trata de los anlisis de tipo sistmico propugnados por Rapoport (1969), que desarrolla una teora sistmica de los corpus textuales, segn la cual hay que anlizar siempre bajo los mismos parmetros el cambio o la evolucin de un mismo corpus textual (por ejemplo, editoriales de un peridico) como sistema autnomo. Si el anlisis abarca a un nmero representativo de medios de comunicacin, el autor seala que los resultados pueden considerarse como indicadores temticos del clima social. Es evidente que tambin aqu se parte de presuposiciones tales como que los procesos singulares de comunicacin se pueden categorizar por la sistematicidad de sus productos (lo cual puede ser cierto a veces, pero no siempre) y que el clima social puede ser descrito por una sola variable, aunque slo sea indicativa, como es una categora artificialmente construida de productos de comunicacin. En consecuencia, el problema no es conocer la comunicacin por sus productos, sino en todo caso el pretendido clima social, por la comunicacin, de la cual slo se retiene una categora de variables: el gnero predefinido de productos analizados. En el diseo triangular, el trmino triangulacin se utiliza de varias formas, pero fundamentalmente se refiere a la recogida y comparacin de distintas perspectivas sobre una misma situacin de comunicacin. Se basa en la contrastacin de la descripcin, explicacin y evaluacin de los contenidos analizados en una investigacin, con otras descripciones, explicaciones o evaluaciones de otras investigaciones independientes realizadas sobre el mismo objeto, o bien, dentro de una misma investigacin sobre idntico objeto, de una combinacin de tcnicas, entre ellas el anlisis de contenido, como medio de dar validez externa a los datos. Un ejemplo de este tipo de diseos lo muestra la investigacin expuesta en Piuel & Gaitn (1995) y realizada por Piuel en 1992 sobre el plebiscito chileno de 1988, en la que se combinaron y compararon los resultados de un anlisis de contenido de la campaa electoral del plebiscito chileno en TV y de un anlisis a partir de una encuesta realizada entre los , ciudadanos chilenos nada ms acabar la campaa y realizada la consulta electoral.

14

EPISTEMOLOGA, METODOLOGA Y TCNICAS DEL ANLISIS DE CONTENIDO

3.4. Anlisis de contenido segn los parmetros de medicin y evaluacin Segn los parmetros de medicin y evaluacin pueden diferenciarse anlisis de contenido cuantitativos y cualitativos. La distincin entre anlisis de contenido cuantitativos y cualitativos es dbil, sin embargo, porque los aspectos cualitativos se encuentran en toda investigacin que parta de una teora que sirve para construir el objeto cientfico de estudio, y los anlisis de contenido no pasan a la cuantificacin de las unidades de anlisis hasta que no se ha definido previamente un repertorio de categoras o items provistos por el marco terico, el planteamiento de problemas y por los objetivos del estudio aplicado a un objeto, siempre construido a priori. Pero si reparamos, en cambio, en los parmetros de medicin, se observara que pueden diferenciarse anlisis de contenido frecuenciales, que contabilizan el nmero de ocurrencias o de co-ocurrencias de indicadores o categoras, y anlisis de contenido no frecuenciales que tienen en cuenta su presencia o ausencia. Entre los anlisis de contenido frecuenciales cabe distinguir los anlisis distribucionales de tipo estadstico y los anlisis de relaciones. En los primeros, la interpretacin de frecuencias se atiene a varias normas estadsticas, y en concreto: la norma de la distribucin uniforme, la norma de la distribucin estable y la norma de la representacin no desviada; la norma de la distribucin uniforme permite resaltar que la frecuencia de una categora es mayor o menor que el promedio de todas las categoras, mientras la norma de la distribucin estable permite apreciar modificaciones en las frecuencias con el transcurso del tiempo. La norma de la representacin no desviada, finalmente, pone de manifiesto que las frecuencias observadas son mayores o menores de lo que sera previsible si la muestra fuera representativa de la poblacin de referencia. Las frecuencias sirven entonces para medir estadsticamente datos descriptivos, o para establecer escalas bipolares que marcan la direccin (favorable, desfavorable, neutra, ambivalente), o la intensidad y la direccin simultneamente (cfr. Piuel & Gaitn, 1995). Por otra parte los anlisis de contenido relacionales pueden medir la co-ocurrencia, pero siempre a partir de tabulaciones previas frecuenciales del tipo de las tablas de contingencia (ver Piuel & Gaitn, 1995: cap. 4), entre distintos elementos categoriales, estableciendo entonces relaciones de determinacin, asociacin, equivalencia, oposicin, exclusin, proximidad, simultaneidad, secuencialidad u orden. La tabulacin de frecuencias cruzadas o de co-ocurrencia de dos dimensiones, por su gran simplicidad, es de las ms utilizadas. Pero se dispone tambin de la posibilidad de hacer uso de tcnicas multivariadas para verificar estructuras ms complejas con datos multidimensionales. En el anlisis relacional, el esclarecimiento de estructuras de relaciones lgicas entre categoras, para constatar la discriminacin o la consistencia de unas sobre otras, son tambin otros ejemplos de cmo pueden desarrollarse estas tcnicas (Piuel & Gaitn, 1995).

15

JOS LUIS PIUEL RAIGADA

Cuadro 1 CATEGORAS UNIDADES DISECCIN DISCIPLINA DE DE ANLISIS INFLUENCIA


Trminos, palabras Semntica Lexicologa Psicologa cognitiva Psicosociologa Sociologa de la comunicacin Psicosociologa

PROCESAMIENTO O MEDIDA

OBJETOS DE ESTUDIO (EJEMPLOS)


Hbitos verbales Campos semnticos Productos singulares de comunicacin interpersonal y de masas Productos singulares de comunicacin de masas, segn formatos: periodismo, publicidad, espectculo, etc. Enunciaciones referidas a contextos en productos singulares de procesos de comunicacin Relatos ubicados en contextos de procesos singulares de comunicacin Dramatizaciones entre los interlocutores por el uso de enunciaciones y relatos latentes Productos comunicativos referidos a historias personales de comportamientos comunicativos

Unidades lxicas

Cuantitativo (estadstico)

Unidades temticas Conceptos, referencias

Cuantitativos (estadstico) y/o cualitativos (lgicos) Cuantitativos (estadstico) y/o cualitativos (lgicos)

Unidades temtico Valoraciones, / evaluativas actitudes

Unidades lingsticoproposicionales

Oraciones Proposiciones

Gramatologa Filosofa del lenguaje Sociolingstica

Cualitativos (lgicos)

Unidades formales anlisis semiolgico

Relatos

Antropologa Cualitativos (lgicos) Psicosociologa del conocimiento Narratolologa Sociolingstica Etnometodologa Semitica Socioanlisis Cualitativos (lgicos y hermenuticos)

Unidades pragmticas del discurso y anlisis semitico de acciones Macro-unidades psicobiogrficas y anlisis de historias de vida

Relacin entre enunciacin e interaccin comunicativa

Actores, Crtica literaria personajes Psicosociologa histricos, sujetos representativos Psicologa clnica de aconteceres

Cualitativos (lgicos y hermenuticos)

16

EPISTEMOLOGA, METODOLOGA Y TCNICAS DEL ANLISIS DE CONTENIDO

3.5. El anlisis de contenido segn las unidades de registro y de anlisis Las unidades de registro y las unidades de anlisis en ningn caso son independientes del objeto de estudio, de las fuentes que se eligen estudiar, del diseo de anlisis, de la tcnica de medicin y evaluacin empleada, y, por supuesto, de su campo de aplicacin. En el Cuadro 1 se ilustra de modo esquemtico el ajuste metodolgico entre el tipo de anlisis de contenido, los objetos de estudio, la disciplina de influencia y el campo de aplicacin citando algunos ejemplos. 4. Las tcnicas del anlisis de contenido Dos aspectos fundamentales hay que considerar respecto a las tcnicas para elaborar, registrar y tratar datos en anlisis de contenido. Uno es la normalizacin de los procedimientos para llevar a cabo cada investigacin particular. Otro es la eleccin del software que mejor pueda ajustarse a los planteamientos tericos y metodolgicos de los que se parte. Las consideraremos por este orden. 4.1. La normalizacin de los procedimientos de anlisis: el protocolo Cualquier anlisis de contenido, en tanto que tcnica para la elaboracin, registro y tratamiento de datos sobre procesos singulares de comunicacin, a partir de un corpus representativo de sus productos (mensajes, textos o discursos) singulares, o a partir de un corpus representativo de grabaciones registradas que a la postre constituyen un documento, se somete a un conjunto de procedimientos interpretativos y de tcnicas de refutacin, conocido como protocolo5. Puede decirse que el protocolo es, por consiguiente, un procedimiento o conjunto de normas que guan tanto la segmentacin del corpus segn el establecimiento de criterios interpretativos para su lectura u observacin, como para efectuar el registro ms adecuado de datos, disponibles despus para su tratamiento estadstico o lgico y para el procesamiento posterior (o transmutacin) en datos de segundo y tercer orden, es decir, en datos referidos, a su vez, a datos previamente registrados y tratados. Gracias a la existencia y manejo adecuado de un protocolo de anlisis, suficientemente objetivado, si el mismo corpus es analizado por investigadores diferentes, las conclusiones del estudio deben ser coincidentes; ms an, gracias a la existencia y manejo adecuado de un protocolo de anlisis, suficientemente objetivado, si el mismo o diferentes investigadores estudian corpus diferentes pero igualmente representativos de los mismos procesos y sistemas de comunicacin, tambin concluirn en semejantes resultados; y, finalmemte, gracias a la existencia y manejo adecuado de un protocolo de anlisis, suficientemente objetivado, si el mismo o diferentes
Los programas de anlisis de contenido automtico por ordenador tienen cada cual su protocolo. En este apartado, sin embargo, se toman en cuenta los procedimientos generales sean cuales sean las rutinas particulares de cada programa.
5

17

JOS LUIS PIUEL RAIGADA

investigadores estudian corpus diferentes pero igualmente representativos de diferentes procesos y sistemas de comunicacin, podrn llegar a conclusiones vlidas tanto para comparar los procesos por su naturaleza, como por su evolucin temporal. En efecto, como es sabido, el trmino griego prtokollon, derivado del adjetivo prtos (primero) y del verbo kolln (pegar, ligar, unir), dio origen a los trminos latino protocollum, y al nuestro, protocolo, cuyas acepciones especficas en los mbitos ceremoniales (tanto desde el punto de vista jurdico como diplomtico), pero tambin en la investigacin cientfica, comparten una misma idea: lo que se dispone para ligar de forma vlida un procedimiento. En la investigacin cientfica, concretamente, se entiende por protocolo, o conjunto de enunciados protocolarios, precisamente aquellas reglas de procedimiento necesarias para llevar a cabo un proceso de observacin o experimentacin. En todos los mbitos persiste, entonces, la misma nocin: protocolo es aquello que se dispone para ligar de forma vlida un procedimiento. Esto es tanto como decir que si el procedimiento (manera de proceder, de seguir unos determinados pasos tras otros, etc.) es vlido, lo ser en la medida que no se podrn refutar sus efectos, o sus resultados; las conclusiones, por consiguiente, si existe y se maneja adecuadamente un protocolo de anlisis, suficientemente objetivado, resultarn irrefutables mientras no cambie (por la teora o por la praxis) el objeto de estudio. De aqu la importancia de que el protocolo sea vlido, al menos tanto, como para asegurarse unos lmites razonables al riesgo epistemolgico de cualquier conocimiento: que el procedimiento de observacin sustituya al objeto observado, y entonces nunca podr el conocimiento transcenderse a s mismo. En general, los protocolos para el anlsis de contenido constan de dos tipos de guas de procedimiento. Una es la gua para la interpretacin y segmentacin del corpus, que suele llamarse libro de cdigos. Otra es la gua para el registro de datos, que suele conocerse como ficha de anlisis. 4.1.1. El libro de cdigos: gua para la segmentacin del corpus El libro de cdigos es un manual de instrucciones en el que se establece: 1) Cul es la naturaleza del corpus, qu contiene, para qu sirve, cmo interpretarlo o desde qu perspectiva abordar su lectura, escucha o visualizacin; 2) Cules son sus unidades de anlisis, es decir, cmo segmentar el corpus de forma que a medida que se lee, escucha o visualiza, el analista sepa cundo abrir una ficha de anlisis y proceder a ir registrando datos re-leyendo, reescuchando o re-visualizando los segmentos establecidos de ese corpus; 3) Cmo rellenar las fichas de anlisis, sabiendo a qu cdigo alfanumrico corresponden cada una de las apreciaciones de la interpretacin del segmento analizado; 4) Cmo dar por concluida cada ficha de anlisis, y cmo ordenarlas y archivarlas para su uso posterior en el tratamiento de los datos registrados;

18

EPISTEMOLOGA, METODOLOGA Y TCNICAS DEL ANLISIS DE CONTENIDO

5) Cmo construir o usar una base de datos que permita elaborar y procesar datos de segundo y tercer orden, es decir, cmo producir nuevos datos sobre los inicialmente registrados en las fichas y en la base a la que se han trasladado; 6) Eventualmente, aunque esto no suele fomar ya parte del libro de cdigos, cmo obtener, usando la base, datos de segundo y tercer orden mediante un plan de explotacin: recuento de frecuencias, por ejemplo, establecimiento de medidas estadsticas, correlaciones, plan de cruces para tablas de contingencia, etc. Consideremos una a una estas operaciones para realizar de las cuales se dan instrucciones en el libro de cdigos. Si estas se tienen en cuenta, podrn posteriormente mejor seleccionarse las tcnicas de software que puedan ser usadas, pues mejor podr conocerse que fases son incluidas en sus protocolos de usuario, y cul es la rentabilidad que cada tcnica permite en ahorro de tiempo. De hecho, en los primeros tiempos del anlisis de contenido, todos los procesos sealados se hacan manualmente. Despus, lo primero que se introdujo fue el procesamiento informtico a partir del repicado de los datos, desde las fichas de anlisis, a las bases de datos estadsticas disponibles. Ms tarde, se llegaron a sustituir las fichas de anlisis por bases de datos diseadas para ser utilizadas y rellenadas directamente desde la lectura u observacin del texto. Finalmente, se disearon programas informticos que a partir del reconocimiento ptico de los caracteres visualizados por escner sobre los propios textos, realizan ya todos los pasos en aquellos anlisis exclusivamente apoyados en la segmentacin lingstica de textos impresos. No obstante, el libro de cdigos es siempre un manual de instrucciones a la medida de la metodologa de investigacin concreta, nunca puede funcionar como una prenda prt--porter. Es obvio que no todos los datos que pueden ser elaborados, registrados y tratados, a partir de la diseccin de productos comunicativos o textos, resultarn adecuados, y sern significativos y suficientes, para representar cientficamente la situacin comunicativa que integra supuestamente el acontecer socialmente previsto en que se recurre a la comunicacin, y que ha de constituir el objeto cientfico de anlisis. En trminos generales, por consiguiente, la pertinencia de la elaboracin de datos mediante diseccin (o segmentacin) de productos singulares de comunicacin social (como es el caso del anlisis de contenido) procede de someter a prueba (refutar) que las operaciones de diseccin del texto, y la elaboracin, registro y tratamiento de los datos referidos a ste, resulten adecuados, significativos y suficientes para mostrar su singularidad respecto a la situacin de comunicacin que constituye el campo de estudio, el cual tiene que representar, a su vez singularmente, un objeto de conocimiento cientfico: la comunicacin. Para cumplir este requisito en lo que atae al primer gnero de instrucciones citadas, y una vez justificada la representatividad muestral del corpus (con exigencias similares a la representatividad requerida de una muestra de poblacin a encuestar, cuando se define un universo), es necesario que las operaciones de diseccin del

19

JOS LUIS PIUEL RAIGADA

texto resulten adecuadas a ese objetivo, y a su justificacin se dedica el primer captulo del manual de instrucciones, es decir, a explicar cul es la naturaleza del corpus, qu contiene, para qu sirve, cmo interpretarlo o desde qu perspectiva abordar su lectura, escucha o visualizacin. Ello supone que el analista cuente con la suficiente competencia comunicativa para interpretar el texto, o al menos que la pueda adquirir situndose en la perspectiva exigida por esa competencia. En los programas de anlisis automtico de textos, este tipo de instrucciones es el que se lleva a cabo los diccionarios y thesaurus del programa, razn por la cual estos programas slo pueden abordar anlisis demasiado pegados a la segmentacin semntica de los trminos y enunciados, pero no al registro y tratamiento de datos extratextuales (como los pragmticos de tipo retrico, argumentativo, narrativo, etc.). El segundo captulo del manual de instrucciones que constituye el libro de cdigos est dedicado a exponer y justificar cmo segmentar el corpus de forma que a medida que se lee, escucha o visualiza, el analista sepa cundo abrir una ficha de anlisis y proceder a ir registrando datos re-leyendo, re-escuchando o re-visualizando los segmentos establecidos de ese corpus. Una ficha de anlisis, como se expondr posteriormente, es semejante a un cuestionario de encuesta; si concluida la aplicacin de una encuesta, hay tantos cuestionarios rellenos como encuestados hayan respondido a las preguntas que contiene, al concluir el registro de datos en anlisis de contenido, habr tantas fichas de anlisis rellenas como unidades se hayan encontrado en la segmentacin del copus. La diferencia est en que antes de aplicar una encuesta, ya se sabe previamente cuntos cuestionarios se necesitan: tantos como individuos, grupos familiares, etc., se hayan seleccionado como muestra representativa del universo a estudiar. Pero en el anlisis de contenido la muestra es el corpus: un nmero de ejemplares de peridicos que representan al universo de ejemplares difundidos en un tiempo dado, cubriendo un cierto territorio de audiencias; o un nmero de pelculas, programas de TV, obras escnicas, etc., que representan al universo de obras o productos comunicativos relevantes para conocer un proceso de comunicacin como objeto de estudio, etc. Se sabe por consiguiente con cuntos ejemplares (peridicos, pelculas, programas de TV) se cuenta, y se sabe de antemano cmo segmentar el corpus, por ejemplo, en unidades de redaccin en cada peridico (editoriales, o, por secciones, noticias, artculos de opinin, crnicas, reportajes, etc. ), o por secuencias en el flujo audiovisual de las retransmisiones por TV de , los spots de publicidad, o de las teleseries. Pero no se sabe muchas veces con certeza cuntas unidades de anlisis aparecern. Este es el tipo de unidades que pueden denominarse unidades formales y que son las unidades que componen fenomenolgicamente al objeto material de estudio, y sirven para fijar alternativas metodolgicas por las que se transmutan en datos manejables, segn eleccin de una o ms tcnicas para procesarlos y analizarlos. Obviamente, las alternativas metodolgicas tienen que ver con la elaboracin y registro posteriores de otros datos que hemos dado en llamar de segundo orden (presencia o ausencia de determinados rasgos en

20

EPISTEMOLOGA, METODOLOGA Y TCNICAS DEL ANLISIS DE CONTENIDO

las unidades formales: por ejemplo, en los editoriales de los peridicos, o en las secuencias del programa de TV ), e incluso de tercer orden (ndices de frecuencia, relaciones estadsticas o lgicas obtenidas por comparacin de stas, etc.) que tendrn que ser procedentes del objeto de estudio, y que tendrn igualmente que ser significativos y suficientes para contrastar el objeto de estudio y los objetivos fijados en su anlisis. Por ejemplo, el libro de cdigos puede exponer y justificar que cada vez que en el flujo audiovisual se cambia de secuencia, hay que volver atrs, revisualizar la secuencia concluida, y considerndola de principio a fin, abrir una ficha en la que se registrarn datos internos sobre temas, personajes, escenarios, acciones, etc. (vase un ejemplo de libro de cdigos y ficha de anlisis en Piuel & Gaitn, 1995: cap. 6). O elegidos todos los editoriales de El Pas, aparecidos a lo largo de un determinado tiempo, abrir una ficha cada vez que aparece un enunciado genrico universal, y releyndolo registrar datos internos sobre variables de la referencia, la predicacin, la atribucin, la modalidad, etc. (vase Gaitn, 1991). El tercer captulo de un libro de cdigos se dedica a establecer cmo rellenar las fichas de anlisis, sabiendo a qu cdigo alfanumrico de ella corresponden cada una de las apreciaciones de la interpretacin del segmento analizado (secuencia de TV cuadro escnico, frases de los titulares que componen una unidad periodstica, , etc.) Estas apreciaciones, si el analista o equipo de analistas cuentan con la competencia comunicativa requerida, constituyen los datos que ms tarde irn, ficha por ficha, a integrar la base de datos. Es ste quizs el captulo central de cualquier libro de cdigos, hasta el punto que por esta causa, el manual de instrucciones as llamado, se denomina libro de cdigos. Su contenido est estrechamente ligado a la estructura de la ficha de anlisis, o cuestionario que el analista rellena como si l fuese un encuestador que se hace preguntas a s mismo y las responde a la medida de su apreciacin de cada segmento analizado. Para que esta apreciacin, entonces, resulte lo ms objetivada posible, las instrucciones (claras, precisas, sin ambigedades posibles) suelen ensayarse de antemano en las pruebas piloto, e incluso probarse experimentalmente recurriendo a grupos de jueces que experimentalmente sirven para contrastar las apreciaciones buscadas ante la lectura, escucha o visualizacin de segmentaciones representativas del corpus. Las apreciaciones sobre los aspectos relevantes de cada segmentacin, se estructuran por variables y categoras, a cada una de las cuales se le har corresponder con un nmero de columnas y filas en la base de datos. Por ello, este captulo del libro de cdigos es tan crucial, ya que resulta el ms consultado por los analistas cada vez que ante una apreciacin no sepa con certeza qu nmero de variable asignarle y qu nmero de categora le corresponde. El cuarto captulo del libro de cdigos se dedica a explicar cmo dar por concluida cada ficha de anlisis, y cmo ordenarlas y archivarlas para su uso posterior en el tratamiento de los datos registrados. Normalmente las instrucciones referidas al cierre, as como al orden de archivo para uso posterior respecto a la base de datos, viene

21

JOS LUIS PIUEL RAIGADA

determinado por aquellas variables que en la ficha de anlisis se refieren a la numeracin e integracin de cada unidad formal en la estructura del corpus. Por ejemplo, si a cada enunciado genrico universal le corresponde una ficha de anlisis a rellenar, en ella habr que consignar datos referidos al editorial en cuestin, identificable por su tema, su orden de aparicin en el peridico, su fecha de pblicacin, etc. Y si a cada secuencia de un spot de publicidad le ha de corresponder una ficha de anlisis, en ella habr que consignar a qu spot pertenece, cul es el producto anunciado, a qu categora de productos pertenece, etc. Incluso a veces una ficha de anlisis (o una fila en la base de datos, especialmente en aquellas bases de datos informticas que directamente remplazan a las fichas que utiliza el analista), incluye variables que contienen ya recuentos o clculos sobre datos registrados en la misma ficha (o fila); por ejemplo, si se han consignado variables para operadores y conectores ligados a unidades lxicas, o referenciales, o predicativas, etc., los clculos en funcin de los cuales evaluar actitudes, argumentos, etc., y que servirn para caracterizar a cada unidad formal o segmentacin analizada en la ficha de anlisis. En ocasiones, no todas las variables de una ficha de anlisis presentan precodificadas todas las casillas posibles para dar respuesta a las apreciaciones de sus rasgos; puede haber variables cuya apreciacin la expresa cada analista escribiendo una frase o una palabra clave que a su juicio puede resumirla. En ese caso, ser necesario posteriormente postcodificar las respuestas, antes de registrarlas en la base de datos, de forma que slo se considerar concluida una ficha, cuando tras la palabra clave recogida, se acompaa el registro correspondiente a la categora de pots-codificacin que resulte necesario consignar. El quinto captulo del libro de cdigos sirve para explicar cmo construir o usar una base de datos que permita elaborar y procesar datos de segundo y tercer orden, es decir, cmo producir nuevos datos sobre los inicialmente registrados en las fichas y en la base a la que se han trasladado. Esto se establece dando instrucciones sobre el tipo de operaciones a efectuar con el conjunto de las fichas de anlisis ya rellenas: por ejemplo, agrupndolas a veces segn categoras relevantes por el objeto de estudio, por el corpus analizado, por las segmentaciones efectuadas en ste, etc. Cuando los procedimientos de anlisis eran manuales, esta parte del libro de cdigos era muy prolija, especialmente en los anlisis de unidades temticas y evaluativas. Hoy en da, en que prcticamente slo se utilizan bases de datos informticas, este tipo de operaciones son ms fciles de realizar, pues se efectan mediante el teclado de funciones tiles para segmentar los archivos, una vez que todos los datos de las fichas (o registros del archivo) correspondientes, han sido introducidos. Normalmente estas instrucciones son las que dejan ya dispuestos los datos registrados en el conjunto de las fichas de anlisis, para su tratamiento o procesamiento posterior, y que constituye a veces un apartado de este captulo, o un nuevo captulo, el sexto, de los citados anteriormente. El sexto y ltimo captulo del libro de cdigos se dedica a explicar cmo obtener, usando la base, datos de segundo y tercer orden mediante un plan de explotacin: recuento de frecuencias, por ejemplo, establecimiento de medidas estadsticas, corre-

22

EPISTEMOLOGA, METODOLOGA Y TCNICAS DEL ANLISIS DE CONTENIDO

laciones, plan de cruces para tablas de contingencia, etc. Tambin puede ocurrir que estas instrucciones no formen parte del libro de cdigos, pero siempre formarn parte del protocolo de anlisis, pudiendo entonces constituir una tercera gua (llamada plan de explotacin). La razn por la cual el plan de explotacin de datos no suele incluirse en el libro de cdigos es que esto va destinado al equipo de analistas cuya misin termina con el rellenado de todas las fichas de anlisis, mientras re-leen, re-escuchan o re-visualizan el corpus, y con el archivado de stas cumpliendo las instrucciones dadas para su agrupamiento y ordenacin. Se supone que el trabajo con las bases datos, tras haber repicado todos los registros en ella, no es misin de los analistas, sino de otro equipo de colaboradores en la investigacin: los procesadores de datos. Es a ellos entonces a quienes se destina el plan de explotacin. Siguiendo el plan de explotacin, los procesadores terminan su trabajo proporcionando lo que se denominan tabulaciones, a partir de las cuales el investigador principal efectuar la interpretacin de los datos de segundo y tercer orden, y elaborar los datos de orden posterior es decir, aquellos que sirven para exponer y describir las conclusiones del estudio. Son estas ltimas unidades, y sus correspondientes interpretaciones relativas a variables confirmadas y no confirmadas, las que precisamente se llevarn al informe de investigacin en calidad de conclusiones, y especialmente las que dotan de sentido a todo el proceso de elaboracin, registro y tratamiento de datos. Por esta razn, cuando la investigacin est concluida, y el problema inicial cobra una solucin aplicable, ya sea a corto o largo plazo, el informe presenta, junto a las correspondientes unidades de cada fase de aplicacin del protocolo, los anexos del Libro de cdigos, Ficha de anlisis y Plan de explotacin. Muchos datos que sin embargo han sido extrados en el proceso de investigacin y que permanecen ocultos en las tabulaciones, sern silenciados o desechados. Las tabulaciones posiblemente han contemplado cruces entre variables (e incluso, puesto que su base informtica lo permite, se han efectuado nuevos cruces no previstos en el plan de explotacin) que sin embargo no llegan al informe final, ya sea porque sus datos resultan no suficientemente significativos, o porque se hicieron de forma exploratoria an suponiendo que podan carecer de significatividad. En el informe, pues, slo aparecern aquellas unidades de orden posterior, o conclusiones, que sirvan para confirmar en uno u otro sentido, las relaciones entre el objeto de estudio analizado, y el problema planteado desde los objetivos inicialmente formulados. Pero el protocolo de anlisis con sus correspondientes libro de cdigos, ficha de anlisis y plan de explotacin, se presenta como si de tal objeto de estudio, dado el planteamiento del problema inicial, slo se pudieran haber elaborado, registrado y tratado los datos previstos, cuando en realidad todo investigador lo sabe hay infinidad de datos de diverso orden, elaborados, registrados y tratados pero que sin embargo nadie conocer, salvo el investigador y sus colaboradores. 4.1.2. La ficha de anlisis: plantilla para el registro de datos La ficha de anlisis es una plantilla para el registro de datos al re-leer, re-escuchar

23

JOS LUIS PIUEL RAIGADA

o re-visualizar cada una de las segmentaciones del corpus, contempladas en el libro de cdigos. Como se explic antes, se trata de un cuestionario que el analista rellena como si l fuese un encuestador que se hace preguntas a s mismo y las responde a la medida de su apreciacin de cada segmento ledo, escuchado o visualizado. Pero a diferencia de los cuestionarios de encuesta, donde para cada variable se formula la pregunta correspondiente, ms las casillas para registrar las respuestas previstas y precodificadas, en la ficha de anlisis a veces no se formula ninguna pregunta, sino slo el nombre de la variable y en todo caso su nmero de cdigo (columna, en la base de datos). La razn es que el analista siempre tiene a mano el libro de cdigos para consulta y, adems, siempre es ms manejable una ficha de anlisis de slo una cara (habitualmente en una cartulina del tamao ficha) que si para rellenar cada una de ellas tiene que manejar un folleto (el lector puede consultar una ficha de anlisis en el ejemplo de investigacin expuesto en Piuel & Gaitn, 1995: 463). Y, sobre todo en este caso, el de usar fichas de anlisis para consignar manualmente el registro de datos, se gastar menos papel, pues lo normal es que un anlisis supere las 5.000 fichas. La estructura de la ficha, con sus correspondientes variables y casillas para consignar el registro de datos, debe servir para rellenarlas lo mejor posible, de forma que el analista pronto aprenda, sin tener que recurrir ms que al principio al libro de cdigos, a registrar los cdigos alfanumricos que se corresponden con cada variable, y con cada una de las apreciaciones personales de la interpretacin del segmento observado (frases de los titulares que componen una unidad periodstica, secuencia de TV cuadro escnico, etc.). Estas apreciaciones, si el analista o equipo de analistas , cuentan con la competencia comunicativa requerida, y que constituyen los datos que ms tarde irn, ficha por ficha, a integrar la base de datos, son las que se consignan rellenando la casilla o casillas correspondientes para cada variable. Las fichas de anlisis suelen comenzar por aquellas variables que se utilizan para relacionar la unidad de anlisis, o segmento del corpus visualizado u observado, con el resto de unidades que integran cada ejemplar del corpus, y con todo el corpus globalmente. Por ejemplo, spot a que pertenece la secuencia visualizada, o editorial al que pertenece la frase retenida, y nmero o categora que dentro del corpus le corresponde al spot, o al peridico, etc. En segundo lugar, las fichas de anlisis suelen continuar por aquellas variables que ataen a los aspectos ms generales del segmento ledo o visualizado (por ejemplo, temas generales, o mbitos de referencia), hasta llegar a aquellas otras variables que ataen a detalles ms particulares (por ejemplo, en una frase, variables referidas a la expresin de sujeto, y a la expresin de predicado, o en una secuencia, variables que ataen al escenario donde ni los actores ni los objetos cambian, aunque se sucedan acciones diversas); finalmente se da paso, de la forma que resulte ms fcil para los analistas, a las variables que requieren relecturas, o re-visualizaciones, repetidas para interpretar detalles (por ejemplo, categoras de la atribucin, modalidad, relaciones, o, refirindose a los personajes de un relato, categoras referentes a las apre-

24

EPISTEMOLOGA, METODOLOGA Y TCNICAS DEL ANLISIS DE CONTENIDO

ciaciones de su rasgos fsicos, o sociales, o comunicativos, o a sus acciones, aspiraciones, actos, enunciaciones, etc.). Incluso a veces una ficha de anlisis (o una fila en la base de datos, especialmente en aquellas bases de datos informticas que directamente remplazan a las fichas que utiliza el analista), incluye variables que contienen ya recuentos o clculos sobre datos registrados en la misma ficha (o fila); por ejemplo, si se han consignado variables para operadores y conectores ligados a unidades lxicas, o referenciales, o predicativas, etc., los clculos en funcin de los cuales evaluar actitudes, argumentos, etc., y que servirn para caracterizar cada unidad formal o segmentacin analizada en la ficha de anlisis. Estos clculos para cada ficha, cuando stas se rellenan manualmente, pueden afectuarse antes de concluirla, o en un segundo momento que ser aquel en que se revisan todas las fichas cumplimentadas y se disponen para su ordenacin, archivo y traslado a la base de datos informtica (repicado). Ms an, ya hemos dicho anteriormente que en ocasiones no todas las variables de una ficha de anlisis presentan precodificadas todas las casillas posibles para dar respuesta a las apreciaciones de sus rasgos; en ese caso puede haber variables cuya apreciacin la expresa cada analista escribiendo una frase o una palabra clave que a su juicio puede resumirla. Esto facilita enormemente el proceso de visualizacin o lectura y el cumplimiento de cada ficha, evitando as que una cierta inercia en el registro de categoras demasiado cualitativas, pero expresadas por nmeros, se escasquille en la rutina del analista. Consignada pues una palabra clave, o juicio extrado del texto en su literalidad, ser necesario posteriormente postcodificar las respuestas as expresadas, antes de registrarlas en la base de datos, de forma que slo se considerar concluida una ficha cuando tras la palabra clave recogida, se acompaa el registro correspondiente a la categora de post-codificacin que resulte necesario consignar. Este proceso lo suelen realizar los analistas, siguiendo las instrucciones del libro de cdigos, cuando revisan los clculos internos de cada ficha si los hubiera y cuando proceden a la ordenacin y archivo de las fichas, momento que aprovechan para aplicar sus instrucciones y rellenar las casillas numeradas que se corresponden con las categoras de la post-codificacin. A partir de aqu, el restante tratamiento de datos en anlisis de contenido corresponde al plan de explotacin, cuyas caractersticas ya hemos explicado y cuyo documento es hoy exclusivamente un archivo informtico (habitualmente denominado tabulacin) que por su formato (en general en lenguaje ASCII universal) puede ser importado a los programas estadsticos de tratamiento de datos (v.g. el SSPS) que efectan con ellos las operaciones que el investigador, l mismo, o los colaboradores encargados del procesamiento, realizan siguiendo el plan de explotacin. Las tcnicas basadas en software informtico suelen ahorrar muchos de estos pasos. La lgica marcada por sus protocolos internos suele ser del mismo tipo. Ahora slo queda, una vez tenido lo anterior en consideracin, contemplar cul es el universo de tcnicas informticas de anlisis de contenido, tratando de clasificarlas y describirlas brevemente.

25

JOS LUIS PIUEL RAIGADA

4.2. Clasificacin de software para anlisis de textos La clasificacin que se ofrece a continuacin es la proporcionada por Harald Klein (Social Science Consulting, 07407 Rudolstadt, Germany, en Text Analysis Info Page, en http://www.textanalysis.info/html), como la supuestamente ms clara de las existentes. Citar solamente los programas ms relevantes a mi juicio, aparecidos en la ltima modificacin de esta pgina (23 de enero de 2002). 4.2.1 Software aplicado al lenguaje: anlisis de usos de las palabras 4.2.1.1. Tratamiento lingstico: anlisis sintcticos y anlisis semnticos de las palabras
CAPITO 1.0 Autor: Hans Messelken, Oliver Fink. Distribuidor: Semiotis GmbH, Rheinbach, Alemania. Sistema(s) operativos: Win98, WinNT. Descripcin: estadstica de textos, compara textos, calcula la legibilidad con frmulas, genera listas de palabra y resmenes automticos (en alemn) PLCA 2.0F 2 Programa para anlisis de contenido lingstico. Autor: Carl W. Roberts Distribuidor: IEC progamma Groningen, Pases Bajos. Documentacin: incluido en versin de demostracin. Sistema(s) operativos: DOS, versin de Windows en desarrollo. Descripcin: PLCA suministra el medio para trazar un mapa de textos en una matriz de datos que contiene la informacin sobre palabras y sus interrelaciones. Cada clusula dentro de un texto es cifrada en un registro separado de datos. CETA 2.0 Anlisis de Texto Automatizado evaluativo (en holands) Autor: Ridder. Distribuidor: IEC progamma Groningen, Pases Bajos. Sistema (s) operativos: DOS. Descripcin: CETA apoya la codificacin semntica y asume que un texto consiste en una coleccin de las declaraciones, que describe relaciones entre segmentos de significado. Analizando cada oracin de un texto, CETA representa el texto como una red. El anlisis subsecuente de esta red puede revelar el discurso que es la base del texto.

SATO 4.0 Autor: Franois Daoust. Distribuidor: Universidad de Montreal, Canad (en francs). Sistema(s) operativos: DOS Descripcin: SATO permite la anotacin de documentos multilinges, tiene una lengua de pregunta que asegura la posicin sistemtica de segmentos textuales definidos por el usuario, la produccin de un ndice; listas de palabra clasificadas albabticamente o por frecuencia; la clasificacin de palabras, compuestos de palabras o frases; la definicin de variables para realizar enumeraciones mltiples y anlisis lexicomtrico; funciones de diccionario, y segn los casos un ndice de legibilidad (GUNNING).

26

EPISTEMOLOGA, METODOLOGA Y TCNICAS DEL ANLISIS DE CONTENIDO

PROFILER + Autor: Michael Young. Distribuidor: Red de Ciencia Social. Sistema(s) operativos: Win98, WinNT. Descripcin: un motor de anlisis de contenido de objetivo general diseado para anlisis de liderazgo. Profiler + busca una oracin de la izquierda siguiendo un juego ordenado de seales predefinido (palabras y/o puntuacin) que sirve como indicador de un rasgo, de una medida de inters o quizs de un tipo particular de comunicacin. Profi-

ler + examina cada serie y consulta una base de datos para determinar si una seal determinada sirve como indicador de un sntoma. Si la seal realmente sirve como indicador del sntoma, se pone el programa a determinar si otras seales del conjunto se hacen tambin presentes segn un orden determinado. Si todas las seales pueden ser emparejadas entonces las acciones indicadas por ellas son tomadas en consideracin y llevadas a un archivo, por el que se define un perfil para el hablante.

4.2.1.2. Banco de datos: recuperacin de informacin en textos, elaboracin de ndices, correspondencia de textos, listas de palabras, KWIC/KWOC (key-word-incontext, palabra clave dentro de contexto)
ASK SAM 4.0 Autor, Distribuidor: ASK SAM Software. Sistema operativo: Win3.1, Win98, WinNT, OS/2. Descripcin: AskSam es un programa de recuperacin de documentos rpido, mediante sistema de hipertexto, semejante a un editor de pginas Web. DBT 3.1 - Data base testuale. (DBT-Lexis). Autor: Eugenio Picchi. Distribuidor: Lexis (Universidad de Pisa). Sistema de operaciones: Win9x, WinNT. Descripcin: DBT puede hacer bsquedas de palabras, correspondencias, juegos de palabras siguiendo la lgica booleana (incluso aplicando lgica borrosa) tanto dentro del texto o en componentes accesorios (apuntes, apndices, etc.). Tambin permite hacer listas de palabra segn ordenes de clase diferentes, incluyendo un ndice (index) de tpicos, un diccionario, o tambin frecuencia de secuencias de caracteres y secuencias de palabra, manejo de imgenes, etc. que pueden ser asociadas a cada parte del texto. ATA- ASHTON TEXT ANALYSER (WinATAMark2) Autor y distribuidor: Peter Roe. Sistema (s) operativos: Win98, WinNT. Descripcin: ATA genera listas de palabra, palabras clave y palabras clave en contexto. (KWIC, KWOC). ERIC JOHNSONS PROGRAMS. Los programas de Eric Johnson sobre todo han sido realizados para el anlisis de juegos dramaticos y poesa. Requieren textos SGML etiquetados, segn limitaciones de las obras a que se aplican (por ejemplo de Jane Austen o Shakespeare). As, el programa ACTORES efecte la lista de personajes simultneamente en escena -generando un tratamiento cada vez que uno de los personajes entra o sale de la escena, seguiendo las coocurrencias de personajes en la accin, etc. y efectuando el tratamiento de sus intervenciones, segn diversas variables dramticas y literarias (por ejemplo, FINDLIST comparacin de listas de palabra (ms de dos), o PICKWICK: filtro de programa para escenas o lugares dramticos siguiendo el etiquetado de los textos. Etc.

27

JOS LUIS PIUEL RAIGADA

LEXA 7.0 Corpus ProcessingSoftware. Autor: Raymond Hickey, Universidad de Essen/Alemania. Distribuidor: Universidad de Bergen, Noruega. Sistema(s) operativos: DOS. Descripcin: LEXA es un sistema abierto basado en archivos. Puede realizar anlisis semnticos, listas de palabras, tablas de frecuencias lxicas, comparacin de archivos y funciones de recopilacin, as como estadstica a carcteres, palabras, y oraciones, buscando los grupos de archivos capaces de detectar secuencias de segmentos de texto, frass, etc. (DBF-files).

METAMORPH Distribuidor: Thunderstone Software. Sistemas operativos: DOS, Win98, WinNT, Unix. Descripcin: Metamorph es un paquete de bsqueda, sin cualesquiera pasos de proceso previo. Metamorph tiene un vocabulario de lengua en ingls de 250,000 palabra y asociaciones de frases por conceptos para preguntas en lenguaje natural, que utiliza la lgica booleana, aunque suministra el control de proximidad entre palabras, bsquedas borrosas, correspondencias regulares de expresin verdadera, y bsquedas de valor numrico

MicroOCP Autor: Susan Hockey, Iain Hart. Sistema (s) operativos: DOS, versiones de unidad central para VMS, UNIX, y VM/CMS CON UN RECOPILADOR LENGUAJE FORTRAN. Descripcin: OCP es un instrumento para generar correspondencias, listas de palabras, e incluye un ndice de textos en cualquier lengua o alfabeto. OCP funciona sobre un archivo de ASCII del texto. El texto puede ser etiquetado en ficheros para incluir la informacin adicional como el nmero de lnea, captulos, notas, etc.

TACTO 2.1.5 Autores: Michael Stairs, John Bradley, Ian Lancashire, Lidio Presutti. Distribuidor: Universidad de Toronto. Sistema (s) operativos: DOS. Descripcin: El TACTO es un sistema de 15 programas diseado para la recuperacin texto y el anlisis de obras literarias. Los investigadores usan el TACTO para recuperar las presencias (las ocurrencias) de una palabra, un modelo de palabra, o la combinacin de palabras. Los programas tambin pueden hacer las clases ms simples de anlisis, como frecuencias clasificadas de juegos de palabras o frases, o la clasificacin de enlaces de palabras segn su fuerza de asociacin. El TACTO es utilizado para textos individuales literarios, o de pequeo grupos de texto de tamao medio.

MONOCONC PRO 2.0 Autor: Michael Barlow. Distribuidor: Athelstan. Sistema (s) operativos: Win95, Win 98, etc. Descripcin: MonoConc es un programa de concordancias, que puede crear correspondencias, listas de palabras, (con listas de exclusin, el caso sensible/insensible), convierte textos, y trabaja con textos etiquetados y con lenguas diferentes.

28

EPISTEMOLOGA, METODOLOGA Y TCNICAS DEL ANLISIS DE CONTENIDO

4.2.2. Software aplicado al contenido: tratamiento del contenido de comunicacin humana, principalmente en textos. A menudo las bases de datos son caractersticas de estos programas. 4.2.2.1. Anlisis cualitativo: buscar regularidades y diferencias en el texto, explorar el texto entero (QDA Qualitative Data Analysis, anlisis cualitativo de datos). Algunos programas permiten el procesamiento de la informacin de audio y de vdeo. No hay un paradigma comn de QDA, existiendo muchos enfoques.
AQUAD FIVE 5.8 Autor: Gnter L. Huber (en alemn; tambin existe versin espaola: AQUAD CINCO 5.8). Distribuidor: Verlag Inge Huber, Schwangau. Documentacin: manual ingls, manual alemn y manual espaol. Sistema (s) operativos: Win98, WinNT. Descripcin: interpretacin de textos mediante codificacin simple del texto sin gua previa de categoras, o mediante un proceso semiautomtico de codificacin a partir de listados de ocurrencia de trminos prefijados, que aparecen destacados sobre la pantalla siguiendo el texto. Los programas de anlisis permiten desde el recuento de palabras aisladas, hasta la confeccin de listas de palabras (diccionarios), diferenciacin de hablantes, codificacin de las partes de textos producidos por hablantes diferentes, etc. Los segmentos de texto pueden ser recuperados por nmero de archivos de texto, nmeros de lnea del texto, cdigo, palabra clave, etc. (la bsqueda texto es completa). Permite la comparacin de casos/textos mediante anlisis booleanos de rasgos crticos (minimizacin lgica de tablas de contingencia). CODE-A-TEXT MULTI MEDIA V4 Autor: Alan Cartwright. Distribuidor: Sabio Scolari. Sistema (s) operativos: Win98, WinNT. Descripcin: es un instrumento flexible que ayuda almacenar y cifrar prcticamente cualquier clase de datos tanto para mtodos cualitativos como para cuantitativos de anlisis. Adems de datos basados en texATLAS.ti Autor: Thomas Muhr. Distribuidor: Sabio Scolari. Documentacin: manual corto en formato de PDF. Descripcin: Tratamiento de datos textuales, grficos, de audio, y de vdeo mediante codificacin intuitiva y fcil sobre la pantalla (arrastre con el ratn) con definicin flexible de segmentos de datos. Permite un nmero prcticamente ilimitado de documentos, segmentos, cdigos, y notas, as como trazar mapas mentales y asignacin de anotaciones a todo el tipo de unidades, segmentos de datos, cdigos, notas, etc. Los datos enlazados pueden ser manejados mediante enlaces de hipertexto. La generacin de textos en HTML permite formatear la investigacin para su publicacin en la red.

tos, el tambin acepta el sonido y el vdeo. Para los que trabajan con textos basados en la palabra escrita, es capaz de hacer ver el texto y oir las palabras habladas. Esta funcionalidad es til para quienes trabajan en las reas de psicologa clnica, psicoterapia, y otras profesiones que confan en el anlisis a fondo de textos y datos orales registrados.

29

JOS LUIS PIUEL RAIGADA

C-I-SAID - Code-A-Text Integrated System for the Analysis of Interviews and Dialogues Autor: Alan Cartwright. Distribuidor: Sabio Scolari. Sistema (s) operativos: Win98, WinNT. Descripcin: CISAID se ha desarrollado como sistema multimedia de Cdigos para anlisis de texto y ha sido diseado para suministrar mtodos e instrumentos tanto para el anlisis cualitativo como para el cuantitativo conservando los enlaces a los datos de la fuente (texto, audio, o vdeo). En CISAID se ofrecen modos sofisticados de organizar y buscar datos de la fuente textual, mediante tabulaciones al margen y representaciones grficas de esto datos. Se incluyen pruebas estadsticas que a menudo suministran un modo de indicar la fuerza comparativa de una relacin.

KWALITAN 5.05 Autor: Vincent Peters. Distribuidor: Vincent Peters. Sistema (s) operativos: DOS (4.0), Win95, 98, WinNT. Descripcin: Kwalitan es un programa para el anlisis de datos cualitativos y es un programa de base de datos de objetivo especial y basado en prueba experimental de teoras. Hasta 25 cdigos puede asociarse a un segmento de texto. Kwalitan da una descripcin alfabtica de los cdigos ya asociados a los segmentos seleccionados, juntos con sus frecuencias y puede crear una estructura de rbol para establecer la estructura jerrquica de los cdigos. Los cdigos y sus combinaciones pueden ser buscados, tambin mediante la lgica booleana. Kwalitan posee algunos rasgos para el anlisis de contenido, por ejemplo las frecuencias de palabras, las descripciones de palabra clave en contexto y de palabra clave fuera del contexto. Matrices de frecuencias de palabras o cdigos pueden ser generadas y analizadas por su software estadstico

TEXT EZ 3.06C Autor: Conwal Incorporated. Distribuidor: CDC Sistema (s) operativos: Win98, WinNT. Descripcin: CDC el TEXTO EZ es un programa de software desarrollado para asistir a investigadores en creacin, manejo, y anlisis semi-estructurado de bases de datos cualitativos. La entrada de datos permite a los investigadores crear libros de cdigos (codebooks) en lnea, aplicar cdigos a segmentos de respuestas abiertas, desarrollar estudios de caso, conducir bsquedas sobre bases de datos para identificar los segmentos de texto que muestran condiciones especificadas por el usuario, y exportar datos en una amplia serie de formatos para el anlisis remoto con otros programas de software de anlisis cualitativos o estadsticos. La capacidad de exportar e importar el codebook (libro de cdigos) ayuda a coordinar esfuerzos de codificacin cuando se trabaja simultneamente con copias del mismo archivo de base de datos. HYPERQUAL 3.0 version 1.1 Autor: Raymond V Padilla. Distribui. dor: Hyperqual. Sistema operativo: MacOS 8 o mejor. Descripcin: HyperQual3 es un instrumento para el almacenaje, direccin, organizacin, y anlisis cualitativo de datos de texto. Maneja con eficacia entrevistas estructuradas e inestructuradas, observaciones, documentos, y notas de investigacin. Rasgos: marcacin de texto semiautomtica, y automtica (codificacin). Clasificacin fcil de segmentos de texto codificados. Muestra categoras disponibles mientras se codifican los datos. Analiza notas de investigacin como datos. Exporta fcilmente a cualquier procesador de texto.

30

EPISTEMOLOGA, METODOLOGA Y TCNICAS DEL ANLISIS DE CONTENIDO

HYPERRESEARCH 2.0 Autor: S. Hesse-Biber, P. Dupuis, T. S. Distribuidor: Sabio, Inc. Sistemas operativos: Win95, Win98, WinNT, MacOS 7.5, PowerPC. Descripcin: Fcil de usar. Interfaz: destaca mens desplegables. Pe rm i t e trabajar con texto, material grfico, material de audio, y de vdeo. Los informes extrados incluyen hiperenlaces al material subyacente de la fuente. Funciones comprensivas cifrar y recuperar: permite seleccionar cualquier segmento de texto (desde 1 carcter a un archivo entero) y aplicar sin limitaciones nombres de cdigo al segmento de texto seleccionado. Recuerda cdigos nominales y los selecciona basandose en la proximidad a otros cdigos. Los informes pueden ser MARTIN 2.0 Autor y distribuidor: Robert Schuster. Sistemas operativos: Win3.1, Win95, 98, no WinNT. Descripcin: Los diferentes pasos de ejecucin son seleccionados por el teclado o con un ratn. A partir de la seleccin de un paso, un marcador numerado es agregado al texto y automticamente es copiado a un ndice por separado que aparece en ventana: la tarjeta de ndice . Cada tarjeta puede ser identificada con una descripcin opcional breve y con cualquier nmero de palabras claves opcionales. Las anotaciones pueden ser asociadas a cada paso sin salir del programa. La longitud de anotaciones es limitada principalmente por los recursos del ordenador. Aunque sea posible unir unos pasos a otros por el rasgo de palabra clave opcional, las tarjetas tambin pueden ser relacionadas de manera informal apilandolas sobre la pantalla de ordenador. Como las relaciones entre pasos comienzan a aparecer, stas pueden ser formalizadas moviendo tarjetas segn una jerarqua de grupos y carpetas. Las tarjetas tambin pueden ser movidas entre carpetas y pueden ser duplicadas para la inclusin en carpetas mltiples. Los proyectos de MARTIN estn basa-

presentados mediante enlaces de hipertexto al material original de la fuente. Permite autocodificacin: cifra automticamente fuentes mltiples a casos mltiples, buscando frases mltiples en un solo paso. Especifica igualmete una porcin de carcteres, palabras, o lneas antes y\o despus de las frases encontradas para ser incluidas en el segmento seleccionado para la autocodificacin.Permite trazar un mapa de cdigo: usando la ventana de mapa de cdigo representa grficamente relaciones entre sus cdigos. Permite pruebas de hiptesis: posee un sistema experto para realizar anlisis a fondo de los datos codificados para ver si la codificacin apoya las hiptesis previs tas.

dos en la asociacin fsica entre las partes de un anlisis ms que sobre estructuras de codificacin formales; todas las descripciones, palabras claves, y comentarios al margen puede ser modificados en cualquier momento siguiendo el progreso de anlisis. Y como cada uno de los componentes de un anlisis es manejado como un objeto separado y ocupa su propia ventana, el escritorio de MARTIN puede mostrar tanto elementos del anlisis como deseos tenga el investigador dentro de los lmites de las ventanas y los recursos del ordenador. Las carpetas y los grupos de carpetas de MARTIN son continuamente jerarquizados. Los estudios llevados a cabo por separado por diversos investigadores pueden ser unidos unos a otros importando cualquiera de sus componentes como textos para el anlisis remoto. Textos originales pueden ser impresos con sus marcadores de texto, apuntes, y pasos extrados. Los pasos pueden ser impresos con la informacin de la fuente, apuntes, anotaciones, y palabras claves. Todas las opciones de impresin generan un archivo imprimible en ASCII, WordPerfect, o formato de Microsoft Word.

31

JOS LUIS PIUEL RAIGADA

THE ETHNOGRAPH 5.04 Autor: John V. Seidel. Distribuidores: Sabio Scolari. Sistemas operativos: Win3.1, Win95, 98, WinNT. Descripcin: El Ethnograph v5.0 para ordenadores personales sistema operativo Windows es un programa del ordenador verstil diseado para hacer el anlisis de datos durante la investigacin cualitativa ms fcil, ms eficiente, y ms eficaz. Puede importar directamente datos cualitativos basados en documentos de texto, desde cualquier procesador de texto. El Ethnograph ayuda buscar y anotar los segmentos que sean de inters dentro de un proyecto, marcarlos QMA Qualitative Media Analysis, former KIT Autor y distribuidor: Carl Verner Skou. Sistemas operativos: Win98, WinNT. Descripcin: QMA es un programa para el anlisis cualitativo de grabaciones. Puede tratar un mximo de 300 entrevistas (de hasta 18 horas cada una). Puede implementar cdigos en una estructura de rbol, y compilarlos en grupos lgicos. El nmero de cdigos usados para el anlisis puede ser 65535, que combinados puede llegar a varios millones (dependiendo del tamao RAM). Cada nota puede ir compuesta de 32000 carcteres. El anlisis puede efectuarse a partir de QSR NUD*IST 5 (N5) Autores: Lyn y Tom Richards. Distribuidores: Sabio. Sistemas operativos: Win95, 98, WinNT. Descripcin: diseado para investigadores que hacen uso de datos complejos, N5 ofrece un juego de herramientas completo para la codificacin rpida, la exploracin cuidadosa y la direccin rigurosa del anlisis. Con las ordenes precisas para automatizar la codificacin y la bsqueda, N5 sirve una amplia gama de mtodos. Sus archivos de funciones y procedimientos de importacin hacen del programa un sistema rpido, ligando datos cualitativos y cuantitativos. Los documentos

con palabras de cdigo y controlar los anlisis que puede luego ser recuperado para su inclusin en informes. Su primera versin fue lanzada en 1985, y fue uno de los primeros programas para promover el uso del ordenador para el anlisis de datos cualitativos. Desde entonces el Ethnograph ha seguido siendo desarrollado por analistas de datos cualitativos para uso de analistas de datos cualitativos como cientficos sociales, historiadores, crticos literarios, investigadores del campo de la salud, analistas de negocio y de mercado, investigadores legales y otros. una buena porcin de criterios: por ejemplo miembros de un grupo o hablantes. QMA puede encontrar el modelo de anlisis sobre la base de variables independientes, orden temporal de intervenciones, integracin en el grupo, qu persona habla - y combinaciones de todo ello. Todo el conjunto, apuntes y resultados, puede ser exportado por separado en archivos para el anlisis avanzado en Excel o SPSS. QMA puede trabajar con los formatos siguientes de multimedia: Grabaciones de audio: WAV, AIFF, MP3, y Grabaciones en vdeo: AVI, Apple QuickTime 1.0-2.0, MPEG-1, MPEG-2 y Archivos de msica: MIDI.

son importados por separado o en grandes cantidades, en texto simple o con formato automtico ligado a la unidad escogida de texto. Codificacin sobre pantalla, con acceso inmediato al sistema de cdigos. El material cifrado es mostrado para la reflexin, la revisin de codificacin y la codificacin sobre categoras nuevas. Con las bsquedas de codificacin, el investigador puede probar hiptesis, localizar un modelo explicativo o perseguir una lnea de hiptesis ligadas a una conclusin prevista o alternativa.

32

EPISTEMOLOGA, METODOLOGA Y TCNICAS DEL ANLISIS DE CONTENIDO

QSR NViVo 1.3 Autores: Lyn y Tom Richards. Distribuidor: Sabio. Sistemas operativos: Win95, 98, WinNT. Descripcin: NVivo puede manejar datos de texto enriquecido con plena capacidad de corregir, visualmente, para cifrar, y unir documentos cifrados, filtrados, codficados y encontrados mediante bsquedas. En NVivo, se puede crear, corregir, cifrar y explorar documentos compuestos, encajados mediante hiperenlaces a archivos de multimedia y webs encadenados entre ellos segn datos e ideas. Hay varios modos de automatizar la codificacin de documentos. Los documentos y nodos de enlace pueden ser entrelazados por hipertexto para suministrar redes. De este modo los documentos de anotaciones, de comentarios pueden ser ligados a nodos y a otros documentos; y los nodos pueden ser construidos para actuar como referencias de extracto (resumen) para los temas mencionados en los documentos. Los documentos son totalmente editables, y la correccin no trastorna o invalida la codificacin

previa. Este rasgo de revisin mientras usted codifica permite a los usuarios aumentar sus documentos con el tiempo, y cifrar y unir el texto agregado as como corregir el texto ya cifrado. Puede darse a los documentos y nodos de anlisis (y lo que ellos representan) un nmero indefinido de atributos (propiedades) para describirlos y caracterizarlos y usarlos adems como filtros. Tambin la importacin y exportacin de datos de atributos, va tablas de contingencia, puede llevarse a programas estadsticos. Los atributos pueden tener cualesquiera valores relevantes (fechas, nmeros, composiciones lgicas, secuencias en cadena, etc.). Los documentos y nodos pueden ser agrupados en un nmero indefinido de juegos para cualquier objetivo que desee alcanzar el usuario, y pueden ser estudiados por sus rasgos, contenido, etc. Un integrado instrumento de bsqueda suministra un nmero grande de caminos para buscar rasgos, incluyendo resmenes tabulares estadsticos.

MAXQDA, o German MaxQDA Autor: Udo Kuckartz Distribuidores: VERBI GmbH Ana Kuckartz. Sistemas operativos: Win95, 98, WinNT, versin inglesa y alemana. Descripcin: la versin anterior de este programa es Winmax. Con MAXQDA se puede: crear e importar textos en Formato RTF; crear grupos de texto y organizar material textual para el anlisis temporal; crear cdigos jerrquicos con hasta diez niveles; seleccionar segmentos de texto y asignar cdigos o subcdigos ligados a un color como atributo de cada cdigo. Muestra el texto con rayas de codificaciones que indican que los cdigos han sido ligados entre s. Permite importacin pre-cifrada, por ejemplo de focus groups o entrevistas. Selecciona palabras o trminos (condiciones) del texto o los inserta automticamente en su sistema de cdigo (in-vivo-coding) Busca la palabra o

las combinaciones de palabras en sus textos. Enlaza iconos especiales a los tipos diferentes de notas (notas de teora, notas metodolgicas etc.). Maneja un juego de atributos (variables) para cada texto, usando las variables como con filtro para la recuperacin de texto o bsquedas lxicas. Exporte la tablas de variables a programas estadsticos como Excel o SPSS. Un juego de hasta 10 funciones analticas permite la recuperacin de texto (cerca, rodeado por, seguido de, al menos etc.). Es capaz de facilitar el manejo tanto de pequeos estudios as como conjunto grandes de texto.

33

JOS LUIS PIUEL RAIGADA

4.2.2.2. Transcripcin de software (audio y video)


SALT 6.1 - Systematic Analysis of Language Transcripts Autores: Robin S. Chapman y Jon F. Molinero. Distribuidor: Laboratorio de Lengua, Universidad de Wisconsin-Madison. Sistemas operativos: Win95, 98, WinNT, MacOS. Descripcin: el programa de SAL contiene todo un surtido de anlisis estndar. Incluye: los tipos de expresiones que remiten a distribucin de imitaciones, respuestas a preguntas, expresiones incompletas, ininteligibles, y no verbales; el clculo del nmero total de palabras, la longitud de expresin, y la lingstica de Brown; nmero y longitud de pausas y tarifa de oratoria; listas y frecuencias de races de palabra, morfemas ligados, y cdigos; las distribuciones de expresiones por longitud en los trminos y criterios de palabras y morfemas; distribucin de hablantes y turnos de palabra segn criterios de expresiones consecutivas; frecuencias para juegos de palabras, incluyendo palabras de pregunta, formas negativas, conjunciones, modales y semi-verbos auxiliares-, pronombres, y cualquier juego de palabras que se quiera definir; nmero y tipos de circunloquios (pausas llenas, repeticiones, revisiones). Los valores de estas variables pueden ser comparados con la Base de datos de Referencia de SAL que contiene datos empricamente extrados de los nios del Wisconsin segn categoras de edad diferentes (3-13 aos), gnero, probando el contexto, y la longitud de transcripcin. Se contempla la estadstica de desviacin estndar para muchas de las variables de anlisis. TRANSCRIBER 1.4.3 Autor: Claudio Barras y muchos otros. Documentacin: manual de usuario (en francs) o manual de referencia (en ingls) Sistemas operativos: MacOS, Linux (Win98 en desarrollo). Descripcin: Transcriber es un instrumento para ayudar a la anotacin manual de seales de discurso. Suministra un interfaz de usuario fcil de usar, grfico, para segmentar grabaciones de discurso de larga duracin, transcribindolas, y etiquetando turnos de discurso, cambios de tema y condiciones acsticas. Esta expresamente diseado para la anotacin de grabaciones de noticias, pero sus caractersticas podran tambin ser tiles en otras reas de investigacin de discurso. ESA - Event Structure Analysis Autor y distribuidor: David Heise. Sistema operativo: JAVA. Descripcin: ESA es un programa en lnea que ayuda a analizar acontecimientos secuenciales. El anlisis previamente necesario produce un diagrama que muestra cmo algunos acontecimientos (por ejemplo, noticias) son necesarios para que ocurran otros acontecimientos, y cmo acontecimientos en abstracto pueden ser representados como acontecimientos concretos. Se puede probar si el diagrama resultante trabaja como una gramtica para explicar la secuencia de acontecimientos o de noticias. El anlisis por codificacin comprende al agente, la accin, el objeto, el instrumento, el ajuste, la alineacin, el producto, y el beneficiario de cada acontecimiento. Esto permite determinar cmo la gente, las cosas que se hacen, y las consecuencias resultan unidos por los acontecimientos del discurso o por el discurso de los acontecimientos (noticias).

34

EPISTEMOLOGA, METODOLOGA Y TCNICAS DEL ANLISIS DE CONTENIDO

KEDS - Kansas Event Data System Autor y distribuidor: Philip A. Schrodt. Sistema operativo: MacOS. Descripcin: el Sistema KEDS es un programa para la codificacin de datos de noticias internacionales que usan el modelo y el simple anlisis gramatical. Est diseado para trabajar con artculos cortos de noticias como aquellos

encontrados en informes de servicio de telgrafo o cronologas. Hasta el momento, KEDS principalmente ha sido usado para cifrar noticias del servicio de telgrafo de Reuters, pero en principio puede ser usado para otro tipo de referencias a acontecimientos mediante cifrado de esquemas. Hay tambin una lista de correo electrnico.

4.2.2.3. Anlisis de datos sobre acontecimientos de referencia: anlisis de acontecimientos (o noticias) en datos textuales. 4.2.2.4. Anlisis cuantitativo: se analiza el texto para probar selectivamente hiptesis y formular inferencias estadsticas. El resultado es una matriz de datos que representa los resultados numricos de la codificacin. 4.2.2.4.1. Empleando sistemas de categoras: ya sean estos sistemas proporcionados (como herramienta) por el programador de software, o por el propio investigador (como modelo de representaciones), a fin de ser utilizados como criterios de bsqueda en el texto y facilitar codificaciones. Los paquetes del software con diccionarios incorporados son a menudo restringidos a ciertos idiomas, algunos se encuentran limitados por el tamao de la unidad de texto y se restringen a la tarea de procesar respuestas a preguntas abiertas, siendo incapaces de analizar textos de medios de comunicacin. Las categoras pueden ser temticas o semnticas; esto puede tener implicaciones sobre la definicin de unidades de texto y variables externas.
PCAD 2000 Autor y distribuidor: Software de GIGAOCTETO. Sistema (s) operativos: Win95, 98. Descripcin: su rea primaria de inters es medir estados psicobiolgicos relevantes como la ansiedad, la hostilidad, y la esperanza mediante escalas de anlisis de contenido Gottschalk-Gleser. Estas escalas han sido empricamente desarrolladas y probadas, y han demostrado ser confiables y vlidas en una amplia gama de estudios. PROTAN - Protocol Analyser. Autor y distribuidor: Robert Hogenraad. Sistema (s) operativos: DOS, MacOS, OS/2. Descripcin: lista de palabras, concordancias, frecuencias de categoras, secuencias de manuales de categoras en forma electrnica e impresa. PROTAN es el sucessor en francs, del GENERAL INQUIRER, con muchas utilidades que realizan numerosas tareas de anlisis de texto. PROTAN es muy complejo y difcil de manejarse. La documentacin est en francs, pero las utilidades estn el ingls.

35

JOS LUIS PIUEL RAIGADA

DICCIN 5.0 Autor: Roderick F. Venado. Distribuidor: Sabio Scolari. Sistema operativo: Win95, 98, WinNT. Descripcin: Diccin 5.0 emplea diccionarios (listas de palabras) para buscarlas en un texto con las siguientes variables: Certeza: indica resolucin, inflexibilidad, y entereza y una tendencia de hablar ex-cathedra; Actividad que destaca movimiento, cambio, la puesta en prctica de ideas y la anulaLIWC 2.0 - Linguistic Word Count Autor: James B. Pennebaker. Distribuidor: Erlbaum asociados. Sistema operativo: Win95, 98, WinNT. Descripcin: el programa analiza archivos de texto sobre una base de sinnimos, interesndose por los porcentajes de las palabras que se emparejan en cada cada una de las dimensiones de lengua. El programa tiene 68 dimensiones predeterminadas (variables de salida) segn inclusin de dimensiones lingsticas, para categoras de palabras que dan un toque psicolgico, y categoras de preocupaciones (inters) personales, pudiendo tambien acomodarse a dimensiones definidas tambin por el usuario.

cin de cualquier inercia; Optimismo que describe referencias tangibles, inmediatas, reconocibles segn afectan diariamente a la vida de la gente de forma confiada; Concordancia destacando el acuerdo sobre los valores de un grupo y rechazando los modos de acuerdo idiosincrticos; Realismo que describe referencias tangibles, inmediatas, reconocibles segn afectan diariamente a la vida de la gente de forma probada (realista) INTEXT 4.1 - INhaltsanalyse von TEXTen (anlisis de contenido de textos) Autor y distribuidor: Harald Klein. Sistema operativo: DOS. Descripcin: Intext es la versin de MS-DOS de Textquest. Este usa diccionarios para cifrar textos, con rasgos especiales como son la codificacin interactiva, el modelo de bsqueda de co-ocurrencias de palabras, y la detection de la negacin. Pero tambin analiza la legibilidad y los estadsticos de texto as como de secuencias de palabras. Est disponible en ingls y el alemn. La ayuda en lnea est disponible. La Versin windows de TextQuest tiene un interfaz de usuario moderno.

TEXTPACK 7.0 TextPackage Autores: Peter Ph. Mohler, Cornelia Zll. Distribuidor: ZUMA Mannheim. Sistemas operativos: Win95, 98, WinNT, en ingls o espaol. Descripcin de sus rasgos: las frecuencias de palabra en un texto entero o en sus sub-unidades, pueden ser filtradas por variables externas (identificadores) y/o por su frecuencia, clasificadas alfabticamente o por frecuencia, tablas de orden (jerrquico) segn clases. Analiza palabras-clave-en-contexto y palabra clave del contexto (KWIC/KWOC) Singulariza palabras, races de palabra (los principios

de cada cadena de palbras) y puede mostrar secuencias de palabra en su contexto. TEXTPACK categoriza/clasifica un texto segn un diccionario de usuario. Esto genera tantos archivos como frecuencias de categora y secuencias de categoras haya. La validez de la codificacin puede ser comprobada por varias opciones (por ejemplo, la insercin de nmeros de categora o etiquetas de categora a lo largo del texto). Seleccin de unidades de texto: filtrado sobre la base de las variables externas o usando un archivo numrico para seleccionar unidades de texto.

36

EPISTEMOLOGA, METODOLOGA Y TCNICAS DEL ANLISIS DE CONTENIDO

GENERAL INQUIRER Autor y distribuidor: Philip J. Piedra. Sistema operativo: JAVA, cuyos sistemas de categoras son Archivos Excel (XLS). Descripcin: el abuelo del software de anlisis de contenido est ahora disponible para los ordenadores que controlan JAVA y son capaces de leer el sistema de categora (archivos de Excel).

WORDSTAT 3.1c Autor: Normand Peladeau. Distribuidor: Provalis Investigacin. Sistemas operativos: Win95, 98, WinNT. Descripcin: WordStat es un programa de estadstica de objetivo general (comparable al SPSS por ejemplo). Ambos paquetes estn integrados y es sobre todo til para la codificacin de respuestas a preguntas abiertas.

4.2.2.4.2. Sin emplear sistemas de categoras: basados en la utilizacin de las co-ocurrencias de palabras/frases y/o conceptos. Cada palabra/o segmento de texto se toma en consideracin.
HAMLET Autor: Alan Brier. Sistema operativo: DOS, Win3.1, Win95, 98, WinNT. Descripcin: la idea principal de HAMLET es de buscar un archivo de texto para palabras en una lista de vocabulario dada, y contar frecuencias conjuntas dentro de cualquier unidad de contexto especificada. Frecuencias de palabra individuales (fi), frecuencias conjuntas (fij) para pares de palabras (yo, j), tanto expresadas en los trminos (condiciones) de la unidad escogida de contexto, como en correspondencia estandarizada de frecuencias conjuntas: Sij = (fij) / (fi + fj fij). Una opcin remota permite la comparacin de los resultados al aplicar el escalamiento multidimensional a matrices de frecuencias conjuntas sacadas de una porcin de textos; ofrece funciones como KWIC (listados, palabras clave en el contexto para cualquier cadena de palabras dada; WORDLIST genera listas de palabras y frecuencias; COMPARE, compara palabras de listas comunes a pares de textos, y es til para la generacin de listas de vocabulario, para la inclusin de sinnimos, para el empleo en la comparacin de una porcin de textos, etc. INTELLIGENT MINER FOR TEXT - TEXT ANALYSIS TOOLS 2.3 Autor y distribuidor: IBM. Sistemas operativos: AIX 4.2.1, Solaris 2.5.1, WinNT 4.0, OS/390. Descripcin: instrumentos de anlisis de texto que pueden ser usados para analizar todos los tipos de documentacin en lnea, de peticiones de cliente e informes tcnicos en artculos de revistas y peridicos. Organiza la documentacin creando una estructura de directorio de carpetas, con instrumentos de clasificacin que pueden catalogar y clasificar artculos segn categoras definidas por el usuario. Navega por la documentacin buscando la informacin sobre un tema especfico, y se pueden usar muchos documentos diferentes en cada bsqueda. Los instrumentos de Clustering pueden suministrar una descripcin de toda la documentacin que ha sido usada. Resume la documentacin y detalla la informacin, mediante resmenes de documento automticamente creados, y aportando sumarios para determinar si el documento entero debera ser ledo.

37

JOS LUIS PIUEL RAIGADA

SEMIO 2.0 Autor: Claudio Vogel. Distribuidor: Semio. Sistema (s) operativos: Win95, 98, WinNT, Solaris 2.5. Descripcin: La taxonoma de Semio combina la tecnologa de anlisis lingstico y de clustering estadstico con exigencias de vocabulario definidas por el usuario para crear por intuicin la estructura de categoras que suministra el acceso inteligente al espacio global de la informacin dentro de una masa de texto inestructurado. Frases importantes y palabras clave son extradas de una variedad de fuentes de texto como sitios de intranet/Internet, Lotus Notes, Documentum, bases de datos ODBC-, XML, etc. Este proceso combina la deteccin de lengua, el anlisis de proximidad y la extraccin de texto ms limpia, ms informativa disponible. Una vez que este proceso ha seleccionado la informacin realmente relevante del original de texto inestructurado, puede serlo aplicado un nmero indefinido de estructuras de clasificacin de alto nivel. Estas estructuras extraen derivados lxicos y los colocan en categoras. El resultado: una estructura de categoras que en realidad suministra ideas al usuario sobre el espacio de bsqueda sin recurrir al mtodo huntand-peckde bsquedas de palabra clave. Ya que la nica exigencia de una estructura de clasificacin es que esto refleja la informa-

cin que puede ser encontrada dentro del texto fuente, de forma que la configuracin y la personalizacin de la estructura es prcticamente ilimitada. El cliente puede configurar sus taxonomas para reflejar un tesauro corporativo o un vocabulario controlado. La taxonoma de Semio es totalmente compatible con la ISO thesauri, y puede ser adaptada a cualquier iniciativa de terminologa por parte del usuario. El poder de aplicar estructuras de clasificacin mltiples al mismo texto de la fuente se hace claro cuando los usuarios ven por primera vez la prueba real textual que condujo en primer lugar a aquellas estructuras. Pasos de Proceso: La taxonoma de Semio realiza un proceso de tres pasos para clasificar el contenido de texto. El texto es recogido de fuentes diferentes aproximadamente de 500 formatos diferentes que pueden ser ledos. Permite la extraccin de frases relevantes, informativas dentro el texto. Las frases son asociadas a un juego de categoras que pueden proceder de un tesauro, pre construido de la Semio, o de una estructura de encargo. Las estructuras de categoras entonces pueden ser validadas y modificadas en un proceso fcil, iterativo para asegurar la calidad y la consistencia.

SPAD-T Autor y distribuidor: CISIA-CERESTA. Sistemas operativos: Win95, 98, WinNT. Descripcin: la SPAD-T analiza los textos automticamente asociando la informacin numricamente cifrada. La clasificacin tambin puede tomar variables externas (por ejemplo la edad, el sexo, la profesin) en consideracin la utilizacin de la SPAD-N. La SPAD-T cuenta palabras y secuencias de palabra (frases) que usan tablas de orden segn clase y criterios de exclusin como la longitud o la frecuencia. Usando palabras caracterizadas por mto-

dos de probabilidad, se encuentran las secuencias de palabras, u oraciones ms probables. Tambin efecta KWICs con una longitud de lnea fija de 132 carcteres. Compara vocabularios de textos con diferentes tipos de anlisis de factorial y anlisis de correspondencia. Tambin se pueden incluir variables externas. Son tambin posibles tablas de contingencia de palabras comunes o los segmentos repetidos dentro de los textos. Los anlisis jerrquicos permiten por ejemplo una clasificacin automtica de respuestas a preguntas abiertas.

38

EPISTEMOLOGA, METODOLOGA Y TCNICAS DEL ANLISIS DE CONTENIDO

TEXTANALYST 2.0 (versin alemana) Autor: Sergej Ananyan. Distribuidor: Megaputer. Sistemas operativos: Win95, 98, WinNT. Descripcin: TextAnalyst es un instrumento de tratamiento de texto capaz de anlisis semntico automatizado. Adems, TextAnalyst puede ayudar a realizar clustering de documentos en textbase, a la recuperacin semntica de documentos, y a enfocar (concentrar) una exploracin de texto alrededor de un cierto tema.

T-LAB Autor: Franco Lancia y Marco Silvestri. Distribuidor: Computer Data Sistemi. Sistemas operativos: Win95, 98, WinNT. Descripcin: el T-LAB, compara y traza un mapa del contenido de clases diferentes de textos: transcripciones de discurso, artculos de peridico, textos legislativos, documentos (inclusin de transmisiones de Internet), libros, respuestas a preguntas abiertas, etc. Rasgos bsicos son: las Asociaciones de palabras, trazar un mapa de correspondencias, especificidades, concordancias, nota, vocabulario. Sus rasgos avanzados son: marcacin, seleccin de palabra, anlisis de correspondencia, anlisis de redes, mapa de co-ocurrencias, anlisis de contexto elemental, anlisis de secuencia

4.2.2.5. Codificacin de respuestas a preguntas abiertas: estos programas no pueden analizar una cantidad grande de textos, slo pueden servir para ciertos textos homogneos y a menudo son limitados segn el tamao de una unidad de texto.

TEXTSMART 1.0 Distribuidor SPSS Inc. Sistema operativo: Win95, 98, WinNT, el programa est en lenguaje Java. TextSmart es un ins trumento para la codificacin automtica de respuestas a preguntas abiertas, y no puede cifrar textos muy largos. La clasificacin requiere preselecciin de palabras y la definicin de listas (palabras y sus sinnimos), y trabaja slo con textos ingleses. VERBATIMBLASTER Autor: David S. Walonick. Distribuidor: StatPac Inc, EE. UU. Sistema operativo: Win95, Win 98, WinNT, Win2000 Descripcin: El programa VERBATIMBLASTER es una parte de StatPac y codifica respuestas a preguntas abiertas automticamente.

VERBASTAT 3.0. Distribuidor: SPSS Inc. Autor: DataStat, empresa que fue comprada por SPSS. Sistema operativo: Win95, 98, WinNT. Descripcin: VerbaStat es el software para codificar respuestas a preguntas abiertas. Suministra una especie de mscara, la codificacin tiene que ser hecha a mano.

39

JOS LUIS PIUEL RAIGADA

5. Conclusiones En las pginas precedentes se le ha dedicado, en primer lugar, un apartado a la reflexin epistemolgica sobre el anlisis de contenido como objeto de estudio caracterizado por constituir una prctica de investigacin en ciencias sociales que consiste, a su vez, en construir un objeto de estudio (por ejemplo, una comunicacin singular) para cuya representacin cientfica (trascendente y por tanto refutable) se usa como procedimiento la seleccin y anlisis de productos comunicativos que objetivamente pertenecen a aquella comunicacin, que son significativos para conocerla desde una una perspectiva terica, y que son vlidos o pertinentes para poner a prueba las condiciones, tanto particulares como generales, en virtud de las cuales estos productos comunicativos han sido empleados, o pueden serlo, en cualquier tipo de comunicacin semejante a aquella que los ha producido. En segundo lugar, le hemos dedicado un apartado a la metodologa (reglas de procedimiento) que aspira a ligar de foma vlida una secuencia de actuaciones y alternativas que ataen a la seleccin del corpus, a su segmentacin en unidades de anlisis y a su examen orientado a elaborar, registrar y tratar datos de diversos rdenes lgicos, gracias a los cuales se construye un metadiscurso capaz de representar cientficamente (o de forma trascendente o refutable) al objeto de estudio que en ningn caso es el propio corpus, sino la prctica humana que ha generado el objeto material de anlisis: el producto comunicativo analizado. En tercer lugar, se le ha dedicado un ltimo apartado a las alternativas tcnicas que subyacen a cualquier procedimiento de anlisis, ya sea este realizado en todos sus pasos por los investigadores y analistas, ya sea este realizado automticamente sirvindonos de los recursos de software disponibles, y brevemente repertoriados y descritos siguiendo el trabajo de Harald Klein. Es de esperar que ahora cobre sentido una ltima reflexin con la que pretendo concluir esta exposicin: en anlisis de contenido, como en cualquier otro procedimiento de investigacin cientfica, la verdad o falsedad nunca son imputables a los mtodos, sino a las teoras a que ellos sirven; la precisin o el error de unos datos tampoco son imputables a los mtodos, sino a las tcnicas para su elaboracin, registro y tratamiento; a los mtodos (y el anlisis de contenido es un mtodo) le compete la adecuacin o inadecuacin de los procedimientos para servir a una teora, y la adecuacin o inadecuacin de los procedimientos para elegir y usar unas tcnicas capaces de proporcionar datos susceptibles, por una parte, de refutar una teora, y, por otra parte, susceptibles de evitar errores formales o materiales.

40

EPISTEMOLOGA, METODOLOGA Y TCNICAS DEL ANLISIS DE CONTENIDO

Referencias bibliogrficas Berelson, B. (1952). Content analysis in communication research. Nueva York: The Free Press. Eco, U. (1975). La estructura ausente. Barcelona: Lumen. [Edicin original italiana, 1968]. Gaitn, J.A. (1991). Historia, comunicacin y reproduccin social en la transicin espaola. Anlisis de las expresiones generales y universales de la representacin del acontecer en un diario de referencia dominante: El Pas, 1976, 1981. Madrid: Universidad Complutense de Madrid. Gaitn, J.A. & J.L. Piuel Raigada (1997). Tcnicas de investigacin social. Elaboracin y registro de datos. Madrid: Sntesis. George, A.L. (1959). Propaganda analysis: A study of inferences made from Nazi propaganda in World War II. Evanston, IL: Row Peterson. Hall, E.T. (1973). La dimensin oculta. Enfoque antropolgico del uso del espacio. Madrid: Instituto de Estudios de.Administracin Local. [Edicin original: (1966). The hidden dimension. Nueva York: Doubleday & C]. Holsti, O.R. (1969). Content analysis for the social sciences and humanities. MA: Reading Addison-Wesley. Ibez, J. (1986). Ms all de la sociologa. Madrid: Siglo XXI. Klein, H. Text Analysis Info Page. URL: http://www.textanalysis.info/html Lasswell, H. (1965). Why be quantitative?. In H. Lasswell & N. Leites (comps.), Language of politics. Cambridge: MIT Press, 142-44. Lippmann, W. (1922). Public opinion. Nueva York: Macmillan. Martn Serrano, M. (1989). La produccin social de comunicacin. Madrid: Alianza Universidad. Martn Serrano, M. et al. (1981). Epistemologa de la comunicacin y anlisis de la referencia. Madrid: Visor. Piuel Raigada, J.L. (1989). La expresin. Una introduccin a la filosofa de la comunicacin. Madrid: Visor. Piuel Raigada, J.L. (1993). Cultura poltica y TV en la transicin en Chile. Madrid: C.E.D.E.A.L. Piuel Raigada, J.L. & J.A. Gaitn (1995). Metodologa general. Conocimiento cientfico e investigacin en la comunicacin social. Madrid: Sntesis. Piuel Raigada, J.L. y J.I. Garca-Lomas (2001). Autopoiesis y comunicacin. Research Group n 51 (ISA), III Congreso Internacional de Sociociberntica. Len, Guanajuato (Mxico), 26-30 junio 2001. Pool, I. de S. (1959). Trend in content analysis. Urbana, IL.: University of Illinois. Rapoport, A. (1969). Hous form and culture. Nueva York: Prentice Hall. Todorov, T. (1982). Las categoras del relato literario. In VV .AA., Anlisis estructural del relato. Buenos Aires: Ediciones B. [Texto original, 1966].

41

You might also like